Vous êtes sur la page 1sur 131

Transformac

oes de imagens baseadas em Morfologia


Matem
atica

Este exemplar corresponde `a redacao final da


Tese devidamente corrigida e defendida por
Leyza Elmeri Baldo Dorini e aprovada pela
Banca Examinadora.

Campinas, 16 de fevereiro de 2009.

Tese apresentada ao Instituto de Computacao,


unicamp, como requisito parcial para a obtencao do ttulo de Doutora em Ciencia da
Computacao.

FICHA CATALOGRFICA ELABORADA PELA


BIBLIOTECA DO IMECC DA UNICAMP
Bibliotecria: Miriam Cristina Alves CRB8a / 5094

Dorini, Leyza Elmeri Baldo


D734t

Transformaes de imagens baseadas em morfologia matemtica/


Leyza Elmeri Baldo Dorini -- Campinas, [S.P. :s.n.], 2009.
Orientador : Neucimar Jernimo Leite
Tese (doutorado) - Universidade Estadual de Campinas, Instituto de
Computao.
1. Morfologia matemtica. 2. Processamento de imagens. 3. Anlise
de imagens. I. Leite, Neucimar Jernimo. II. Universidade Estadual de
Campinas. Instituto de Computao. III. Ttulo.

Ttulo em ingls: Image transformations based on mathematical morphology operations..


Palavras-chave em ingls (Keywords): 1. Mathematical morphology. 2. Image processing. 3.
Image analysis.
rea de concentrao: Processamento de imagens.
Titulao: Doutora em Cincia da Computao
Banca examinadora: Prof. Dr. Neucimar Jernimo Leite (IC-UNICAMP)
Prof. Dr. Aparecido Nilceu Marana (DCo-UNESP)
Prof. Dr. Roberto Hirata Jnior (IME-USP)
Prof. Dr. Alexandre Xavier Falco (IC-UNICAMP)
Prof. Dr. Hlio Pedrini (IC-UNICAMP)
Data da defesa: 16/02/2009
Programa de Ps-Graduao: Doutorado em Cincia da Computao

ii

iii

Instituto de Computacao
Universidade Estadual de Campinas

Transformac
oes de imagens baseadas em Morfologia
Matem
atica
Leyza Elmeri Baldo Dorini1
Janeiro de 2009

Banca Examinadora:
Prof. Dr. Neucimar Jeronimo Leite (Orientador)
Prof. Dr. Aparecido Nilceu Marana - DCo/UNESP
Prof. Dr. Roberto Hirata J
unior - IME/USP
Prof. Dr. Alexandre Xavier Falcao - IC/UNICAMP
Prof. Dr. Helio Pedrini - IC/UNICAMP
Prof. Dr. Arnaldo de Albuquerque Ara
ujo - DCC/UFMG (suplente)
Profa. Dra. Anamaria Gomide - IC/UNICAMP (suplente)

Suporte financeiro de: bolsa FAPESP (processo 2005/4462-2).

Resumo
Este trabalho apresenta um novo conjunto de transformacoes de imagens que podem
ser utilizadas como uma etapa adicional em diversas aplicacoes, tal como segmentacao,
de modo a evitar o uso de operacoes com custo computacional mais alto. Tais transformacoes utilizam como base operacoes de morfologia matematica e possuem a forma
de um operador do tipo toggle. Inicialmente, foi definida uma nova operacao com propriedades espaco-escala, atraves da qual pode-se obter uma simplificacao bem controlada
da imagem em que maximos e mnimos interagem ao mesmo tempo, uma vantagem em
relacao a outras abordagens que consideram transformacoes de extremos separadamente.
A analise de diferentes nveis de representacao traz in
umeras vantagens, possibilitando
lidar adequadamente com a natureza multi-escala das images e permitindo a extracao das
caractersticas especficas que se tornam explcitas a cada escala. A partir de variacoes na
formulacao e na forma de aplicacao do operador proposto, foi possvel definir uma nova
operacao de limiarizacao adaptativa multi-escala e um metodo de filtragem de rudo. Foram realizados diversos experimentos que comprovaram as vantagens da utilizacao das
abordagens propostas.

vii

Abstract
In this work, we present a new set of image transformations that can be used as an additional step in several applications, such as segmentation, to avoid the need of operations with
a higher computational cost. These transformations are based on mathematical morphology operations and have the format of a toggle operator. The first proposed operation
has scale-space properties, which conduce to a well-controlled simplification of the image
where minima and maxima interact at the same time, an advantage when compared to
other approaches. Through the analysis of different representation levels, it is possible to
deal with the multiscale nature of images, as well as to extract the specific features that
become explicit at each scale. By changing the primitives the form of application of the
proposed operator, we also define an adaptative multiscale thresholding operation and a
noise filtering method. We show the results of several computational experiments, which
demonstrate the advantages of the proposed approaches.

ix

Agradecimentos
Ao meu marido Fabio, por estar sempre ao meu lado, compartilhando momentos alegres
e difceis e, acima de tudo, me incentivando a sempre acreditar em mim mesma.
Ao meu orientador, Prof. Neucimar Leite, pelo incentivo e apoio prestados.
Ao Prof. Farhad Jafari, University of Wyoming, pelo apoio e incentivo durante a realizacao do Programa de Estagio no Exterior.
Ao Instituto de Computacao e `a UNICAMP, pela estrutura e ambiente.
A todos que de alguma forma contriburam para este trabalho: famlia, professores, colegas
e funcionarios do IC.
` FAPESP pelo suporte financeiro.
A

xi

Conte
udo
Resumo

vii

Abstract

ix

Agradecimentos

xi

1 Introduc
ao
1.1 Principais contribuicoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Organizacao da tese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1
2
3

2 Princpios b
asicos de processamento de imagens e morfologia matem
atica
2.1 Definicoes basicas de processamento de imagens . . . . . . . . . . . . . . .
2.2 Transformacoes de imagens e operadores . . . . . . . . . . . . . . . . . . .
2.3 Elementos e funcoes estruturantes . . . . . . . . . . . . . . . . . . . . . . .
2.4 Operacoes basicas de morfologia matematica . . . . . . . . . . . . . . . . .
2.5 Outras transformacoes morfologicas . . . . . . . . . . . . . . . . . . . . . .
2.6 Operadores do tipo toggle . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.7 Transformada de watershed . . . . . . . . . . . . . . . . . . . . . . . . . .
2.8 Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

7
7
9
12
14
18
22
23
25

3 Teoria espaco-escala
3.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Visao geral da teoria espaco-escala . . . . . . . . . . . . . .
3.3 Abordagem linear . . . . . . . . . . . . . . . . . . . . . . . .
3.4 Espacos-escala em duas dimensoes . . . . . . . . . . . . . . .
3.5 Abordagens nao-lineares . . . . . . . . . . . . . . . . . . . .
3.6 Espacos-escala morfologicos . . . . . . . . . . . . . . . . . .
3.6.1 Erosao/Dilatacao Morfologica Multi-escala . . . . . .
3.6.2 Espacos-escala baseados em aberturas e fechamentos
3.6.3 Espacos-escala baseados em operadores conexos . . .

27
27
29
30
33
34
36
36
37
39

xiii

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

3.7

Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4 Operador SMMT: Self-dual Multiscale Morphological Toggle


4.1 Propriedades espaco-escala . . . . . . . . . . . . . . . . . . . . .
4.2 Variacao no n
umero de iteracoes do operador SMMT . . . . . .
4.3 Testes experimentais . . . . . . . . . . . . . . . . . . . . . . . .
4.4 Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.

5 Exemplos de segmentac
ao de imagens com o operador SMMT
5.1 Segmentacao de imagens em nveis de cinza . . . . . . . . . . . .
5.2 Aplicacao: segmentacao de celulas . . . . . . . . . . . . . . . . . .
5.2.1 Abordagem proposta . . . . . . . . . . . . . . . . . . . . .
5.2.2 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3 Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6 Abordagem toggle para binariza
c
ao multi-escala de imagens
6.1 Trabalhos relacionados . . . . . . . . . . . . . . . . . . . . . . .
6.2 Binarizacao de imagens com problemas de iluminacao . . . . . .
6.3 Binarizacao de imagens de documentos . . . . . . . . . . . . . .
6.3.1 Resultados experimentais . . . . . . . . . . . . . . . . . .
6.3.2 Abordagem multi-escala para binarizacao automatica . .
6.4 Segmentacao de movimento em vdeo . . . . . . . . . . . . . . .
6.4.1 Abordagem proposta . . . . . . . . . . . . . . . . . . . .
6.5 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.6 Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7 Um
7.1
7.2
7.3

operador de filtragem auto-dual


Operador de filtragem proposto e suas propriedades
Filtragem de rudos do tipo gaussiano e impulsivo .
Filtragem de rudo do tipo speckle . . . . . . . . . .
7.3.1 Trabalhos relacionados . . . . . . . . . . . .
7.3.2 Resultados . . . . . . . . . . . . . . . . . . .
7.3.3 Filtragem e segmentacao de imagens SAR .
7.4 Conclusoes . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.

41
42
47
50
52

.
.
.
.
.

53
54
58
59
62
66

.
.
.
.
.
.
.
.
.

67
69
71
72
73
80
81
82
83
85

.
.
.
.
.
.
.

87
89
92
95
96
97
104
105

8 Conclus
oes e trabalhos futuros
107
8.1 Trabalhos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
8.2 Trabalhos publicados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

xiv

Lista de Tabelas
5.1
5.2
5.3

Medida F-score ao considerar um u


nico segmento que melhor se ajusta ao
objeto a ser segmentado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Medida F-score ao considerar a uniao de segmentos que melhor correspondem (se sobrepoem) ao objeto a ser segmentado. . . . . . . . . . . . . . . . 56
Conjuntos de caractersticas e taxas de classificacao. . . . . . . . . . . . . . 65

6.1 Indices de Precisao e Revocacao. . . . . . . . . . . . . . . . . . . . . . . . . 80


7.1
7.2
7.3
7.4
7.5
7.6

Primitivas consideradas nos testes. . . . . . . . . . . . . . . . . . . . . . . . .

RMSE considerando o filtro toggle (rudo gaussiano). . . . . . . . . . . . .


RMSE considerando o centro morfologico (rudo gaussiano). . . . . . . . .
RMSE considerando o filtro toggle (rudo do tipo impulsivo). . . . . . . .
RMSE considerando o centro morfologico (rudo do tipo impulsivo). . . . .
RMSE medio dos resultados de filtragem das imagens da Figura 7.2 para
o filtro toggle (rudo speckle). O RMSE medio das imagens com rudo e
27.22. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.7 Valores medios da media e desvio padrao dos nveis de cinza calculados
nas regioes homogeneas para as cinco versoes corrompidas da imagem da
Figura 7.3(a). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.8 Valores medios das medidas calculadas com base nas regioes homogeneas
para as cinco versoes corrompidas da imagem da Figura 7.3(a). . . . . . . .
7.9 Valores medios da media e desvio padrao dos nveis de cinza calculados
nas regioes homogeneas para as cinco versoes corrompidas da imagem da
Figura 7.3(b). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.10 Valores medios das medidas calculadas com base nas regioes homogeneas
para as cinco versoes corrompidas da imagem da Figura 7.3(b). . . . . . . .
7.11 Valores medios da media e desvio padrao dos nveis de cinza calculados
nas regioes homogeneas para as cinco versoes corrompidas da imagem da
Figura 7.3(c). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
xv

92
94
94
94
95

98

100
100

101
101

102

7.12 Valores medios das medidas calculadas com base nas regioes homogeneas
da imagem para as cinco versoes corrompidas da imagem da Figura 7.3(c). 102
7.13 Valores medios da media e desvio padrao das regioes homogeneas para
versoes com rudo da Figura 7.3(a-c). . . . . . . . . . . . . . . . . . . . . . 103
7.14 Media das medidas para as versoes com rudo da Figura 7.3(a-c). . . . . . 103

xvi

Lista de Figuras
2.1
2.2
2.3
2.4

2.5

2.6
2.7

2.8

2.9

2.10

3.1

Diferentes formas de representacao de uma imagem: (a) binaria, (b) em


nveis de cinza e (c) superfcie topografica. . . . . . . . . . . . . . . . . .
Exemplos de elementos estruturantes planares abrangendo uma vizinhanca
3 3. O ponto branco denota o centro do elemento estruturante. . . . .
Exemplos de funcoes estruturantes nao-planares: (a) parabolica (b) conica
e (c) piramide. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exemplo de dilatacao binaria: (a) imagem original, (b) aplicacao do elemento estruturante da Figura 2.2(a) e (c) imagem dilatada (os pixels na
cor cinza foram criados). . . . . . . . . . . . . . . . . . . . . . . . . . .
Exemplo de erosao binaria: (a) imagem original, (b) aplicacao do elemento
estruturante da Figura 2.2(a) e (c) imagem erodida (os pixels na cor cinza
foram eliminados). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
(a) Imagem original, (b) dilatacao e (c) erosao de (a) utilizando um elemento estruturante quadrado de tamanho 3 3. . . . . . . . . . . . . . .
Exemplo de filtragem morfologica de uma imagem com rudo sal e pimenta:
(a) imagem original, (b) abertura (c) fechamento e (d) fechamento seguido
de abertura. Todos os exemplo utilizaram um elemento estruturante circular de raio 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exemplo de fechamento por reconstrucao: (a) imagem original, (b) dilatacao com elemento estruturante circular de raio 20 e (c) reconstrucao
geodesica por erosao utilizando (b) como imagem marcadora. . . . . . .
Ilustracao da transformada de watershed [5]: (a) imagem em nveis de
cinza, (b) representacao de (a) como uma superfcie topografica e (c)-(e)
processo de inundacao e construcao de diques. . . . . . . . . . . . . . . .
Transformada de watershed : (a) imagem original, (b) maximos regionais,
(c) segmentacao utilizando maximos como marcadores, (d) pontos que possuem um contraste maior que 15 (e) segmentacao resultante ao considerar
pontos selecionados em (d) como marcadores. . . . . . . . . . . . . . . .
Representacao multi-escala de um sinal.
xvii

. 13
. 14

. 15

. 16
. 17

. 19

. 22

. 24

. 24

. . . . . . . . . . . . . . . . . . . 28

3.2

3.3
3.4
3.5
3.6
3.7

3.8
3.9
4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.8
4.9

5.1

Exemplo de espaco-escala gaussiano: (a) sinal unidimensional aleatorio,


(b)-(e) representacao espaco-escala para escalas crescentes e (f) fingerprint
considerando maximos locais como caractersticas. . . . . . . . . . . . . .
Exemplo ilustrando a criacao de um novo maximo local ao gerar um espacoescala gaussiano em duas dimensoes [52]. . . . . . . . . . . . . . . . . .
Espaco-escala gaussiano bidimensional utilizando as escalas (desvio padrao
do n
ucleo): (a) 1, (b) 2 e (c) 4. . . . . . . . . . . . . . . . . . . . . . . .
Difusao anisotropica de uma imagem considerando diferentes coeficientes
de difusao: c1 = 20, c1 = 50 e c1 = 100. . . . . . . . . . . . . . . . . . . .
Representacao do espaco-escala MMDE. Erosao nas escalas (a) -0.5 e (b)
-0.05, (c) imagem original, dilatacao nas escalas (d) 0.05 e (e) 0.5. . . .
Representacao do espaco-escala baseado na operacao de abertura: (a) imagem original e abertura utilizando uma funcao estruturante compacta e
anti-convexa de tamanhos (b) 3 e (c) 5. . . . . . . . . . . . . . . . . . . .
Espaco-escala baseado no filtro alternado sequencial []B (f ) utilizando
funcoes estruturantes de tamanho (a) 3, (b) 5 e (c) 7. . . . . . . . . . . .
Espaco-escala gerado pela abertura por reconstrucao. . . . . . . . . . . .

. 31
. 33
. 34
. 35
. 37

. 38
. 39
. 39

Transformacao realizada pelo SMMT para diferentes quantidades de iteracoes


das primitivas: (a) 10, (b) 50 e (c) 64. . . . . . . . . . . . . . . . . . . . .
Transformacao realizada pelo SMMT para diferentes quantidades de iteracoes
das primitivas: (a) 10, (b) 50 e (c) 64. . . . . . . . . . . . . . . . . . . . .
Transformacao realizada pelo SMMT para diferentes quantidades de iteracoes
das primitivas: (a) 10, (b) 50 e (c) 64. . . . . . . . . . . . . . . . . . . . .
Simplificacao obtida pelo operador ao considerar sucessivas aplicacoes (k =
1, 3 e 5) das primitivas na escala = 1. . . . . . . . . . . . . . . . . . . . .
Transformacao do SMMT ao considerar os parametros 1 = 5 e k = (a)
1, (b) 5, (c) 10 e (d) 15. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Transformacao do SMMT ao considerar os parametros 1 = 1 e k = (a)
1, (b) 5, (c) 10 e (d) 15. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Transformacao do SMMT ao considerar os parametros 1 = (a) 15, (b)
10, (c) 5 e (d) 1 com k = 1. . . . . . . . . . . . . . . . . . . . . . . . . . .
Transformacao do SMMT ao considerar os parametros 1 = (a) 15, (b)
10, (c) 5 e (d) 1 com k = 5. . . . . . . . . . . . . . . . . . . . . . . . . . .
Transformacao do SMMT ao considerar os parametros 1 = 15 com (a)
k = 1, (b) k = 5 e 1 = 1 com (c) k = 1, (d) k = 5, . . . . . . . . . . . .

48
48
49
49
50
51
51
52
52

(a) Imagem original e simplificacoes quando utilizando (b) operador SMMT


e (c) abertura por reconstrucao (com idempotencia dos operadores). . . . . 53
xviii

5.2
5.3

5.4

5.5

5.6

5.7

5.8
5.9
5.10
5.11

5.12
5.13

5.14

6.1

Exemplo aplicacao da transformada de h-maximos. A linha pontilhada na


parte inferior da figura mostra a localizacao dos maximos [77]. . . . . . . .
Resultados para uma imagem com iluminacao nao-uniforme (variacao gaussiana): (a) imagem original, usando imagens transformadas (b) 1 = 60
e k = 1, com h = 2; (c) 1 = 60 e k = 1, com h = 10, e (d) com base na
imagem original e h = 10. . . . . . . . . . . . . . . . . . . . . . . . . . . .
Resultados de segmentacao para uma imagem com iluminacao nao-uniforme
(variacao linear) (a) imagem original, (b) usando imagem transformada
1 = 10 e k = 5, com h = 45, e (c) com base na imagem original usando
h = 45. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
(a) imagens originais, (b) segmentacao manual e resultados obtidos com
marcadores extrados (c) da imagem processada pelo SMMT e (d) da imagem original. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Melhoria na imagem gradiente apos aplicacao do operador SMMT: (a,d)
versoes original e processada, (b,e) imagens gradiente e (c,f) resultados da
segmentacao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Esquema de segmentacao do citoplasma: (a) imagem original, (b) limiarizacao para eliminacao do fundo, (c) abertura utilizando um elemento
estruturante de tamanho maior que a distribuicao de tamanho das RBC e
(d) contorno de (c) sobreposto na imagem original. . . . . . . . . . . . . .
Celulas da linha celular granuloctica: (a) mieloblasto, (b) promielocito, (c)
mielocito, (d) metamielocito, (e) neutrofilo bastonete e (f) segmentado [53].
Segmentacao do n
ucleo de WBC em imagens com um u
nico n
ucleo. . . . .
Segmentacao do n
ucleo de WBC em imagens com m
ultiplas celulas. . . . .
Exemplo de segmentacao onde o vazamento pode ser evitado com a utilizacao do operador SMMT. Resultados utilizando como marcador externo
a imagem gradiente (Sobel) da imagem (a,c) original e (b,d) processada
pelo SMMT. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Resultados de segmentacao de citoplasma. . . . . . . . . . . . . . . . . . .
Segmentacao com Normalized Cuts: (a) imagem original e resultados considerando a imagem (b) processada pelo SMMT ( 1 = 5, k = 15) e (c) a
partir da original. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Resultados com Mean Shift. (a) imagem de entrada (primeira linha: original e segunda linha: processada pelo SMMT, (b) Segmentacao e (c) bordas
da segmentacao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

54

55

55

57

60

61
62
62
63

63
63

64

64

Efeito da alteracao dos parametros no operador de binarizacao: (a) imagem


original, (b) 1 = 1 e k = 25 e (c) 1 = 40 e k = 5. . . . . . . . . . . . 68
xix

6.2

6.3

6.4

6.5

6.6

6.7

6.8

6.9
6.10

6.11
6.12
6.13
6.14
6.15

6.16

Resultados de binarizacao para imagens com diferentes condicoes de iluminacao: (a) imagens originais, (b) Otsu, (c) Niblack, (d) Gatos Gatos et
al. e (e) medias deslizantes. . . . . . . . . . . . . . . . . . . . . . . . . . .
Resultados do operador de binarizacao proposto utilizando imagens com
diferentes condicoes de iluminacao considerando como parametros (a) k =
50 e 1 = 1, (b) k = 50 e 1 = 2, (c) k = 10 e 1 = 1, (d) k = 2 e
1 = 8, (e) k = 2 e 1 = 25) e (f) k = 5 e 1 = 20. . . . . . . . . . . .
Influencia dos parametros escala e n
umero de iteracoes na binarizacao:
(a) imagem original e imagens processadas pelo operador utilizando (b)
1 = 1 e k = 1, (c) 1 = 10 e k = 1, (d) 1 = 1 e k = 10 e (e) 1 = 5
e k = 10. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Resultados de binarizacao. (a) imagem original e resultados para (b)
medias deslizantes, (c) Niblack, (d) Sauvola, (e) Gatos et al. e (f) abordagem proposta utilizando 1 = 20 e k = 5. . . . . . . . . . . . . . . . . . .
Resultados de binarizacao. (a) imagem original e resultados para (b) algoritmo de medias deslizantes (c) metodo de Gatos et al. e (d) abordagem
proposta utilizando 1 = 15 e k = 5. . . . . . . . . . . . . . . . . . . . . .
Resultados de binarizacao. (a) imagem original e resultados para (b)
medias deslizantes, (c) metodo de Gatos et al. e (d) abordagem proposta
utilizando 1 = 30 e k = 5. . . . . . . . . . . . . . . . . . . . . . . . . . .
Resultados de binarizacao. (a) imagem original e resultados para (b) Otsu,
(c) Sauvola, (d) medias deslizantes e (e) abordagem proposta para 1 = 20
e k = 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Observe que as componentes brancas no resultado de (a) medias deslizantes
nao aparecem na (b) abordagem proposta. . . . . . . . . . . . . . . . . . .
Resultados para um procedimento de OCR utilizando o software Abby [2].
(a) Imagem original e textos extrados a partir dos resultados de (b) medias
deslizantes (Figura 6.8(d)) e (c) abordagem proposta (Figura 6.8(e)). . . .
Imagens utilizadas para testes de OCR: (a) Doc 01, (b) Doc 02 e (c) Doc 03.
Resultados para o algoritmo de Sauvola. . . . . . . . . . . . . . . . . . . .
Resultados para a abordagem proposta. . . . . . . . . . . . . . . . . . . . .
Resultados de binarizacao para o algoritmo de Gatos et al.. . . . . . . . . .
Resultados de binarizacao para o algoritmo de Gatos et al. em que o
algoritmo de Sauvola e substitudo pelo operador proposto na obtencao da
estimativa inicial do texto. . . . . . . . . . . . . . . . . . . . . . . . . . . .
Abordagem multi-escala para binarizacao automatica. (a) imagem original
e resultados ao considerar (b) 5 escalas e (c) apenas a escala mais baixa. .
xx

71

72

73

74

75

76

76
77

77
78
78
79
79

80
81

6.17 Abordagem proposta: imagem de referencia do fundo (a) original e (b)


processada; quadro da sequencia (c) original e (d) processado; (e) resultado
final. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
6.18 Resultados de segmentacao para as diferentes abordagens. (a) imagem
original, (b) diferenca entre dois quadros, (c) subtracao de fundo, (d) utilizando morfologia matematica, (e) utilizando o procedimento proposto com
1 = 11 e k = 5, (f) utilizando o procedimento proposto com 1 = 11 e
k = 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
7.1

Imagens utilizadas nos experimentos: (a) original e corrompidas por rudo


do tipo (b) gaussiano e (c) impulsivo. . . . . . . . . . . . . . . . . . . . .
7.2 Testes em imagens com rudo speckle: (a) imagem original e versoes com
rudo. O RMSE e (b) 16.74, (c) 27.43 e (d) 37.51. . . . . . . . . . . . . .
7.3 Imagens originais a partir das quais foram geradas as versoes com rudo
utilizadas para avaliacao das abordagens de filtragem. . . . . . . . . . .
7.4 Analise da qualidade dos contornos: (a) imagem original e contornos estimados a partir da filtragem obtida (b,c) com o algoritmo SRAD e (d,e)
com o filtro toggle combinado com difusao anisotropica. . . . . . . . . .

xxi

. 92
. 98
. 99

. 104

Captulo 1
Introduc
ao
A area de analise e processamento de imagens abrange um grande n
umero de aplicacoes,
que envolvem desde tarefas de mais baixo nvel, como deteccao de pontos caractersticos,
ate tarefas mais especializadas, tais como segmentacao e classificacao.
Grande parte destas aplicacoes possui etapas em comum. Por exemplo, como em
geral as imagens possuem um rudo inerente, frequentemente associado ao processo de
aquisicao, e comum a aplicacao de uma etapa de pre-processamento na imagem original
antes de qualquer transformacao. Muitas vezes tal etapa nao visa somente filtrar o rudo,
mas tambem simplificar a imagem a fim de eliminar detalhes nao significativos que possam
prejudicar o resultado final.
Este trabalho tem como principal objetivo definir um conjunto de transformacoes de
imagens que possam ser utilizadas como uma etapa adicional em diversas aplicacoes,
de modo a evitar o uso de operacoes com custo computacional mais alto. Estas transformacoes utilizam como base operacoes de morfologia matematica, uma abordagem naolinear de processamento de imagens que fundamenta-se em areas tais como teoria dos
conjuntos e geometria integral. Essencialmente, sao exploradas as diferentes formas de
aplicacao de um operador toggle, cuja ideia chave consiste em associar uma imagem com
(a) um conjunto de possveis transformacoes (denominadas primitivas) i , e (b) uma regra de decisao que determina em cada pixel x o melhor valor entre os candidatos i e
f (x) [74, 75]. Aqui, a seguinte classe de operador toggle foi utilizada:

se (x) f (x) < f (x) (x),


1 ,
T (x) =
(1.1)
f (x), se (x) f (x) = f (x) (x),

2 ,
em outros casos.
Como pode-se facilmente observar, tal operador envolve duas primitivas, 1 e 2 , as
quais podem ou nao consistir em transformacoes agindo na imagem original. A regra de
decisao, por sua vez, compara em cada pixel a similaridade entre duas transformacoes
morfologicas, e , com o valor original deste.
1

Captulo 1

1.1

Principais contribui
c
oes

As principais contribuicoes deste trabalho sao as seguintes:


Abordagens multi-escala vem sendo amplamente utilizadas em diversas aplicacoes
de analise e processamento de sinais, sendo fundamentais em casos onde nao existem
informacoes preliminares sobre a escala de observacao apropriada. A ideia basica
consiste em criar uma famlia de sinais derivados, permitindo assim a analise de
diferentes nveis de representacao.
A teoria espaco-escala e uma destas abordagens. A partir dela, podem ser estabelecidas as condicoes necessarias para a definicao de transformacoes que possibilitem a
manipulacao de caractersticas presentes em diferentes nveis de maneira consistente.
Este trabalho propoe um novo operador com propriedades espa
co-escala, o
qual conduz a uma simplificacao da imagem em que detalhes indesejados sao eliminados sem comprometer de forma significativa as caractersticas de interesse. Desse
modo, e possvel identificar estruturas importantes utilizando operacoes simples,
bem como obter bons resultados de segmentacao e filtragem mesmo em imagens
com problemas de iluminacao. Alem disso, o operador e auto-dual, ou seja, o fundo
e a forma da imagem sao transformados de forma simetrica.
Diferentemente de outras abordagens, o operador espaco-escala proposto transforma
maximos e mnimos da imagem ao mesmo tempo, conduzindo a uma fusao de regioes
que a simplifica de tal forma que estruturas significativas podem ser identificadas
mesmo quando da existencia de variacoes nas condicoes de iluminacao.
Estas propriedades sao exploradas para definir uma nova opera
c
ao de limiariza
c
ao adaptativa multi-escala, na qual o conceito de escala esta relacionado a`
intensidade da transformacao realizada nos nveis de cinza da imagem.
No entanto, nenhuma destas abordagens consegue lidar adequadamente com imagens que possuem rudo distribudo de maneira uniforme, assim como e o caso para
os rudos do tipo impulsivo ou speckle, por exemplo. Neste contexto, foi proposto um
novo m
etodo de filtragem que explora a combinacao de primitivas mais adequada
ao rudo sendo considerado, tornando a abordagem adaptativa.
Alem da formalizacao das transformacoes propostas, tambem sao discutidos diversos
exemplos em que as mesmas mostraram-se de fundamental importancia para obtencao de
resultados de boa qualidade.

1.2. Organizacao da tese

1.2

Organizac
ao da tese

O texto desta tese esta organizado de modo a apresentar tanto os principais resultados
da pesquisa realizada quanto a fundamentacao teorica associada. Esta secao descreve
brevemente o conte
udo de cada captulo.

Captulo 2: Princpios basicos de processamento de imagens e morfologia


matem
atica
Este captulo traz uma breve introducao aos conceitos que se fazem necessarios para
a compreensao adequada do restante do texto. Inicialmente, sao apresentadas algumas
definicoes basicas, bem como os operadores utilizados para definir transformacoes de imagens e suas principais propriedades.
O foco principal sao as operacoes de morfologia matematica, uma teoria de processamento nao-linear de imagens introduzida na decada de 60. Originalmente desenvolvida
para analise de dados geologicos, mais especificamente da estrutura de meios porosos, esta
teoria envolve atualmente um conjunto de tecnicas utilizadas na formalizacao e solucao de
diversos problemas praticos e teoricos de processamento e analise de imagens [57, 71, 72].

Captulo 3: Teoria espaco-escala


Os principais problemas referentes ao uso de metodos multi-escala se devem `a dificuldade de relacionar informacoes significativas do sinal atraves dos diferentes nveis.
Visando evita-los, Witkin [84] propos uma nova abordagem, denominada espaco-escala,
que formaliza um conjunto de propriedades que possibilitam a manipulacao de estruturas da imagem presentes em diferentes escalas de maneira consistente. Como nesta
representacao uma caracterstica de interesse descreve um caminho contnuo, e possvel
relacionar informacoes obtidas em diferentes nveis de observacao, bem como determinar
sua localizacao precisa no sinal original.
Uma das principais propriedades desta abordagem e que a transformacao para um
nvel mais grosseiro nao introduz novas estruturas, ou seja, caractersticas pertencentes
a uma escala especfica tambem estao presentes em todas as escalas mais finas. Tais
fatos conduzem a uma simplificacao do sinal original, pois a quantidade de caractersticas
diminui e as remanescentes em um dado nvel correspondem a simplificacoes daquelas
existentes inicialmente. Este captulo discute as principais propriedades que caracterizam
um metodo espaco-escala. Alem disso, e apresentada uma breve revisao da literatura,
abrangendo desde os primeiros metodos propostos, baseados em operacoes lineares, ate
aqueles formalizados recentemente [7].

Captulo 1

Captulo 4: Um novo operador espaco-escala


Este captulo define um novo operador com propriedades espaco-escala, denominado
Self-dual Multiscale Morphological Toggle (SMMT):
Defini
c
ao 1.1. (Operador Self-dual Multiscale Morphological Toggle) Seja k1 (x) =
[B (f )]k (x), isto e, a dilatacao de f (x) com a func
ao estruturante n
ao-planar B k vezes.
k
k
ao:
De forma an
aloga, 2 (x) = [B (f )] (x). Denomina-se operador SMMT a func
k
k
k
1 (x), se 1 (x) f (x) < f (x) 2 (x),
(f g )k (x) =
f (x), se k1 (x) f (x) = f (x) k2 (x),
k
2 (x), em outros casos.

(1.2)

Como pode-se observar, as primitivas consistem nas transformacoes basicas da morfologia matematica, erosao e dilatacao, utilizando funcoes estruturantes nao-planares.
Desse modo, e possvel introduzir o conceito de escala, a qual determina a intensidade das
modificacoes realizadas na imagem. A regra de decisao analisa pontualmente qual valor
transformado esta mais proximo do original e e calculada uma u
nica vez.
Note tambem que as primitivas sao aplicadas de forma iterativa. Como discutido em
mais detalhes posteriormente, o aumento no n
umero de iteracoes e equivalente a considerar
uma regiao de maior dimensao para calculo do valor transformado de um pixel. Com isso,
estruturas mais significativas podem ser identificadas [13].

Captulo 5: Resultados de segmentacao


Este captulo ilustra alguns exemplos em que a utilizacao do operador SMMT mostrouse de fundamental importancia para a obtencao de bons resultados na segmentacao de
imagens em nveis de cinza. Isso se deve principalmente `as suas propriedades, as quais
conduzem a uma simplificacao mais significativa quando comparada `aquelas derivadas de
metodos tradicionais tais como os filtros por reconstrucao [15, 16].
Com o objetivo de comprovar as vantagens da utilizacao do operador proposto, os resultados obtidos a partir da imagem transformada e da original foram comparados entre si
e tambem com uma base segmentada manualmente. Visando uma analise mais completa,
foram consideradas inclusive imagens com iluminacao nao-uniforme, fator este que compromete o desempenho de muitos algoritmos [12]. Alem disso, a aplicacao do SMMT e
inserida como uma etapa adicional em um metodo nao-supervisionado de segmentacao de
celulas, ilustrando a importancia da analise multi-escala para simplificacao e regularizacao
dos contornos da imagem [17].

1.2. Organizacao da tese

Captulo 6: Um operador de binarizacao multi-escala


Na transformacao realizada pelo operador SMMT, maximos e mnimos da imagem
interagem ao mesmo tempo, conduzindo a uma fusao de regioes que a simplifica de tal
forma que estruturas significativas podem ser identificadas mesmo na presenca de variacoes
nas condicoes de iluminacao e alguns tipos de rudo.
Este fato, aliado `as propriedades multi-escala, e explorado para definicao de uma
nova operacao de limiarizacao adaptativa multi-escala [45]. Em resumo, as primitivas
do SMMT sao substitudas pelos valores zero e um. Assim, se o valor de um pixel esta
mais proximo do seu valor erodido atribui-se a ele zero (preto). Caso contrario, atribui-se
o valor um (branco), inclusive se a diferenca entre o seu valor erodido e dilatado for a
mesma.
Definic
ao 1.2. (Operador de binarizac
ao adaptativo multi-escala) Seja k1 (x) =
[B (f ) ]k (x), isto e, a dilatacao de f (x) com a func
ao estruturante dependente de escala
k
k
B k vezes. De forma analoga, 2 (x) = [B (f ) ] (x). O novo operador de binarizacao e
dado pela funcao:
k

(f g ) (x) =

1, se k1 (x) f (x) f (x) k2 (x),


0, em outros casos.

(1.3)

Tal operacao explora principalmente o fato que diferentes estruturas sao afetadas dependendo da escala utilizada. Quanto menor a escala, por exemplo, maior deve ser a
diferenca entre os nveis de cinza de pixels vizinhos para que os mesmos sejam alterados
por uma das primitivas. Esta caracterstica e u
til nas aplicacoes em que e necessario
extrair informacoes relacionadas a regioes em que ha uma maior variacao, tais como contornos (os quais tipicamente correspondem aos limites fsicos dos objetos).
Dependendo do objetivo especfico, diferentes combinacoes de parametros devem ser
consideradas. Enquanto escalas maiores tendem a criar regioes, escalas menores as delimitam, identificando regioes de contorno. Este captulo tambem apresenta aplicacoes
envolvendo a binarizacao de imagens de documentos [45] e a segmentacao de movimento
em vdeo [18].

Captulo 7: Um operador de filtragem auto-dual


Embora consiga lidar com problemas de iluminacao e alguns tipos de rudo, o operador
SMMT nao e robusto quando o rudo esta distribudo de maneira uniforme na imagem, tal

Captulo 1

como na presenca de rudo aditivo, por exemplo. Este fato motivou o desenvolvimento de
uma nova variacao do operador toggle (Equacao 1.1) que possua propriedades de filtragem.
Em suma, este captulo propoe uma maneira alternativa de construcao de filtros morfologicos auto-duais, estendendo os resultados validos ao considerar centros morfologicos
para uma classe diferente de operadores toggle [14]. A nova transformacao e aplicada
de forma iterativa (nao mais as primitivas) e considera um conjunto mais abrangente
de transformacoes (que sejam apropriadas para tratar o rudo em questao). Para evitar
problemas tais como oscilacoes, por exemplo, as primitivas precisam ter determinadas
propriedades, que serao discutidas com maiores detalhes no momento apropriado.
Defini
c
ao 1.3. (Filtro toggle) Seja 1 um sup-filtro e 2 um inf-filtro. Denomina-se filtro
toggle a seguinte transformacao

k
k
k
k
k
[1 (f )](x), se [1 (f )](x) f (x) < f (x) [2 (f )](x),
f k+1 (x) =
(1.4)
f k (x),
se [1 (f k )](x) f k (x) = f k (x) [2 (f k )](x),

k
[2 (f )](x), em outros casos,
em que k denota a iteracao.
Para avaliar a abordagem proposta, foram realizados testes com diferentes tipos de
rudo e conjuntos de primitivas. De forma geral, os resultados obtidos sao superiores
`aqueles definidos por filtros freq
uentemente utilizados com esta finalidade.

Captulo 8: Conclusoes
Por fim, sao apresentadas as conclusoes deste trabalho de pesquisa, bem como as
perspectivas de trabalhos futuros.

Captulo 2
Princpios b
asicos de processamento
de imagens e morfologia matem
atica
A morfologia matematica consiste em uma abordagem nao-linear de processamento de
imagens que se fundamenta em areas tais como teoria dos conjuntos e geometria integral.
Seu principal objetivo e extrair informacoes significativas de uma imagem com base na
analise da sua geometria e da forma de seus objetos. Introduzida na decada de 60,
foi originalmente desenvolvida para analise de dados geologicos, mais especificamente
da estrutura de meios porosos, representados utilizando imagens binarias. Atualmente,
envolve um conjunto de tecnicas utilizadas na formalizacao e solucao de diversos problemas
praticos e teoricos de processamento e analise de imagens [57, 71, 72].
Este captulo descreve conceitos relacionados `as areas de morfologia matematica e
processamento de imagens necessarios `a compreensao deste trabalho. Inicialmente, sao
apresentadas algumas definicoes basicas sobre imagens. Na Secao 2.2, sao discutidos os
operadores utilizados para definir transformacoes de imagens e suas principais propriedades. Na sequencia, a Secao 2.3 descreve algumas funcoes/elementos estruturantes. A
Secao 2.4 apresenta as operacoes fundamentais de morfologia matematica e algumas de
suas propriedades, e a Secao 2.5 define outras operacoes derivadas. Por fim, a Secao 2.6
trata dos operadores do tipo toggle e a Secao 2.7 do operador de watershed.

2.1

Definic
oes b
asicas de processamento de imagens

O processamento e analise de imagens e uma area que aborda um grande n


umero de
aplicacoes praticas, tais como reconhecimento de padroes e segmentacao. Tem como principais objetivos a representacao de uma imagem de maneira mais apropriada (reduzindo
o seu nvel de rudo, por exemplo) e a extracao de caractersticas significativas para o
problema especfico sendo considerado (tais como marcadores dos objetos de interesse).
7

Captulo 2

Uma imagem contnua e definida como o mapeamento de um subconjunto dos n


umeros
reais, Df , denominado suporte ou domnio de definicao de f , em um espaco de cores C [25]:
f : Df R2 C,

(2.1)

em que f e denominada funcao imagem e f (Df ) e o conjunto (ou gamute) de cores de f .


De forma geral, C Rn , com n determinando a dimensionalidade da imagem.
No entanto, para fins de processamento computacional, e preciso utilizar uma representacao discreta. Uma imagem digital pode ser definida como sendo uma imagem
contnua que foi discretizada em termos de coordenadas espaciais e valor da intensidade
no ponto, denominado pixel (picture element) [26]. Dependendo do conjunto de valores
associados a um determinado pixel, a imagem pode ser classificada de diferentes formas.
Neste trabalho, serao utilizadas apenas imagens binarias e em tons de cinza e as aplicacoes
serao restritas aos casos uni- e bidimensional.
Em uma imagem binaria, os pixels assumem os valores zero, quando pertencem ao seu
fundo, ou um, caso contrario. Mais precisamente, uma imagem binaria n-dimensional e
um mapeamento de um subconjunto dos n
umeros inteiros, Df , denominado domnio de
definicao de f , no conjunto {0, 1} [75]:
f : Df Zn {0, 1}.

(2.2)

No contexto de morfologia matematica, os objetos que compoem tais imagens sao interpretados como conjuntos. A imagem ilustrada na Figura 2.1(a), por exemplo, pode ser
analisada considerando apenas o conjunto dos pixels de valor um (brancos).
Por outro lado, para imagens em nveis de cinza o intervalo dos valores que podem ser
atribudos a um pixel e estendido ao conjunto dos inteiros nao-negativos. Formalmente,
uma imagem em nveis de cinza e o mapeamento de um subconjunto dos n
umeros inteiros,
Df , denominado domnio de definicao de f , em um conjunto finito e limitado dos inteiros
nao-negativos [75]:
f : Df Zn {0, 1, . . . , tmax },
(2.3)
em que tmax , representando o valor maximo que pode ser associado a um pixel, depende
do tipo de dados utilizado e e dado por tmax = 2n 1, com n representando o n
umero
de bits. Uma imagem de 8 bits, por exemplo, possui valores variando de 0 a 255. A
Figura 2.1(b) mostra um exemplo.
Na definicao de determinadas transformacoes de morfologia matematica, uma imagem
em nveis de cinza e interpretada como uma superfcie topografica, onde o valor de um
pixel representa a sua altura [75]. Tal representacao, ilustrada na Figura 2.1(c), utiliza
conceitos como pico (ponto de maximo), vale (ponto de mnimo), plato (zona plana) e
watershed (contorno de uma regiao) da funcao imagem.

2.2. Transformacoes de imagens e operadores

(a)

(b)

(c)

Figura 2.1: Diferentes formas de representacao de uma imagem: (a) binaria, (b) em nveis
de cinza e (c) superfcie topografica.

2.2

Transformaco
es de imagens e operadores

Uma transformacao e classificada como de imagem para imagem se ela preserva o mesmo
domnio de definicao que a imagem inicial e se mantem um mapeamento deste no conjunto
dos n
umeros inteiros nao-negativos [75]. O exemplo mais trivial e o operador identidade,
I, o qual nao altera os valores iniciais dos pixels:
I(f ) = f.

(2.4)

Outra transformacao amplamente utilizada e a limiarizacao. Ela consiste, por exemplo,


em alterar o valor de um determinado pixel para um, caso seu nvel de cinza pertenca a
um determinado intervalo de valores, ou para zero, caso contrario. Formalmente:

1, se ti f (x) tj ,
[T[ti ,tj ] (f )](x) =
(2.5)
0, em outros casos.
Observe que, neste caso, o resultado depende apenas do pixel sobre analise. As transformacoes morfologicas, por outro lado, embora tambem sejam classificadas como sendo
de imagem para imagem, consideram os valores dos nveis de cinza na vizinhanca do
pixel em questao para calculo do seu valor transformado. Portanto, faz-se necessario um
conjunto de operadores que possam ser utilizados na definicao de tais transformacoes.
Conforme mencionado anteriormente, uma das bases da morfologia matematica e a
teoria de conjuntos, onde as operacoes basicas sao a uniao, , e a interseccao, . Quando
imagens em nveis de cinza sao consideradas, tais operacoes sao representadas pelos operadores de maximo e mnimo pontual, respectivamente [35, 72].

10

Captulo 2

Dadas duas imagens, f e g, com o mesmo domnio de definicao, as operacoes de


maximo e mnimo pontual sao dadas por:

(f g)(x) = max{f (x), g(x)},
(2.6)
(f g)(x) = min{f (x), g(x)}.
O complemento, por sua vez, e definido da seguinte forma [75]:
f c (x) = tmax f (x),

(2.7)

em que tmax representa o valor maximo que pode ser atribudo a um pixel de acordo com
o tipo de dados da aplicacao. O negativo de uma transformacao, denotada aqui por , e
dado por:
(f ) = [(f c )]c .
(2.8)
A translacao horizontal de uma imagem f por um vetor b, denotada por fb , substitui o
valor original do pixel na posicao x pelo valor existente na posicao transladada horizontalmente pelo vetor, isto e:
fb (x) = f (x + b).
(2.9)
De forma geral, as transformacoes morfologicas podem ser definidas utilizando combinacoes das operacoes de maximo e mnimo pontual, complemento e translacao.
As relacoes de ordem da teoria de conjuntos (representadas pela operacao de inclusao)
tambem sao estendidas para imagens em nveis de cinza. Dadas duas imagens, f e g,
com o mesmo domnio de definicao, f e dita menor que g se, considerando posicoes
correspondentes, os valores dos pixels de f sao menores que os de g [75]:
f g f (x) g(x).

(2.10)

Esta relacao de ordem e definida para transformacoes de maneira analoga. Uma transformacao e menor ou igual a uma transformacao se, e somente se, para qualquer
imagem f , o valor transformado (f ) e menor ou igual a (f ):
(f ) (f ).

(2.11)

Propriedades das transformac


oes de imagens
Transformacoes de imagens podem ser caracterizadas atraves de propriedades algebricas
e topologicas, as quais permitem definir aspectos do seu comportamento que sao fundamentais para determinar sua aplicabilidade em um problema especfico. A seguir, serao
apresentadas brevemente algumas das propriedades basicas que podem ser associadas `as
transformacoes (inclusive morfologicas) de imagens [29, 72, 75].

2.2. Transformacoes de imagens e operadores

11

1. Idempot
encia: Uma transformacao e dita idempotente se, ao repeti-la mais de
uma vez na mesma imagem, o resultado permanece inalterado, ou seja, e equivalente
aplica-la uma ou n vezes:
(n) = ,
(2.12)
em que (n) denota a n-esima iteracao da transformacao, (n) = (n1) . Quando
aplicadas iterativamente, algumas transformacoes morfologicas utilizam esta propriedade como criterio de parada. Outras dependem dela para evitar problemas tais
como oscilacoes.
2. Extensividade: Uma transformacao e extensiva se a imagem transformada e
maior ou igual `a imagem original:
(f ) f.

(2.13)

3. Anti-extensividade: De maneira analoga, uma transformacao e anti-extensiva


se a imagem transformada e menor ou igual `a imagem original:
(f ) f.

(2.14)

4. Crescente: Uma transformacao e dita crescente se ela preserva a relacao de


ordem entre imagens:
f g (f ) (g).
(2.15)
5. Dualidade: Duas transformacoes e sao duais se:
(f ) = (f ) (f ) = [(f c )]c ,

(2.16)

em que c denota o operador complemento e o negativo. Em outras palavras, duas


operacoes e sao duais se aplicar em uma imagem f e equivalente a tomar
o complemento da aplicacao de no complemento de f . Algumas propriedades de
transformacoes duais podem ser herdadas, tais como:
idempotente idempotente;
crescente crescente;
anti-extensiva extensiva;
extensiva anti-extensiva.
6. Auto-dualidade: Uma transformacao e auto-dual se:
= ,

(2.17)

12

Captulo 2

em que, novamente, o smbolo denota o negativo. Observe que, neste caso, ha um


tratamento simetrico do fundo e da forma, considerando que aplicar a transformacao
auto-dual em uma imagem f e equivalente a realizar o complemento da aplicacao
de no complemento de f , (f ) = [(f c )]c .
7. Complementaridade: Duas transformacoes e sao complementares se aplicar
em uma imagem e equivalente a aplicar no complemento desta imagem:
(f ) = (f c ),

(2.18)

em que o smbolo c denota o complemento. Por outro lado, uma transformacao


e dita auto-complementar se
(f ) = (f c ),
(2.19)
ou seja, se a transformacao consiste no seu proprio operador complementar.
8. Homotopia: Duas transformacoes e sao homotopicas se ambas possuem a
mesma arvore homotopica, o que equivale a possuir a mesma estrutura geometrica.

2.3

Elementos e func
oes estruturantes

Para se extrair informacoes relativas aos objetos de uma imagem de forma precisa, e
fundamental determinar adequadamente a vizinhanca que sera considerada no calculo do
valor transformado de cada pixel. Isso depende da escolha apropriada de um elemento de
base - um elemento estruturante no caso binario, ou funcao estruturante para imagens em
nveis de cinza - o qual, de maneira simplificada, define o tamanho e a forma da regiao a
ser considerada por uma transformacao morfologica.
Tais elementos podem ser classificadas em duas categorias: planares, onde todas as
posicoes possuem o valor zero, ou nao-planares, quando os valores associados podem
ser distintos, definindo uma altura para a funcao estruturante. Tais valores podem ser
interpretados como pesos dados `as diferentes direcoes consideradas [36].
A Figura 2.2 ilustra alguns elementos estruturantes planares abrangendo uma vizinhanca 3 3, sendo que a escolha do mais apropriado depende da informacao que se
deseja extrair. Estruturas diagonais, por exemplo, podem ser exploradas atraves por
meio do elemento estruturante ilustrado na Figura 2.2(c).
Embora amplamente utilizadas, devido principalmente `a facilidade de implementacao e
resultados satisfatorios em muitos casos, as funcoes estruturantes planares nao conseguem
extrair algumas propriedades especficas das imagens. Por exemplo, seu uso transforma
as regioes em torno de maximos e mnimos locais em regioes planas, podendo causar o
deslocamento da sua posicao e constituindo um problema para diversas aplicacoes [35].

2.3. Elementos e funcoes estruturantes

(a)

13

(b)

(c)

Figura 2.2: Exemplos de elementos estruturantes planares abrangendo uma vizinhanca


3 3. O ponto branco denota o centro do elemento estruturante.

Nestes casos, pode-se utilizar as funcoes estruturantes nao-planares, denotadas aqui por
B , as quais possuem o seguinte formato:
B (x) = ||B|(||1 x) x B , 6= 0.

(2.20)

Para garantir um comportamento de escala condizente, B deve satisfazer a determinadas


condicoes [36].

0,
se x = 0,
|| 0 B (x)
, em outros casos.
0 < |1 | < |2 | B1 (x) B2 (x) x B1 .

(2.21)

|| B (x) 0.
Tais condicoes exigem que B seja uma funcao monotonicamente decrescente ao longo
de qualquer direcao radial a partir da origem (ou seja, anti-convexa). Para evitar deslocamento de nveis e translacao horizontal, as seguintes condicoes tambem devem ser
observadas [36]:
sup {B (t)} = 0 e B (0) = 0.
(2.22)
tB

As funcoes estruturantes nao-planares podem ser utilizadas na definicao de transformacoes morfologicas dependentes de escala, as quais permitem a analise de diferentes
nveis de representacao, fator essencial para lidar adequadamente com a natureza multiescala das imagens. Devido `a sua importancia para este trabalho, tais aspectos serao
discutidos com mais detalhes no proximo captulo.
Uma classe importante de tais funcoes discutida na literatura e representada pelas
funcoes estruturantes quadraticas [79]. Os paraboloides, por exemplo, possuem boas propriedades de segunda derivada e separabilidade, possibilitando uma implementacao computacionalmente eficiente [35]. Pode-se mostrar que uma funcao estruturante nao-planar

14

Captulo 2

pode ser derivada a partir de qualquer funcao estruturante concava [70]. A Figura 2.3
ilustra tres exemplos.

(a)

(b)

(c)

Figura 2.3: Exemplos de funcoes estruturantes nao-planares: (a) parabolica (b) conica e
(c) piramide.
Neste trabalho, foram utilizadas as funcoes estruturantes parabolica e piramide, sendo
esta u
ltima definida por:
B (x, y) = ||1 max{|x|, |y|}.

(2.23)

Esta funcao gera um elemento estruturante em que cada posicao e associada `a sua
distancia do centro. Tal caracterstica facilita a visualizacao e/ou descricao de alguns
dos resultados teoricos deste trabalho.

2.4

Operac
oes b
asicas de morfologia matem
atica

A erosao e a dilatacao sao as operacoes fundamentais da morfologia matematica, constituindo a base para a definicao de transformacoes mais complexas [29, 57, 72, 75]. Para
imagens binarias, a dilatacao dos pontos da forma, X, por um elemento estruturante B,
denotada por B (X), e definida como o conjunto de pontos x tal que B intercepta X
quando sua origem esta centrada em x:
B (X) = {x | Bx X 6= },

(2.24)

em que Bx denota a translacao do centro do elemento estruturante B para a posicao


x. Tal formulacao corresponde `a pergunta o elemento estruturante toca o conjunto?,
e e ilustrada na Figura 2.4. Esta equacao deriva da operacao de teoria dos conjuntos
denominada soma de Minkowski:
[
(X B) = {x + b : x X, b B} =
Xb ,
(2.25)
bB

2.4. Operacoes basicas de morfologia matematica

(a)

(b)

15

(c)

Figura 2.4: Exemplo de dilatacao binaria: (a) imagem original, (b) aplicacao do elemento
estruturante da Figura 2.2(a) e (c) imagem dilatada (os pixels na cor cinza foram criados).

a qual possui interessantes propriedades, tais como comutatividade e invariancia `a translacao.


De maneira analoga, a erosao de um conjunto X por um elemento estruturante B,
B (X), e definida como o conjunto de pontos x tal que B esta includo em X quando sua
origem esta centrada em x:
B (X) = {x | Bx X},
(2.26)
em que, novamente, Bx denota a translacao do centro do elemento estruturante B para
a posicao x. Esta formulacao, ilustrada na Figura 2.5, equivale `a pergunta o elemento
estruturante cabe no conjunto? e deriva da subtracao de Minkowski, definida como:
\
(X B) =
Xb .
(2.27)
bB

As operacoes de soma e subtracao de Minkowski (Equacoes 2.25 e 2.27) podem ser


estendidas para imagens em nveis de cinza utilizando as definicoes de maximo e mnimo
pontual, apresentadas anteriormente na Secao 2.2:
_
fb
(2.28)
(f B) =
bB

e
(f B) =

fb .

(2.29)

bB

Em resumo, o resultado das operacoes e dado pelo valor maximo (mnimo) encontrado
nas posicoes de f transladadas pelos vetores b.
Portanto, as operacoes de dilatacao e erosao para imagens em nveis de cinza podem ser definidas em termos do maximo e mnimo na vizinhanca definida pelo elemento
estruturante transladado:

16

Captulo 2

(a)

(b)

(c)

Figura 2.5: Exemplo de erosao binaria: (a) imagem original, (b) aplicacao do elemento
estruturante da Figura 2.2(a) e (c) imagem erodida (os pixels na cor cinza foram eliminados).

Defini
c
ao 2.1. (Dilatacao) A dilatacao de uma imagem f pela func
ao estruturante planar
B, [B (f )](x), e dada por [75]:
[B (f )](x) = max{f (x + b)},
bB

(2.30)

ou seja, o valor dilatado de um pixel x e o m


aximo na vizinhanca definida por B.
Defini
c
ao 2.2. (Erosao) A erosao de uma imagem f pela func
ao estruturante planar B,
[B (f )](x), e dada por [75]:
[B (f )](x) = min{f (x + b)},
bB

(2.31)

ou seja, o valor erodido de um pixel x e o mnimo na vizinhanca definida por B.


A Figura 2.6 mostra as versoes dilatada e erodida de uma imagem utilizando o elemento
estruturante ilustrado na Figura 2.2(b).
Quando funcoes estruturantes nao-planares sao utilizadas, as operacoes de erosao e
dilatacao sao definidas da seguinte forma:
Defini
c
ao 2.3. (Dilatacao) A dilatacao de uma imagem f pela func
ao estruturante B (x),
[B (f ) ](x), e dada por [75]:
[B (f )](x) = max{f (x + b) + B (b)}.
bB

(2.32)

Defini
c
ao 2.4. (Erosao) A erosao de uma imagem f pela func
ao estruturante B (x),
[B (f ) ](x), e dada por [75]:
[B (f )](x) = min {f (x + b) B (b)}.
bB

(2.33)

2.4. Operacoes basicas de morfologia matematica

(a)

(b)

17

(c)

Figura 2.6: (a) Imagem original, (b) dilatacao e (c) erosao de (a) utilizando um elemento
estruturante quadrado de tamanho 3 3.
As operacoes de dilatacao e erosao tambem podem ser definidas atraves do conceito
de adjuncao [29], levando a uma abordagem matematica mais consistente em termos de
operacoes algebricas. Uma discussao detalhada desta abordagem pode ser encontrada
em [29, 72].
As principais propriedades da dilatacao sao sumarizadas a seguir [27, 29, 35]:
1. Comutatividade: b (X) = x (B);
2. Associatividade: C (B) (A) = C (B (A));
3. Extensiva: b (X) X se o elemento estruturante contem sua origem;
4. Decomposic
ao: bc (X) = b (X) c (X) e bc (X) = b (X) c (X).
A erosao, por sua vez, satisfaz as seguintes propriedades:
1. N
ao-comutatividade: b (X) 6= x (B);
2. N
ao-associatividade: No entanto, a seguinte relacao e verdadeira: C (B (A)) =
C (B) (A);
3. Anti-extensiva: b (X) X se o elemento estruturante contem sua origem;
4. Decomposic
ao: bc (X) = b (X) c (X) e bc (X) = b (X) c (X).
Juntamente com a associatividade, as propriedades relacionadas `a decomposicao permitem a definicao de formas de implementacao eficientes, explorando conceitos tais como
separabilidade. Alem disso, as duas transformacoes sao invariantes `a translacao e preservam a homotopia da imagem original. Ambas tambem sao crescentes, implicando

18

Captulo 2

assim que, se X Y , entao b (X) b (Y ) e b (X) b (Y ). Pode-se tambem verificar


facilmente que as operacoes de erosao e dilatacao sao duais, ou seja:
B (X) = [B (X c )]c ,

(2.34)

em que c denota o complemento. Entretanto, elas nao sao auto-duais nem consistem em
transformacoes inversas uma da outra, isto e, X 6= B [B (X)].
Algumas destas propriedades podem ser visualizadas na Figura 2.6. Observe que,
enquanto a erosao diminui as regioes escuras da imagem e expande as claras, a dilatacao
faz o contrario (anti-extensividade e extensividade). Este comportamento tambem mostra
o efeito dual das transformacoes.
importante ressaltar que as propriedades apresentadas podem ser estendidas para
E
imagens em nveis de cinza de forma direta, substituindo-se os operadores de teoria dos
conjuntos pelos seus equivalentes para funcoes. Uma discussao mais detalhada sobre tais
aspectos pode ser encontrada em [27, 29, 71, 75].

2.5

Outras transforma
c
oes morfol
ogicas

As operacoes de erosao e dilatacao possuem algumas limitacoes mas, se combinadas de


modo apropriado, resultam em transformacoes morfologicas mais robustas. A erosao,
por exemplo, alem de eliminar pequenas estruturas, tambem causa a reducao de todas
as outras. No entanto, se uma dilatacao for aplicada na imagem erodida, parte das
estruturas perdidas sera recuperada. Tal procedimento, de aplicar uma erosao seguida de
uma dilatacao, define uma nova transformacao denominada abertura [75]:
B (f ) = B [B (f )],

(2.35)

denota o transposto de B, B
= {b | b B}. O uso de B
torna o resultado
em que B
da transformacao independente da posicao de origem do elemento estruturante, mesmo
quando este nao e simetrico.
O fechamento, que consiste em uma dilatacao seguida de uma erosao, tende a recuperar
de maneira aproximada a forma inicial das estruturas da imagem que foram dilatadas [75]:
B (f ) = B [B (f )],

(2.36)

denota o transposto de B.
em que, novamente, B
As operacoes de abertura e fechamento sao duais e ambas sao crescentes e idempotentes. Alem disso, a abertura e anti-extensiva e atua sobre as estruturas claras, enquanto
que o fechamento e extensivo e em termos visuais atua sobre as estruturas escuras da

2.5. Outras transformacoes morfologicas

19

imagem. Ambas nao preservam a homotopia da imagem original e podem usar tanto
funcoes estruturantes planares quanto nao-planares.
Transformacoes crescentes e idempotentes caracterizam os denominados filtros morfologicos, uma abordagem nao-linear que conduz tanto a recuperacao de imagens com
rudo quanto a remocao de estruturas ou objetos especficos de uma imagem segundo
criterios tais como geometria ou contraste [75]. Por ser uma transformacao crescente,
a relacao de ordem das imagens filtradas e preservada, possibilitando assim a sua comparacao. A idempotencia garante a estabilidade da operacao, evitando problemas como
a oscilacao, por exemplo.
Desde a sua introducao em 1988, a teoria de filtragem morfologica vem sendo amplamente explorada, envolvendo desde a definicao de diferentes formas de construcao com
propriedades adicionais, tais como auto-dualidade, ate a utilizacao de filtros em que a
condicao de idempotencia e apenas parcialmente satisfeita. Tais filtros, denominados
filtros derivados [29], serao abordados com mais detalhes no Captulo 7.
A Figura 2.7 ilustra a aplicacao das operacoes de abertura e fechamento (que consistem nos filtros morfologicos mais basicos) em uma imagem com rudo do tipo sal-epimenta (Figura 2.7(a)). Observe que, como nenhuma delas satisfaz a propriedade de
auto-dualidade, nao ha um tratamento simetrico das estruturas claras e escuras da imagem (Figuras 2.7(b) e (c)). Este problema pode ser minimizado combinando-se as duas
operacoes (Figura 2.7(d)).

(a)

(b)

(c)

(d)

Figura 2.7: Exemplo de filtragem morfologica de uma imagem com rudo sal e pimenta:
(a) imagem original, (b) abertura (c) fechamento e (d) fechamento seguido de abertura.
Todos os exemplo utilizaram um elemento estruturante circular de raio 3.

Observe que, dependendo do nvel de rudo presente na imagem, apenas uma iteracao
pode nao ser suficiente para uma filtragem adequada, considerando-se a presenca de rudos
de diferentes escalas. Neste caso, mesmo a utilizacao de um elemento estruturante de
maior dimensao pode prejudicar o resultado final, eliminando estruturas importantes.

20

Captulo 2

Uma solucao consiste em aplicar aberturas e fechamentos de forma alternada usando elementos estruturantes de tamanho crescente. Tal procedimento define um filtro alternado
sequencial.
Defini
c
ao 2.5. (Filtro alternado sequencial) Seja (f B i ) uma abertura com elemento
estruturante de tamanho i e (f B i ) um fechamento de tamanho i. Considere tambem as
seguintes combinacoes, as quais constituem filtros morfol
ogicos [75]:
mi = (f B i ) B i ,

ri = ((f B i ) B i ) B i ,

ni = (f B i ) B i ,

si = ((f B i ) B i ) B i .

Um filtro alternado sequencial de tamanho i e definido como a combinac


ao de um destes
filtros, com o tamanho do elemento estruturante variando de um ate i:
Mi = m i . . . m 2 m 1 ,
Ni = n i . . . n 2 n 1 ,

Ri = r i . . . r 2 r 1 ,
Si = si . . . s2 s1 .

Embora nao sejam necessariamente auto-duais, os filtros alternados sequenciais conduzem a um tratamento mais simetrico das estruturas da imagem do que quando as
operacoes de abertura e fechamento sao utilizadas individualmente. Outra desvantagem
de tais operacoes e que elas causam o deslocamento dos contornos [33, 72], o que pode
prejudicar o desempenho de tarefas de mais alto nvel que dependem da localizacao exata
destes.
Para evitar este problema, pode-se considerar filtros por reconstrucao, os quais recuperam apenas a estrutura das componentes nao eliminadas na etapa inicial de filtragem,
preservando assim sua informacao de contorno. Dois destes filtros frequentemente utilizados sao apresentados a seguir [75].
A abertura por reconstrucao consiste em uma erosao seguida por uma reconstrucao
morfologica por dilatacao, ou seja [75]:
(n)

R (f ) = Rf [(f )],

(2.37)

em que (f ) denota a erosao de f com um elemento estruturante de tamanho n e


(i)

Rf ([(f )]) = f ([(f )])

(2.38)

(i)

e a reconstrucao morfologica por dilatacao, em que f ([(f )]) representa a i-esima dilatacao geodesica da imagem marcadora [(f )] utilizando f como imagem mascara:
(i)

f ([(f )]) = (i) ([(f )]) f,

(2.39)

2.5. Outras transformacoes morfologicas

21

ou seja, e o mnimo pontual entre a imagem mascara e a i-esima dilatacao de tamanho n


da imagem marcadora. O ndice i representa a iteracao onde a idempotencia e atingida,
isto e, (i) ([(f )]) = (i+1) ([(f )]).
Em resumo, pode-se afirmar que a reconstrucao por dilatacao de [(f )] com relacao a
f , tal que D[(f )] = Df e [(f )] f , e definida como a dilatacao geodesica de [(f )] com
relacao `a f ate a estabilidade.
O fechamento por reconstrucao, que consiste em uma dilatacao seguida por uma reconstrucao morfologica por erosao, e definido por dualidade [75]:
(n)

R (f ) = Rf? [(f )],

(2.40)

em que (f ) denota a dilatacao de f com um elemento estruturante de tamanho n e


(i)

Rf? [(f )] = f ([(f )])

(2.41)

(i)

e a reconstrucao morfologica por erosao em que f ([(f )]) representa a i-esima erosao
geodesica de f utilizando [(f )] como imagem marcadora:
(i)

f ([(f )]) = (i) ([(f )]) f,

(2.42)

ou seja, e o maximo pontual entre a imagem mascara e a i-esima dilatacao de tamanho n


da imagem marcadora. O ndice i representa novamente a iteracao onde a idempotencia
e atingida, isto e, (i+1) ([(f )]) = (i) ([(f )]).
(i)
De maneira analoga ao caso anterior, f ([(f )]) representa a erosao geodesica de
[(f )] utilizando f com imagem mascara e i representa a iteracao onde a idempotencia e
atingida, isto e, ([ (i) (f )]) = (i+1) ([(f )]).
A Figura 2.8 ilustra um exemplo de fechamento por reconstrucao. Observe na Figura 2.8(c) que apenas as componentes que nao foram eliminadas pela dilatacao (Figura 2.8(b)) foram reconstrudas.
Em alguns casos especficos, a aplicacao de uma mesma operacao em todos os pixels
de uma imagem pode nao conduzir a resultados satisfatorios. Nestas situacoes, podese utilizar as transformacoes adaptativas, que modificam os pixels de diferentes formas,
segundo criterios pre-estabelecidos que levam em consideracao informacoes tais como os
valores dos nveis de cinza na vizinhanca definida pelo elemento estruturante, por exemplo.
Tais transformacoes podem ser definidas atraves de operadores do tipo toggle, discutidos
na proxima secao.

22

Captulo 2

(a)

(b)

(c)

Figura 2.8: Exemplo de fechamento por reconstrucao: (a) imagem original, (b) dilatacao
com elemento estruturante circular de raio 20 e (c) reconstrucao geodesica por erosao
utilizando (b) como imagem marcadora.

2.6

Operadores do tipo toggle

Em transformacoes do tipo toggle, a ideia central consiste em associar uma imagem com
(a) um conjunto de possveis transformacoes (primitivas) i , e (b) uma regra de decisao
que determina em cada pixel x o melhor valor entre os candidatos i [74, 75].
Defini
c
ao 2.6. [74] Denomina-se mapeamento toggle das primitivas (i ) qualquer mapeamento tal que:
1. em cada ponto x, x e igual a i ou f (x),
2. no mapeamento toggle , o criterio que transforma uma das primitivas i em um
dado ponto x depende somente das primitivas i , no valor numerico f (x) e em
possveis constantes,
3. se no ponto x ao menos uma das primitivas i coincide com o mapeamento identidade f (x), entao
x = f (x).
(2.43)
Um exemplo simples de operador do tipo toggle e a limiarizacao binaria, em que a
regra de decisao envolve, no ponto x, o valor f (x) e um limiar. Neste caso, as primitivas
sao o branco e o preto, ambas independentes de f (x).
Contudo, primitivas tambem podem consistir em transformacoes agindo na imagem
original, como ocorre nos centros morfologicos, por exemplo. A definicao de centro morfologico, , para uma famlia de primitivas i deriva de [74]:
= (I ) = (I ) ,

(2.44)

2.7. Transformada de watershed

23

com = i e = i , onde representa o maximo pontual e representa o mnimo.


Ao considerar apenas duas primitivas, o centro morfologico e equivalente `a mediana [74], uma transformacao nao-linear freq
uentemente utilizada para filtragem de rudo
devido a suas propriedades de preservacao de bordas. No entanto, alem de nao ser idempotente, sua aplicacao consecutiva pode desfazer mudancas e causar oscilacoes [30]. Heijmans [31] utilizou o centro morfologico para construir operadores auto-duais e, subseq
uentemente, filtros auto-duais.
Outro exemplo de operador do tipo toggle e dado a seguir. Dadas duas primitivas, 1
e 2 , a regra de decisao escolhe como valor transformado aquele que mais se aproxima do
valor original do pixel sendo analisado.

1 (x), se 1 (x) f (x) < f (x) 2 (x),


T (x) =
f (x), se 1 (x) f (x) = f (x) 2 (x),

2 (x), em outros casos.

(2.45)

Neste trabalho, esta classe de operadores e explorada para a definicao de diferentes transformacoes, com aplicacoes em segmentacao, filtragem e analise multi-escala de imagens.
Nos captulos 3-7 os resultados obtidos sao apresentados de forma mais detalhada.

2.7

Transformada de watershed

Basicamente, um procedimento de segmentacao consiste em particionar uma imagem em


um conjunto de regioes homogeneas e nao-sobrepostas, as quais devem corresponder a
objetos da imagem significativos para uma certa aplicacao. Uma segmentacao precisa e
essencial para um grande n
umero de aplicacoes de processamento de imagens, tais como
reconhecimento e representacao.
No contexto de morfologia matematica, a segmentacao de imagens em nveis de cinza
e tipicamente realizada da seguinte forma. Primeiramente, sao extrados marcadores
das estruturas significativas da imagem, e entao a transformada denominada wastershed

(Linha Divisora de Aguas)


[6, 75] e utilizada para obter os contornos de tais estruturas da
forma mais precisa possvel. A seguir, sao apresentadas as ideias principais do metodo.
Considere uma imagem em tons de cinza representada como uma superfcie topografica,
assim como ilustrado anteriormente na Figura 2.1(c). Assuma que cada mnimo desta superfcie corresponda a uma perfuracao e que ela e colocada na agua verticalmente a uma
velocidade constante. Iniciando no mnimo de menor altitude, a agua ira progressivamente preencher as bacias da imagem (Figura 2.9). O conjunto de diques construdos nos
lugares em que dois fluxos de agua distintos se encontram, representando a particao das
bacias da imagem original, e denominado watershed.

24

Captulo 2

(a)

(b)

(c)

(d)

(e)

Figura 2.9: Ilustracao da transformada de watershed [5]: (a) imagem em nveis de cinza,
(b) representacao de (a) como uma superfcie topografica e (c)-(e) processo de inundacao
e construcao de diques.

Os limites das bacias de uma imagem em nveis de cinza tambem podem ser interpretados como as zonas de influencia dos seus mnimos regionais. Neste sentido, a transformada de watershed e o esqueleto por zonas de influencia dos mnimos da imagem [75].
No entanto, extremos (freq
uentemente utilizados como marcadores) podem corresponder
a estruturas nao-significativas ou rudo, causando super-segmentacao.
Para evitar este problema, uma alternativa e selecionar os extremos segundo algum
criterio, tal como contraste, area das regioes e assim por diante. A Figura 2.10 ilustra um
exemplo. A utilizacao de todos os maximos locais como marcadores provoca uma supersegmentacao (Figura 2.10(c)). Se somente pontos que possuem um contraste maior que 15
forem utilizados como marcadores, um resultado mais preciso e obtido (Figura 2.10(e)).

(a)

(b)

(c)

(d)

(e)

Figura 2.10: Transformada de watershed : (a) imagem original, (b) maximos regionais, (c)
segmentacao utilizando maximos como marcadores, (d) pontos que possuem um contraste
maior que 15 (e) segmentacao resultante ao considerar pontos selecionados em (d) como
marcadores.

2.8. Conclusoes

2.8

25

Conclus
oes

Transformacoes de imagens sao amplamente utilizadas em diversas aplicacoes, consistindo desde etapas de pre-processamento ate procedimentos completos. Este captulo
apresentou alguns exemplos, bem como uma breve revisao de conceitos necessarios ao entendimento do restante do texto. Uma maior enfase foi dada `as operacoes de morfologia
matematica, as quais constituem a base das transformacoes propostas neste trabalho.
No entanto, e preciso considerar tambem a analise de diferentes nveis de representacao,
a qual vem sendo amplamente utilizada para lidar com a natureza multi-escala das imagens. Atraves de tais abordagens, e possvel extrair as caractersticas de interesse que se
tornam explcitas em cada nvel. Diversas formulacoes foram propostas, tais como wavelets, decomposicao piramidal e espaco-escala, esta u
ltima o foco principal deste trabalho.
O proximo captulo discute em detalhes suas principais propriedades.

Captulo 3
Teoria espaco-escala
3.1

Introduc
ao

Ao se extrair caractersticas de interesse de uma imagem, e de extrema importancia considerar que determinadas informacoes apenas fazem sentido sob certas condicoes de observacao. Um exemplo tpico e que a analise do galho de uma arvore deve ser realizada
a uma distancia variando de alguns centmetros a alguns metros. Para a medida de
quilometros, e mais apropriado analisar uma floresta, por exemplo. Este fato esta relacionado ao conceito de escala.
A uma imagem digital pode-se associar, em princpio, as escalas externa e interna,
correspondendo ao seu tamanho e `a sua densidade de amostragem, respectivamente. Entretanto, no contexto deste trabalho, o termo escala refere-se aos diferentes tipos de estruturas presentes em uma imagem. Em outras palavras, dependendo da relacao entre o
tamanho de tais estruturas e o tamanho (e forma de aplicacao) dos operadores utilizados
nas transformacoes, diferentes informacoes se tornam explcitas.
Contudo, a escolha da escala de observacao mais adequada nao e uma tarefa trivial.
Embora ela seja conhecida em certas situacoes especficas, como no caso de uma intervencao por parte de um especialista, por exemplo, isso nao e possvel na maioria dos
demais casos. Este problema motivou o desenvolvimento das abordagens multi-escala,
amplamente utilizadas em diversas aplicacoes de analise e processamento de sinais. A
ideia basica consiste em criar uma famlia de sinais derivados cujas estruturas sao sucessivamente eliminadas, definindo assim um conjunto de sinais simplificados. Desta forma, e
possvel analisar os diferentes nveis de representacao e utilizar aqueles que exibem apenas
as caractersticas de interesse (Figura 3.1).

27

28

Captulo 3

Figura 3.1: Representacao multi-escala de um sinal.

Os principais problemas referentes ao uso de metodos multi-escala se devem `a dificuldade de relacionar informacoes significativas do sinal atraves dos diferentes nveis.
Em [84], Witkin propos uma nova abordagem, denominada espaco-escala, na qual uma
caracterstica de interesse descreve um caminho contnuo na representacao, possibilitando
que estruturas da imagem presentes em diferentes escalas possam ser manipuladas de
maneira consistente. Assim, e possvel relacionar informacoes obtidas em diferentes nveis
de observacao, bem como determinar sua localizacao precisa no sinal original.
Um questionamento que pode surgir e por que representar em m
ultiplos nveis uma
informacao que ja esta presente no sinal original. Uma das principais razoes e que a
simplificacao sucessiva remove detalhes indesejados, tais como como rudo ou estruturas insignificantes, facilitando o processamento de tarefas futuras. Em uma aplicacao de
reconhecimento de objetos ou rastreamento em vdeo, por exemplo, e de fundamental
importancia que a sequencia de imagens considerada nao possua artefatos que possam
comprometer o resultado final. Neste caso, a utilizacao de uma imagem na escala apropriada torna desnecessarias etapas de pre-processamento com um custo alto. Alem disso,
por lidar explicitamente com o parametro de escala, esta abordagem possibilita a manipulacao apenas das estruturas significativas da imagem que se tornam explcitas em cada
nvel. Aliado ao fato de que o aumento da escala esta relacionado `a reducao da quantidade
de informacao, isto tambem implica num aumento da eficiencia computacional.
Desde a introducao da teoria espaco-escala, diversas formulacoes tem sido propostas.
Este captulo faz uma breve revisao das principais abordagens e propriedades [7, 29, 82].
A Secao 3.2 apresenta as ideias basicas da teoria e a Secao 3.3 discute a formulacao
linear inicial proposta por Witkin, assim como os axiomas que determinam as condicoes
necessarias para constituicao de uma abordagem espaco-escala. Na Secao 3.4 e discutida
a extensao para o caso bidimensional e na Secao 3.5 sao introduzidas as abordagens naolineares. Dentre estas, destacam-se os espacos-escala baseados em morfologia matematica,
discutidos na Secao 3.6 e foco principal deste trabalho.

3.2. Visao geral da teoria espaco-escala

3.2

29

Vis
ao geral da teoria espa
co-escala

A teoria espaco-escala estabelece as condicoes necessarias para a definicao de transformacoes que possibilitem a manipulacao de caractersticas presentes em diferentes nveis
de representacao de maneira consistente. Uma propriedade fundamental e que a transformacao para um nvel mais grosseiro nao introduza novas estruturas, ou seja, caractersticas pertencentes a uma escala especfica tambem estao presentes em todas as escalas
mais finas.
Isso conduz a uma simplificacao do sinal original, considerando que a quantidade de
caractersticas diminui e que as remanescentes em um dado nvel correspondem a simplificacoes daquelas existentes inicialmente. Contudo, nao e necessario que suas localizacoes
preciso apenas que elas definam casejam exatamente as mesmas atraves das escalas. E
minhos contnuos. Desse modo, caractersticas em diferentes nveis estao relacionadas se
elas pertencem ao mesmo caminho no espaco-escala resultante.
Outra propriedade exigida para abordagens espaco-escala e a fidelidade [7]. Sejam f (x)
a imagem original e [T (x, )](f ) a representacao da observacao na escala . A fidelidade
requer que a transformacao espaco-escala convirja para o sinal original conforme tende
a zero, isto e,
lim [T (x, )](f ) = f (x).

(3.1)

Invariancia Euclidiana tambem e desejada, ou seja, uma translacao e/ou rotacao da imagem original deve implicar em um espaco-escala igualmente transladado/rotado.
Observe que os requisitos para definicao de um espaco-escala conduzem naturalmente
a uma simplificacao do sinal em consideracao. As propriedades de continuidade e nao
introducao de novas caractersticas permitem a sua manipulacao consistente, enquanto a
fidelidade indica que a filtragem inicia no sinal original e fica mais intensa com o aumento
da escala. Alem disso, de acordo com a condicao de invariancia Euclidiana, o procedimento
de filtragem nao deve depender de nenhum conhecimento preliminar sobre a orientacao
ou o posicionamento do sinal utilizado.
Ao contrario de outras abordagens multi-escala, tais como piramides, a representacao
espaco-escala preserva a mesma resolucao espacial (mesma amostragem) em todos os
nveis. Isso permite o acesso imediato aos dados de interesse em qualquer escala sem a
necessidade de processamento adicional. Aliado `a propriedade de continuidade, esse fato
permite rastrear de forma direta as caractersticas de interesse atraves da representacao,
bem como determinar sua localizacao exata no sinal original.
Embora possuam propriedades em comum, as abordagens espaco-escala diferem na
forma com que geram as representacoes. A seguir, serao discutidas algumas delas.

30

Captulo 3

3.3

Abordagem linear

Na formulacao inicial, desenvolvida para sinais contnuos unidimensionais, uma famlia de


sinais derivados e gerada atraves da convolucao do sinal original com um n
ucleo gaussiano
de media zero, cujo desvio padrao representa o conceito de escala. Seja f (x) : Rn R o
sinal original e g(x, ) : Rn R R um n
ucleo de suavizacao. A imagem espaco-escala
n
na escala e dada por T : R R R:
[T (x, )](f ) = f (x) g(x, ),
em que denota a operacao de convolucao e g(x, ) e o n
ucleo gaussiano [36]:


1 T
2 n/2
g(x, ) = (2 )
exp 2 x x .
2

(3.2)

(3.3)

Tal formulacao, usualmente denominada espaco-escala gaussiano, consiste na forma


canonica para gerar um espaco-escala linear [34, 84]. Koenderink [40] foi o primeiro a
observar a sua estrutura diferencial, mostrando que a gaussiana e a funcao de Green (ou
propagador) da equacao de difusao. Isso permite que metodos baseados em Equacoes
Diferenciais Parciais (EDPs) possam ser utilizados para gerar esta representacao. De
fato, as solucoes para a equacao do calor (ou equacao de difusao isotropica):
T (x, t)
= T (x, t),
t

(3.4)

em que e o Laplaciano, sao amostras do espaco-escala gaussiano para um tempo fixo


t [36].
A princpio, o projeto de um espaco-escala linear pode parecer arbitrario, levando a
crer que qualquer n
ucleo de suavizacao conduz a uma representacao valida. No entanto,
conforme discutido anteriormente, tal procedimento deve satisfazer a um conjunto de
propriedades. As condicoes para o caso linear unidimensional, denominadas axiomas da
teoria espaco-escala, sao sumarizadas abaixo [50, 52].
1. N
ao-criac
ao de novos extremos: Witkin [84] observou que na representacao
espaco-escala de sinais unidimensionais contnuos o n
umero de cruzamentos por zero
na derivada segunda do sinal diminui com o aumento da escala. Tal propriedade
e denominada monotonicidade, considerando que o n
umero de caractersticas deve
ser um funcao monotonicamente decrescente em funcao da escala. Alem disso,
como a diferenciacao comuta com a convolucao, o n
umero de extremos em uma
derivada espacial de qualquer ordem, calculada a partir da representacao espacoescala, tambem diminui para escalas crescentes.

3.3. Abordagem linear

31

As Figuras 3.2(b)-(e) ilustram o espaco-escala resultante da convolucao do sinal unidimensional discreto mostrado na Figura 3.2(a) com um n
ucleo gaussiano utilizando
desvios padroes crescentes. Pode-se verificar que, com o aumento da escala, os detalhes menos significativos sao sucessivamente eliminados levando, consequentemente,
a uma simplificacao progressiva do sinal.
A Figura 3.2(f) ilustra o grafico denominado fingerprint, que mostra a posicao das
caractersticas de interesse em cada nvel da representacao espaco-escala. Para facilitar a visualizacao, considere que tais caractersticas equivalem aos maximos locais.
Observe que os maximos mais significativos persistem ate as escalas mais grosseiras
e que, uma vez eliminados, eles nao tornam a aparecer. Note tambem que os caminhos definidos atraves dos diferentes nveis sao contnuos e novas estruturas nao sao
criadas, refletindo as propriedades de continuidade e monotonicidade.

(a)

(b)

(c)

(d)

(e)

(f)

Figura 3.2: Exemplo de espaco-escala gaussiano: (a) sinal unidimensional aleatorio, (b)(e) representacao espaco-escala para escalas crescentes e (f) fingerprint considerando
maximos locais como caractersticas.
2. Linearidade e invari
ancia `
a transla
c
ao, rota
c
ao e escala: A invariancia `a
rotacao e translacao garante que todas as posicoes da imagem sao tratadas de forma
identica, ou seja, a representacao espaco-escala nao depende de nenhum conhecimento preliminar sobre a posicao do sinal original. Isso implica que uma rotacao
e/ou translacao do sinal original deve resultar em um espaco-escala igualmente rotado e/ou transladado. Quando combinadas `a linearidade, tais condicoes permitem
o uso de n
ucleos de convolucao como operadores para gerar a representacao espacoescala, trazendo benefcios tais como a implementacao eficiente. A propriedade de

32

Captulo 3

invariancia `a escala assegura que n


ucleos de diferentes escalas sao equivalentes em
termos qualitativos.
3. Estrutura de semi-grupo e separabilidade: a estrutura de semi-grupo garante
que o resultado da convolucao de dois n
ucleos mantera a mesma estrutura e que
g(x, 1 ) g(x, 2 ) = g(x, 1 + 2 ),

(3.5)

em que o smbolo denota a convolucao. Tais propriedades permitem que uma


representacao espaco-escala possa ser construda incrementalmente, ou seja, se uma
imagem na escala 1 for utilizada como entrada para uma observacao em uma escala
mais grosseira 2 , isso e equivalente a realizar uma observacao diretamente no nvel
1 + 2 . Isso conduz a uma interpretacao matematica muito precisa, onde o nvel
1 + 2 pode ser analisado independentemente da escala inicial do sinal [33].
A propriedade de separabilidade, por sua vez, possibilita uma implementacao eficiente atraves da utilizacao de duas convolucoes unidimensionais ao inves de uma
u
nica bidimensional.
4. N
ao-realce de extremos locais e gerador infinitesimal: Quando combinadas,
as propriedades de estrutura de semi-grupo e continuidade em relacao `a escala conduzem a um resultado indicando que a famlia espaco-escala deve ter um gerador
infinitesimal. Isso significa que, sob determinadas condicoes de regularidade, existe
um caso limite do operador:
[T (x, )](f ) f
.
0

A = lim

(3.6)

Aliada a` propriedade de nao-realce de extremos locais (assim como o proprio nome


indica, esta propriedade requer que o valor de um maximo (mnimo) local nao aumente (diminua) com o aumento da escala), tal condicao implica que a representacao
espaco-escala satisfaz a equacao de difusao.
Pode-se provar que a u
nica famlia que satisfaz estes axiomas e a dos n
ucleos gaussianos, o que torna a abordagem descrita nesta secao a forma canonica de gerar um
espaco-escala linear. Alem disso, embora os resultados apresentados acima estejam relacionados a sinais contnuos, eles tambem sao validos para o caso discreto [50]. No entanto,
sua extensao para dimensoes maiores que um nao e possvel, conforme discutido a seguir.

3.4. Espacos-escala em duas dimensoes

3.4

33

Espacos-escala em duas dimens


oes

possvel provar que, para dimensoes maiores que um, qualquer n


E
ucleo de convolucao
utilizado para obter a representacao espaco-escala introduz novas caractersticas com o
aumento da escala [49]. Em outras palavras, nao existem n
ucleos triviais em R2 ou Z2
para os quais a propriedade de monotonicidade seja preservada no caso linear.
Um exemplo que ilustra claramente este fato foi apresentado por Lifshitz and Pizer [49]
e e ilustrado na Figura 3.3. As caractersticas de interesse equivalem aos maximos locais.
Considere uma imagem composta por dois picos, um deles mais alto que o outro e ambos
possuindo uma forma suave bem definida. Eles sao conectados de tal forma que a imagem
possui um u
nico ponto de maximo, situado no pico de maior altitude (Figura 3.3(a)). Ao
gerar o espaco-escala gaussiano, a regiao entre eles ira erodir mais rapidamente, fazendo
com que o pico mais baixo se torne um maximo local - o que viola a propriedade de
monotonicidade (Figura 3.3(b)).

(a)

(b)

Figura 3.3: Exemplo ilustrando a criacao de um novo maximo local ao gerar um espacoescala gaussiano em duas dimensoes [52].

Sendo assim, para dimensoes maiores que um, e preciso considerar um conjunto de
condicoes menos restritivas para constituicao de um espaco-escala. Lindenberg [51] observou que, como nao e possvel evitar que o n
umero de extremos locais aumente, a ideia
e restringir o n
umero de criacoes a poucas ocorrencias.
Koenderink [40], por sua vez, definiu uma extensao da propriedade de monotonicidade
para duas dimensoes, denominada causalidade, segundo a qual novas superfcies (curvas)
de nvel nao devem ser criadas com o aumento da escala. No caso discreto, em que nao
ha uma correspondencia direta para curvas de nvel, isso implica que os extremos locais
devem satisfazer a propriedade de nao-realce, segundo a qual o valor de um maximo nao
deve aumentar (e o de um mnimo nao deve diminuir) para escalas crescentes. Observe
que a causalidade nao impoe condicoes sobre a criacao de novos extremos [21].

34

Captulo 3

possvel provar que as propriedades de homogeneidade, isotropia (as quais basicaE


mente implicam que todos os pontos em diferentes nveis de escala devem ser tratados de
forma similar) e causalicade constituem as condicoes necessarias e suficientes para uma
formulacao em termos da equacao de difusao nos casos uni- e bidimensional [50].
Outro problema relacionado `a famlia de n
ucleos gaussianos e o borramento das imagens derivadas, uma limitacao para tarefas de mais alto nvel que exigem a localizacao
exata dos contornos, tais como reconhecimento de objetos. Este fato pode ser visto como
um exemplo do princpio da incerteza, pois o n
ucleo gaussiano (que constitui um filtro passa-baixa) restringe o espectro de frequencia, causando o borramento no domnio
espacial [7]. A Figura 3.4 ilustra esse fato.

(a)

(b)

(c)

Figura 3.4: Espaco-escala gaussiano bidimensional utilizando as escalas (desvio padrao


do n
ucleo): (a) 1, (b) 2 e (c) 4.

Estes problemas motivaram o desenvolvimento de abordagens nao-lineares.

3.5

Abordagens n
ao-lineares

De maneira geral, representacoes espaco-escala nao-lineares sao geradas com base em


transformacoes de morfologia matematica ou EDPs nao-lineares. Uma abordagem amplamente utilizada e a tecnica de difusao anisotropica proposta por Perona e Malik [66], a
qual e capaz de reduzir o rudo ao mesmo tempo em que preserva contornos e minimiza,
assim, o problema de borramento relacionado ao caso gaussiano.
A ideia principal consiste em diminuir a difusao na direcao do gradiente de mais alta
magnitude. Desta forma, dependendo do valor de tal magnitude, o operador constitui
um filtro passa-altas (em regioes de contorno) ou uma difusao isotropica (em regioes
homogeneas). Alem disso, este metodo preserva a propriedade de monotonicidade para

3.5. Abordagens nao-lineares

35

extremos do sinal quando coeficientes de difusao apropriados sao escolhidos.


Os autores consideram a seguinte EDP:

I
= div[c(|I|) I],

I( = 0) = I ,

(3.7)

em que e o operador gradiente, div o divergente, | | denota a magnitude, c(x) e o


coeficiente de difusao e I0 a imagem (ou condicao) inicial. Os autores sugerem duas
diferentes formas para calcular os coeficientes de difusao:
1
c1 (x) =
e c2 (x) = exp[(x/k)2 ],
(3.8)
1 + (x/k)2
em que k e um parametro que representa a magnitude do contorno. A primeira equacao
favorece regioes mais amplas em relacao `as menores, enquanto a segunda favorece regioes
de alto contraste. A Figura 3.5 mostra as imagens resultantes da aplicacao da tecnica de
difusao anisotropica para diferentes valores do coeficiente c1 .

(a)

(b)

(c)

Figura 3.5: Difusao anisotropica de uma imagem considerando diferentes coeficientes de


difusao: c1 = 20, c1 = 50 e c1 = 100.
Outra abordagem nao-linear que obedece ao princpio da causalidade consiste na definicao de uma classe especial de espacos-escala que podem ser linearizados atraves de
um isomorfismo no domnio espacial reproduzindo, desta forma, o espaco-escala gaussiano. Tal abordagem, que conduz aos denominados espacos-escala pseudo-lineares, possui
aplicacoes em imagens escalares, vetoriais e multi-espectrais, e pode ser utilizada inclusive
em casos em que o espaco-escala gaussiano apresenta inconsistencias [21, 22].
Todavia, de forma geral, tais tecnicas possuem um custo computacional alto e demandam diversos parametros. As abordagens baseadas em morfologia matematica minimizam
estes problemas e tem se mostrado eficientes gerando, como abordado a seguir, espacosescala com interessantes propriedades.

36

3.6

Captulo 3

Espacos-escala morfol
ogicos

Desde a sua formalizacao por Matheron e Serra [57, 71, 72], a morfologia matematica
vem sendo amplamente utilizada em diversas aplicacoes de processamento de imagens.
No contexto da teoria do espaco-escala, combinacoes das operacoes de erosao e dilatacao
utilizando funcoes estruturantes nao-planares (Secao 2.3) tem se mostrado eficientes na
definicao de diversos espacos-escala nao-lineares. A seguir, sao discutidas algumas abordagens propostas na literatura.

3.6.1

Eros
ao/Dilata
c
ao Morfol
ogica Multi-escala

Em [35, 36], Jackway introduziu um novo espaco-escala, denominado Erosao/Dilatacao


Morfologica Multi-escala (Multiscale Morphological Dilation Erosion - MMDE), o qual e
baseado em um operador do tipo toggle e definido por:

[B (f )](x), se > 0,
(f B )(x) =
(3.9)
f (x),
se = 0,

[B (f )] (x), se < 0.
em que f e a imagem original e [B (f )](x) denota a dilatacao e [B (f )](x) a erosao do
pixel na posicao x utilizando uma funcao estruturante dependente de escala B . Observe
que a regra de decisao analisa o sinal da escala para decidir se a imagem sera dilatada
( > 0) ou erodida ( < 0).
A Figura 3.6 ilustra uma possvel representacao espaco-escala gerada pelo MMDE.
Note que, enquanto o uso de escalas negativas realca as estruturas escuras da imagem,
escalas positivas tem o efeito oposto. Pode-se provar que as condicoes necessarias (inclusive monotonicidade) sao satisfeitas assumindo-se como caractersticas de interesse os
maximos locais quando a escala e positiva e os mnimos locais quando ela e negativa [7, 36].
Para tal, e essencial que as funcoes estruturantes satisfacam as propriedades especificadas
anteriormente na Secao 2.3.
Contudo, o MMDE apresenta algumas desvantagens. Como as caractersticas de interesse sao diferentes dependendo do sinal da escala, essa abordagem pode ser vista como
dois espacos-escala distintos, onde a nocao de escala negativa consiste apenas em uma
notacao conveniente para exibir a representacao. Alem disso, devido ao vies dos nveis
de cinza inerente `as transformacoes extensivas e anti-extensivas (o valor transformado de
um pixel e exclusivamente maior ou menor que seu valor original, respectivamente), essa
abordagem e sensvel a rudo [7].
O operador proposto em [46, 47] explora a idempotencia do MMDE, estabelecendo uma
relacao entre a funcao estruturante B e os extremos que persistem em uma determinada
escala. Para evitar o deslocamento espacial das linhas delimitadas pela transformada

3.6. Espacos-escala morfologicos

(a)

(b)

37

(c)

(d)

(e)

Figura 3.6: Representacao do espaco-escala MMDE. Erosao nas escalas (a) -0.5 e (b)
-0.05, (c) imagem original, dilatacao nas escalas (d) 0.05 e (e) 0.5.

de watershed, o conjunto de extremos obtido durante o processo de filtragem e utilizado


como marcador em uma modificacao homotopica da imagem original. A fusao dos extremos atraves das diferentes escalas tambem e controlada, possibilitando a definicao de
marcadores que conduzem a bons resultados de segmentacao.
A erosao/dilatacao multi-escala idempotente de um sinal f e dada por:

n
[B (f )] (x), se > 0,
(f } g )(x) =
f (x),
se = 0,

n
[B (f )] (x), se < 0.

(3.10)

em que [B (f )]n (x) denota a n-esima iteracao da dilatacao e [B (f )]n (x) a n-esima
iteracao da erosao do pixel na posicao x utilizando a funcao estruturante nao-planar B .
Aqui, n denota a iteracao em que a idempotencia e atingida, ou seja, [B (f )]n (x) =
[B (f )]n+1 (x), para < 0 e [B (f )]n (x) = [B (f )]n+1 (x), para > 0. As principais
propriedades do espaco-escala MMDE sao preservadas para o caso idempotente [46].

3.6.2

Espa
cos-escala baseados em aberturas e fechamentos

A primeira abordagem proposta para espacos-escala baseados em aberturas e fechamentos utilizava imagens binarias e consistia na aplicacao da operacao de abertura com um
elemento estruturante circular de tamanho crescente [8]. As caractersticas de interesse
eram definidas como os cruzamentos por zero existentes na curvatura do contorno dos
objetos da imagem. Posteriormente, verificou-se que as condicoes necessarias e suficientes
para garantir a monotonicidade eram que os elementos estruturantes fossem compactos e
anti-convexos [37]. Por dualidade, as mesmas afirmacoes sao validas para a operacao de
fechamento [35].
No entanto, embora tais resultados possam ser estendidos para o caso unidimensional
atraves da utilizacao de funcoes estruturantes compactas e anti-convexas, a monotoni-

38

Captulo 3

cidade nao e valida para a filtragem bidimensional de imagens em nveis de cinza [64].
A Figura 3.7 ilustra um exemplo de espaco-escala baseado em abertura no qual pode-se
observar uma maior simplificacao da imagem com o aumento da escala.

(a)

(b)

(c)

Figura 3.7: Representacao do espaco-escala baseado na operacao de abertura: (a) imagem original e abertura utilizando uma funcao estruturante compacta e anti-convexa de
tamanhos (b) 3 e (c) 5.

Um sinal que e estritamente crescente (ou decrescente) em cada subintervalo de tamanho n e denominado um sinal localmente monotonico de grau n, ou lomo-n. O espacoescala proposto em [7] calcula iterativamente a media entre a abertura e o fechamento de
um pixel ate que um sinal raiz seja encontrado, considerando como caracterstica de interesse as regioes localmente monotonicas. Entretanto, tambem nao preserva a propriedade
de monotonicidade em duas dimensoes.
Embora as operacoes de abertura e fechamento constituam filtros morfologicos (ambas
sao crescentes e idempotentes - veja Secao 2.5), o fato de elas nao serem auto-duais pode
torna-las sensveis a rudo. Enquanto a abertura elimina apenas impulsos positivos, por
exemplo, o fechamento tem este efeito para os impulsos negativos, o que constitui um vies
na transformacao.
Para reduzir este problema, podem ser utilizados filtros alternados sequenciais, ou
seja, pode-se aplicar combinacoes das operacoes de abertura e fechamento com funcoes
estruturantes de tamanho crescente de maneira recursiva (Captulo 2). A Figura 3.8
ilustra um exemplo. Observe que a simplificacao nao preserva de modo apropriado o
contorno das estruturas da imagem. Assim como no caso anterior, o conceito de escala
esta relacionado `a dimensao (ao tamanho) da funcao estruturante.

3.6. Espacos-escala morfologicos

(a)

39

(b)

(c)

Figura 3.8: Espaco-escala baseado no filtro alternado sequencial []B (f ) utilizando


funcoes estruturantes de tamanho (a) 3, (b) 5 e (c) 7.

3.6.3

Espa
cos-escala baseados em operadores conexos

Uma das grandes desvantagens das operacoes de abertura e fechamento e que elas causam
o deslocamento dos contornos [33, 72]. Para evitar este problema, pode-se utilizar filtros
por reconstrucao, os quais recuperam apenas a estrutura das componentes que nao forem
eliminados em uma etapa inicial, preservando assim a forma original dos objetos [75].
Neste caso, os contornos sao uma das possveis caractersticas de interesse. A Figura 3.9
mostra um exemplo de aplicacao da operacao de abertura por reconstrucao utilizando
funcoes estruturantes de tamanho crescente no qual os contornos sao preservados.

(a)

(b)

(c)

Figura 3.9: Espaco-escala gerado pela abertura por reconstrucao.

A abertura e o fechamento por reconstrucao constituem operadores conexos, os quais


transformam uma imagem atraves da eliminacao ou fusao de suas zonas planas (regioes

40

Captulo 3

onde o nvel de cinza e constante). Isso justifica porque a posicao dos contornos e preservada. Tais operacoes tambem podem ser classificadas como levelings, uma classe mais
generica de filtros morfologicos introduzida por Meyer [59]. No entanto, filtros por reconstrucao nao sao auto-duais, ou seja, eles tratam o fundo e o primeiro plano da imagem
de maneira assimetrica.

3.7

Conclus
oes

Este captulo apresentou uma breve revisao da teoria espaco-escala, abrangendo desde as
propriedades necessarias ate algumas das abordagens existentes na literatura. Como podese observar no decorrer do texto, abordagens nao-lineares possuem vantagens significativas
quando comparadas `as lineares. No entanto, nestes casos existe uma grande dificuldade
para satisfazer todas as condicoes necessarias para constituicao de um espaco-escala, em
especial a monotonicidade.
Alem disso, varias abordagens propostas apresentam limitacoes, tais como o vies nos
nveis de cinza, o que pode comprometer de forma significativa o resultado final. Outras
utilizam conceitos que influenciam apenas a forma de apresentacao dos resultados, mas
nao a transformacao propriamente dita. O uso de uma escala negativa no MMDE,
por exemplo, indica apenas que operacao e quais caractersticas de interesse devem ser
consideradas (a funcao estruturante definida para as escalas 15 e -15 e o mesmo).
Tais problemas motivaram o desenvolvimento de um novo operador espaco-escala,
apresentado em detalhes no proximo captulo.

Captulo 4
Operador SMMT: Self-dual
Multiscale Morphological Toggle
Este captulo define uma nova transformacao de imagens com interessantes propriedades
de simplificacao, a partir da qual detalhes indesejados podem ser eliminados sem que
as caractersticas de interesse sejam comprometidas de maneira significativa. Esta transformacao, denominada Self-dual Multiscale Morphological Toggle (SMMT), possui a forma
de um operador toggle e e definida por:
Definic
ao 4.1. (Operador SMMT) Seja k1 (x) = [B (f )]k (x), isto e, a dilatacao de
f (x) com a funcao estruturante dependente de escala B k vezes. De forma analoga,
k2 (x) = [B (f )]k (x). Denomina-se operador SMMT a func
ao:
k
k
k
1 (x), se 1 (x) f (x) < f (x) 2 (x),
k
k
k
[B (f )] (x) =
f (x), se 1 (x) f (x) = f (x) 2 (x),
k
2 (x), em outros casos.

(4.1)

A proxima secao mostra que tal operacao possui propriedades espaco-escala ao considerar escalas crescentes e um n
umero de iteracoes fixo. Como maximos e mnimos da
imagem interagem ao mesmo tempo, sao evitados alguns dos problemas relacionados a
outras abordagens espaco-escala baseadas em morfologia matematica, tais como a manipulacao de escalas negativas e o vies nos nveis de cinza.
Por outro lado, ao variar o n
umero de iteracoes, uma regiao maior e analisada no
calculo do valor transformado de cada pixel. Desse modo, extremos mais significativos
passam a ter uma maior abrangencia, o que conduz a uma homogeneizacao dos nveis de
cinza da imagem, assim como discutido na Secao 4.2. Por fim, a Secao 4.3 apresenta alguns
testes que exemplificam o comportamento do operador para diferentes configuracoes de
parametros.
41

42

Captulo 4

4.1

Propriedades espa
co-escala

Esta secao discute algumas das propriedades necessarias para constituicao de um espacoescala: fidelidade, causalidade (monotonicidade), continuidade e invariancia Euclidiana.
As funcoes estruturantes consideradas neste trabalho satisfazem `a seguinte condicao (Equacao 2.21):

0,
se x = 0;
|| 0 B (x)
, em outros casos,
a qual conduz diretamente ao requisito de fidelidade. Isso significa que, conforme a escala
tende a zero, a transformacao espaco-escala converge para o sinal original (basta observar
que a imagem nao e transformada ao aplicar as operacoes de erosao e dilatacao utilizando
tal elemento estruturante).
De forma geral, a monotonicidade e o requisito mais difcil de ser satisfeito, conforme
discutido anteriormente na Secao 3.4. Para provar esta propriedade para o operador
SMMT, serao necessarios alguns resultados preliminares [36]. Embora eles sejam validos
para qualquer funcao estruturante que satisfaca `as condicoes especificadas na Secao 2.3,
visando facilitar o entendimento das provas, algumas das proposicoes a seguir supoem o
uso da funcao estruturante piramide (Equacao 2.23).
A Proposicao 4.2 define o comportamento do SMMT ao processar extremos locais de
uma imagem. Em resumo, como a dilatacao de um maximo local consiste no seu proprio
valor original, este nao sera alterado segundo a regra de decisao do operador. O resultado
e analogo para mnimos locais considerando a operacao de erosao.
Proposi
c
ao 4.2 (Convergencia dos extremos da imagem). Seja B (x) a func
ao estruturante pir
amide.
ao f (xmax ) e um m
aximo local de f (x) e
1. Se [B (f )]k (xmax ) e um maximo local, ent
k
k
[B (f )] (xmax ) = [B (f )] (xmax ) = f (xmax ).
2. Se [B (f )]k (xmin ) e um mnimo local, ent
ao f (xmin ) e um mnimo local de f (x) e
k
k
[B (f )] (xmin ) = [B (f )] (xmin ) = f (xmin ).
Prova. Primeiramente, a funcao [B (f )]k (x) e dita ter um m
aximo local em x0 se e
k
k
somente se [B (f )] (x0 ) [B (f )] (x), x em alguma -vizinhanca de x0 , N (x0 , ) =
{x : kx x0 k < }. Considere o caso (1) primeiro. Seja f (xmax ) um m
aximo local, e
assuma que o sup ocorre para tk = .
[B (f )]k (xmax ) =

sup

{f (xmax tk ) + kB (tk )} =

tk N (xmax ,k)

= f (xmax ) + kB ()
f (xmax ) f (xmax ).

(4.2)

4.1. Propriedades espaco-escala

43

Assim, [B (f )]k (xmax ) = (f )(xmax ). Logo, como [B (f )]k (xmax ) 6= (f )(xmax ), a regra
de decisao do operador SMMT ir
a escolher como valor transformado aquele definido pela
k
dilatacao, isto e, [B (f )] (xmax ) = [B (f )]k (xmax ), o qual equivale ao valor original do
pixel, assim como mostrado acima. Alem disso, como B (0) = 0, segue que o sup ocorre
para t = 0. A prova para o caso (2) e an
aloga.

Esta proposicao tambem prova outro importante resultado. Como nao ha realce de
extremos (pois o valor de um maximo (mnimo) local nao aumenta (diminui) ao considerar
escalas crescentes), segue que a propriedade de causalidade e satisfeita.
A proxima proposicao mostra que a regra de decisao do SMMT escolhera pontualmente a mesma primitiva atraves das escalas. Esta propriedade garante que nao ocorrem
oscilacoes, um problema muito comum em transformacoes toggle.
Proposic
ao 4.3 (Convergencia de um pixel para uma mesma primitiva ao longo das
escalas). Seja B (x) a funcao estruturante pir
amide.
1. Se [B (f )]k (x) = [B (f )]k (x), ent
ao [B (f )]k (x) = [B (f )]k (x), .
2. Se [B (f )]k (x) = [B (f )]k (x), ent
ao [B (f )]k (x) = [B (f )]k (x), .
Prova. Da Equacao 2.23, B (x, y) = ||1 max{|x|, |y|}. Portanto, para > 0,
1
1
||
||
, o que implica que B (x) B (x) 0. Destes fatos, segue que
max {f (x tk ) + kB (tk )} f

tk N (x,k)

max {f (x tk ) + kB (tk )} f < f


tk N (x,k)

min {f (x tk ) kB (tk )}

tk N (x,k)

(4.3)

min {f (x tk ) kB (tk )},

tk N (x,k)

o que prova a proposicao.

Note que maximos e mnimos locais interagem ao mesmo tempo, ao contrario de


outras abordagens que os consideram separadamente [36]. Como a imagem esta sendo
transformada localmente de diferentes formas (pixels vizinhos podem convergir para diferentes primitivas), novos extremos podem ser criados em algumas condicoes especficas,
discutidas a seguir.

44

Captulo 4

Para um dado pixel x, assuma que [B (f )]k (x) = [B (f )](x). Sejam N (x) os vizinhos
de x tal que f () > f (x), N (x). Se [B (f )]k () = [B (f )]() N (x), um
novo maximo regional pode ser criado. Isto ocorre porque, ao serem transformados por
uma operacao anti-extensiva, os valores originais dos pixels em N (x) podem se tornar
menores que f (x). Como um pixel converge para exclusivamente uma das primitivas
(Proposicao 4.3), estes extremos irao persistir para todas as demais escalas. Um exemplo
e dado a seguir. Considere a seguinte configuracao:

f =

106
92
44

92
55
35
19

56
30
52
27

30
25
23

Os resultados das operacoes de erosao e dilatacao na escala 1 = 20 sao dados por:

106 92 72
75 50 50
92 86 72 35
55 50 30 30

[B (f )] = 39 35 39 25 [B (f )] = 72 72 52 32

32 32 32
19 27 23


Segundo a regra de decisao, a transformacao SMMT resultante e dada por:

[B (f )] =

106
92
39

92
50
35
19

50
30
52
27

30
25
23

Observe que, como o pixel cujo valor inicial era 55 foi transformado pela operacao
de erosao, sendo associado ao valor 50, o pixel na posicao central tornou-se um maximo
local. Isso ocorre para todo 1 21. Entretanto, conforme discutido anteriormente no
Captulo 3, a propriedade de monotonicidade dificilmente e satisfeita em duas dimensoes.
Neste caso, a ideia e restringir o n
umero de criacoes a poucas [51] e garantir que a condicao
de nao-realce de extremos seja valida (o que e verdadeiro segundo a Proposicao 4.2).
Contudo, caso deseje-se garantir a monotonicidade estrita do SMMT, e possvel considerar um estagio de pos-processamento que, para cada extremo criado, verifica os resultados do operador para os pixels em N (x) e muda a primitiva aplicada, se necessario.
No exemplo acima, se todos os pixels com valores maiores do que aquele sendo analisado
convergirem para a erosao, e necessario alterar pelo menos um deles para a dilatacao. Do

4.1. Propriedades espaco-escala

45

mesmo modo, e preciso verificar se todos os pixels da vizinhanca considerada que possuem valores menores convergiram para a dilatacao. Essa discussao pode ser estendida
de maneira analoga para mnimos locais.
Esta etapa de pos-processamento, juntamente com a Proposicao 4.2, e essencial para
provar o seguinte resultado (necessario para provar a monotonicidade estrita).
Proposic
ao 4.4 (Relacao entre extremos presentes em diferentes escalas). Seja B (x)
a funcao estruturante piramide. Ela possui um u
nico m
aximo na origem, ou seja, g(x)
sendo um maximo local implica x = 0.
1. Se 1 > 2 e [B1 (f )]k (xmax ) e um m
aximo local, ent
ao [B2 (f )]k (xmax ) e um
maximo local e [B1 (f )]k (xmax ) = [B2 (f )]k (xmax ).
ao [B2 (f )]k (xmin ) e um
2. Se 1 > 2 e [B1 (f )]k (xmin ) e um mnimo local, ent
mnimo local e [B1 (f )]k (xmin ) = [B2 (f )]k (xmin ).
Prova. Considere o caso (1) primeiro. Da Equac
ao 2.20, segue que B2 = B1 J (x),
onde J (x) 0 x G , e J (0) = 0. Considere [B2 (f )](xmax ) com 1 > 2 > 0,
[B2 (f )]k (xmax ) =
=

sup

{f (xmax tk ) + kB2 (tk )} =

(4.4)

tk N (xmax ,k)

sup

{f (xmax tk ) + kB1 (tk ) J (t)}

tk N (xmax ,k)

sup

{f (xmax tk ) + kB1 (tk )} =

tk N (xmax ,k)

= [B1 (f )]k (xmax ).


Ate aqui, provou-se que [B2 (f )]k (xmax ) [B1 (f )]k (xmax ). Como o sup ocorre no lado
direito da Equacao 4.4 para t = 0 (Proposic
ao 4.2), segue que:
f (xmax t) + B2 (t) = f (xmax t) + B1 (t),

(4.5)

ent
ao, o sup tambem ocorre no lado esquerdo da Equac
ao 4.4 para t = 0 e,
[B2 (f )]k (xmax ) = [B1 (f )]k (xmax ).

(4.6)

Agora, considerando o estagio de p


os-processamento, pode-se garantir que existe um e na
vizinhanca de xmax tal que
[B2 (f )](xmax + e) [B1 (f )](xmax + e),

e N (0, ).

(4.7)

Portanto, [B2 (f )](xmax ) e um m


aximo local, provando a parte (1) da proposicao. A
parte (2) pode ser provada de maneira an
aloga.

46

Captulo 4

Estes argumentos conduzem ao seguinte resultado.


Teorema 4.5 (Monotonicidade do operador SMMT). Sejam f : D Rn R uma
func
ao limitada, B : G R2 R uma func
ao estruturante, e
Eext (f ) = {x : f (x) e um extremo local}

(4.8)

um conjunto de pontos que representa os extremos locais de f . Ent


ao, para qualquer
1 > 2 > 0
Eext [B1 (f )] Eext [B2 (f )] Eext (f ).
(4.9)
Prova. Suponha que o teorema e falso e Eext [B1 (f )] * Eext [B2 (f )] para algum
1 > 2 > 0. Entao, existe xmax D tal que [B1 (f )](xmax ) e um extremo local mas
ao 4.4.
[B2 (f )](xmax ) nao o e, o que contradiz a Proposic

Note que este procedimento tambem evita a flutuacao (mudanca da posicao) das caractersticas atraves das escalas, satisfazendo automaticamente as propriedade de continuidade e causalidade forte. Finalmente, a condicao de invariancia Euclidiana segue
diretamente do uso de funcoes estruturantes espacialmente simetricas.
Um espaco-escala usualmente difere do seu dual1 pela direcao do bias dos nveis de
cinza, ou seja, enquanto o espaco-escala tende a nveis de cinza mais claros, seu dual
tende a nveis mais escuros (ver [7], por exemplo). A escolha de qual espaco-escala usar
depende da aplicacao sendo considerada e geralmente e arbitraria. O operador SMMT e
auto-dual, isto e, ele transforma o fundo e os objetos de interesse da imagem de forma
simetrica, evitando o vies introduzido quando se escolhe um espaco-escala e ignora-se o
seu dual. A Proposicao 4.6 prova que o operador SMMT e auto-dual.
Proposi
c
ao 4.6. Considere duas primitivas duais 1 e 2 , ou seja, 1 (x) = 2 (xc )c , onde
o smbolo c denota o complemento. Se 1 e extensiva e 2 e anti-extensiva, o operador
toggle dado por

1 (x), se 1 (x) f (x) < f (x) 2 (x),


T (x) =
(4.10)
f (x), se 1 (x) f (x) = f (x) 2 (x),

2 (x), em outros casos,

e auto-dual.
Prova. Segue diretamente da definicao de complemento.
1

O dual de um operador que gera um espaco-escala conduz a um espaco-escala dual.

4.2. Variacao no n
umero de iteracoes do operador SMMT

47

A proxima secao discute o comportamento do SMMT ao variar o n


umero de iteracoes
para uma escala fixa. Neste caso, embora as propriedades espaco-escala nao sejam mais
validas, tambem ocorre uma simplificacao da imagem. Deste modo, e possvel eliminar
detalhes indesejados que podem interferir no desempenho de aplicacoes de mais alto nvel.

4.2

Variac
ao no n
umero de itera
c
oes do operador
SMMT

Para evitar efeitos indesejaveis, tais como falhas e oscilacoes, operadores do tipo toggle
devem preferencialmente ser idempotentes [73]. Como o SMMT nao possui tal propriedade, e importante assegurar que o mesmo possui um comportamento bem controlado
independentemente dos parametros escolhidos. Da Proposicao 4.3, segue que um pixel
sera transformado por exclusivamente uma das primitivas ao considerar escalas crescentes,
evitando assim problemas de estabilidade. Portanto, falta mostrar apenas que a variacao
no n
umero de iteracoes nao compromete o funcionamento do operador proposto.
Novamente por questoes de maior facilidade de visualizacao, sera considerada a funcao
estruturante piramide (Equacao 2.23). Neste caso, para uma escala fixa, a seguinte
equivalencia para o operador SMMT e valida (Captulo 2) [16]:
[B3 (f )]k (x) == [B2k+1 (f )]1 (x),

(4.11)

em que o subscrito em denota o tamanho do elemento estruturante. Em outras palavras,


realizar k iteracoes das primitivas utilizando um elemento estruturante de tamanho 3 3
e equivalente a realizar uma iteracao com um elemento estruturante de tamanho 2k + 1
2k + 1. Isso indica que, com o aumento do n
umero de iteracoes, uma regiao mais ampla
e considerada para calculo do valor transformado de um pixel.
Desse modo, extremos mais significativos tendem a influenciar a transformacao dos
pixels, conduzindo a uma homogeneizacao dos nveis de cinza e, consequentemente, `a
simplificacao da imagem. Esta transformacao ocorre de tal forma que, a cada iteracao,
um pixel e associado a um valor que depende de dois fatores: sua distancia de um extremo
significativo e similaridade entre seu valor original e o valor destes extremos.
As Figuras 4.1, 4.2 e 4.3 ilustram alguns exemplos que permitem a visualizacao deste
fato. Na Figura 4.1, e possvel observar claramente as regioes de influencia definidas pelos
extremos mais significativos (equivalentes `as colunas de valor 255 e zero).

48

Captulo 4

(a)

(b)

(c)

Figura 4.1: Transformacao realizada pelo SMMT para diferentes quantidades de iteracoes
das primitivas: (a) 10, (b) 50 e (c) 64.
A Figura 4.2 mostra outra configuracao. Neste caso, um extremo (representado pela
linha mais escura) que e significativo ate um determinado n
umero de iteracoes e absorvido
por outro extremo mais forte apos um certo momento. Uma caracterstica importante
e que, a nao ser que outro extremo influencie novamente a regiao transformada, uma vez
absorvido, o extremo nao torna a aparecer (nao existem oscilacoes neste sentido). Observe
que, na idempotencia, o resultado obtido e equivalente `aquele da Figura 4.1.

(a)

(b)

(c)

Figura 4.2: Transformacao realizada pelo SMMT para diferentes quantidades de iteracoes
das primitivas: (a) 10, (b) 50 e (c) 64.
Por fim, a Figura 4.3 mostra um caso em que os extremos representados pelos quadrados mais claros permanecem inalterados ate a idempotencia. Neste exemplo, e possvel
observar tambem que, ao variar o n
umero de iteracoes, nao necessariamente um pixel
ira ser sempre transformado pela mesma primitiva, o que ocorre ao considerar escalas
crescentes. Isso acontece porque, como uma regiao diferente esta sendo considerada para
calculo do valor transformado, um pixel que inicialmente aproxima-se mais do seu valor
dilatado pode se aproximar mais do erodido devido `a influencia de um mnimo presente
na nova regiao considerada.

4.2. Variacao no n
umero de iteracoes do operador SMMT

(a)

(b)

49

(c)

Figura 4.3: Transformacao realizada pelo SMMT para diferentes quantidades de iteracoes
das primitivas: (a) 10, (b) 50 e (c) 64.
Neste contexto, pode-se afirmar que o operador SMMT simplifica a imagem criando
regioes quase-planas.
Definic
ao 4.7. [55] (Zona-R-plana) Dois pixels, x e y, pertencem `
a mesma zona R-plana
de uma funcao f se, e somente se, existe uma n-tupla de pixels, (p1 , p2 , . . . , pn ), tal que
p1 = x e pn = y e, para todo i, (pi , pi+1 ) s
ao vizinhos e satisfazem `
a relac
ao fpi R fpi+1 .
Tomando R como sendo a igualdade, sao definidas zonas planas, ou seja, componentes
conectados onde os valores dos pixels sao constantes [55]. O operador SMMT define
zonas quase-planas, em que a relacao |fp fq | se verifica. A Figura 4.4 ilustra
as transformacoes resultantes da aplicacao do SMMT utilizando diferentes n
umeros de
iteracoes das primitivas em uma pequena porcao de uma imagem.

(a)

(b)

(c)

Figura 4.4: Simplificacao obtida pelo operador ao considerar sucessivas aplicacoes (k =


1, 3 e 5) das primitivas na escala = 1.
Observe que a simplificacao ocorre de tal forma que, na vizinhanca de um maximo
(mnimo) significativo, a transformacao realizada pelo SMMT faz com que os valores
dos pixels sejam dilatados (erodidos), o que acaba criando uma especie de regiao de
influencia com nveis de cinza similares para cada extremo. A distribuicao de tais regioes
depende de diferentes fatores, tais como a forma com que eles afetam uns aos outros e do
n
umero de iteracoes realizadas.

50

Captulo 4

Em outras palavras, como maximos (mnimos) locais determinam o valor dilatado


(erodido), pode-se interpretar o resultado do SMMT como a convergencia do nvel de
cinza de um pixel para o extremo mais significativo na regiao considerada (a qual depende
da funcao estruturante e do n
umero de iteracoes).

E importante ressaltar que, embora a equivalencia nao seja exata para outras funcoes
estruturantes (pois os pesos associados `as suas posicoes sao diferentes), a ideia e a mesma.
A proxima secao traz alguns testes experimentais.

4.3

Testes experimentais

A seguir, sao apresentados alguns exemplos que ilustram a transformacao realizada pelo
SMMT ao considerar diferentes combinacoes de valores de escala e n
umero de iteracoes.
Em todos os casos, o branco representa o pixel transformado pelo valor dilatado e o preto
pelo erodido. A cor cinza, por sua vez, indica que o valor inicial nao foi alterado.
As Figuras 4.5 e 4.6 representam a variacao no n
umero de iteracoes ao considerar as
1
1
escalas = 5 e = 1, respectivamente. Note que a aplicacao iterativa faz com que
o tamanho das regioes possuindo a mesma cor aumente. Tal comportamento se deve ao
fato que, como pixels vizinhos usualmente possuem valores similares, eles tendem a ser
influenciados pelo mesmo extremo. O aumento no n
umero de iteracoes faz com que a
regiao de influencia de tais extremos significativos seja maior.

(a)

(b)

(c)

(d)

Figura 4.5: Transformacao do SMMT ao considerar os parametros 1 = 5 e k = (a) 1,


(b) 5, (c) 10 e (d) 15.
Observe que existem menos pixels com a cor cinza na Figura 4.6, o que indica que a
imagem esta sendo modificada de modo mais intenso ao ser processada por uma escala
maior.

4.3. Testes experimentais

(a)

51

(b)

(c)

(d)

Figura 4.6: Transformacao do SMMT ao considerar os parametros 1 = 1 e k = (a) 1,


(b) 5, (c) 10 e (d) 15.
Este comportamento tambem pode ser observado nas Figuras 4.7 e 4.8, em que o uso
de escalas menores (que implicam em elementos estruturantes mais altos) faz com que
menos regioes sejam modificadas. Isso se deve ao fato de que a diferenca dos nveis de
cinza de pixels vizinhos precisa ser proporcional `a altura do elemento estruturante para
que eles sejam modificados.

(a)

(b)

(c)

(d)

Figura 4.7: Transformacao do SMMT ao considerar os parametros 1 = (a) 15, (b) 10,
(c) 5 e (d) 1 com k = 1.
Tais caractersticas foram exploradas de diferentes formas neste trabalho, dependendo
da aplicacao especfica em consideracao. Enquanto o aumento no valor da escala ou no
n
umero de iteracoes conduz a uma maior simplificacao da imagem, o uso de escalas mais
baixas possibilita a identificacao de regioes com uma maior variacao nos nveis de cinza,
tais como contornos. Considere a Figura 4.8(a), por exemplo. Neste caso, se os pixels
que nao tiveram seu valor alterado fossem associados `a cor branca, o resultado seria uma
imagem binaria onde apenas os caracteres seriam destacados pela cor preta.

52

Captulo 4

(a)

(b)

(c)

(d)

Figura 4.8: Transformacao do SMMT ao considerar os parametros 1 = (a) 15, (b) 10,
(c) 5 e (d) 1 com k = 5.
A Figura 4.9 mostra as imagens resultantes (com os valores dos nveis de cinza transformados pelas primitivas) da aplicacao do SMMT para diferentes escalas e n
umero de
iteracoes. A partir delas, e possvel visualizar o resultado da transformacao realizada para
diferentes parametros.

(a)

(b)

(c)

(d)

Figura 4.9: Transformacao do SMMT ao considerar os parametros 1 = 15 com (a)


k = 1, (b) k = 5 e 1 = 1 com (c) k = 1, (d) k = 5,

4.4

Conclus
oes

Este captulo apresentou a definicao de um novo operador com propriedades espaco-escala


denominado SMMT. A Secao 4.1 provou que ele possui as propriedades necessarias e a
Secao 4.2 mostrou que a transformacao proposta tambem e estavel se aplicada iterativamente. Por fim, alguns resultados de testes experimentais foram discutidos na Secao 4.3.
O proximo captulo mostra alguns exemplos de segmentacao de imagens em nveis de
cinza em que a simplificacao realizada pelo SMMT possibilitou a extracao de marcadores
mais robustos, produzindo resultados mais precisos quando comparados `aqueles obtidos
a partir da imagem original.

Captulo 5
Exemplos de segmenta
c
ao de
imagens com o operador SMMT
Este captulo mostra alguns exemplos em que a utilizacao do operador SMMT mostrou-se
de fundamental importancia para obtencao de bons resultados de segmentacao de imagens
em nveis de cinza. Isso se deve principalmente `as suas propriedades, as quais conduzem
a uma simplificacao mais significativa quando comparada `aquelas derivadas de metodos
tradicionais tais como os filtros por reconstrucao. A Figura 5.1 ilustra um exemplo.

(a)

(b)

(c)

Figura 5.1: (a) Imagem original e simplificacoes quando utilizando (b) operador SMMT
e (c) abertura por reconstrucao (com idempotencia dos operadores).
Observe que, embora a abertura por reconstrucao produza menos zonas planas (Figura 5.1(c)), a aplicacao do SMMT resulta em uma simplificacao que preserva de forma
mais adequada as estruturas da imagem (Figura 5.1(b)). Desse modo, marcadores mais
relevantes para uma segmentacao morfologica podem ser extrados.
Com o objetivo de comprovar as vantagens da utilizacao do operador proposto, os
resultados obtidos a partir da imagem transformada e da original foram comparados
entre si e tambem com uma base segmentada manualmente. Os resultados sao discutidos
na proxima secao. A Secao 5.2 apresenta os resultados para uma aplicacao especfica que
envolve a segmentacao/classificacao de imagens de celulas.
53

54

5.1

Captulo 5

Segmentac
ao de imagens em nveis de cinza

Basicamente, tecnicas de segmentacao visam particionar uma imagem em um conjunto de


regioes homogeneas e nao-sobrepostas, as quais devem representar algo significativo para
uma determinada aplicacao. Como constituem a base para diversas tarefas de processamento de imagens, tais como reconhecimento e classificacao, e essencial que os resultados
obtidos sejam precisos.
No contexto de morfologia matematica, a segmentacao de imagens em nveis de cinza
e tipicamente realizada da seguinte forma. A partir de marcadores das estruturas significativas da imagem, a transformada de watershed [6] e aplicada para estimar os contornos
correspondentes da maneira mais precisa possvel. No entanto, extremos locais (freq
uentemente utilizados como marcadores) podem corresponder a estruturas nao-significativas
ou rudo, causando super-segmentacao.
Para evitar este problema, uma alternativa e selecionar extremos segundo algum
criterio. Uma abordagem tpica consiste em utilizar a transformacao de h-maximos (hmnimos) para suprimir todos os maximos (mnimos) da imagem cujo contraste seja menor
que um dado valor h, e usar os maximos (mnimos) restantes como marcadores. A Figura 5.2 ilustra o efeito de sua aplicacao em um sinal unidimensional.

(a)

(b)

Figura 5.2: Exemplo aplicacao da transformada de h-maximos. A linha pontilhada na


parte inferior da figura mostra a localizacao dos maximos [77].

A transformacao de h-maximos pode ser definida atraves de uma reconstrucao morfologica por dilatacao de f utilizando a imagem transladada (f h) como marcadora:
Rf (f h) = fi (f h), em que i denota a iteracao em que a idempotencia e atingida,
ou seja, fi+1 (f h) = fi (f h) [75]. Essa transformacao esta relacionada ao conceito de
dinamica [78], uma medida de persistencia das estruturas marcadas pelos extremos quando
filtros de contraste sao aplicados. Maximos locais de uma imagem f serao maximos de sua
transformada de h-maximos somente se a estrutura que eles marcam tiver um contraste
maior que h, o que tambem implica numa dinamica maior que h [77]. A transformacao
de h-mnimos e definida de maneira analoga.

5.1. Segmentacao de imagens em nveis de cinza

55

Contudo, selecionar extremos pode nao ser suficiente para evitar super-segmentacao,
dado que rudos nao necessariamente serao eliminados neste processo. Desse modo, tornase necessaria uma etapa adicional visando a simplificacao das estruturas da imagem original. Nos exemplos a seguir, a transformada de watershed e calculada utilizando-se
como marcadores os maximos estendidos resultantes da aplicacao da transformacao de
h-maximos na imagem original e tambem naquela processada pelo operador SMMT.
As Figuras 5.3 e 5.4 mostram os resultados de segmentacao para imagens com iluminacao nao-uniforme [65]. A u
ltima coluna de cada figura apresenta os melhores resultados ao considerar os h-maximos da imagem original como marcadores. Observe que a
utilizacao da imagem transformada pelo SMMT torna os resultados menos sensveis `as
mudancas de iluminacao, possibilitando a extracao de marcadores que definem uma segmentacao que realca as estruturas mais significativas da imagem sem introduzir artefatos.

(a)

(b)

(c)

(d)

Figura 5.3: Resultados para uma imagem com iluminacao nao-uniforme (variacao gaussiana): (a) imagem original, usando imagens transformadas (b) 1 = 60 e k = 1, com
h = 2; (c) 1 = 60 e k = 1, com h = 10, e (d) com base na imagem original e h = 10.

(a)

(b)

(c)

Figura 5.4: Resultados de segmentacao para uma imagem com iluminacao nao-uniforme
(variacao linear) (a) imagem original, (b) usando imagem transformada 1 = 10 e k = 5,
com h = 45, e (c) com base na imagem original usando h = 45.

A avaliacao dos resultados de um algoritmo de segmentacao nao e uma tarefa facil,


principalmente quando nao ha um objetivo especfico definido (na extracao dos caracteres,
por exemplo, o resultado esperado e bem-definido). Embora mostre as vantagens do
operador proposto, a analise qualitativa apresentada acima, baseada em criterios tais
como a insensibilidade a variacoes nas condicoes de iluminacao, e totalmente subjetiva.

56

Captulo 5

Com o intuito de avaliar de forma mais precisa o efeito da utilizacao da imagem


simplificada pelo operador SMMT no processo de segmentacao morfologica, os resultados
obtidos foram comparados com a sua versao segmentada manualmente para uma base de
100 imagens [4]. Para evitar potenciais ambiguidades, cada imagem possui apenas um
objeto de interesse bem definido. A medida de avaliacao considerada foi a F-score, que
consiste na media harmonica dos ndices de precisao, P , e revocacao, R:
F =

2 (P R)
,
P +R

(5.1)

em que F varia de 0 a 1 (o valor 1 representa a segmentacao perfeita). Em resumo,


a precisao indica a porcentagem dos pixels classificados como parte do objeto que sao
de fato relevantes, enquanto que a revocacao representa a proporcao do total de pixels
pertencentes ao objeto que foram classificados corretamente como tal [10].
Visando obter uma analise mais robusta, cada imagem da base de comparacao foi
transformada atraves do operador SMMT para diferentes escalas e n
umero de iteracoes
= 1, . . . , 20, k = 1, . . . , 8. Alem disso, foram extrados como marcadores maximos
estendidos para h = 1, . . . , 20, tanto na imagem original quanto na processada pelo operador. Em ambos os casos, apenas o melhor resultado foi considerado para o calculo do
ndice F-score medio da base. Desta forma, e possvel comparar em termos quantitativos
a melhor segmentacao obtida a partir de cada abordagem.
A Tabela 5.1 apresenta o ndice F-score medio ao considerar, para calculo das medidas
de precisao e revocacao, apenas os pixels pertencentes `a regiao segmentada que melhor
aproxima o objeto de interesse.
Tabela 5.1: Medida F-score ao considerar um u
nico segmento
objeto a ser segmentado.
Imagem segmentada
F-score Revocacao
A partir da original
0.6781
0.8400
Processada pelo SMMT 0.8460
0.9192

que melhor se ajusta ao


Precisao
0.5685
0.7836

A Tabela 5.2 mostra os ndices calculados considerando-se a uniao das regioes segmentadas que melhor se sobrepoem ao objeto de interesse.
Tabela 5.2: Medida F-score ao considerar a uniao de segmentos que melhor correspondem
(se sobrepoem) ao objeto a ser segmentado.
Imagem segmentada
F-score Revocacao Precisao Fragmentacao
A partir da original
0.8368
0.8910
0.7888
8.27
Processada pelo SMMT 0.9199
0.9392
0.9013
9.46

5.1. Segmentacao de imagens em nveis de cinza

57

A medida de fragmentacao corresponde `a quantidade de regioes necessarias para tal


sobreposicao. Observe que nas duas avaliacoes o melhor ndice F-score medio refere-se
aos resultados de segmentacao utilizando marcadores extrados das imagens processadas
pelo operador SMMT. A Figura 5.5 ilustra alguns exemplos [4].

(a)

(b)

(c)

(d)

Figura 5.5: (a) imagens originais, (b) segmentacao manual e resultados obtidos com
marcadores extrados (c) da imagem processada pelo SMMT e (d) da imagem original.
Embora a fragmentacao seja maior quando a imagem transformada pelo SMMT e utilizada, isso nao e necessariamente ruim se a segmentacao resultante e significativa, assim
como ocorre na primeira linha da Figura 5.5, por exemplo. Alem disso, como a distribuicao dos nveis de cinza da imagem transformada e mais homogenea, a segmentacao final
e menos sensvel `as variacoes de iluminacao, as quais podem influenciar negativamente o
resultado, tal como ilustrado na segunda linha da Figura 5.5.
Alem da super-segmentacao, outro problema freq
uente e o vazamento, isto e, a situacao
em que parte do objeto conquista pixels do fundo da imagem ou vice-versa. Isso ocorre
principalmente quando os contornos sao pouco definidos, mas pode acontecer mesmo se
o objeto de interesse tem um contraste bem diferente do fundo, tal como no exemplo
ilustrado na terceira linha da Figura 5.5. O resultado obtido atraves da imagem simplificada nao e comprometido devido `a regularizacao realizada pelo SMMT. A proxima secao
explora tais aspectos atraves de uma aplicacao envolvendo imagens celulares.

58

5.2

Captulo 5

Aplicac
ao: segmenta
c
ao de c
elulas

A segmentacao de celulas e um problema complexo, considerando que elas podem se


sobrepor ou ter variacoes na sua forma e tamanho. Alem disso, devido principalmente a`
heterogeneidade da iluminacao, o contraste entre as regioes de fronteira e o fundo varia
dependendo das condicoes de captura.
Esta secao ilustra a segmentacao de globulos brancos (White Blood Cells - WBC),
tambem denominados leucocitos [3], os quais consistem em celulas do sistema imunologico
produzidas na medula ossea e encontradas em diversas partes do corpo, tais como sangue
e tecidos conjuntivos. Como o n
umero de WBC e um indicador de determinadas doencas,
a contagem das suas diferentes classes, denominada contagem diferencial, tem um papel
fundamental na analise da sa
ude do paciente em diferentes estagios como, por exemplo,
diagnostico, tratamento e acompanhamento [3, 76].
Alem de ser tediosa e extremamente custosa em termos de tempo, a contagem diferencial realizada de forma manual por um especialista e imprecisa, de difcil reproducao
e subjetiva, dependendo do seu conhecimento e/ou interpretacao. Tal fato motivou o desenvolvimento de metodos automatizados para realizar esta tarefa de modo objetivo e eficiente. De forma geral, tais metodos segmentam a celula em suas componentes principais,
n
ucleo e citoplasma, dos quais sao extradas as caractersticas utilizadas para classifica-la
segundo seu nvel de maturacao.
As tecnicas de segmentacao propostas sao usualmente baseadas em esquemas de deteccao de contorno e crescimento de regioes. Kumar e Sreenivas [41] segmentam o n
ucleo
utilizando o operador de energia de Teager e o citoplasma atraves de um metodo simples
que usa transformacoes morfologicas. Theera-Umpon [76] propoe uma tecnica automatica
para segmentar o n
ucleo e o citoplasma de WBC baseada no algoritmo de fuzzy c-means
e em operacoes basicas de morfologia matematica.
Em [39], Jiang et al. sugerem um esquema de segmentacao de WBC baseado em
filtragem espaco-escala e clusterizacao de histograma. Liao e Deng [48] partem de um
contorno aproximado dos componentes obtido por limiarizacao e o aperfeicoam utilizando
tecnicas de analise de forma. O uso isolado de tecnicas de limiarizacao, por sua vez,
conduz a resultados insatisfatorios na maioria dos casos, devido principalmente ao fato
de que a informacao espacial nao e considerada.
Esta secao propoe a utilizacao do operador espaco-escala SMMT como uma etapa de
pre-processamento na segmentacao de WBC atraves da transformada de watershed [17].
Conforme discutido a seguir, tal procedimento conduz a resultados de melhor qualidade,
possibilitando a extracao de caractersticas mais robustas a serem utilizadas posteriormente em um processo de classificacao e, consequentemente, na realizacao da contagem
diferencial automatica de forma mais adequada.

5.2. Aplicacao: segmentacao de celulas

5.2.1

59

Abordagem proposta

As propriedades de simplificacao do operador SMMT foram exploradas com o objetivo


de melhorar a qualidade da imagem antes de segmenta-la em seus componentes n
ucleo e
citoplasma. Escolhendo a escala apropriada, apenas as caractersticas de interesse serao
preservadas e, ao variar o n
umero de iteracoes, uma regularizacao do contorno e obtida
devido a uma fusao de regioes (Captulo 4). As imagens resultantes consistem, assim, em
versoes mais apropriadas aos algoritmos de segmentacao, facilitando seu processamento e
conduzindo a resultados mais precisos.
Segmentac
ao do n
ucleo
O n
ucleo foi segmentado atraves da transformada de watershed baseada na transformada
imagem floresta (Image Foresting Transform - IFT) [54], uma metodologia para o projeto
de operadores de processamento de imagens baseada em conectividade (grafos). A IFT
associa cada pixel a uma arvore de caminho de custo mnimo cuja raiz e um marcador
externo ou interno (denominado semente) [19]. Tal custo e determinado por uma funcao
dependente da aplicacao, que usualmente baseia-se nas propriedades locais da imagem
- tais como cor, gradiente e posicao do pixel. A floresta de caminho otimo resultante
consiste em duas sub-florestas com rotulos distintos: objeto e fundo.
As sementes internas devem necessariamente pertencer aos objetos de interesse e as
externas sao inicializadas como seus contornos (imagem gradiente). Explorando o fato
que, para o conjunto de testes considerado, a regiao do n
ucleo e mais escura que o restante
da imagem, a semente interna e determinada atraves de uma operacao de limiarizacao, a
qual gera (pelo menos) uma amostra para cada WBC.
Devido `a nao-uniformidade da iluminacao, o contraste das regioes de contorno da
celula pode modificar-se significativamente, resultando em uma imagem gradiente fraca
que nao necessariamente possui valores mais altos nos pixels da borda (Figura 5.6(b)).
Assim, como ilustrado na Figura 5.6(c), pode ocorrer vazamento, ou seja, uma semente do
objeto conquista uma parte da area pertencente ao fundo ou vice-versa. Existem algumas
extensoes da IFT para lidar com este problema, tal como a poda de arvore [60].
Este trabalho propoe uma abordagem mais simples, em que a imagem original e processada pelo operador SMMT antes de ser utilizada por algoritmos de segmentacao. Com
isso, os nveis de cinza passam a ter uma distribuicao mais homogenea, levando a uma
regularizacao do contorno que melhora a qualidade do gradiente (Figura 5.6(e)). Desta
forma, a segmentacao resultante e mais exata, possibilitando a extracao de caractersticas
mais precisas para serem utilizadas posteriormente em um processo de classificacao (Figura 5.6(f)). Esta regularizacao e mais precisa que aquela obtida atraves de metodos
tradicionais como, por exemplo, o high-boost e o Laplaciano [26].

60

Captulo 5

(a)

(b)

(c)

(d)

(e)

(f)

Figura 5.6: Melhoria na imagem gradiente apos aplicacao do operador SMMT: (a,d)
versoes original e processada, (b,e) imagens gradiente e (c,f) resultados da segmentacao.
Para descartar pixels do citoplasma conectados ao n
ucleo e eliminar pequenas irregularidades, e aplicada uma erosao (de tamanho um) na imagem processada antes do calculo
da transformada de watershed. O esquema proposto esta sumarizado a seguir.
Algoritmo 1 Procedimento para segmentacao do n
ucleo de WBC
1: dada uma imagem de entrada I;
2: criar uma imagem bin
aria, Ib, por limiarizacao;
3: criar uma imagem simplificada, Is, aplicando o operador SMMT em I (foram consideradas 10 iteracoes na escala um na maioria dos experimentos realizados);
4: calcular uma eros
ao em Is para descartar pequenos resduos;
5: calcule a transformada de watershed utilizando Ib como marcadores internos e Is para
calcular a imagem gradiente.

Segmenta
c
ao do citoplasma
Como o n
ucleo ja esta segmentado, resta apenas separar o citoplasma do fundo e das
celulas vermelhas do sangue (Red Blood Cells - RBC). Em um primeiro passo, a imagem
original e limiarizada para eliminar o fundo (no conjunto de testes, este e sempre mais
claro que os objetos de interesse).
Para identificar e descartar as RBC, a abordagem proposta explora o fato de que elas
possuem um tamanho similar, geralmente menor que o das WBC. Para obter a distribuicao de tamanho das estruturas da imagem, pode-se utilizar a funcao granulometrica, a
qual e calculada com base em uma serie de aberturas a partir de elementos estruturantes

5.2. Aplicacao: segmentacao de celulas

61

de tamanho crescente. Em resumo, esta transformacao consiste no mapeamento entre


o tamanho do elemento estruturante e o n
umero de objetos eliminados [57, 75]. Assim,
RBC podem ser descartadas aplicando-se uma abertura na imagem limiarizada utilizando
um elemento estruturante circular de raio maior que aquele correspondente `a sua distribuicao de tamanho. Desta forma, sao preservados apenas os marcadores das WBC, que
sao as u
nicas componentes conexas na imagem limiarizada que satisfazem este tamanho
especfico. O resultado consiste em uma imagem binaria cujos contornos correspondem a
uma aproximacao do citoplasma.
Quando existem RBC sobrepostas, e possvel que as mesmas nao sejam eliminadas
atraves deste procedimento, sendo incorretamente classificadas como WBC. Para evitar
este problema, e verificado se as componentes conexas resultantes deste processo envolvem
um dos n
ucleos pre-segmentados.
Embora possua algumas limitacoes, esta segmentacao aproximada do citoplasma e
suficiente para gerar bons resultados de classificacao pois, para esse fim, o principal componente e o n
ucleo. O citoplasma apenas auxilia na diferenciacao entre alguns estagios
de maturacao (onde a forma do n
ucleo e similar, mas a proporcao n
ucleo/citoplasma e
diferente). O esquema proposto e sumarizado no Algoritmo 2 e ilustrado na Figura 5.7.
Algoritmo 2 Procedimento para segmentacao do citoplasma de WBC
1: dada uma imagem de entrada I;
2: calcular a fun
cao granulometrica para obter a distribuicao de tamanho das RBC, sd;
3: criar uma imagem bin
aria, Ib, utilizando um valor de limiar que separe todo o fundo;
4: calcular uma abertura em Ib com um elemento estruturante de tamanho sd;
5: descartar componentes que n
ao possuem interseccao com um n
ucleo pre-segmentado.

(a)

(b)

(c)

(d)

Figura 5.7: Esquema de segmentacao do citoplasma: (a) imagem original, (b) limiarizacao
para eliminacao do fundo, (c) abertura utilizando um elemento estruturante de tamanho
maior que a distribuicao de tamanho das RBC e (d) contorno de (c) sobreposto na imagem
original.

62

Captulo 5

5.2.2

Resultados

As linhas celulares mais importantes relacionadas `a medula ossea sao as series denominadas eritroide, linfoide e granuloctica [56]. De acordo com o nvel de maturacao, elas
diferem em caractersticas tais como forma, textura, cor, granularidade e densidade.
O conjunto de imagens utilizado neste trabalho pertence `a serie granulocytic, composta
pelas celulas mieloblasto, promielocito, mielocito, metamielocito, neutrofilo bastonete e
segmentado, ilustradas na Figura 5.8. Para que o processo de classificacao envolva apenas
caractersticas baseadas na forma, nao serao utilizadas amostras do tipo promielocito pois,
neste caso, seria necessario considerar informacoes de cor e textura) [76].

(a)

(b)

(c)

(d)

(e)

(f)

Figura 5.8: Celulas da linha celular granuloctica: (a) mieloblasto, (b) promielocito, (c)
mielocito, (d) metamielocito, (e) neutrofilo bastonete e (f) segmentado [53].
Tais imagens pertencem ao CellAtlas.com [3], um banco de dados p
ublico com imagens de celulas de sangue classificadas por especialistas da areas de hematologia. Foram
realizados testes em mais de 100 amostras, obtendo-se resultados promissores. A Figura 5.9 ilustra alguns exemplos de segmentacao do n
ucleo de WBC.

Figura 5.9: Segmentacao do n


ucleo de WBC em imagens com um u
nico n
ucleo.
Em contraste a abordagens que exigem uma sub-imagem para cada WBC, o esquema
proposto tambem produz bons resultados de segmentacao para imagens compostas por
varias celulas, mesmo em casos onde o fundo e complexo e contem RBC sobrepostas. Observe na Figura 5.10 que resultados precisos sao obtidos, eliminando assim a necessidade
de uma etapa adicional para extracao de sub-imagens.

5.2. Aplicacao: segmentacao de celulas

63

Figura 5.10: Segmentacao do n


ucleo de WBC em imagens com m
ultiplas celulas.
Como discutido anteriormente, a iluminacao nao-uniforme pode afetar o contraste no
contorno entre o n
ucleo e o citoplasma, aumentando as chances de vazamento devido `a
baixa definicao da imagem gradiente [76]. A Figura 5.11 ilustra alguns resultados em que
o pre-processamento da imagem inicial com o operador SMMT foi essencial para evitar
tais problemas.

(a)

(b)

(c)

(d)

Figura 5.11: Exemplo de segmentacao onde o vazamento pode ser evitado com a utilizacao
do operador SMMT. Resultados utilizando como marcador externo a imagem gradiente
(Sobel) da imagem (a,c) original e (b,d) processada pelo SMMT.
Finalmente, a Figura 5.12 apresenta alguns resultados de segmentacao do citoplasma.
Embora seja apenas uma estimativa, esta segmentacao pode ser considerada uma boa
representacao da area e forma do citoplasma para fins de extracao de caractersticas,
conforme discutido na proxima secao.

Figura 5.12: Resultados de segmentacao de citoplasma.

64

Captulo 5

A simplificacao realizada pelo SMMT tambem conduz a melhores resultados quando


associada a outros algoritmos de segmentacao. As Figuras 5.13 e 5.14 mostram os resultados obtidos para os algoritmos normalized cuts [38] e mean shift [9], respectivamente.
No primeiro, os pixels da imagem sao vistos como pontos em um espaco de caractersticas
organizados na forma de um grafo com pesos. A segmentacao, interpretada como um
problema de agrupamento de pixels com caractersticas semelhantes, e realizada atraves
de um procedimento de corte em grafo cujo criterio se baseia tanto na dissimilaridade
entre os diferentes grupos quanto na similaridade entre os componentes de cada grupo.

(a)

(b)

(c)

Figura 5.13: Segmentacao com Normalized Cuts: (a) imagem original e resultados considerando a imagem (b) processada pelo SMMT ( 1 = 5, k = 15) e (c) a partir da
original.
O algoritmo Mean Shift, por sua vez, define os agrupamentos como sendo as zonas de
influencia dos maximos de uma funcao densidade de probabilidade formada pela representacao dos pixels no espaco de caractersticas [9].

(a)

(b)

(c)

Figura 5.14: Resultados com Mean Shift. (a) imagem de entrada (primeira linha: original
e segunda linha: processada pelo SMMT, (b) Segmentacao e (c) bordas da segmentacao.

5.2. Aplicacao: segmentacao de celulas

65

Resultados de Classificac
ao
Os sistemas automatizados de contagem diferencial em geral nao atingem taxas de classificacao aceitaveis, impossibilitando seu uso na pratica. Por este motivo, e preciso que
o processo seja feito manualmente, tornando os resultados subjetivos `a interpretacao da
pessoa realizando a tarefa. A diferenca entre a classificacao realizada por dois especialistas independentes e de aproximadamente 15% e, portanto, a precisao da contagem
manual pode ser estimada em 85% [56]. Um dos fatores que causam essa diferenca na
interpretacao dos resultados e que, enquanto os estagios de maturacao sao uma variavel
contnua, a escolha do especialista precisa ser discreta.
Neste trabalho, a classificacao foi realizada a partir de caractersticas extradas dos
resultados de segmentacao da secao anterior, que considerou o conjunto de imagens composto por cinco classes de celulas pertencentes `a serie celular granuloctica (Figura 5.8).
Tais caractersticas representam a forma geometrica do n
ucleo e tambem da celula completa. Os seguintes parametros foram extrados do componente n
ucleo: (f1) area, (f2)
solidez, (f3) excentricidade, (f4) area da parte convexa do n
ucleo e (f5) permetro. A
excentricidade representa a razao entre os tamanhos maximo e mnimo de eixo, e assume
um valor entre 0 e 1. A solidez representa a proporcao dos pixels no fecho convexo que
tambem pertencem ao objeto. Por fim, tambem foi calculada a taxa entre a area do n
ucleo
e citoplasma (f6).
O n
umero excessivo de caractersticas pode perturbar o processo de reconhecimento
de padroes, pois as mesmas podem ser contraditorias ou mesmo representar informacao
nao-significativa, tal como rudo. Portanto, e necessario avaliar qual subconjunto e o mais
apropriado para o problema especfico. Isso tambem causa a reducao da dimensionalidade
do espaco de caractersticas e, consequentemente, uma melhoria do desempenho e da
capacidade de discriminacao do algoritmo de classificacao. Aqui, as caractersticas f1-f6
foram combinadas experimentalmente de diferentes formas para identificar quais delas
conduziam a taxas de classificacao mais precisas. A Tabela 5.3 mostra a porcentagem das
WBC corretamente classificadas para diferentes combinacoes, utilizando o algoritmo de
classificacao knn com a abordagem leave-one-out [10].
Tabela 5.3: Conjuntos de caractersticas e taxas de classificacao.
Caractersticas
Taxa de Classificacao Correta
f1, f2, f3, f4, f5 e f6
54.29%
f2 e f5
60.00%
f3 e f5
68.57%
f3, f5 e f6
70.23%
f3, f4 e f5
71.43%

66

Captulo 5

Observe que, mesmo considerando apenas caractersticas baseadas na forma e um


classificador muito simples, foram obtidos bons resultados preliminares (lembre-se que
a segmentacao manual possui uma acuracia de 85%). Isso indica que as informacoes
derivadas dos componentes n
ucleo e citoplasma segmentados pela abordagem proposta
sao confiaveis e podem ser aplicadas em testes mais completos, seja em conjunto com
outras caractersticas ou utilizando classificadores mais robustos. Observe ainda que a
selecao das caractersticas mais discriminativas aumentou as taxas de classificacao de
54.29% para 71.43%.
importante ressaltar que o objetivo dos testes realizados foi apenas avaliar se os
E
n
ucleos segmentados pela abordagem proposta sao adequados para fins de classificacao
(em termos de precisao na recuperacao da forma, por exemplo). Para uma analise mais
robusta, seria preciso considerar um maior formalismo na selecao de caractersticas. Neste
sentido, podem ser utilizadas tecnicas automaticas de selecao de caractersticas, bem como
algoritmos de classificacao mais robustos.

5.3

Conclus
oes

Este captulo apresentou exemplos em que a qualidade dos resultados obtidos depende
fortemente da simplificacao realizada pelo operador SMMT. Em alguns casos, tal simplificacao permite a extracao de marcadores mais significativos, evitando super-segmentacao.
Em outros, conduz `a regularizacao do contorno, possibilitando o calculo de uma imagem
gradiente adequada.
Bons resultados foram obtidos mesmo em imagens com problemas de iluminacao,
conforme ilustrado nas Figuras 5.3 e 5.4. A Secao 5.1 tambem mostrou que a segmentacao
obtida atraves da imagem processada pelo operador e mais precisa do que quando a
imagem original e utilizada diretamente.
Por fim, foram discutidos os resultados de segmentacao e classificacao de WBC em
que, novamente, a utilizacao do operador SMMT foi fundamental para evitar problemas
tais como vazamento. O proximo captulo apresenta um novo operador de binarizacao
que explora as propriedades do SMMT para identificar ou delimitar regioes de interesse.

Captulo 6
Abordagem toggle para binariza
c
ao
multi-escala de imagens
Diferentemente de outras abordagens, na transformacao realizada pelo operador SMMT,
maximos e mnimos da imagem interagem ao mesmo tempo, conduzindo a uma fusao de
regioes que a simplificam de tal forma que importantes estruturas podem ser identificadas mesmo quando da existencia de variacoes nas condicoes de iluminacao. Alem disso,
por lidar explicitamente com o conceito de escala, tal abordagem possibilita a analise
da imagem em diferentes nveis de representacao, o que facilita a identificacao daqueles
contendo o conjunto das caractersticas de interesse. Neste captulo, tais propriedades sao
exploradas para definir uma nova operacao de limiarizacao adaptativa multi-escala:
Definic
ao 6.1. (Operador de binarizac
ao adaptativo multi-escala) Seja k1 (x) =
[B (f )]k (x), isto e, a dilatacao de f (x) com a func
ao estruturante dependente de escala
k
k
B k vezes. De forma analoga, 2 (x) = [B (f )] (x). O novo operador de binarizacao e
dado pela funcao:

1, se k1 (x) f (x) f (x) k2 (x),
k
(6.1)
(f g ) (x) =
0, em outros casos.
Em resumo, se o valor de um pixel est
a mais pr
oximo do seu valor erodido atribui-se a
ele zero (preto). Caso contrario, atribui-se o valor um (branco), inclusive se a diferenca
entre o seu valor erodido e dilatado for a mesma.
Esta operacao explora principalmente o fato de que diferentes estruturas sao afetadas
dependendo da escala e do n
umero de iteracoes (Captulo 4). Quanto menor a escala, por
exemplo, maior deve ser a diferenca entre os nveis de cinza de pixels vizinhos para que
os mesmos sejam alterados por uma das primitivas. Esta caracterstica pode ser utilizada
para extrair informacoes relacionadas a regioes em que ha uma maior variacao, tais como
contornos (os quais tipicamente correspondem aos limites fsicos dos objetos).
67

68

Captulo 6

Observe tambem que, assim como e o caso para o SMMT, a regra de decisao baseia-se
na similaridade do pixel sendo analisado em relacao `as transformacoes morfologicas de
erosao e dilatacao dependentes de escala. Dado que o valor de um maximo (mnimo) local
e considerado para determinar o valor dilatado (erodido), pode-se interpretar o resultado
da aplicacao do operador de binarizacao como a representacao da convergencia de um
pixel para a regiao de influencia de um extremo local (veja a discussao destes aspectos no
Captulo 4). Em resumo, um pixel arbitrario pode convergir para a regiao de influencia
de um mnimo (valor zero), de um maximo (valor um) ou para nenhuma (valor um). O
aumento no n
umero de iteracoes considera uma vizinhanca mais ampla nesta analise.
A Figura 6.1 ilustra o efeito da mudanca de parametros para uma imagem com iluminacao nao-uniforme. Como o fundo e mais escuro que os graos (Figura 6.1(a)), os pixels
pertencentes a ele tendem a se aproximar mais do seu valor erodido quando escalas mais
altas sao consideradas (pois, neste caso, pequenas variacoes nos nveis de cinza sao suficientes para modifica-los). A aplicacao iterativa evita que extremos nao significativos - tais
como aqueles presentes devido `as variacoes nas condicoes de iluminacao - comprometam
o resultado (Figura 6.1(b)).
A Figura 6.1(c) mostra o resultado ao considerar uma escala menor. Neste caso, regioes
com nveis de cinza homogeneos tendem a nao ser alteradas, fazendo com que o fundo
nao seja transformado (Captulo 4). A parte interna, por ser mais clara, aproxima-se
mais da transformacao definida pela dilatacao e tambem e alterada para o valor um. Por
outro lado, os pixels pertencentes aos contornos dos graos, regioes em que ha uma maior
variacao, estao mais proximos do valor erodido e sao associados ao valor zero.

(a)

(b)

(c)

Figura 6.1: Efeito da alteracao dos parametros no operador de binarizacao: (a) imagem
original, (b) 1 = 1 e k = 25 e (c) 1 = 40 e k = 5.

Portanto, dependendo do objetivo especfico, diferentes combinacoes de parametros


devem ser utilizadas. Enquanto escalas maiores tendem a criar regioes, escalas menores
as delimitam, identificando regioes de contorno.

6.1. Trabalhos relacionados

6.1

69

Trabalhos relacionados

Basicamente, a limiarizacao consiste na transformacao de uma imagem em nveis de cinza


numa imagem binaria, a qual deve preferencialmente preservar informacoes relevantes
sobre n
umero, forma e posicao dos objetos que a compoem. A principal motivacao,
neste sentido, vem do fato de que a complexidade dos dados e reduzida, simplificando
processamentos futuros.
A metodologia mais simples neste tipo de transformacao consiste em utilizar um u
nico
limiar para toda a imagem. Contudo, devido a fatores como rudo e heterogeneidade na
iluminacao, os resultados obtidos sao geralmente insatisfatorios para a maioria dos casos,
exigindo o uso de diversos valores de limiares.
As abordagens de binarizacao sao tipicamente classificadas em duas categorias, dependendo da forma de obtencao do limiar: globais, se dados que representam a imagem como
um todo sao utilizados, ou locais, quando considera-se apenas a informacao em uma vizinhanca do pixel a ser transformado. As tecnicas globais mais frequentemente utilizadas
sao baseadas em analise de histograma, determinando o valor do limiar a partir daquele
que melhor separa seus picos [68]. Metodos de multi-limiarizacao, por sua vez, alem da
analise da funcao de distribuicao do histograma tambem podem utilizar informacoes sobre
contornos [81].
Entretanto, o bom desempenho de tais abordagens depende de um conhecimento preliminar sobre o n
umero ideal de picos. Alem disso, como nao necessariamente todas as
caractersticas de interesse formam picos proeminentes (como e o caso para objetos distintos com o mesmo nvel de cinza), bons resultados sao obtidos apenas quando existe
uma boa separacao entre o fundo e os objetos de interesse. Estes fatores tornam inviavel
sua aplicacao em imagens com iluminacao nao-uniforme, por exemplo [68].
Uma abordagem de limiarizacao global de proposito geral bastante conhecida e o
algoritmo de Otsu [63, 65]. Basicamente, ele seleciona como limiar o valor t que minimiza
a seguinte relacao:
2
(t) = b2 ,
(6.2)
t
em que b2 representa a variacao dos valores medios de cada classe considerada (fundo e
objetos) em relacao `a media total de todos os pixels e t2 e a variancia total.
Por outro lado, tecnicas de limiarizacao local fornecem uma solucao adaptativa, dado
que o valor do limiar e determinado pontualmente com base na informacao presente em
uma vizinhanca pre-definida. Devido ao custo computacional, e importante que tais
transformacoes sejam eficientes. Algumas delas sao descritas a seguir.
O metodo das medias deslizantes determina o limiar com base no nvel de cinza medio
dos u
ltimos n pixels e foi especialmente desenvolvido para imagens contendo texto. A

70

Captulo 6

imagem pode ser manipulada como uma cadeia unidimensional de pixels e a media pode
ser calculada exatamente ou estimada atraves da seguinte equacao [65]:
Mi+1 = Mi

Mi
+ gi+1 ,
n

(6.3)

em que Mi+1 e a media deslizante estimada para o pixel i + 1, gi+1 e o seu nvel de cinza
e Mi e a media anterior (isto e, para o pixel i). O valor do limiar e definido como uma
certa porcentagem desta media deslizante.
O algoritmo de Niblack foi desenvolvido para segmentacao de imagens de documentos
e define um limiar local a partir da media e do desvio padrao calculados sobre uma janela
retangular em torno do pixel sendo transformado segundo a seguinte equacao [61]:
T = m + k s,

(6.4)

em que m e a media e s e o desvio padrao dos pixels da janela. A variavel k determina


quanto do objeto e mantido e assume um valor entre 1 e 1. Como desvantagens, o
metodo possui a baixa eficiencia computacional (o tempo de calculo do limiar varia com o
tamanho da vizinhanca), a sensibilidade ao tamanho da janela (o ideal e que ela contenha
no mnimo um caracter) e a ocorrencia de rudo na regiao do fundo.
Para minimizar este rudo, Sauvola propos uma extensao a este algoritmo na qual o
valor do limiar e calculado considerando um intervalo dinamico do desvio padrao, R, de
acordo com a equacao [69]:

s

T =m 1+k
1 ,
(6.5)
R
em que, novamente, m e s sao a media e o desvio padrao dos pixels da janela. Aqui, k
assume um valor positivo entre 0 e 1. Para determinar apropriadamente o valor de R,
e necessario conhecer o contraste do documento. Contudo, a influencia do tamanho da
janela e o custo computacional permanecem um problema.
Gatos et al. [24] propuseram um esquema de binarizacao local para imagens de documentos que e robusto a diferentes problemas de degradacao. O metodo consiste em cinco
passos principais: (a) pre-processamento utilizando o filtro de Wiener [26], (b) calculo de
uma aproximacao inicial do texto utilizando o algoritmo de Sauvola (Equacao 6.5), (c)
estimativa da superfcie do fundo atraves de interpolacao, (d) limiarizacao dos objetos
de interesse com base na combinacao entre a estimativa do fundo e a imagem original,
e (e) etapa de pos-processamento para melhorar a qualidade das letras e preservar a sua
conexidade.
A seguir, os metodos descritos sao comparados ao operador proposto em diferentes
contextos. Visando avaliar adequadamente a sua robustez, ele e aplicado em imagens de
diferentes classes e sujeitas a diversos tipos de degradacao.

6.2. Binarizacao de imagens com problemas de iluminacao

6.2

71

Binarizac
ao de imagens com problemas de iluminac
ao

O primeiro experimento tem como objetivo verificar o efeito da utilizacao de imagens


com iluminacao nao-uniforme. Os resultados da abordagem proposta foram comparados
`aqueles obtidos por alguns algoritmos descritos anteriormente neste captulo: Otsu [63],
medias deslizantes [83], Niblack [61] e Gatos et al. [24]. A Figura 6.2 apresenta os resultados ao considerar imagens com variacao linear, gaussiana e senoidal, respectivamente [65].

(a)

(b)

(c)

(d)

(e)

Figura 6.2: Resultados de binarizacao para imagens com diferentes condicoes de iluminacao: (a) imagens originais, (b) Otsu, (c) Niblack, (d) Gatos Gatos et al. e (e) medias
deslizantes.
Observe que o desempenho de alguns metodos foi significativamente afetado. O
metodo de limiarizacao global de Otsu, por exemplo, nao apresentou resultados satisfatorios em nenhum caso (Figura 6.2(b)). O algoritmo de Niblack gerou rudo na regiao
de fundo para todos os experimentos (Figura 6.2(c)). Os metodos de Gatos et al. (Figura 6.2(d)) e de medias deslizantes (Figura 6.2(d)) conseguiram lidar adequadamente
com imagens textuais, considerando que foram desenvolvidos para este proposito. Contudo, produziram efeitos indesejaveis nos demais casos.

72

Captulo 6

A abordagem proposta, por sua vez, conduz a uma binarizacao satisfatoria em todos
os exemplos, assim como ilustrado na Figura 6.3. Como discutido no incio deste captulo,
dependendo dos parametros escolhidos, regioes tendem a ser criadas ou delimitadas. O
u
nico resultado de baixa qualidade foi obtido para a imagem de texto utilizando uma escala
mais alta (Figura 6.3(c)), caso em que o operador tenta criar regioes. Este problema pode
ser resolvido com a utilizacao de escalas menores (Figura 6.3(f)).

(a)

(b)

(c)

(d)

(e)

(f)

Figura 6.3: Resultados do operador de binarizacao proposto utilizando imagens com


diferentes condicoes de iluminacao considerando como parametros (a) k = 50 e 1 = 1,
(b) k = 50 e 1 = 2, (c) k = 10 e 1 = 1, (d) k = 2 e 1 = 8, (e) k = 2 e 1 = 25) e
(f) k = 5 e 1 = 20.
A proxima secao discute de forma mais detalhada a aplicacao das abordagens de
limiarizacao em imagens contendo texto.

6.3

Binarizac
ao de imagens de documentos

A binarizacao de imagens de documentos pode ser definida como a sua segmentacao nos
componentes texto e fundo. Alem de gerar imagens que sao mais apropriadas `as tarefas de
mais alto nvel, por exemplo o reconhecimento de caracteres, este procedimento tambem
facilita o gerenciamento de dados e diminui a quantidade de espaco de armazenamento
necessaria, um aspecto importante tendo em vista o grande n
umero de documentos digitalizados existentes atualmente.
importante observar que tais imagens estao sujeitas a diferentes problemas de deE
gradacao, os quais podem perturbar significativamente os resultados se metodos de limiarizacao apropriados nao forem utilizados. Em documentos historicos, por exemplo, e
muito comum a ocorrencia de iluminacao nao-uniforme, manchas e borroes.

6.3. Binarizacao de imagens de documentos

73

As propriedades do operador de binarizacao proposto podem ser exploradas para lidar


com estes problemas. Conforme mencionado anteriormente, diferentes estruturas sao
modificadas em funcao da escala de processamento do operador. Para detectar regioes
contendo texto, as quais possuem uma variacao maior nos nveis de cinza, sao utilizadas
escalas mais baixas. Este procedimento e capaz de lidar adequadamente com diferentes
tipos de rudo e com variacoes nas condicoes de iluminacao. O aumento do n
umero de
iteracoes garante que extremos significativos sejam considerados. A Figura 6.4 ilustra
como os parametros influenciam os resultados.

(a)

(b)

(c)

(d)

(e)

Figura 6.4: Influencia dos parametros escala e n


umero de iteracoes na binarizacao: (a)
imagem original e imagens processadas pelo operador utilizando (b) 1 = 1 e k = 1, (c)
1 = 10 e k = 1, (d) 1 = 1 e k = 10 e (e) 1 = 5 e k = 10.
Observe que para 1 = 1 e k = 1 o fundo apresenta-se muito ruidoso, dificultando
visivelmente a identificacao do texto (Figura 6.4(b)). Em uma escala menor, apenas as
regioes com uma grande variacao nos nveis de cinza sao modificadas. Contudo, um pouco
de rudo persiste, dado que os extremos mais significativos da imagem influenciam apenas
uma pequena regiao ao seu redor (Figura 6.4(c)). Ao considerar mais iteracoes, ocorre
a situacao oposta em que caractersticas indesejaveis podem aparecer, porem acompanhadas de uma melhor definicao dos contornos das letras (Figura 6.4(d)). Finalmente, a
combinacao apropriada dos parametros conduz a um bom resultado, em que apenas os
objetos de interesse sao segmentados (Figura 6.4(e)).

6.3.1

Resultados experimentais

Os resultados obtidos com a abordagem proposta foram comparados `aqueles de outros


metodos de binarizacao para imagens com problemas de degradacao pertencentes a diferentes categorias: manuscritos historicos, jornais antigos e documentos modernos. A
partir de alguns exemplos apresentados a seguir, sao discutidas as conclusoes gerais sobre
o desempenho de cada metodo. Em uma primeira analise, os resultados serao avaliados
qualitativamente segundo criterios visuais baseados na sua qualidade e na preservacao da
informacao textual. A seguir, sao realizados experimentos de reconhecimento otico de
caracteres (OCR) visando uma analise da aplicacao das imagens transformadas.

74

Captulo 6

A Figura 6.5 ilustra um trecho da binarizacao de uma imagem de jornal antigo. Alem
dos tradicionais problemas de iluminacao nao-uniforme e borroes, estas imagens sao frequentemente degradadas por um rudo extra causado principalmente pela baixa qualidade
da matriz de impressao.

(a)

(b)

(c)

(d)

(e)

(f)

Figura 6.5: Resultados de binarizacao. (a) imagem original e resultados para (b) medias
deslizantes, (c) Niblack, (d) Sauvola, (e) Gatos et al. e (f) abordagem proposta utilizando
1 = 20 e k = 5.
Os metodos de medias deslizantes e Niblack causaram o aparecimento de bastante
rudo na regiao do fundo (Figura 6.5(b) e (c)). O algoritmo de Sauvola produziu caracteres finos ou mesmo desconexos (Figura 6.5(d)), desempenho este que prejudica os
resultados da abordagem de Gatos et al. (Figura 6.5(e)). Pode-se afirmar que a abordagem proposta conseguiu unir as vantagens dos metodos: eliminou a maior parte do rudo
sem comprometer a definicao do texto (Figura 6.5(f)).
Documentos historicos possuem uma grande importancia cultural e cientfica. Devido
a sua natureza, e comum a presenca de problemas de degradacao, tais como vazamento
da tinta de um lado a outro da pagina, manchas e borroes. Estes rudos podem ser considerados entre os mais difceis de eliminacao devido, entre outros fatos, `a sua semelhanca
com as propriedades textuais (nveis de cinza e dimensao das componentes, por exemplo)
da imagem original. A Figura 6.6 ilustra alguns resultados.

6.3. Binarizacao de imagens de documentos

75

(a)

(b)

(c)

(d)

Figura 6.6: Resultados de binarizacao. (a) imagem original e resultados para (b) algoritmo
de medias deslizantes (c) metodo de Gatos et al. e (d) abordagem proposta utilizando
1 = 15 e k = 5.
O metodo de medias deslizantes apresentou novamente rudos na regiao de fundo. Embora a abordagem sugerida por Gatos et al. [24] produza resultados regulares, o emprego
do algoritmo original de Sauvola para obtencao da primeira aproximacao dos objetos de
interesse resulta, em muitos casos, numa imagem com caracteres mal definidos ou ate
mesmo descartados. Neste caso, mesmo a etapa de pos-processamento nao consegue recupera-los. O operador proposto, por sua vez, apresentou um desempenho superior com
base nesta analise subjetiva, recuperando os caracteres de forma mais precisa.
A Figura 6.7 ilustra um exemplo em que o metodo proposto eliminou de forma mais
adequada os componentes do lado reverso do papel. Isso se deve a dois fatores principais:
para a escala utilizada, os pixels associados a rudo se aproximaram mais do seu valor
dilatado ou, ainda, a diferenca para o nvel de cinza dos seus vizinhos nao foi suficientemente grande (Figura 6.7(d)). Observe que, embora apresente uma capacidade maior de
supressao de rudos que o algoritmo de medias deslizantes (Figura 6.7(b)), o metodo de
Gatos et al. elimina tambem detalhes importantes das letras (Figura 6.7(c)).

76

Captulo 6

(a)

(b)

(c)

(d)

Figura 6.7: Resultados de binarizacao. (a) imagem original e resultados para (b) medias
deslizantes, (c) metodo de Gatos et al. e (d) abordagem proposta utilizando 1 = 30 e
k = 5.
Em imagens digitalizadas, uma das principais dificuldades refere-se `a baixa qualidade
da impressao/escrita e ao contraste irregular. O exemplo da Figura 6.8 ilustra o desempenho de alguns metodos na presenca de iluminacao nao-uniforme. Observe como
um metodo de limiarizacao global e sensvel a este tipo de problema (Figura 6.8(b)). O
algoritmo de Sauvola errou ao classificar as letras das regioes mais claras como fundo
(Figura 6.8(c)), inviabilizando a sua utilizacao no metodo de Gatos et al..

(a)

(b)

(c)

(d)

(e)

Figura 6.8: Resultados de binarizacao. (a) imagem original e resultados para (b) Otsu,
(c) Sauvola, (d) medias deslizantes e (e) abordagem proposta para 1 = 20 e k = 2.

6.3. Binarizacao de imagens de documentos

77

Embora o algoritmo de medias deslizantes seja menos afetado por rudo (Figura 6.8(d)),
as imagens resultantes apresentam algumas componentes lineares brancas nas letras (Figura 6.9(a)), as quais podem prejudicar resultados de OCR (Figura 6.10(b)). Por sua
vez, a abordagem proposta produz dados precisos que podem ser mais adequadamente
utilizados em sistemas de OCR (Figura 6.10(c)).

Figura 6.9: Observe que as componentes brancas no resultado de (a) medias deslizantes
nao aparecem na (b) abordagem proposta.

(a)

(b)

(c)

Figura 6.10: Resultados para um procedimento de OCR utilizando o software Abby [2].
(a) Imagem original e textos extrados a partir dos resultados de (b) medias deslizantes
(Figura 6.8(d)) e (c) abordagem proposta (Figura 6.8(e)).
Por este motivo, o metodo de medias deslizantes nao sera utilizado nas comparacoes
da proxima secao, a qual apresenta uma analise mais criteriosa de procedimentos de OCR.
An
alise de resultados de OCR
Esta secao discute com mais detalhes o resultado de procedimentos de OCR quando
utilizadas imagens binarizadas pelos algoritmos de Sauvola [69], Gatos et al. [24] e atraves
da abordagem proposta (metodos que obtiveram o melhor desempenho nos testes da secao
anterior). Desse modo, e possvel avaliar de maneira quantitativa o desempenho de cada
metodo. A Figura 6.11 apresenta as imagens originais. Como metrica de avaliacao, foram
utilizadas as medidas de precisao, P , e revocacao, R, dadas por:
PV
PV
e
R=
(6.6)
PV + FP
PV + FN
em que P V e o n
umero de palavras que foram corretamente recuperadas (verdadeiro
positivo), F P representa as palavras ou rudos indevidamente recuperadas (falso positivo)
e F N indica a quantidade de palavras nao recuperadas (falso negativo).
P =

78

Captulo 6

Figura 6.11: Imagens utilizadas para testes de OCR: (a) Doc 01, (b) Doc 02 e (c) Doc 03.
Observe na Figura 6.12 que o algoritmo de Sauvola conduziu novamente a resultados
em que os caracteres possuem uma definicao baixa, sendo desconexos ou muito finos em
alguns casos.
Em regioes onde a iluminacao nao e uniforme, partes do texto chegam a ser completamente descartadas. Neste sentido, o operador proposto e mais robusto (Figura 6.13),
nao identificando as letras de forma adequada apenas em regioes muito crticas (tal como
no canto inferior direito da imagem na primeira coluna).

Figura 6.12: Resultados para o algoritmo de Sauvola.


Estes resultados influenciam diretamente o desempenho do procedimento de OCR, que
apresenta taxas de precisao e revocacao em media 12% melhores quando sao utilizadas as
imagens binarizadas pelo operador proposto.

6.3. Binarizacao de imagens de documentos

79

Figura 6.13: Resultados para a abordagem proposta.


A Figura 6.14 mostra os resultados de binarizacao obtidos com o algoritmo definido
por Gatos et al.. Como o algoritmo de Sauvola e utilizado para obter uma primeira
aproximacao do texto, alguns dos problemas presentes na figura acima permanecem. Nem
mesmo a etapa responsavel por melhorar a conexidade das letras consegue recuperar
alguns caracteres.
Para minimizar este problema, o operador de binarizacao aqui proposto foi utilizado no
lugar do algoritmo de Sauvola para obter uma primeira estimativa do texto, produzindo
resultados mais precisos (Figura 6.15). Com este procedimento, as taxas de precisao e
revocacao aumentaram de 82.99% para 91.66% (na media).

Figura 6.14: Resultados de binarizacao para o algoritmo de Gatos et al..

80

Captulo 6

Figura 6.15: Resultados de binarizacao para o algoritmo de Gatos et al. em que o algoritmo de Sauvola e substitudo pelo operador proposto na obtencao da estimativa inicial
do texto.
A Tabela 6.1 mostra os ndices de precisao e revocacao para as tres imagens exemplo.
Tabela 6.1: Indices de Precisao e Revocacao.
M
etodo
Sauvola
Gatos et al.
SMMT
SMMT + Gatos et al.

Doc 01
Precis
ao
Revocac
ao
0.76
0.78
0.81
0.87
0.87
0.90
0.92
0.91

Doc 02
Precis
ao Revocac
ao
0.74
0.78
0.81
0.83
0.88
0.91
0.91
0.92

Doc 03
Precis
ao Revocac
ao
0.86
0.89
0.91
0.92
0.93
0.95
0.95
0.95

Observe que, embora visualmente os resultados obtidos com o algoritmo de Gatos et


al. parecam inferiores aos do algoritmo de Sauvola (compare as Figuras 6.12-6.15), seus
ndices de precisao e revocacao sao superiores porque ele conduz a uma melhor definicao
dos caracteres. Em outras palavras, pequenas falhas nas letras comprometem o resultado
de procedimentos de OCR assim como ocorreu no exemplo mostrado anteriormente nesta
secao (Figura 6.10).

6.3.2

Abordagem multi-escala para binariza


c
ao autom
atica

Como a grande maioria dos sistemas de processamento de documentos trabalha com


imagens de diferentes tipos e estilos, e desejavel que o procedimento de binarizacao seja
feito de forma automatica, sem a necessidade de intervencao do usuario a cada aplicacao.
Esta secao propoe uma abordagem que explora a natureza multi-escala do algoritmo
de binarizacao proposto. Considere que a imagem inicial e processada pelo operador para
n diferentes escalas. O resultado final e definido atraves de um procedimento de votacao,
ou seja, e dado pelos pixels classificados como texto em um n
umero mnimo de nveis
de representacao. A Figura 6.16 ilustra a metodologia. Neste exemplo, o operador foi

6.4. Segmentacao de movimento em vdeo

81

aplicado em oito diferentes escalas e apenas os pixels classificados como texto em pelo
menos cinco delas foram considerados no resultado.

(a)

(b)

(c)

Figura 6.16: Abordagem multi-escala para binarizacao automatica. (a) imagem original
e resultados ao considerar (b) 5 escalas e (c) apenas a escala mais baixa.

Observe que estruturas mais significativas de fato persistem por mais tempo (Figura 6.16(b)). Quando apenas a escala mais baixa (que identifica variacoes maiores nos
nveis de cinza) e considerada, o resultado apresenta alguns rudos (Figura 6.16(c)). A
proxima secao discute a aplicacao do operador de binarizacao proposto para fins de segmentacao de movimento em vdeo.

6.4

Segmentac
ao de movimento em vdeo

A identificacao de objetos em movimento em sequencias de imagens e extremamente importante, considerando que o baixo desempenho desta tarefa pode prejudicar estagios de
processamento posteriores, como extracao de caractersticas e rastreamento, por exemplo [20]. No entanto, mesmo quando cameras estacionarias sao utilizadas para captura,
este problema e de difcil solucao. Isso se deve principalmente ao grande n
umero de
parametros nao-controlados, tais como condicoes de iluminacao e modelos de fundo.
As abordagens existentes podem ser divididas em quatro categorias principais [80]:
diferenciacao temporal, analise estatstica pontual, fluxo otico e modelagem e subtracao
de fundo. A tecnica mais utilizada de diferenciacao temporal calcula a diferenca simetrica
entre pixels correspondentes em duas imagens consecutivas e classifica como fundo aqueles cuja diferenca e maior que um limiar. Embora nao seja afetada por mudancas de
iluminacao, ela recupera a forma de maneira insatisfatoria e e sensvel a rudos. A analise
estatstica pontual classifica os pixels com base em estatsticas calculadas durante um

82

Captulo 6

certo intervalo de tempo. Os metodos baseados em fluxo otico inferem o movimento com
base em vetores de caractersticas e possuem um alto custo computacional.
As abordagens de modelagem e subtracao de fundo comparam o quadro atual com
um modelo do fundo, o qual pode ser estatico (imagem de referencia capturada sem
objetos em movimento) ou estimado a cada iteracao utilizando estatsticas tais como
media ou mediana. No primeiro caso, a abordagem pode tornar-se suscetvel a mudancas
de iluminacao, alem de ser inviavel, por exemplo, em ambientes nao controlados ou quando
a camera se movimenta. A estimativa da imagem de referencia, por sua vez, aumenta o
custo computacional de maneira significativa e e altamente dependente das estatsticas
utilizadas para estimar o modelo do fundo. Alem disso, algumas combinacoes destas
quatro categorias tambem foram propostas.
Neste trabalho, o operador de binarizacao proposto e utilizado em um procedimento de
segmentacao de movimento baseado na abordagem de modelagem e subtracao de fundo.
Tal procedimento e robusto a mudancas nas condicoes de iluminacao, mesmo com a utilizacao de um modelo de fundo estatico. A forma dos objetos e recuperada de maneira
precisa com base na informacao geometrica da imagem obtida atraves de transformacoes
de morfologia matematica. Outros trabalhos as utilizam neste mesmo contexto. No
entanto, a aplicacao de operacoes tais como aberturas e fechamentos de forma isolada
mostrou-se pouco eficaz, principalmente na presenca de rudo [28]. A combinacao de diversas operacoes morfologicas tambem ja foi explorada mas, de forma geral, as abordagens
propostas exigem a definicao de diversos parametros em diferentes transformacoes, o que
pode comprometer a eficiencia computacional e a estabilidade do metodo [42].

6.4.1

Abordagem proposta

As propriedades do operador de binarizacao aqui introduzido foram exploradas na definicao de um metodo de segmentacao de movimento baseado na abordagem de modelagem e subtracao de fundo. A ideia principal e processar a imagem para evitar que
problemas tais como a variacao nas condicoes de iluminacao ou rudos comprometam a
qualidade do resultado. A metodologia, sumarizada no Algoritmo 3, consiste basicamente
em aplicar o operador no modelo de referencia do fundo e no quadro da sequencia em
analise e, entao, subtrair as imagens transformadas.
O objeto em movimento e adequadamente detectado devido `as propriedades de convergencia do operador, em que cada pixel converge para a regiao de influencia do extremo
local mais significativo, conforme ilustrado na Figura 6.17. No quadro processado, os pixels correspondentes `as posicoes em movimento convergem para um mnimo local, sendo
associadas ao valor zero (Figura 6.17(d)).
Na imagem de referencia do fundo, por sua vez, o valor um e atribudo a tais posicoes,

6.5. Resultados

83

Algoritmo 3 Segmentacao de movimento em vdeo


1: Dada uma imagem de refer
encia do fundo da imagem, Ib ;
2: Aplicar o operador proposto em Ib , obtendo Ib
3: for cada quadro da sequ
encia, If do
4:
Aplicar o operador de binarizacao em If , obtendo If
5:
Calcular a diferenca Ir = If Ib ;
6:
Aplicar uma transformacao (fechamento, por ex.) para remover pequenos resduos.
7: end for
segundo a regra de decisao do operador, considerando que elas pertencem `a regiao de influencia de um maximo (Figura 6.17(b)). Como a transformacao realizada pelo operador
reduz os efeitos da iluminacao nao-uniforme, a diferenca entre as duas imagens ira identificar de maneira adequada os objetos de interesse sem que as variacoes na iluminacao
sejam consideradas e confundidas com um possvel movimento (Figura 6.17(e)).

(a)

(b)

(c)

(d)

(e)

Figura 6.17: Abordagem proposta: imagem de referencia do fundo (a) original e (b)
processada; quadro da sequencia (c) original e (d) processado; (e) resultado final.

6.5

Resultados

Os experimentos realizados consideraram duas diferentes classes de sequencias de imagem.


A primeira contem vdeos gravados no salao de entrada de uma universidade e mostra
atores em diferentes situacoes de complexidade, tais como caminhando em grupo, simulando uma briga ou deixando um pacote no chao. A segunda classe contem sequencias
gravadas em um centro comercial contendo alguns consumidores. Ambas as classes estao
disponveis publicamente [1] e foram adquiridas utilizando uma resolucao de 384 288 a
25 frames por segundo.
A u
nica premissa considerada pela abordagem proposta e que as sequencias foram
adquiridas utilizando uma u
nica camera estacionaria com um fundo estatico e sem utilizacao de efeitos como zoom, por exemplo. Os resultados obtidos com a abordagem aqui
definida foram comparados com outros quatro metodos.

84

Captulo 6

Embora seja rapido, o algoritmo de diferencas entre dois quadros (Figura 6.18(b))
mostrou uma baixa capacidade de recuperacao da forma do objeto em movimento e apresentou resduos causados por mudancas na iluminacao. A modelagem e subtracao de
fundo utilizando um modelo estimado atraves da media dos u
ltimos n quadros apresentou alguns falsos positivos (Figura 6.18(c)). Isso acontece quando um objeto permanece
parado por muito tempo, tornando-se parte do modelo. Assim, ao se mover novamente,
um falso positivo e identificado.
Os resultados obtidos tambem foram comparados com uma abordagem baseada em
morfologia matematica [42], pertencente `a categoria de modelagem e subtracao de fundo.
Primeiramente, o objeto em movimento e estimado a partir da diferenca entre o gradiente
morfologico do quadro corrente e um modelo de fundo. A aproximacao resultante e filtrada
atraves de filtros de volume e contraste e, finalmente, picos sao realcados e regioes sem
coerencia temporal sao eliminadas.
Ao comparar os resultados da abordagem proposta (Figuras 6.18(e)-(f)) com aquela
baseada em morfologia matematica discutida no paragrafo anterior (Figura 6.18(d)), podese afirmar que resultados equivalentes foram obtidos, mas com um custo computacional
menor. Alem disso, apenas dois parametros precisam ser configurados, representando
a escala e o n
umero de iteracoes, ambos intuitivos. Outra diferenca e que a abordagem descrita em [42] utiliza funcoes convexas, enquanto que aqui sao utilizadas funcoes
anti-convexas, as quais possuem interessantes propriedades discutidas anteriormente neste
trabalho (Secao 2.3) [70].
Nas Figuras 6.18(e) e 6.18(f) e possvel identificar como a escolha dos parametros do
operador influencia nos resultados. Dependendo da escala considerada, diferentes estruturas sao modificadas. Note que com a escala 1 = 11, apenas o objeto em movimento
principal e mantido (as pessoas perto das janelas sao eliminadas). O aumento no n
umero
de iteracoes, por sua vez, torna as arestas mais bens definidas e pode ser visto como
alternativa para conectar partes dos objetos. Alem disso, o operador apresenta boa recuperacao da forma, sem os problemas previamente descritos relacionados a falsos positivos
ou escolha de limiar.
As abordagens baseadas em diferencas que utilizam um limiar para classificar um
pixel como parte do fundo (Figuras 6.18(b) e 6.18(c)) tem uma desvantagem em comum:
a escolha de um valor errado pode produzir resultados de segmentacao insatisfatorios.
Um limiar baixo faz com que caractersticas irrelevantes sejam identificadas, enquanto
que com um limiar alto a maioria dos objetos em movimento pode ser confundida com
rudo e descartada. Tais fatores tornam estes metodos extremamente sensveis a mudancas
de iluminacao e sombras.

6.6. Conclusoes

85

(a)

(b)

(c)

(d)

(e)

(f)

Figura 6.18: Resultados de segmentacao para as diferentes abordagens. (a) imagem


original, (b) diferenca entre dois quadros, (c) subtracao de fundo, (d) utilizando morfologia
matematica, (e) utilizando o procedimento proposto com 1 = 11 e k = 5, (f) utilizando
o procedimento proposto com 1 = 11 e k = 2.

6.6

Conclus
oes

Neste captulo, algumas propriedades do operador SMMT foram exploradas na definicao


de um operador de binarizacao adaptativo. Quando parametros apropriados sao utilizados, somente regioes com grande variacao nos nveis de cinza serao transformadas. Este
comportamento e interessante em diversas aplicacoes em que as caractersticas de interesse
sao, por exemplo, as regioes de contorno. O operador proposto mostrou-se robusto em diferentes imagens, inclusive quando na presenca de variacoes nas condicoes de iluminacao,
conforme ilustrado na Secao 6.2.
A Secao 6.3 apresentou alguns resultados de segmentacao de texto presente em imagens de documentos degradados por problemas como iluminacao nao-uniforme e manchas. Quando comparado a outras abordagens existentes na literatura, o operador de
binarizacao aqui definido se mostrou robusto a uma grande variedade de problemas de
degradacao, sem causar efeitos indesejaveis tais como caracteres com contornos fracos ou
pouco definidos. O operador tambem mostrou um desempenho superior em testes de

86

Captulo 6

OCR.
Por fim, a Secao 6.4 propos uma abordagem de segmentacao de movimento em vdeo
baseada no metodo de binarizacao definido neste trabalho. Os experimentos realizados
mostraram que, apesar da simplicidade da cadeia de processamento em que o operador
foi inserido, a qualidade dos resultados obtidos e comparavel `a de outros metodos mais
complexos desenvolvidos para este fim.
importante enfatizar que, assim como foi verificado o melhor conjunto de parametros
E
a ser utilizado em cada imagem especfica para o operador SMMT, este procedimento
tambem foi realizado para os demais algoritmos utilizados na analise comparativa (quando
possvel).
No entanto, embora consiga lidar com problemas de iluminacao e alguns tipos de rudo,
o operador SMMT nao e robusto quando o rudo esta distribudo de maneira uniforme
na imagem, tal como na presenca de rudo aditivo, por exemplo. Este fato motivou o
desenvolvimento de uma nova variacao do operador toggle que possua propriedades de
filtragem, conforme discutido no proximo captulo.

Captulo 7
Um operador de filtragem auto-dual
Tecnicas de remocao/reducao de rudo tem como principal objetivo reconstruir uma imagem degradada da maneira mais precisa possvel, constituindo uma etapa fundamental
para a obtencao de resultados satisfatorios em diversas aplicacoes. Diferentes tipos de
rudo apresentam caractersticas distintas, as quais devem ser consideradas na definicao
das transformacoes utilizadas.
As primeiras abordagens para restauracao de imagens foram definidas em grande parte
no domnio da frequencia [26]. Este trabalho, no entanto, propoe um metodo aplicado
no domnio espacial, mais especificamente um filtro morfologico. Conforme discutido
anteriormente no Captulo 2, esta classe de filtros e composta por operadores, , que sao
crescentes e idempotentes. A primeira condicao implica na preservacao da ordem, isto e,
X Y (X) (Y ). A idempotencia, ((X)) = (X), visa garantir a estabilidade
do metodo, alem de refletir o fato de que operacoes crescentes nao sao reversveis e causam
perda de informacao [74]. Existem ainda algumas propriedades que sao desejaveis, tais
como auto-dualidade, ou seja, = , em que (X) = ((X c ))c denota o negativo de
. Desta forma, o fundo e o primeiro plano de uma imagem sao transformados de forma
simetrica.
A teoria de filtragem morfologica tem sido amplamente discutida desde a sua introducao. Serra e Vincent [74] apresentaram um tutorial sobre o assunto, abrangendo
desde as operacoes basicas de abertura e fechamento ate filtros alternados sequenciais e
operadores toggle (Captulo 2). Em [32], Heijmans explorou a construcao de filtros morfologicos, mas o metodo proposto produz filtros que nao necessariamente sao auto-duais.
Alem disso, o mesmo tambem formalizou o conceito de filtros derivados, nos quais
a condicao de idempotencia e apenas parcialmente satisfeita. Desse modo, e possvel
definir transformacoes com propriedades de filtragem de forma mais flexvel e assegurar
um comportamento bem controlado, sem problemas tais como oscilacoes. A Definicao 7.1
apresenta este conceito.
87

88

Captulo 7

Defini
c
ao 7.1. [32] Um operador crescente e denominado
1. um superfiltro se 2 ;
2. um subfiltro se 2 ;
3. um inf-superfiltro se (id ) = ;
4. um sup-subfiltro se (id ) = ;
5. um inf-filtro se e um filtro e um inf-superfiltro;
6. um sup-filtro se e um filtro e um sup-subfiltro;
7. um filtro forte se e tanto um sup-filtro quanto um inf-filtro.
Subsequentemente, Heijmans generalizou a nocao de filtros alternados sequenciais utilizando filtros derivados ao inves das operacoes de abertura e fechamento [31]. Alem disso,
um importante resultado foi estabelecido com a proposicao de um metodo de construcao
de filtros auto-duais baseado no centro morfologico. Essencialmente, explora-se a propriedade de que todo operador crescente e auto-dual pode ser modificado de tal forma
que sua aplicacao iterativa define pontualmente uma sequencia monotona (estritamente
crescente ou decrescente) implicando, assim, na convergencia para um operador limite
que e idempotente.
A partir de tais ideias, este trabalho propoe uma maneira alternativa para construcao
de filtros morfologicos auto-duais, estendendo os resultados validos ao considerar centros morfologicos para a classe de operadores toggle utilizada na definicao do SMMT
(Equacao 1.1).
A principal motivacao para a definicao desta nova abordagem vem do fato que, apesar
de suas propriedades de simplificacao, o SMMT nao apresenta um bom desempenho, em
termos de filtragem, quando a imagem possui rudo distribudo de maneira aleatoria em
toda a sua extensao. O novo operador toggle e aplicado de forma iterativa (nao mais
as primitivas) e considera um conjunto mais abrangente de transformacoes (que sejam
apropriadas para tratar o rudo em questao). Desse modo, explora-se mais uma possvel
variacao da Equacao 1.1 (no captulo anterior, a alteracao das primitivas conduziu a um
metodo de binarizacao).
A proxima secao apresenta a definicao do operador de filtragem proposto, bem como
as provas necessarias de que o mesmo constitui um filtro. A Secao 7.2 ilustra os resultados
para imagens degradadas por rudos do tipo gaussiano e impulsivo, comparando-os `aqueles
obtidos atraves do centro morfologico. Por fim, a Secao 7.3 discute os resultados para o
rudo speckle e apresenta uma aplicacao de filtragem de imagens de Radar de Abertura
Sintetica (SAR). Todos os experimentos consideraram diferentes pares de primitivas e
elementos estruturantes.

7.1. Operador de filtragem proposto e suas propriedades

7.1

89

Operador de filtragem proposto e suas propriedades

A formalizacao do operador de filtragem proposto e dada pela seguinte definicao.


Definic
ao 7.2. (Filtro toggle) Seja 1 um sup-filtro e 2 um inf-filtro. Denomina-se filtro
toggle a seguinte transformacao

k
k
k
k
k
[1 (f )](x), se [1 (f )](x) f (x) < f (x) [2 (f )](x),
k+1
f (x) =
(7.1)
f k (x),
se [1 (f k )](x) f k (x) = f k (x) [2 (f k )](x),

k
[2 (f )](x), em outros casos,
em que k representa o n
umero de iterac
oes.
Observe que a regra de decisao baseia-se novamente na similaridade entre os valores
transformados e originais de cada pixel. Entretanto, ao contrario do que ocorre no SMMT,
o operador e aplicado na imagem resultante da iteracao anterior, ao passo que as primitivas
sao calculadas uma u
nica vez a cada iteracao. Devido `as suas propriedades, as primitivas
constituem transformacoes extensivas ou anti-extensivas. Isso garante que as diferencas
sao valores em R+ .
Para provar que o operador definido constitui de fato um filtro, e necessario mostrar
que ele e crescente e idempotente. A primeira condicao pode ser assegurada utilizandose como primitivas composicoes de transformacoes crescentes. Por outro lado, e facil
verificar que o operador nao e necessariamente idempotente. Portanto, sera considerada a
abordagem proposta por Heijmans [31], discutida brevemente na introducao deste captulo
e formalizada na Proposicao 7.3 a seguir.
Proposic
ao 7.3. Se e um operador contnuo e n , ent
ao e idempotente. Em
particular, se tambem e crescente, ent
ao e um filtro.
Prova. Veja [31], Proposicao 15.

Basicamente, e preciso provar que a aplicacao iterativa do operador define pontualmente uma sequencia monotona. Desse modo, garante-se que cada pixel ira assumir
valores estritamente crescentes ou decrescentes, convergindo de tal forma que a idempotencia e atingida sem oscilacoes. A Proposicao 7.4 prova que a regra de decisao do
filtro toggle escolhera sempre a mesma primitiva para definir o valor transformado de
cada pixel. Assim, considerando-se as propriedades de tais transformacoes, a condicao de
convergencia e satisfeita.

90

Captulo 7

Proposi
c
ao 7.4. Sejam 1 um sup-filtro e 2 um inf-filtro. Supondo-se f k+1 (x) =
[1 (f k )](x), e fato que:
1. [1 (f k+1 )]([1 (f k )](x)) < 2[1 (f k )](x) f k (x) e
2. [2 (f k+1 )]([1 (f k )](x)) f k (x).
Portanto, o filtro toggle converge pontualmente para exclusivamente uma das primitivas
atraves das iteracoes.
Prova. O operador definido na Equac
ao 7.1 pode ser facilmente reescrito como

k
k
k
k
[1 (f )](x), se [1 (f )](x) + [2 (f )](x) < 2f (x),
f k+1 (x) =
(7.2)
f k (x),
se [1 (f k )](x) + [2 (f k )](x) = 2f k (x),

k
[2 (f )](x), em outros casos.
Por hip
otese, f k+1 (x) = [1 (f k )](x). Para provar que na pr
oxima iterac
ao a regra de
decis
ao ir
a escolher novamente a mesma primitiva, e preciso mostrar que f k+2 (x) =
[1 (f k+1 )](x), isto e,
[1 (f k+1 )]([1 (f k )](x)) + [2 (f k+1 )]([1 (f k )](x)) < 2[1 (f k )](x),

(7.3)

o que e satisfeito (trivialmente) considerando-se (1) e (2). A prova para f k+1 (x) =
[2 (f k )](x) e analoga.

A condicao (1) do enunciado da Proposicao 7.4 implica que a diferenca entre valores
transformados sucessivos decresce atraves das iteracoes. Isso constitui uma sequencia
(crescente ou decrescente) que e pontualmente monotona e que converge para um valor
constante. A Proposicao 7.5 prova este fato.
Proposi
c
ao 7.5. Seja 1 um sup-filtro. Se [1 (f k+1 )]([1 (f k )](x)) [1 (f k )](x)
[1 (f k )](x) f k (x) (condicao (1)), (1 )
e mon
otona crescente e a sequencia converge.
k=1
Prova. Considere um  > 0 e seja c = sup(1,k ). Logo, c e finito e, dado  > 0, existe
pelo menos um inteiro N tal que 1,N > c . Como a sequencia e mon
otona crescente,
temos que
|c 1,k | <  k > N,
o que significa, por definicao, que a sequencia converge para c. A prova correspondente a`
primitiva 2 e analoga.

7.1. Operador de filtragem proposto e suas propriedades

91

A partir destes resultados, e possvel afirmar que o filtro toggle possui as propriedades
especificadas anteriormente na Proposicao 7.3.
Proposic
ao 7.6. Se um operador T (x) constitui um filtro toggle, ent
ao ele satisfaz as
condicoes da Proposicao 7.3.
Prova. Da Proposicao 7.5, segue que as primitivas s
ao estacion
arias, ou seja, elas
convergem para um valor constante ap
os um certo n
umero de iterac
oes. A Proposicao 7.4
prova que o filtro toggle converge pontualmente para uma das primitivas ate atingir a
idempotencia. Logo, considerando que o mesmo e contnuo por definic
ao, T (x) e um
filtro de acordo com a Proposic
ao 7.3.

Como mencionado anteriormente, uma propriedade desejavel para filtros e a autodualidade. A Proposicao 7.7 afirma que a classe de operadores toggle utilizada na definicao
do filtro toggle e auto-dual se transformacoes duais sao utilizadas como primitivas. Desse
modo, os resultados obtidos para centros morfologicos [31] sao estendidos para uma classe
diferente de operadores toggle.
Proposic
ao 7.7. Sejam 1 e 2 duas primitivas duais, ou seja, 1 (x) = 2 (xc )c , onde o
smbolo c denota o complemento. O operador definido por

[1 (f )](x) se [1 (f )](x) f (x) < f (x) [2 (f )](x),


T (x) =
(7.4)
f (x)
se [1 (f )](x) f (x) = f (x) [2 (f )](x),

[2 (f )](x) em outros casos,

constitui uma transformacao auto-dual.


Prova. Segue diretamente da definic
ao de complemento.

Uma das principais vantagens do filtro toggle e a possibilidade de utilizacao de um


conjunto mais amplo de primitivas (ao se considerar uma transformacao extensiva e outra
anti-extensiva, por exemplo, a imagem nao e alterada pelo centro morfologico). Alem
disso, ao inves de depender de um operador auto-dual, a abordagem proposta requer
apenas que as primitivas sejam duais e correspondam a determinados tipos de filtros
derivados. Por fim, ela tambem e flexvel, no sentido de permitir a determinacao da
transformacao mais adequada segundo as caractersticas especficas de cada rudo.
Visando avaliar o desempenho do operador de filtragem proposto em diferentes contextos, foram realizados testes em imagens corrompidas por rudos de diferentes tipos. As
proximas secoes discutem os resultados.

92

Captulo 7

7.2

Filtragem de rudos do tipo gaussiano e impulsivo

Nesta secao, as imagens de teste estao corrompidas por rudos do tipo gaussiano (media
5 e variancia 2) e impulsivo (densidade de rudo 0.1). O primeiro possui uma funcao
densidade de probabilidade com distribuicao normal (Figura 7.1(b)). O rudo do tipo
impulsivo, tambem denominado sal e pimenta, ocorre na forma de pontos brancos e pretos
distribudos de forma aleatoria (Figura 7.1(c)).

(a)

(b)

(c)

Figura 7.1: Imagens utilizadas nos experimentos: (a) original e corrompidas por rudo do
tipo (b) gaussiano e (c) impulsivo.

A Tabela 7.1 indica as primitivas consideradas nos testes.


Tabela 7.1: Primitivas consideradas nos testes.
Primitiva
?

1
Propriedade
sup-filtro
sup-filtro
sup-filtro
inf-superfiltro
inf-superfiltro
superfiltro
subfiltro

Primitiva
?

2
Propriedade
inf-filtro
inf-filtro
inf-filtro
sup-subfiltro
sup-subfiltro
inf-superfiltro
inf-superfiltro

em que denota a erosao, , a dilatacao, , a abertura, , o fechamento e


(
f (x),
se f (x) < f (x)nn ,
(f (x)) =
f (x)nn , em outros casos,

(7.5)

ou seja, e uma transformacao que calcula a media dos nveis de cinza na vizinhanca
de tamanho n n de um pixel mas mantem os valores iniciais menores que essa media.

7.2. Filtragem de rudos do tipo gaussiano e impulsivo

93

por sua vez, mantem os valores maiores que a media. A utilizacao destas
A primitiva ,
primitivas permite explorar o efeito da combinacao de operadores morfologicos com uma
funcao linear.
O smbolo ? representa a modificacao do resultado das transformacoes e de modo
que este encontre-se entre o valor definido pelas operacoes de abertura e fechamento. Esta
condicao e necessaria para definir um sup-filtro , em que e um fechamento e e um
superfiltro ( 2 ) tal que . De maneira analoga, pode-se definir um sup-filtro
em que e uma abertura e e um subfiltro (2 )
tal que [32].
,
As primeiras tres primitivas da Tabela 7.1 satisfazem as condicoes da Proposicao 7.4.
Logo, nestes casos, o operador proposto constitui um filtro (Proposicao 7.6).
Para as demais primitivas, a convergencia pontual acontece depois de um pequeno
n
umero de iteracoes, conforme verificado atraves de experimentos computacionais. Isso
se deve ao fato de que tais primitivas possuem uma caracterstica em comum: mesmo
nao sendo necessariamente extensivas (anti-extensivas), elas sao maiores (menores) que o
mnimo (maximo) na vizinhanca definida pelo elemento estruturante. Com isso, os valores
que um pixel pode assumir estao limitados pelo maximo ou mnimo da regiao. Portanto,
embora haja uma pequena oscilacao inicial, esta e controlada e a convergencia ocorre em
poucas iteracoes.
Nos experimentos realizados, foram utilizados tres tipos de elementos estruturantes.
O primeiro, denotado por NFlat L, representa o elemento estruturante nao-planar linha


B = 1 0 1 . NFlat S denota o elemento estruturante nao-planar de dimensao 3 3
que representa o paraboloide, B = ||kx/k2 (Figura 2.3(a)). Por fim, Flat consiste
no elemento estruturante planar quadrado de dimensao 3 3 (Figura 2.2(b)).
Os resultados do filtro toggle foram comparados com aqueles obtidos utilizando-se o
centro morfologico, , definido para uma famlia de primitivas i como [74]:
= (I ) = (I ) ,

(7.6)

com = i e = i , em que representa o maximo e o mnimo pontual . Observe


que para duas primitivas, 1 e 2 , o centro morfologico consiste na mediana entre as
primitivas e a imagem original (Secao 2.6) [74].
O desempenho dos metodos de filtragem foi avaliado atraves da analise do erro medio
quadratico (Root Mean Square Error - RMSE), dado por [26]:
M 1 N 1
1 XX
RM SE =
[f (x, y) f (x, y)]2
M N x=0 y=0

"

# 21
(7.7)

em que f (x, y) e f(x, y) denotam as imagens original e filtrada, respectivamente, ambas de


tamanho M N . Essencialmente, esta medida representa a diferenca pontual acumulada
entre os nveis de cinza das imagens avaliadas.

94

Captulo 7

As Tabelas 7.2 e 7.3 apresentam o RMSE calculado a partir da imagem com rudo
gaussiano filtrada utilizando-se o filtro toggle e o centro morfologico, respectivamente. O
RMSE entre a imagem degradada e a original e de 24.84. Observe que resultados similares
sao obtidos para as duas abordagens, exceto no caso das primitivas e , em que o centro
nao alterou a imagem (pois a mediana entre a imagem original e suas transformacoes
extensiva e anti-extensiva e ela propria). A configuracao que resultou em uma filtragem
e elementos estruturantes nao-planares.
mais precisa envolveu o par de primitivas e
Tabela 7.2: RMSE considerando o filtro toggle (rudo gaussiano).
Primitivas
?

e
e
e
e
e
e
e

NFlat S
25.08
19.92
19.92
27.80
19.74
15.24
15.43

1a iterac
ao
NFlat L
24.97
21.67
21.73
37.37
20.53
20.78
22.10

Flat
24.98
22.06
22.12
39.39
20.08
20.88
22.06

NFlat S
25.04
18.79
18.79
28.19
18.33
15.68
14.80

3a iterac
ao
NFlat L
24.97
20.11
20.19
49.57
17.43
20.23
19.40

Flat
24.98
21.45
21.52
55.18
17.20
20.18
19.26

NFlat S
25.03
18.31
18.31
28.19
18.33
14.95
14.55

5a iterac
ao
NFlat L
24.95
19.53
19.62
56.57
17.12
20.03
18.54

Flat
24.96
21.42
21.49
65.53
17.19
19.99
18.42

Tabela 7.3: RMSE considerando o centro morfologico (rudo gaussiano).


Primitivas
?

e
e
e
e
e
e
e

NFlat S
24.81
19.01
19.06
24.84
17.25
16.72
19.20

1a iterac
ao
NFlat L
24.85
19.76
19.76
24.84
17.49
16.67
15.68

Flat
24.81
19.35
19.39
24.84
16.57
16.23
19.13

NFlat S
24.80
16.79
16.85
24.84
16.24
16.32
16.37

3a iterac
ao
NFlat L
24.85
18.47
18.47
24.84
16.73
16.63
14.18

Flat
24.81
18.43
18.50
24.84
15.46
16.53
16.31

NFlat S
24.80
15.81
15.87
24.84
16.11
16.19
15.49

5a iterac
ao
NFlat L
24.85
17.92
17.92
24.84
16.66
16.31
14.23

Flat
24.81
18.32
18.39
24.84
15.39
17.03
15.54

As Tabelas 7.4 e 7.5 mostram as medidas referentes aos resultados de filtragem da


imagem com rudo do tipo impulsivo considerando o filtro toggle e o centro morfologico,
respectivamente. O RMSE entre a imagem degradada e a original e de 44.98. Assim como
no caso gaussiano, os ndices resultantes das duas abordagens sao semelhantes e os elementos estruturantes nao-planares foram mais robustos. Observe que os pares de primitivas
baseados nas operacoes de abertura e fechamento obtiveram os melhores resultados.
Tabela 7.4: RMSE considerando o filtro toggle (rudo do tipo impulsivo).
Primitivas
?

e
e
e
e
e
e
e

NFlat S
45.14
22.34
22.34
53.25
19.31
18.01
16.76

1a iterac
ao
NFlat L
45.30
21.40
21.40
67.52
16.28
15.01
11.16

Flat
45.30
20.59
20.59
74.93
16.30
15.33
12.46

NFlat S
45.25
13.64
13.64
54.03
15.83
17.94
16.68

3a iterac
ao
NFlat L
45.28
11.57
11.57
64.73
15.71
14.89
11.16

Flat
45.28
11.54
11.55
70.28
15.84
15.21
12.52

NFlat S
45.26
13.28
13.27
46.01
15.46
14.93
12.62

5a iterac
ao
NFlat L
45.18
10.86
10.86
46.29
14.95
14.55
10.88

Flat
45.18
10.59
10.60
46.31
15.02
16.26
12.33

7.3. Filtragem de rudo do tipo speckle

95

Tabela 7.5: RMSE considerando o centro morfologico (rudo do tipo impulsivo).


Primitivas
?

7.3

e
e
e
e
e
e
e

1a iterac
ao
NFlat S NFlat L
45.00
45.01
12.90
22.31
12.89
22.31
44.98
44.98
11.35
13.53
13.57
14.83
16.05
12.80

Flat
45.01
13.24
13.24
44.98
11.73
13.74
16.04

3a iterac
ao
NFlat S NFlat L
45.00
45.01
10.52
21.36
10.52
21.36
44.98
44.98
12.41
13.03
12.95
12.45
10.63
10.66

Flat
45.01
11.13
11.13
44.98
12.63
12.96
10.66

5a iterac
ao
NFlat S NFlat L
45.00
45.02
10.32
20.54
10.31
20.54
44.98
44.98
12.46
13.05
12.22
12.70
9.78
10.33

Flat
45.01
11.11
11.11
44.98
12.63
12.41
9.76

Filtragem de rudo do tipo speckle

O rudo speckle causa o aparecimento de um padrao de aspecto granular, prejudicando


a visualizacao e limitando a interpretacao da imagem original. Tipicamente, este rudo
e causado por ondas coerentes que chegam fora de fase no sensor apos serem refletidas
por uma superfcie. O modelo usado para descricao e dado em termos de um rudo
multiplicativo, representado pela seguinte equacao [85]:
g = nf,

(7.8)

em que g e a imagem observada, n o rudo e f a versao ideal que se deseja estimar atraves
da filtragem.
Este tipo de rudo e uma caracterstica inerente em imagens obtidas por sistemas de
imageamento tais como radar de abertura sintetica (Synthetic Aperture Radar - SAR)
e ultra-som. Portanto, sua reducao consiste de uma etapa de pre-processamento fundamental em muitas aplicacoes visando otimizar resultados de deteccao e classificacao, por
exemplo, possibilitando uma melhor discriminacao dos objetos de interesse da cena e uma
segmentacao automatica facilitada [62].
Embora idealmente o rudo deva ser completamente removido, na pratica o mesmo
essencial que tal procedimento nao
pode apenas ser reduzido de forma significativa. E
comprometa estruturas importantes da imagem, devendo-se utilizar um filtro que consiga
ao mesmo tempo suavizar areas homogeneas e preservar os detalhes de interesse do modo
mais preciso possvel.
Filtros nao-lineares sao amplamente utilizados em processamento de imagens para
reduzir rudo sem borrar ou distorcer contornos. No entanto, embora conduzam a bons
resultados na presenca de rudo aditivo, eles nao tem se mostrado tao eficientes para
o caso multiplicativo. Visando superar tal problema, este trabalho propoe uma nova
abordagem, em que o filtro toggle e combinado com outra tecnica nao-linear: a difusao
anisotropica [66]. O metodo proposto nesta secao permite aliar a flexibilidade de escolha
de diferentes transformacoes do filtro toggle com as in
umeras vantagens da tecnica de
difusao anisotropica.

96

7.3.1

Captulo 7

Trabalhos relacionados

De modo geral, o rudo speckle pode ser reduzido de duas formas [62]. A primeira delas
acontece durante o estagio de aquisicao de dados. Em sistemas SAR, por exemplo, esse
processo denomina-se multi-look e possui tres passos principais: (1) dividir a abertura
sintetica em L segmentos (denominados looks) estatisticamente independentes entre si,
(2) formar L imagens diferentes a partir destes segmentos e (3) calcular a media entre
tais imagens. Embora este procedimento reduza a quantidade de rudo speckle, o custo
computacional aumenta significativamente e a resolucao da imagem e comprometida se o
valor L for muito grande. Muitos sistemas SAR integram alguns poucos looks durante o
processo de formacao para melhorar (mesmo que minimamente) a sua qualidade.
A segunda forma de reducao de rudo, foco deste trabalho, abrange metodos que sao
aplicados apos a formacao da imagem e envolvem a utilizacao de tecnicas de filtragem
espacial. Tais filtros tipicamente modificam a imagem com base em estatsticas locais,
ou seja, o rudo e reduzido estimando-se a refletividade de um pixel como uma funcao da
sua intensidade e de algumas estatsticas calculadas a partir dos nveis de cinza da sua
vizinhanca.
Varias destas abordagens tem sido propostas na literatura. O filtro de Lee aproxima
o modelo multiplicativo do rudo por um linear e entao aplica o criterio de minimizacao
do erro medio quadratico. Essencialmente, o resultado e calculado atraves de uma combinacao linear da intensidade do pixel central da janela com a intensidade media nesta
janela. Desta forma, e realizada uma filtragem adaptativa, a qual pode consistir em
uma simples media (em regioes homogeneas) ou no operador identidade (nas posicoes
correspondentes aos contornos e detalhes de interesse) [43, 44].
O filtro de Frost [23], ao contrario do filtro de Lee, estima a refletividade a partir da
convolucao da imagem observada com a resposta de impulso do sistema de imageamento,
obtida atraves da minimizacao do erro medio quadratico entre a imagem observada e o
modelo de refletividade da cena. Este metodo tambem e dito adaptativo, pois se ajusta
`as estatsticas locais da imagem para preservar arestas e pequenas caractersticas [62].
Metodos de filtragem baseados em equacoes diferenciais parciais tambem tem sido
propostos. Uma abordagem amplamente utilizada e a tecnica de difusao anisotropica
proposta por Perona e Malik [66], capaz de reduzir o rudo ao mesmo tempo em que preserva contornos. A ideia principal consiste em diminuir a difusao na direcao do gradiente
de mais alta magnitude. Desta forma, dependendo do valor de tal magnitude, o operador
constitui um filtro passa-altas (em regioes de contorno) ou uma difusao isotropica (em
regioes homogeneas) (o Captulo 3 apresenta uma discussao mais detalhada). Apesar de
apresentar bons resultados para imagens corrompidas por rudo aditivo, esta abordagem
tende a realcar o rudo do tipo speckle ao inves de elimina-lo, precisando ser combinada
com outros metodos para obtencao de bons resultados.

7.3. Filtragem de rudo do tipo speckle

97

Nesta secao, esta tecnica e combinada com o operador de filtragem proposto anteriormente. A transformacao inicial realizada pelo filtro toggle evita que a aplicacao da difusao
anisotropica realce rudos, conduzindo a resultados em que regioes homogeneas sao suavizadas sem prejudicar as informacoes de contorno. Desse modo, e possvel explorar as
vantagens de ambos os metodos.
Yu e Acton [85] propuseram uma extensao ao metodo de difusao anisotropica, denominada Difusao Anisotropica para Reducao de Speckle (Speckle Reducing Anisotropic
Diffusion - SRAD), a qual tem a vantagem de nao necessitar da definicao de um limiar
na funcao de difusao. Em seu lugar e utilizada uma estimativa do desvio padrao do rudo
em cada iteracao. Por ser baseado na mesma abordagem de minimizacao do erro medio
quadratico que os filtros de Lee e Frost, o SRAD pode ser interpretado como a extensao
do filtro adaptativo para reducao de rudo speckle no mesmo sentido em que a difusao
anisotropica de Perona e Malik e a extensao do filtro da media. No entanto, o bom desempenho deste metodo depende da definicao de uma regiao significativa (por parte do
usuario) para gerar as estimativas necessarias.
Metodos baseados na transformada de wavelets tambem tem sido utilizados. Uma
abordagem basica envolve tres passos principais: (1) decompor a imagem aplicando a
transformada, (2) modificar alguns coeficientes por limiarizacao e (3) reconstruir uma
versao refinada a partir destes coeficientes atraves da transformada de wavelets inversa.
Tais metodos baseiam-se no fato que a energia do sinal e maior que a do rudo ou, em
outras palavras, que os coeficientes wavelet do sinal sao maiores que aqueles do rudo.
Entretanto, este procedimento pode ser ineficiente e gerar problemas em alguns casos.
Em uma imagem de ultra-som, por exemplo, a relacao entre a taxa do rudo e o sinal e
muito pequena para discrimina-los por uma simples limiarizacao dos coeficientes. Com
isso, o sinal pode ser reduzido com rudo e/ou o rudo pode ser amplificado com o sinal [85].
Outras abordagens, tais como o filtro de Kalman e filtros alternados sequenciais sao
menos comuns devido a sua complexidade computacional e tambem a algumas limitacoes
relacionadas `a degradacao da resolucao e suavizacao de areas uniformes. Contudo, as
mesmas tambem podem conduzir a bons resultados de filtragem.

7.3.2

Resultados

Para comprovar o bom desempenho das duas abordagens propostas (filtro toggle e sua
combinacao com a difusao anisotropica), foram realizados testes comparando os resultados
obtidos com aqueles de outros metodos de filtragem. Para escolher a sua melhor configuracao para o rudo speckle, o filtro toggle foi aplicado utilizando as mesmas primitivas
e elementos estruturantes da secao anterior (Tabela 7.1) em tres imagens. Elas possuem
nveis de rudo com desvio padrao 0.15, 0.25 e 0.35 e sao ilustradas na Figura 7.2. Desse

98

Captulo 7

modo, e possvel escolher os parametros que melhor se adaptam a diferentes intensidades


de rudos. O criterio considerado foi novamente o RMSE entre a imagem original (sem
rudo) e a filtrada.

(a)

(b)

(c)

(d)

Figura 7.2: Testes em imagens com rudo speckle: (a) imagem original e versoes com
rudo. O RMSE e (b) 16.74, (c) 27.43 e (d) 37.51.
A Tabela 7.6 mostra a media do RMSE relativo aos resultados de filtragem das tres
imagens acima utilizando as primitivas da Tabela 7.1. Observe que a utilizacao de elementos estruturantes nao-planares produz imagens mais proximas do ideal, assim como
foi o caso para os rudos do tipo gaussiano e impulsivo. Este fato se justifica pelas propriedades de tais elementos estruturantes, discutidas anteriormente [70]. Elementos planares,
por sua vez, tendem a preservar a maior parte das zonas planas, o que constitui uma
propriedade mais fraca de filtragem.
O par de primitivas que conduziu aos melhores resultados considerando elementos
mostrando novamente a viabilidade da utilizacao
estruturantes nao-planares foi e ,
de transformacoes morfologicas combinadas com operacoes lineares.
Tabela 7.6: RMSE medio dos resultados de filtragem das imagens da Figura 7.2 para o
filtro toggle (rudo speckle). O RMSE medio das imagens com rudo e 27.22.
Primitivas
?

e
e
e
e
e
e
e

1a iterac
ao
NFlat S NFlat L
27.50
27.38
23.71
27.07
23.71
27.15
30.62
39.28
23.09
24.16
17.62
25.91
18.29
26.77

Flat
27.37
27.47
27.53
41.24
23.63
25.54
26.75

3a iterac
ao
NFlat S NFlat L
27.50
27.38
22.76
25.80
22.76
25.90
31.04
47.75
21.60
20.06
17.57
25.58
15.57
24.12

Flat
27.37
27.01
27.10
52.98
19.56
25.83
24.02

5a iterac
ao
NFlat S NFlat L
27.44
27.36
22.31
25.26
22.31
25.38
31.04
52.24
21.60
19.64
16.46
25.43
15.30
22.97

Flat
27.35
26.99
27.07
60.36
19.42
25.50
22.80

Na comparacao entre as diferentes abordagens de filtragem, foram avaliados varios


aspectos. A taxa de contraste representa a intensidade do efeito do rudo speckle em uma
imagem e e dada por [58]:
f
=
,
(7.9)
f

7.3. Filtragem de rudo do tipo speckle

99

em que f denota o desvio padrao e f e a media da imagem filtrada f. A reducao desta


taxa indica uma diminuicao do nvel de rudo. Alem disso, foi analisada a similaridade
dos contornos das imagens filtradas em relacao a um modelo ideal. Para tal, foi utilizada
a medida denominada figura de merito de Pratt (Pratts Figure of Merit - FOM) [67]:

X
1
1
F OM =
,
, Nideal }
1 + d2i
max{N

(7.10)

i=1

e Nideal representam o n
em que N
umero de pixels de contorno detectados na imagem
filtrada e no modelo, respectivamente. Alem disso, di e a distancia Euclidiana entre o
i-esimo pixel do contorno com relacao `aquele mais proximo no modelo ideal e e uma
constante com valor sugerido igual a 0.9 [85]. Os valores de FOM variam entre zero e um,
com um equivalendo `a perfeita deteccao de contornos.
Tambem foram calculados o RMSE e o valor medio (e desvio padrao) dos nveis de
cinza nas imagens filtradas, visando avaliar tanto a capacidade de restauracao quanto a
de homogeneizacao das abordagens analisadas.
Os resultados do filtro toggle e de sua combinacao com a tecnica de difusao anisotropica (tal combinacao e denotada por F T + DA nas tabelas a seguir) foram comparados `aqueles obtidos com os seguintes metodos: os filtros de Lee [43, 44] e Frost [23]
aplicados individualmente e tambem combinados com a tecnica de difusao anisotropica,
difusao anisotropica [66], transformada de wavelets [11] e SRAD [85].
A partir de tres imagens sinteticas, cada uma possuindo sete regioes homogeneas
com nveis de cinza distintos (Figura 7.3), foram geradas cinco versoes com diferentes
intensidades de rudo multiplicativo (com valores de desvio padrao: 0.05, 0.15, 0.25, 0.35 e
0.45). Os resultados apresentados nas Tabelas 7.7 a 7.14, referentes a cada uma das cinco
versoes com rudo das imagens de teste, correspondem `a media das medidas calculadas
em cada regiao homogenea.

Figura 7.3: Imagens originais a partir das quais foram geradas as versoes com rudo
utilizadas para avaliacao das abordagens de filtragem.

100

Captulo 7

A Tabela 7.7 apresenta a media e o desvio padrao dos nveis de cinza referentes aos
resultados de filtragem de cada uma das cinco versoes com rudo geradas a partir da
imagem da Figura 7.3(a). A media na imagem sem rudo e de 159.14. Para as versoes
com menos rudo (colunas Rudo 01 e Rudo 02, por exemplo), todas as abordagens
apresentam um desvio padrao baixo. No entanto, ao considerar rudos mais intensos, o
filtro toggle sozinho ou combinado com a abordagem de difusao anisotropica mostrou-se
mais estavel, sendo um pouco inferior apenas quando comparado ao metodo SRAD.
A Tabela 7.8 apresenta as demais medidas. Observe que, embora o metodo SRAD
conduza a menores valores de RMSE e , seus ndices de FOM sao muito similares aos do
filtro toggle combinado com a abordagem de difusao anisotropica no caso FT 03 + DA
( 1 = 4 e k = 20).
Tabela 7.7: Valores medios da media e desvio padrao dos nveis de cinza calculados nas
regioes homogeneas para as cinco versoes corrompidas da imagem da Figura 7.3(a).
Filtro
Rudo
DA
Lee
Lee + DA
Frost
Frost + DA
Wavelet
FT 01
FT 01 + DA
FT 02
FT 02 + DA
FT 03
FT 03 + DA
SRAD

Rudo 01
159.36 1.26
159.36 1.26
158.18 7.84
158.50 7.28
158.64 7.68
159.17 5.50
158.69 7.28
157.03 8.72
157.03 7.71
157.72 9.30
157.91 6.40
156.74 8.32
156.81 7.91
156.15 9.40

Rudo 02
158.66 15.70
158.66 15.70
157.46 10.71
157.61 8.34
157.93 13.51
158.22 7.04
157.62 10.88
153.93 10.24
153.56 9.37
156.06 12.01
155.93 7.97
152.71 9.51
152.26 9.46
155.96 9.47

Rudo 03
156.15 30.24
156.15 30.24
155.12 13.81
155.15 9.34
155.60 19.13
155.75 11.68
155.24 13.03
151.67 11.57
151.14 10.49
153.66 13.38
153.31 9.10
150.57 11.24
150.07 10.75
155.15 9.34

Rudo 04
152.71 43.80
152.71 43.80
151.74 17.67
151.78 11.38
152.17 24.89
152.30 17.96
151.72 15.60
150.74 12.25
150.16 10.74
150.88 15.28
150.45 10.16
150.94 12.04
150.35 11.23
153.45 8.89

Rudo 05
147.18 56.27
147.18 56.27
146.42 20.00
146.33 12.85
146.84 29.80
146.87 23.70
146.41 17.11
147.05 12.40
146.70 10.80
145.88 15.94
145.51 10.58
147.03 12.10
146.72 11.20
151.30 8.11

Tabela 7.8: Valores medios das medidas calculadas com base nas regioes homogeneas
para as cinco versoes corrompidas da imagem da Figura 7.3(a).
Filtro
Rudo
DA
Lee
Lee + DA
Frost
Frost + DA
Wavelet
FT 01
FT 01 + DA
FT 02
FT 02 + DA
FT 03
FT 03 + DA
SRAD

Rudo 01
RMS FOM
0.05 7.96 0.47
0.01 1.30 0.77
0.05 8.26 0.52
0.05 8.55 0.96
0.05 7.99 0.50
0.04 6.43 0.76
0.05 7.51 0.56
0.06 9.90 0.53
0.05 10.08 0.97
0.06 9.81 0.47
0.05 7.99 0.83
0.06 9.74 0.53
0.06 10.49 0.96
0.01 1.99 0.96

Rudo 02
RMS FOM
0.15 23.26 0.47
0.08 15.79 0.51
0.07 11.34 0.48
0.06 9.96 0.67
0.09 13.93 0.47
0.05 8.23 0.54
0.07 11.47 0.48
0.07 13.37 0.53
0.06 14.09 0.89
0.08 13.18 0.47
0.06 10.67 0.71
0.06 14.20 0.69
0.06 15.64 0.96
0.05 7.49 0.94

Rudo 03
RMS FOM
0.24 36.05 0.47
0.18 30.49 0.47
0.09 15.18 0.47
0.07 12.08 0.53
0.13 20.04 0.47
0.08 13.42 0.51
0.09 14.47 0.49
0.08 16.34 0.51
0.07 16.89 0.82
0.10 15.81 0.47
0.06 13.46 0.57
0.08 17.70 0.65
0.07 18.60 0.89
0.06 11.73 0.89

Rudo 04
RMS FOM
0.32 47.68 0.48
0.28 44.59 0.48
0.12 20.50 0.48
0.08 16.01 0.52
0.17 26.89 0.48
0.11 20.81 0.49
0.11 18.71 0.49
0.09 18.30 0.51
0.07 18.62 0.72
0.11 19.43 0.47
0.07 16.88 0.55
0.08 18.74 0.65
0.08 19.38 0.86
0.06 16.81 0.84

Rudo 05
RMS FOM
0.41 59.97 0.48
0.39 58.10 0.48
0.14 25.53 0.48
0.09 20.71 0.50
0.21 33.69 0.48
0.16 28.23 0.49
0.12 23.32 0.48
0.09 21.73 0.53
0.08 21.97 0.66
0.12 23.58 0.48
0.08 21.31 0.52
0.09 22.08 0.61
0.08 22.59 0.76
0.06 21.65 0.81

7.3. Filtragem de rudo do tipo speckle

101

A Tabela 7.9 mostra a media e o desvio padrao dos nveis de cinza calculados a partir
dos resultados de filtragem das cinco versoes com rudo geradas a partir da imagem da
Figura 7.3(b). A media dos nveis de cinza na imagem original e novamente 159.14. Assim
como no caso anterior, nveis mais intensos de rudo representam mais dificuldades para
as abordagens em geral.
Observe na Tabela 7.10 que, assim como no exemplo anterior, embora o metodo SRAD
apresente ndices de RMSE e um pouco menores, seus ndices de FOM sao muito
similares aos do filtro toggle combinado com a abordagem de difusao anisotropica no caso
FT 03 + DA ( 1 = 4 e k = 20).
Tabela 7.9: Valores medios da media e desvio padrao dos nveis de cinza calculados nas
regioes homogeneas para as cinco versoes corrompidas da imagem da Figura 7.3(b).
Filtro
DA
Lee
Lee + DA
Frost
Frost + DA
Wavelet
FT 01
FT 01 + DA
FT 02
FT 02 + DA
FT 03
FT 03 + DA
SRAD

Rudo 01
159.58 1.71
160.14 8.46
160.58 7.83
160.33 7.87
160.76 6.14
159.99 5.93
160.90 9.15
161.31 7.71
160.47 11.35
161.00 7.60
160.89 8.61
161.20 7.62
162.27 6.04

Rudo 02
158.78 15.22
159.63 11.87
160.03 8.41
159.83 14.20
160.15 7.26
159.94 10.56
160.42 10.40
160.76 8.44
159.98 13.23
160.46 8.14
160.99 9.48
161.27 8.23
162.90 5.85

Rudo 03
156.02 30.11
156.75 15.21
157.08 9.65
156.98 19.91
157.14 12.17
157.09 13.35
158.37 11.23
158.73 9.14
157.02 14.48
157.48 8.86
160.12 10.50
160.42 9.24
161.46 5.42

Rudo 04
154.07 37.34
154.80 16.36
155.10 9.96
154.99 22.39
155.13 14.98
155.13 14.51
157.03 11.79
157.39 9.92
155.05 15.09
155.49 9.57
159.32 11.29
159.63 10.24
160.57 6.35

Rudo 05
147.32 56.01
147.97 21.00
148.21 13.59
148.23 30.00
148.30 23.98
148.50 17.82
153.42 13.43
153.85 11.82
149.07 17.10
149.54 11.46
158.23 13.31
158.60 12.50
157.53 8.04

Tabela 7.10: Valores medios das medidas calculadas com base nas regioes homogeneas
para as cinco versoes corrompidas da imagem da Figura 7.3(b).
Filtro
Rudo
DA
Lee
Lee + DA
Frost
Frost + DA
Wavelet
FT 01
FT 01 + DA
FT 02
FT 02 + DA
FT 03
FT 03 + DA
SRAD

Rudo 01
RMS FOM
0.05 7.97 0.51
0.01 1.81 0.90
0.07 8.66 0.58
0.07 8.22 0.93
0.07 8.02 0.56
0.06 6.48 0.90
0.05 6.03 0.55
0.08 9.65 0.55
0.06 8.48 0.97
0.09 11.73 0.51
0.06 8.29 0.96
0.07 9.16 0.83
0.06 8.41 0.84
0.05 7.32 0.84

Rudo 02
RMS FOM
0.15 23.22 0.50
0.08 15.24 0.51
0.09 12.12 0.50
0.07 8.81 0.63
0.10 14.36 0.50
0.06 7.59 0.56
0.08 10.79 0.52
0.08 11.19 0.55
0.07 9.54 0.85
0.10 13.73 0.50
0.07 8.99 0.68
0.08 10.57 0.67
0.07 9.62 0.75
0.05 7.81 0.77

Rudo 03
RMS FOM
0.24 36.28 0.49
0.17 30.40 0.49
0.11 16.11 0.50
0.08 10.93 0.56
0.14 20.53 0.50
0.09 13.12 0.52
0.10 14.34 0.51
0.08 12.58 0.55
0.07 10.80 0.72
0.11 15.75 0.50
0.07 10.73 0.59
0.08 11.95 0.64
0.07 10.99 0.70
0.05 7.55 0.65

Rudo 04
RMS FOM
0.28 42.06 0.49
0.23 37.91 0.49
0.12 18.00 0.50
0.08 12.40 0.55
0.15 23.52 0.50
0.10 16.54 0.52
0.11 16.36 0.50
0.09 13.89 0.53
0.07 12.43 0.74
0.11 17.22 0.50
0.07 12.61 0.57
0.08 13.10 0.64
0.08 12.37 0.61
0.05 8.75 0.62

Rudo 05
RMS FOM
0.40 59.76 0.50
0.38 57.88 0.50
0.15 25.73 0.50
0.10 19.86 0.52
0.21 33.38 0.50
0.16 27.82 0.50
0.13 23.18 0.51
0.10 17.73 0.54
0.09 16.73 0.62
0.13 22.66 0.50
0.09 18.65 0.54
0.10 15.95 0.67
0.09 15.50 0.74
0.07 13.64 0.58

102

Captulo 7

As Tabelas 7.11 e 7.12 mostram os resultados obtidos para as cinco versoes com rudo
geradas a partir da imagem da Figura 7.3(c). Neste u
ltimo exemplo, o filtro toggle combinado com a abordagem de difusao anisotropica nos casos FT 01 + DA ( 1 = 8 e
k = 25) e FT 03 + DA ( 1 = 4 e k = 20) apresentou resultados superiores aos do
metodo SRAD para diferentes nveis de rudo. O RMSE e menor em todas as imagens.
As demais conclusoes sao similares `aquelas ja discutidas para os dois exemplos anteriores.
Observe tambem que a combinacao da tecnica de difusao anisotropica com os filtros
de Lee e Frost nao conduziu a bons resultados em nenhum dos tres experimentos. A
transformada de wavelets tambem se mostrou pouco eficaz, indicando que ela deve ser
explorada de maneira diferente neste tipo de aplicacao.
Tabela 7.11: Valores medios da media e desvio padrao dos nveis de cinza calculados nas
regioes homogeneas para as cinco versoes corrompidas da imagem da Figura 7.3(c).
Filtro
DA
Lee
Lee + DA
Frost
Frost + DA
Wavelet
FT 01
FT 01 + DA
FT 02
FT 02 + DA
FT 03
FT 03 + DA
SRAD

Rudo 01
159.14 1.21
158.41 6.83
158.36 6.39
158.78 6.63
158.86 4.70
158.81 5.47
157.76 7.54
157.67 6.96
158.27 8.41
158.17 5.44
157.55 7.10
157.47 6.90
156.17 11.08

Rudo 02
158.61 15.61
157.93 10.10
157.80 7.69
158.29 12.85
158.28 6.52
158.08 9.46
155.74 10.18
155.35 9.98
157.17 11.54
156.91 7.74
154.89 9.93
154.51 10.37
156.79 11.35

Rudo 03
156.32 30.03
155.58 13.59
155.44 8.75
155.95 18.88
155.91 11.12
155.66 12.40
153.73 11.24
153.37 10.49
154.63 13.32
154.28 8.82
153.09 11.40
152.76 11.26
156.30 11.05

Rudo 04
154.02 37.28
153.39 15.12
153.24 9.27
153.76 21.48
153.69 13.84
153.43 13.32
152.65 11.64
152.27 10.81
152.82 13.73
152.46 9.04
152.68 12.31
152.33 12.05
155.22 10.97

Rudo 05
147.32 56.14
146.89 20.26
146.76 12.77
147.19 29.68
147.19 23.24
146.95 17.30
149.13 12.86
148.79 11.41
146.90 16.17
146.59 10.58
151.00 13.37
150.68 12.70
152.32 9.82

Tabela 7.12: Valores medios das medidas calculadas com base nas regioes homogeneas
da imagem para as cinco versoes corrompidas da imagem da Figura 7.3(c).
Filtro
Rudo
DA
Lee
Lee + DA
Frost
Frost + DA
Wavelet
FT 01
FT 01 + DA
FT 02
FT 02 + DA
FT 03
FT 03 + DA
SRAD

Rudo 01
RMS FOM
0.05 7.98 0.50
0.01 1.22 0.71
0.05 7.00 0.55
0.05 6.88 0.93
0.04 6.74 0.53
0.03 5.00 0.91
0.04 5.56 0.61
0.05 7.94 0.63
0.05 7.74 0.97
0.06 8.58 0.50
0.04 6.00 0.79
0.05 7.62 0.71
0.05 7.79 0.95
0.08 15.34 0.87

Rudo 02
RMS FOM
0.15 23.25 0.49
0.08 15.64 0.54
0.07 10.33 0.50
0.05 8.30 0.66
0.08 12.99 0.50
0.04 6.94 0.62
0.06 9.71 0.53
0.07 11.29 0.55
0.07 11.66 0.95
0.08 11.91 0.49
0.05 8.69 0.77
0.07 11.63 0.84
0.07 12.61 0.94
0.08 15.34 0.88

Rudo 03
RMS FOM
0.23 36.12 0.49
0.17 30.30 0.49
0.09 14.56 0.50
0.06 10.56 0.59
0.12 19.54 0.50
0.07 12.28 0.55
0.08 13.50 0.51
0.08 13.54 0.56
0.07 13.50 0.86
0.09 14.77 0.49
0.06 11.36 0.65
0.08 14.18 0.79
0.08 14.61 0.89
0.08 15.97 0.87

Rudo 04
RMS FOM
0.28 42.15 0.49
0.23 37.84 0.50
0.10 16.91 0.50
0.06 12.32 0.57
0.14 22.70 0.50
0.09 15.65 0.52
0.09 15.37 0.50
0.08 14.63 0.54
0.08 14.55 0.83
0.10 16.11 0.50
0.06 12.84 0.61
0.08 15.25 0.70
0.08 15.55 0.86
0.08 16.88 0.88

Rudo 05
RMS FOM
0.41 59.92 0.50
0.39 58.00 0.50
0.14 25.27 0.50
0.09 19.65 0.53
0.21 33.32 0.50
0.15 27.41 0.50
0.12 23.00 0.50
0.09 18.40 0.55
0.08 17.96 0.74
0.12 22.30 0.50
0.08 18.91 0.57
0.09 17.40 0.68
0.09 17.38 0.79
0.07 19.92 0.88

7.3. Filtragem de rudo do tipo speckle

103

As Tabelas 7.13 e 7.14 mostram os valores medios das medidas calculadas nas cinco
versoes filtradas para cada experimento (sumarizacao dos resultados das Tabelas 7.7 a 7.12).
Desta forma, e possvel ter uma nocao geral do desempenho das diferentes abordagens.
A combinacao dos filtros de Lee e Frost com a tecnica de difusao anisotropica nao
apresentou resultados satisfatorios, indicando que a transformacao realizada pela abordagem proposta e mais eficaz. Observe tambem que valores similares aos do metodo SRAD
foram obtidos em diversos ndices (principalmente para o caso FT 03 + DA), mostrando
a robustez da abordagem proposta. A partir de uma analise inicial, na qual determina-se
a primitiva mais apropriada, o metodo proposto e automatico. O SRAD, por sua vez,
depende de uma regiao significativa definida pelo usuario (a cada aplicacao do operador)
para produzir bons resultados de filtragem.
Tabela 7.13: Valores medios da media e desvio padrao das regioes homogeneas para
versoes com rudo da Figura 7.3(a-c).
Filtro
Rudo
DA
Lee
Lee + DA
Frost
Frost + DA
Wavelet
FT 01
FT 01 + DA
FT 02
FT 02 + DA
FT 03
FT 03 + DA
SRAD

Experimento 1
154.81 29.45
154.81 29.45
153.78 14.01
153.87 9.84
154.24 19.00
154.46 13.18
153.94 12.78
152.08 11.04
151.72 9.82
152.84 13.18
152.62 8.84
151.60 10.64
151.24 10.11
154.40 9.04

Experimento 2
154.73 26.08
155.15 28.08
155.86 14.58
156.20 9.89
156.07 18.88
156.30 12.91
156.13 12.43
158.03 11.20
158.41 9.41
156.32 14.25
156.80 9.13
159.91 10.64
160.22 9.57
160.95 6.34

Experimento 3
153.15 29.98
155.08 28.05
154.44 13.18
154.32 8.98
154.79 17.90
154.79 11.88
154.59 11.59
153.80 10.69
153.49 9.93
153.96 12.63
153.68 8.32
153.84 10.82
153.55 10.65
155.36 10.85

Tabela 7.14: Media das medidas para as versoes com rudo da Figura 7.3(a-c).
Filtro
Rudo
DA
Lee
Lee + DA
Frost
Frost + DA
Wavelet
FT 01
FT 01 + DA
FT 02
FT 02 + DA
FT 03
FT 03 + DA
SRAD

Experimento 1

RMS FOM
0.23 34.98 0.47
0.19 30.05 0.54
0.10 16.16 0.48
0.07 13.46 0.64
0.13 20.51 0.48
0.09 15.43 0.56
0.09 15.09 0.50
0.08 15.93 0.52
0.07 16.33 0.81
0.09 16.36 0.47
0.06 14.06 0.64
0.07 16.49 0.63
0.07 17.34 0.89
0.05 11.93 0.89

Experimento 2

RMS FOM
0.22 33.86 0.50
0.18 28.65 0.58
0.11 16.12 0.52
0.08 12.04 0.64
0.13 19.96 0.51
0.09 14.31 0.60
0.10 14.14 0.52
0.09 13.00 0.55
0.07 11.59 0.78
0.11 16.22 0.50
0.07 11.85 0.67
0.08 12.15 0.69
0.07 11.38 0.73
0.06 9.01
0.69

Experimento 3

RMS FOM
0.22 33.88 0.50
0.18 28.60 0.55
0.09 14.81 0.51
0.06 11.54 0.65
0.12 19.06 0.50
0.08 13.45 0.62
0.08 13.43 0.53
0.07 13.16 0.57
0.07 13.08 0.87
0.09 14.73 0.50
0.06 11.56 0.68
0.07 13.22 0.74
0.07 13.59 0.89
0.08 16.69 0.88

104

7.3.3

Captulo 7

Filtragem e segmenta
c
ao de imagens SAR

Nos u
ltimos anos, a quantidade de imagens produzidas por sistemas SAR cresceu significativamente, assim como suas aplicacoes: rastreamento, navegacao e monitoramento
ambiental, entre outras. SAR pode ser definida como uma tecnologia de sensoriamento
remoto que combina sinais refletidos para formar imagens complexas de alta definicao que
representam amplas areas de terreno [62].
Portanto, devido `a sua natureza, o rudo speckle esta presente de maneira intrnseca
e um procedimento de filtragem torna-se essencial para melhorar a qualidade destas imagens. Alem da reducao do rudo, e necessario que contornos e detalhes sejam preservados
(sem borramento), considerando que elas sao frequentemente utilizadas para fins de segmentacao e classificacao [58, 62]. A princpio, o rudo deveria ser completamente removido
mas, na pratica, ele pode apenas ser reduzido de forma significativa. Por este motivo,
o objetivo dos metodos de filtragem torna-se, muitas vezes, a obtencao de uma melhor
discriminacao dos objetos de interesse da cena.
Um problema comum em analise e processamento de imagens SAR e detectar caractersticas e contornos correspondendo a estradas e costas. Com base nas medidas discutidas na secao anterior, pode-se observar que, alem de reduzir a taxa de rudo presente
na imagem, a abordagem proposta conduz a uma melhoria na qualidade do contorno,
representada pelo ndice FOM.
A Figura 7.4 ilustra um exemplo em que o detector de Canny foi utilizado para estimar os contornos a partir das imagens filtradas. A imagem original e filtrada utilizando-se
o filtro toggle combinado com a tecnica de difusao anisotropica (Figuras 7.4(d) e (e)) e
tambem o SRAD (Figuras 7.4(b) e (c)). Observe que, dependendo dos parametros utilizados (regiao de analise no caso do SRAD e coeficiente de difusao e n
umero de iteracoes
para o operador proposto), diferentes informacoes podem ser extradas.

(a)

(b)

(c)

(d)

(e)

Figura 7.4: Analise da qualidade dos contornos: (a) imagem original e contornos estimados
a partir da filtragem obtida (b,c) com o algoritmo SRAD e (d,e) com o filtro toggle
combinado com difusao anisotropica.

7.4. Conclusoes

7.4

105

Conclus
oes

Este captulo apresentou uma forma alternativa para construcao de filtros auto-duais
utilizando um operador do tipo toggle cuja regra de decisao baseia-se na similaridade
do valor transformado pelas primitivas com relacao ao original. Quando comparada ao
centro morfologico, a operacao proposta permite considerar um conjunto mais amplo de
transformacoes.
Visando avaliar o desempenho do filtro toggle, o mesmo foi aplicado em imagens com
diversos tipos de rudo considerando-se diversos pares de primitivas. Bons resultados
foram obtidos para todas as imagens de teste. Como discutido anteriormente, o uso
de elementos estruturantes nao-planares produziu imagens mais proximas do caso ideal.
Alem disso, a filtragem de rudo do tipo speckle foi discutida com mais detalhes. A
combinacao do filtro toggle com a tecnica de difusao anisotropica proporcionou a obtencao
de resultados ainda mais precisos. Esta abordagem produziu resultados de boa qualidade
quando comparada a outros metodos conhecidos, tais como o filtro de Lee e o SRAD. Por
fim, foi apresentada uma simples aplicacao de filtragem/segmentacao de imagens SAR.
importante observar que a variacao da escala do elemento estruturante permite
E
utilizar os resultados em diferentes aplicacoes. Enquanto determinadas escalas conduzem
a uma maior homogeneizacao dos nveis de cinza (implicando em um RMSE menor),
outras preservam de forma mais adequada os contornos das estruturas de interesse da
imagem.

Captulo 8
Conclus
oes e trabalhos futuros
Este trabalho propos um conjunto de transformacoes capazes de gerar imagens que sao
mais adequadas para diversas aplicacoes, conduzindo a resultados mais precisos e evitando
etapas de processamento de maior custo computacional. Tais transformacoes possuem a
forma de um operador toggle e utilizam como base operacoes de morfologia matematica
dependentes de escala.
Inicialmente, foi definido um operador com propriedades espaco-escala, denominado
SMMT. Basicamente, explora-se a aplicacao iterativa das primitivas, que consistem nas
operacoes de erosao e dilatacao utilizando elementos estruturantes nao-planares. Esta
abordagem gera uma famlia de imagens que correspondem a versoes simplificadas da
original, nas quais detalhes indesejados e ate mesmo alguns tipos de rudo sao eliminados.
Na abordagem proposta, apenas dois parametros precisam ser configurados, represen importante ressaltar que o
tando a escala e o n
umero de iteracoes, ambos intuitivos. E
parametro de escala e estavel, ou seja, pequenas modificacoes no seu valor resultarao em
pequenas modificacoes no resultado final.
Foram ilustrados alguns exemplos em que a qualidade dos resultados obtidos depende
fortemente da simplificacao realizada pelo operador SMMT. Em alguns casos, tal simplificacao permite a extracao de marcadores mais significativos (devido a caractersticas tais
como preservacao da forma e criacao de regioes de influencia de extremos significativos),
evitando super-segmentacao. Em outros, conduz `a regularizacao do contorno, possibilitando o calculo de uma imagem gradiente adequada. Foram obtidos bons resultados de
segmentacao mesmo em imagens com problemas de iluminacao.
Na transformacao realizada pelo SMMT, maximos e mnimos da imagem interagem
ao mesmo tempo, levando a uma fusao de regioes que a simplifica de tal forma que importantes estruturas podem ser identificadas mesmo quando da existencia de variacoes nas
condicoes de iluminacao. Este fato, aliado `as propriedades multi-escala, foi essencial na
definicao de uma nova operacao de limiarizacao adaptativa multi-escala, a qual explora
107

108

Captulo 8

principalmente o fato que diferentes estruturas sao afetadas dependendo da escala utilizada. Enquanto escalas maiores tendem a criar regioes, escalas menores as delimitam,
identificando regioes de contorno.
Por exemplo, quando parametros apropriados sao utilizados, somente regioes com
grande variacao nos nveis de cinza serao transformadas. Este comportamento e interessante em diversas aplicacoes em que as caractersticas de interesse sao as regioes de
contorno. Foram apresentados alguns resultados de segmentacao de texto em imagens
de documentos degradadas por problemas como iluminacao nao-uniforme e manchas.
Quando comparado a outras abordagens existentes na literatura, o operador de binarizacao aqui definido se mostrou robusto a uma grande variedade destes problemas, sem
causar efeitos indesejaveis tais como caracteres com contornos fracos ou pouco definidos.
O operador tambem mostrou um desempenho superior em testes de OCR.
No entanto, nenhuma destas abordagens consegue lidar adequadamente com imagens
que possuem rudo distribudo de maneira uniforme, assim como e o caso para os rudos
do tipo impulsivo ou speckle, por exemplo. Neste contexto, foi proposta outra variacao
da classe de operador toggle que possui propriedades de filtragem se primitivas adequadas
forem consideradas. Neste caso, o operador e aplicado de forma iterativa (nao mais as
primitivas) e considera um conjunto mais abrangente de transformacoes (que sejam apropriadas para tratar o rudo em questao). O metodo explora a combinacao de primitivas
mais adequada ao rudo sendo considerado, tornando a abordagem adaptativa.
Alem disso, tambem foram apresentados varios outros exemplos de possveis aplicacoes,
os quais ilustram a importancia das transformacoes propostas para obtencao de resultados com boa qualidade em diferentes casos. A proxima secao discute de que forma os
resultados desta pesquisa podem ser estendidos.

8.1

Trabalhos futuros

Considerando sua vasta aplicabilidade, as transformacoes propostas neste trabalho podem


possvel explorar aspectos que permitam tanto a sua
ser ampliadas de diversas formas. E
automatizacao (evitando que parametros precisem ser configurados) quanto a utilizacao
em uma maior variedade de aplicacoes (uma pequena variacao na definicao do SMMT, por
exemplo, possibilitou determinar uma nova operacao de filtragem de rudo em imagens
em nveis de cinza).
Resumidamente, algumas das possveis extensoes sao:
1. estudar a viabilidade da aplicacao do espaco-escala SMMT em diferentes tipos de
transformacoes de imagens. Os exemplos apresentados no decorrer desta tese mostram sua potencialidade. Esta pesquisa inclui, entre outros aspectos:

8.2. Trabalhos publicados

109

analisar criterios de fusao dos extremos da imagem ao longo das diversas escalas, abordando aspectos tais como a relacao entre a altura da funcao estruturante e a distancia entre extremos da imagem. Estas informacoes serao
consideradas na definicao de um novo metodo de segmentacao parametrizada
que leve em conta a iteracao entre maximos e mnimos regionais de uma imagem, o que eventualmente pode conduzir a uma segmentacao auto-dual por
zonas de influencia dos extremos. Tal metodo torna desnecessaria a escolha da
escala e do n
umero de iteracoes cada vez que o operador e utilizado;
estudar os efeitos da aplicacao do operador SMMT em analise granulometrica
e na decomposicao residual de uma imagem, de forma a extrair pontos caractersticos que possam vir a ser utilizados para descricao/registro de imagens;
2. verificar a existencia de outros pares de primitivas que caracterizem um espacoescala morfologico para algum conjunto de caractersticas de interesse;
3. determinar pares de primitivas no filtro toggle que considerem a natureza do rudo
de forma mais especfica;
4. analisar a possibilidade de unir o operador SMMT com outras tecnicas de analise
multirresolucao, de forma a executar operacoes de custo computacional mais alto
apenas em regioes de interesse (tais como bordas e arestas, por exemplo).
Estas extensoes podem contribuir significativamente para a definicao de novos algoritmos de processamento de imagens baseados no processamento nao-linear morfologico.

8.2

Trabalhos publicados

DORINI, L. B. ; LEITE, N. J. A multiscale operator for document image binarization.


In: 4th International Conference on Computer Vision Theory and Applications.
Proceedings of 4th International Conference on Computer Vision Theory and Applications. To appear, 2009.
DORINI, L. E. B., LEITE, N. J. A general self-dual adaptative filtering toggle operator In: XXI Brazilian Symposium on Computer Graphics and Image Processing
(SIBGRAPI). Proceedings of XXI Brazilian Symposium on Computer Graphics and
Image Processing. p. 189-195, 2008. Selecionado para publicac
ao na revista Pattern
Recognition Letters. Sob avaliac
ao
DORINI, L. E. B., LEITE, N. J. Multiscale image representation using scale-space theory
In: XXXI Congresso Nacional de Matematica Aplicada e Computacional. Anais do

110

Captulo 8

XXXI Congresso Nacional de Matematica Aplicada e Computacional. p. 103-110,


2008.
DORINI, L. E. B., LEITE, N. J. Multiscale Morphological Image Simplification In:
13th Iberoamerican Congress on Pattern Recognition. Lecture Notes in Computer
Science. vol. 5197, p. 413-420, 2008.
DORINI, L. E. B., SIMOES, N. C., LEITE, N. J. A Scale-dependent Morphological
Approach to Motion Segmentation In: 14th International Conference on Systems,
Signals and Image Processing. Proceedings of 14th International Conference on
Systems, Signals and Image Processing. p. 122 - 125, 2007.
DORINI, L. E. B., LEITE, N. J. A scale-space toggle operator for morphological segmentation In: 8th International Symposium on Mathematical Morphology. Proceedings
of 8th International Symposium on Mathematical Morphology. 101-112, 2007.
DORINI, L. E. B., MINETTO, R., LEITE, N. J. White blood cell segmentation using
morphological operators and scale-space analysis In: XX Brazilian Symposium on
Computer Graphics and Image Processing. Proceedings of XX Brazilian Symposium
on Computer Graphics and Image Processing. p.294 - 304, 2007.
LEITE, N. J., DORINI, L. E. B. A scaled morphological toggle operator for image
transformations In: XIX Brazillian Symposyum of Computer Graphics and Image
Processing (SIBGRAPI). Proceedings of XIX Brazilian Symposium on Computer
Graphics and Image Processing. p. 323 - 330, 2006.

Bibliografia
[1] Caviar project, http://homepages.inf.ed.ac.uk/rbf/caviar/, February 2007.
[2] ABBYY. www.finereader.com, June 2008.
[3] B. Alberts, A. Johnson, J. Lewis, M. Raff, K. Roberts, and P. Walter. Molecular
Biology of the Cell. Garland Science, 2002.
[4] Sharon Alpert, Meirav Galun, Ronen Basri, and Achi Brandt. Image segmentation
by probabilistic bottom-up aggregation and cue integration. In Proceedings of the
IEEE Conference on Computer Vision and Pattern Recognition, June 2007.
[5] S. Beucher. The watershed transformation. disponvel em http://cmm.ensmp.fr/ beucher/wtshed.html, Dezembro 2008.
[6] S. Beucher and F. Meyer. Mathematical Morphology in Image Processing, chapter
The morphological approach to segmentation: the watershed transformation, pages
433451. Marcel Dekker, 1993.
[7] J.H. Bosworth and S.T. Acton. Morphological scale-space in image processing. Digital
Signal Processing, 13:338367, 2003.
[8] M.H. Chen and P.F. Yan. A multiscale approach based on morphological filtering.
IEEE Transactions on Pattern Analysis and Machine Intelligence, 42(12):33773386,
1989.
[9] D. Comanicu and P. Meer. Mean shift: A robust approach toward feature space
analysis. IEEE Transactions on Pattern Analysis and Machine Intelligence, 24:603
619, 2002.
[10] L.F. Costa and R.M. Cesar. Shape Analysis and Classification, Theory and Practice.
CRC Press, 2001.
[11] I. Daubechies. Ten Lectures on Wavelets. CBMS-NSF Lecture Notes, SIAM, 1992.
111

112

References

[12] L. E. B. Dorini and N. J. Leite. A scaled morphological toggle operator for image
transformations. In XIX Brazilian Symposium on Computer Graphics and Image
Processing, pages 323330. IEEE Press, 2006.
[13] L. E. B. Dorini and N. J. Leite. A scale-space toggle operator for morphological
segmentation. In 8th International Symposium on Mathematical Morphology, pages
101112, 2007.
[14] L. E. B. Dorini and N. J. Leite. A general self-dual adaptative filtering toggle operator. In XXI Brazilian Symposium on Computer Graphics and Image Processing,
pages 189195. IEEE Press, 2008.
[15] L. E. B. Dorini and N. J. Leite. Multiscale image representation using scale-space
theory. In XXXI Congresso Nacional de Matem
atica Aplicada e Computacional,
pages 103110, 2008.
[16] L. E. B. Dorini and N. J. Leite. Multiscale morphological image simplification. In
13th Iberoamerican Congress on Pattern Recognition, pages 413420. Lecture Notes
in Computer Science, 2008.
[17] L. E. B. Dorini, R. Minetto, and N. J. Leite. White blood cell segmentation using
morphological operators and scale-space analysis. In XX Brazilian Symposium on
Computer Graphics and Image Processing, pages 294304. IEEE Press, 2007.
[18] L. E. B. Dorini, N. C. Simoes, and N. J. Leite. A scale-dependent morphological
approach to motion segmentation. In IWSSIP, pages 122125, 2007.
[19] A. X. Falcao, J. Stolfi, and R. A. Lotufo. The image foresting transform: Theory, algorithms, and applications. IEEE Trans. on Pattern Analysis and Machine
Intelligence, 26(1):1929, Jan 2004.
[20] M. Ferryman, S.J. Maybank, and A.D. Worral. Visual surveillance for moving vehicles. In IEEE Workshop on Visual Surveillance, pages 7380, 1998.
[21] L. Florack. Non-linear scale-spaces isomorphic to the linear case with applications to
scalar, vector and multispectral images. International Journal of Computer Vision,
42(1/2):3953, 2001.
[22] Maas R. Florack, L. and W. Niessen. Pseudo-linear scale-space theory. International
Journal of Computer Vision, 32(2/3):247259, 1999.

References

113

[23] V.S. Frost, J. A. Stiles, K. S. Shanmugan, and J. C. Holtzman. A model for radar
image and its application to adaptive digital filtering of multiplicative noise. IEEE
Transactions on Pattern Analysis and Machine Intelligence, 4:157166, 1982.
[24] B. Gatos, I. Pratikakis, and S.J. Perantonis. Adaptative degraded image binarization.
Pattern Recognition, 39:317327, 2006.
[25] J. Gomes and L. Velho. Fundamentos de Computac
ao Gr
afica. Associacao Instituto
Nacional de Matematica Pura e Aplicada, 2003.
[26] R. C. Gonzalez and R. E. Woods. Digital Image Processing. Prentice Hall Upper
Saddle River, 2001. ISBN: 0-20118-075-8.
[27] R.M. Haralick, S.R. Stenberg, and X. Zhuang. Image analysis using mathematical morphology. IEEE Transactions on Pattern Analysis and Machine Intelligence,
PAMI-9(4):532550, 1987.
[28] I. Haritaoglu, D. Harwood, and L. S. Davis. W4: Who? when? where? what? a
real time system for detecting and tracking people. In International Conference on
Automatic Face and Gesture Recognition, pages 222227, 1998.
[29] H. Heijmans. Morphological Image Operators. Academic Press, 1994.
[30] H. J. A. M Heijmans. Self-dual morphological operators and filters. J. Math. Imaging
Vision, 6:1536, 1996.
[31] H.J.A.M. Heijmans. Morphological filters. In Summer School on Morphological Image
and Signal Processing, 1995.
[32] H.J.A.M. Heijmans. Composing morphological filters. IEEE Transactions on Image
Processing, 6:713723, 1997.
[33] H.J.A.M. Heijmans and R. van den Boomgaard. Algebraic framework for linear and
morphological scale-spaces. Journal of Visual Communication and Image Representation, 13:269301, 2002.
[34] T. Iijima. Basic theory of pattern normalization for the case of a typical onedimensional pattern. In Bull. Electrotech. Lab, pages 368388, 1962.
[35] P. Jackway. Morphological Scale-Space with Application to Three-Dimensional Object
Recognition. PhD thesis, Queensland University if Technology, 1994.

114

References

[36] P. T. Jackway and M. Deriche. Scale-space properties of the multiscale morphological


dilation-erosion. IEEE Transactions on Pattern Analysis and Machine Intelligence,
18:3851, 1996.
[37] B.K. Jang and R.T. Chin. Shape analysis using morphological scale space. In 25th
Ann. Conf. on Information Sciences and Systems, pages 14, 1991.
[38] S. Jianbo and J. Malik. Normalized cuts and image segmentation. IEEE Transactions
on Pattern Analysis and Machine Intelligence, 22:888905, 2000.
[39] K. Jiang, Q. Liao, and S. Dai. A novel white blood cell segmentation scheme using
scale-space filtering and watershed clustering. In 2nd International conference on
machine learning and cybernetics, pages 28202825, 2003.
[40] J.J. Koenderink. The structure of images. Biological Cybernetics, 50(5):363370,
1984.
[41] B.R. Kumar and T.V. Sreenivas. Teager energy based blood cell segmentation. In
International conference of digital signal processing, volume 2, pages 619622, 2002.
[42] A. C. Lara and R. Hirata. Motion segmentation using mathematical morphology.
In XIX Brazilian Symposium on Computer Graphics and Image Processing, pages
315322. IEEE Press, 2006.
[43] J.S. Lee. Digital image enhancement and noise filtering by use of local statistics.
IEEE Transactions on Pattern Analysis and Machine Intelligence, 2:165168, 1980.
[44] J.S. Lee. A simple speckle smoothing algorithm for synthetic aperture radar images.
IEEE Transactions on System, Man and Cybernetics, 13:8589, 1983.
[45] N. J. Leite and L. E. B. Dorini. A multiscale operator for document image binarization. In 4th International Conference on Computer Vision Theory and Applications,
page Aceito para publicacao, 2009.
[46] N. J. Leite and M. D. Teixeira. Morphological scale-space theory for segmentation
problems. In IEEE-EURASIP Workshop on Nonlinear Signal and Image Processing,
pages 364368, 1999.
[47] N. J. Leite and M. D. Teixeira. An idempotent scale-space approach for morphological
segmentation. In Mathematical Morphology and its Applications to Image and Signal
Processing, pages 291300. Kluwer Academic Publishers, 2000.

References

115

[48] Q.M. Liao and Deng Y.Y. An accurate segmentation method for white blood cell
images. In IEEE International symposium on biomedical imaging, pages 245248,
2002.
[49] L. M. Lifshitz and S. M. Pizer. A multiresolution hierarchical approach to image
segmentation based on intensity extrema. IEEE Transactions on Pattern Analysis
and Machine Intelligence, 12(4):529540, 1990.
[50] T. Lindeberg. Discrete Scale-Space Theory and the Scale-Space Primal Sketch. PhD
thesis, Computational Vision and Active Perception Laboratory (CVAP), Royal Institute of Technology, 1991.
[51] T. Lindeberg. Scale-space theory: A basic tool for analysing structures at different
scales. Journal of Applied Statistics, 21(2):224270, 1994.
[52] T. Lindeberg. Scale-space theory in computer vision. Kluwer Academic Publishers,
1994.
[53] K. Lofsness. Blood cell maturation chart - www.umn.edu/hema, 2008.
[54] R. A. Lotufo, A. X. Falcao, and F. Zampirolli. IFT-Watershed from gray-scale
marker. In Proc. of XV Brazilian Symp. on Computer Graphics and Image Process
ing, pages 146152. IEEE, Oct 2002.
[55] P. Maragos and F. Meyer. A pde approach to nonlinear image simplification via
levelings andreconstruction filters. In International Conference on Image Processing,
pages 938941, 2000.
[56] T. Markiewicz, S. Osowski, and B. Marianska. White blood cell automatic counting
system based on support vector machine. LNCS, (4432):318326, 2007.
[57] G. Matheron. Random Sets and Integral Geometry. John Wiley and Sons, 1975.
[58] D.M. McDonald. Speckle reduction in synthetic aperture radar images. Technical
Report SRL-0010-TM, Departament of Defense - Surveillance Research Laboratory,
1988.
[59] Fernand Meyer. Levelings, image simplification filters for segmentation. Journal of
Mathematical Imaging and Vision, 20(1-2):5972, 2004.
[60] P.A.V. Miranda, F.P.G. Bergo, L.M. Rocha, and A.X. Falcao. Tree-pruning: A new
algorithm and its comparative analysis with the watershed transform for automatic
image segmentation. In XIX Brazilian Symposium on Computer Graphics and Image
Processing, pages 231239. IEEE Press, 2006.

116

References

[61] W. Niblack. An Introduction to Digital Image Processing. Prentice Hall, 1986.


[62] C. Oliver and S. Quegan. Understanding Synthetic Aperture Radar Images. SciTech
Publishing, 2004.
[63] N. Otsu. A threshold selection method from grey-level histograms. IEEE Transactions on Systems, Man and Cybernetics, 9(1):377393, 1979.
[64] K. Park and C Lee. Scale-space using mathematical morphology. IEEE Transactions
on Pattern Analysis and Machine Intelligence, 18(11):11211126, 1996.
[65] J. R. Parker. Algorithms for Image Processing and Computer Vision. Wiley, 1996.
[66] P. Perona and J. Malik. Scale-space and edge detection using anisotropic diffusion.
IEEE Transactions on Pattern Analysis and Machine Intelligence, 42(12):629639,
1990.
[67] W. Pratt. Digital Image Processing. CRC Press, 1977.
[68] P.K. Sahoo, S. Soltani, and A.K.C. Wong. A survey of thresholding techniques.
Comput. Vision, Graphics and Image Processing, 41(2):233260, 1988.
[69] J. Sauvola and M. Pietikainen. Adaptive document image binarization. Pattern
Recognition, 33:225236, 2000.
[70] J. G. M. Schavemaker, M. J. T. Reinders, J.J Gerbrands, and E. Backer. Image
sharpening by morphological filtering. Pattern Recognition, 33:9971012, 1999.
[71] J. Serra. Image Analysis and Mathematical Morphology. Academic Press, 1982.
[72] J. Serra. Image Analysis and Mathematical Morphology, volume 2: Theoretical Advances. Academic Press, 1988.
[73] J. Serra and L. Vicent. An overview of morphological filtering. Circuits, Systems
and Signal Processing, 11(1):47108, 1992.
[74] J. Serra and L. Vincent. An overview of morphological filtering. Circuits, Systems,
and Signal Processing, 11:47108, 1992.
[75] P. Soille. Morphological Image Analysis: Principles and Applications. SpringerVerlag, 2003.
[76] N. Theera-Umpon. White blood cell segmentation and classification in microscopic
bone marrow images. Lecture Notes on Computer Science, (3614):787796, 2005.

References

117

[77] C. Vachier and F. Meyer. Extinction value: a new measurement of persistence. In


IEEE Workshop on nonlinear signal and image processing, volume 1, pages 254257,
1995.
[78] C. Vachier and L. Vicent. Valuation of image extrema using alternating filters by
reconstruction. In Proc. SPIE Neural, Morphological, and Stochastic Methods in
Image and Signal Processing, volume 2568, pages 94103, 1995.
[79] R. van den Boomgaard. Mathematical morphology: extensions towards computer
vision. PhD thesis, University of Amsterdam, 1992.
[80] L. Wang, W. Hu, and T. Tan. Recent developments in human motion analysis.
Pattern Recognition, 36:585601, 2003.
[81] S. Wang and R.M. Haralick. Automatic multithreshold selection. Comput. Vision,
Graphics and Image Processing, 25:4667, 1984.
[82] J. Weickert, S. Ishikawa, and A. Imiya. Linear scale-space has first been proposed in
japan. J. Math. Imaging Vis., 10(3):237252, 1999.
[83] P. Wellner. Adaptive thresholding for the digital desk. Technical Report EPC1993110, Xerox, 1993.
[84] A. P. Witkin. Scale-space filtering: a new approach to multi-scale description. In
Image Understanding, pages 7995. Ablex, 1984.
[85] Y. Yu and S.T. Acton. Speckle reducing anisotropic diffusion. IEEE Transactions
on Image Processing, 11:12601270, 2002.

Vous aimerez peut-être aussi