Vous êtes sur la page 1sur 137

DISSERTAO DE MESTRADO

ANLISE DA TRANSFORMADA
WAVELET DIRECIONAL ADAPTATIVA
NA CODIFICAO DE IMAGENS.
Karen Frana de Oliveira
Braslia, janeiro de 2009
UNIVERSIDADE DE BRASLIA
FACULDADE DE TECNOLOGIA
UNIVERSIDADE DE BRASILIA
Faculdade de Tecnologia
DISSERTAO DE MESTRADO
ANLISE DA TRANSFORMADA
WAVELET DIRECIONAL ADAPTATIVA
NA CODIFICAO DE IMAGENS.
Karen Frana de Oliveira
Dissertao de mestrado submetida ao Departamento de Engenharia Eltrica
da Faculdade de Tecnologia da Universidade de Braslia, como parte
dos requisitos necessrios para a obteno do grau de mestre.
Banca Examinadora
Prof. Ricardo Lopes de Queiroz, PhD.,
ENE/UnB
Orientador
Prof. Eduardo Antnio Barros da Silva,
PhD., COPPE/UFRJ
Examinador externo
Prof. Adson Ferreira da Rocha, PhD. ,
ENE/UnB
Examinador interno
FICHA CATALOGRFICA
OLIVEIRA, KAREN FRANA DE
Anlise da transformada wavelet direcional adaptativa na codicao de imagens
[Distrito Federal] 2009.
xiii, 117p., 210 297 mm (ENE/FT/UnB, Mestre, Telecomunicaes,
Processamento de Sinais, 2009). Dissertao de Mestrado. Universidade de
Braslia. Faculdade de Tecnologia.
Departamento de Engenharia Eltrica.
1. Codicao de Imagem 2. Filtragem adaptativa
3. Transformadas wavelet 4. Lifting direcional
5. Nmero de condio
I. ENE/FT/UnB II. Ttulo (srie)
REFERNCIA BIBLIOGRFICA
OLIVEIRA, K. F. (2009). Anlise da transformada wavelet direcional adaptativa na
codicao de imagens. Dissertao de Mestrado em Engenharia Eltrica com nfase
em Telecomunicaes, Publicao PPGENE.DM - 363A/09, Departamento de Engenharia
Eltrica, Universidade de Braslia, Braslia, DF, 117p.
CESSO DE DIREITOS
NOME DO AUTOR: Karen Frana de Oliveira.
TTULO DA DISSERTAO DE MESTRADO: Anlise da transformada wavelet dire-
cional adaptativa na codicao de imagens.
GRAU: Mestre ANO: 2009
concedida Universidade de Braslia permisso para reproduzir cpias desta dissertao
de mestrado e para emprestar ou vender tais cpias somente para propsitos acadmicos e
cientcos. O autor reserva outros direitos de publicao e nenhuma parte desta dissertao
de mestrado pode ser reproduzida sem a autorizao por escrito do autor.
Karen Frana de Oliveira
SQS 107 Bloco K Apto 504
70346-110 Braslia - DF - Brasil.
Dedicatria
Dedico esse trabalho a todos os familiares e amigos, que tiveram toda a compreenso
nos momentos de ausncia e que tudo zeram para viabilizar a concentrao de
meus esforos nessa empreitada.
Karen Frana de Oliveira
Agradecimentos
Agradeo aos amigos que, diariamente, conviveram com a nsia de que esse
trabalho fosse nalizado, no s pela pacincia que demonstraram, mas tambm,
pela ajuda que ofertaram. Aos amigos que no participaram diretamente,
igualmente gostaria de agradecer, pois alm de aceitarem minhas sucessivas faltas
ainda foram capazes de torcer para que tudo desse certo e, claro, para que
terminasse logo. Por m, agradeo imensamente minha famlia, alvo mnimo
de ateno nesse perodo, pela verdadeira dedicao a mim oferecida, permitindo o
livre desembarao de minhas atividades, e pelo contnuo incentivo que dela tenho
recebido, essencial transposio de qualquer limite.
Karen Frana de Oliveira
RESUMO
Esse trabalho apresenta um mtodo de anlise da estabilidade numrica de transformadas
wavelet direcionais adaptativas via lifting. O objetivo investigar a relao entre uma
dada combinao de direes dos estgios de lifting e a qualidade de reconstruo das bases
correspondentes. Esse novo mtodo baseado na variao em frequncia do nmero de
condio da matriz polifsica de sntese de bancos de ltros multidimensionais direcionais.
As transformadas implementadas, caracterizadas por bancos de ltros dessa natureza,
permitem adaptar localmente as direes de ltragem s direcionalidades de uma imagem,
resultando em menores coecientes de detalhe nas sub-bandas de alta freqncia. Para tal,
modicou-se o kernel da wavelet interpolante (6,6), inserindo-se informao direcional em
seus estgios de lifting. Diferentes abordagens foram sugeridas para denir a combinao
tima de direes, no sentido de compresso. Os melhores resultados apontaram para
escolha da direo de predio baseada em um algoritmo de minimizao de distoro,
adotando-se, em seguida, a mesma direo para o passo de atualizao. Para realizar os
testes de desempenho da transformada direcional implementada, substitui-se os mdulos de
transformao dos codicadores JPEG2000 e SPIHT. Desse modo, efetivamente conseguiu-
se maior compactao de energia para imagens com transies abruptas. Prossegiu-se com
a anlise da estabilidade numrica das bases, fundamentada na variao do nmero de
condio. Os procedimentos realizados mostraram que bases originadas por direes de
predio distintas da de atualizao realmente apresentam pior qualidade de reconstruo.
Como o mdulo de transformada uma parte importante de um sistema de compresso de
imagens, uma melhoria nesse mdulo efetivamente capaz de prover bons resultados em
termos taxa-distoro para o sistema todo.
ABSTRACT
This work presents a method for the numerical stability analysis of adaptive lifting-based
directional transforms. The goal is to investigate the relation between the directions set
in the lifting scheme and the reconstruction quality of the corresponding bases. This new
method is based on the variation in frequency of the condition number of the synthesis
polyphase transfer matrix of multimensional directional lter banks. The implemented
transforms, characterized by such lters, allows for the adaptation of the ltering directions
to match the local directionality of the image features, resulting in lower energy of the
high-frequency subbands. In order to do so, the (6,6) interpolating wavelet kernel was
modied, inserting directional information into the lifting steps. Dierent methods were
suggested to determine the optimal set of directions, in terms of maximizng compression
performance. Best results pointed to the prediction direction choice based on the distortion
minimization algorithm, followed by the update step in the same direction. In order to
test the directional transforms, the transform modules of JPEG2000 and SPIHT coders
were replaced by the aforementioned transform algorithm. In this way, one can really
achieve higher energy compaction for images with abrupt transitions. Next, we carried a
numerical stability analysis based on the variation in frequency of the condition number of
the transform. Results have shown that bases generated by using the prediction direction
dierent from the update direction actually leads to worse reconstruction quality. As the
transform is one of the crucial elements in transform coding systems, improvements in that
module may eectivelly lead to overall coding improvements.
SUMRIO
1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1 Contextualizao............................................................. 1
1.2 Organizao .................................................................... 4
2 Compresso de Imagens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.1 Conceitos ........................................................................ 5
2.2 Compresso com ou sem perdas .......................................... 6
2.3 Explorando a redundncia ................................................ 8
2.3.1 Redundncia Estatstica.................................................... 8
2.3.2 Informaes Irrelevantes.................................................. 9
2.3.3 Irrelevcia na representao em espao de cores ................ 9
2.4 Elementos de um sistema de compresso ............................. 11
2.4.1 Codificao de entropia.................................................... 11
2.4.2 Quantizao..................................................................... 13
2.4.3 Transformao ................................................................ 13
2.5 Modelagem ...................................................................... 19
2.5.1 Transformadas separveis ................................................. 20
3 Bancos de Filtros. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.1 Banco de filtros e reconstruo perfeita .......................... 23
3.2 Anlise dos erros gerados em um banco QMF...................... 27
3.2.1 Erros de aliasing e de imaging .............................................. 27
3.2.2 Distoro de amplitude e de fase....................................... 30
3.2.3 Um sistema QMF simples com cancelamento de alias ............. 31
3.2.4 Representao Polifsica .................................................. 31
3.2.5 Limitaes impostas pela restrio H
1
(z) = H
0
(z), em um
banco QMF ...................................................................... 33
3.3 Bancos de filtros com M faixas ......................................... 34
3.3.1 Expresso matemtica do sinal reconstrudo - M faixas ....... 35
3.3.2 Representao Polifsica - M Faixas .................................. 36
3.3.3 Reconstruo Perfeita - M Faixas ..................................... 38
3.4 Bancos de Filtros Multidimensionais .................................. 42
v
3.4.1 Consideraes iniciais ....................................................... 42
3.4.2 Conceitos bsicos sobre sinais multidimensionais.................. 43
3.4.3 Filtros Digitais Multidimensionais ...................................... 44
3.4.4 Amostragem de sinais Multidimensionais ............................. 45
3.5 Fundamentos de sistemas multitaxa multidimensionais .......... 48
3.5.1 Componentes Bsicos ........................................................ 48
3.5.2 Representao Polifsica - Multidimensional ...................... 50
3.6 Transformadas wavelet e bancos de filtros .......................... 54
3.6.1 Histrico......................................................................... 54
3.6.2 Modelagem ...................................................................... 55
4 Transformadas direcionais implementadas via lifting . . . . . . . . . . . 59
4.1 Histrico......................................................................... 59
4.2 Lifting .............................................................................. 61
4.2.1 Modelagem ...................................................................... 62
4.3 Lifting bidimensional convencional ...................................... 67
4.4 Lifting bidimensional direcional .......................................... 69
4.4.1 Escolha adaptativa das direes ........................................ 72
4.4.2 Correlao entre as direes de filtragem ........................ 73
5 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.1 Validao ........................................................................ 75
5.2 Implementao da transformada wavelet direcional (D-DWT) 75
5.2.1 Primeira abordagem: direo de atualizao igual de
predio .......................................................................... 76
5.2.2 Segunda abordagem: novo critrio de suavizao para se
escolher a direo de atualizao independentemente......... 77
5.3 Anlise da Estabilidade Numrica ...................................... 78
5.3.1 Metodologia.................................................................... 80
6 Concluses. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
6.1 Sumrio do trabalho e avaliao dos resultados ................. 95
6.2 Sugesto para trabalhos futuros ...................................... 96
REFERNCIAS BIBLIOGRFICAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
Anexos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
I Matrizes com as variaes em frequncia do nmero de condio
e suas representaes grficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
LISTA DE FIGURAS
2.1 Ilustrao de uma imagem digitalizada e a interpretao das coordenadas
das amostras .................................................................................... 6
2.2 Componentes nos espaos de cores RGB e Y C
b
C
r
para a imagem Lena ........ 10
2.3 Viso global de um sistema de compresso.............................................. 11
2.4 Evidenciao dos elementos de um sistema de compresso ......................... 12
2.5 Quantizador escalar simples com quatro smbolos de sada ......................... 13
2.6 Transformao do sinal original x no sinal y por simples somas e diferenas. . 16
2.7 Os sinais x
c
e y
c
muito se assemelham aos sinais x e y, quando as amostras
pequenas foram ceifadas...................................................................... 17
2.8 Exemplo de transformao simples, considerando a mdia das amostras de
um bloco ......................................................................................... 18
2.9 Implementao separvel de uma transformao bidimensional, aplicada
unidimensionalmente s linhas e, em seguida, s colunas............................ 21
2.10 (a) das sub-bandas de uma tranformada wavelet bidimensional: LL -
simbolizando duas ltragens passa-baixa (do ingls, Low-pass); LH - sim-
bolizando uma ltegem passa-baixa (do ingls, Low-pass), seguida de uma
ltragem passa-alta (do ingls, High-pass); HL - simbolizando uma ltragem
passa-alta (do ingls, High-pass), seguida de uma ltragem passa-baixa (do
ingls, Low-pass); HH - simbolizando duas ltragens passa-alta (do ingls,
High-pass).(b) Organizao evidenciando os detalhes destacados em cada
sub-banda:A - aproximao; V - detalhe vertical; H - detalhe horizontal; D -
detalhe diagonal. ............................................................................... 22
3.1 Banco de Filtros Digitais: (a) banco de anlise; (b) banco de sntese. ........... 24
3.2 Banco de Filtros com M faixas criticamente decimado. ............................. 24
3.3 Operaes bsicas para a converso da taxa de amostragem. O so-
breamostrador ou expansor (a) insere M 1 amostras nulas entre cada par
de amostras originais, aumentando a taxa de amostragem por um fator M.
O decimador (b) retm uma a cada M amostras do sinal original, reduzindo
a taxa de amostragem por um fator M. ................................................. 25
3.4 (a) Banco de Filtros Espelhados em Quadratura;(b) repostas tpicas de
magnitude........................................................................................ 26
vii
3.5 Duas possveis repostas em magnitude para os ltros de anlise: (a)sem
sobreposio, e (b)com sobreposio. ..................................................... 28
3.6 Banco de Filtros com M faixas criticamente decimado .............................. 34
3.7 Representao polifsica de um banco de anlise com M faixas................... 37
3.8 Representao polifsica de um banco de sntese com M faixas ................... 38
3.9 Banco de Filtros Digitais: (a) Representao Polifsica de um banco de ltros
com M faixas criticamente decimado; (b) Rearranjo a partir de identidades
nobres; (c) Simplicao, em que P(z) = R(z)E(z). ................................. 39
3.10 Conjunto de pontos resultante da amostragem x(n
0
, n
1
) = x
a
(n
0
n
1
, n
0
+2n
1
) 47
3.11 Conjunto de amostras quincunx. ........................................................... 47
3.12 Demostrao dos quatro componentes polifsicos gerados para amostragem
do tipo hexagonal, localizados no interior do FPD(M). ............................ 52
3.13 Representao em diagrama de blocos das relaes entre os sinais x(n), x
k
(n)
e y
k
(n). ........................................................................................... 52
3.14 Decomposio de x(n) em componentes polifsicos e sua recomposio. ........ 56
3.15 Representao tempo-frequencial para (a)impulso, (b)senide pura e (c)wavelet. 56
3.16 Estrutura em rvore logartmica que origina as wavelets. ........................... 57
3.17 Cada estrutura wavelet packet origina um conjunto de bases, incluindo Walsh
e Haar............................................................................................. 58
4.1 Resultado da ltragem de um ltro adaptativo de Gabor da Imagem Brbara. 62
4.2 Imagem Brbara binarizada com vetores indicando as direes predominantes
nos blocos, obtidas por meio de ltros de Gabor. ..................................... 63
4.3 Representao em diagrama de blocos dos trs passos de lifting: Split,
Prediction-P e Update-U. .................................................................... 64
4.4 Representao das direes de predio e de atualizao de uma (2-D
DWT) convencional separvel. As circunferncias slidas no preenchidas
representam G
00
, as tracejadas no preenchidas G
01
, as slidas preenchidas
G
10
e as tracejadas preenchidas G
11
. Em destaque encontram-se as amostram
a serem preditas ou atualizadas. (a)Transformao entre linhas: Apenas
amostras localizadas sob a mesma coluna podero compor as funes de
predio e de atualizao.(b)Transformao entre colunas: Apenas amostras
localizadas sob a mesma linha podero compor as funes de predio e de
atualizao. ...................................................................................... 68
4.5 Conjunto de direes propostas para a (2-D DWT) direcional adaptativa.
as echas slidas representam os vetores d e d, enquanto os tracejados
representam

d e

d. As circunferncias slidas no preenchidas representam


G
00
, as tracejadas no preenchidas G
01
, as slidas preenchidas G
10
, e as
tracejadas preenchidas G
11
. ................................................................ 70
4.6 Representao de mtodos de implementao de 2-D DWTs direcionais
adaptativas em que a direo escolhida a partir da tangente de uma
inclinao espacial
v
, envolvendo, portanto, localizaes sub-pixel. As
posies inteiras so marcadas por O, as posies half-pixel so marcadas
por +, enquanto as posies quarter-pixel so marcadas por x. ............... 72
4.7 Esquemtico da decomposio direcional em sub-bandas, considerando-se um
nvel completo de 2-D DWT. Os indicadores ao longo das setam referem-se
s direes adotadas em cada passo de predio e de atualizao realizado:
DP1 - Direo de Predio 1; DU1 - Direo de Update 1; DLP2 - Direo de
Predio da sub-banda Low-pass 2; DLU2 - Direo de Update da sub-banda
Low-pass 2; DHP2 - Direo de Predio da sub-banda High-pass 2; DHU2
- Direo de Update da sub-banda High-pass 2. ....................................... 74
5.1 Imagens de Teste: (a) Barbara; (b) Lena; (c) GoldHill; (d) Baboon.............. 83
5.2 Curvas de PSNR taxa resultantes da codicao da imagem Brbara,
utilizando-se a D-DWT com direes de predio e de atualizao iguais....... 84
5.3 Curvas de PSNR taxa resultantes da codicao da imagem Lena,
utilizando-se a D-DWT com direes de predio e de atualizao iguais....... 85
5.4 Curvas de PSNR taxa resultantes da codicao da imagem Baboon,
utilizando-se a D-DWT com direes de predio e de atualizao iguais....... 86
5.5 Curvas de PSNR taxa resultantes da codicao da imagem Goldhill,
utilizando-se a D-DWT com direes de predio e de atualizao iguais....... 87
5.6 Testes de suavizao - imagem Brbara: (a) com critrio de suavizaao; (b)
sem critrio de suavizaao. .................................................................. 88
5.7 Testes de suavizao - imagem Lena: (a) com critrio de suavizaao; (b) sem
critrio de suavizaao. ........................................................................ 89
5.8 Testes de suavizao - imagem Baboon: (a) com critrio de suavizaao; (b)
sem critrio de suavizaao. .................................................................. 90
5.9 Testes de suavizao - imagem Goldhill: (a) com critrio de suavizaao; (b)
sem critrio de suavizaao. .................................................................. 91
5.10 Esquemtico da metodologia de composio da matriz polifsica de sntese a
partir dos coecientes da transformada inversa, considerando a aplicao
sub-banda LL como exemplo................................................................ 92
5.11 Variao do nmero de condio, (E(
1
,
2
)), referente Wavelet inter-
polante (6,6) convencional: DP1 = 5, DU1 = 5, DLP2 = 5, DLU2 =
5, DHP2 = 5 e DHU2 = 5. (a)Representao tridimensional, onde
1
e
2
so os eixos horizontais. (b)Representao bidimensional a cores da variao
de (E(
1
,
2
)), contendo
1
e
2
nas linhas e colunas. ............................. 93
5.12 Variao do nmero de condio, (E(
1
,
2
)), referente combinao de
direes DP1 = 8, DU1 = 5, DLP2 = 5, DLU2 = 5, DHP2 =
5 e DHU2 = 5, contendo, portanto, direo de predio diferente da
de atualizao. (a)Representao tridimensional, onde
1
e
2
so os
eixos horizontais. (b)Representao bidimensional a cores da variao de
(E(
1
,
2
)), contendo
1
e
2
nas linhas e colunas. ................................. 94
I.1 Variao do nmero de condio, (E(
1
,
2
)), referente Wavelet inter-
polante (6,6) convencional: DP1 = 5, DU1 = 5, DLP2 = 5, DLU2 =
5, DHP2 = 5 e DHU2 = 5. ................................................................ 106
I.2 Variao do nmero de condio, (E(
1
,
2
)), referente combinao de
direes DP1 = 3, DU1 = 3, DLP2 = 3, DLU2 = 3, DHP2 =
3 e DHU2 = 3. ................................................................................. 107
I.3 Variao do nmero de condio, (E(
1
,
2
)), referente combinao de
direes DP1 = 9, DU1 = 9, DLP2 = 5, DLU2 = 5, DHP2 =
5 e DHU2 = 5. ................................................................................. 108
I.4 Variao do nmero de condio, (E(
1
,
2
)), referente combinao de
direes DP1 = 5, DU1 = 5, DLP2 = 9, DLU2 = 9, DHP2 =
5 e DHU2 = 5. ................................................................................. 109
I.5 Variao do nmero de condio, (E(
1
,
2
)), referente combinao de
direes DP1 = 1, DU1 = 5, DLP2 = 5, DLU2 = 5, DHP2 =
5 e DHU2 = 5. ................................................................................. 110
I.6 Variao do nmero de condio, (E(
1
,
2
)), referente combinao de
direes DP1 = 8, DU1 = 5, DLP2 = 5, DLU2 = 5, DHP2 =
5 e DHU2 = 5. ................................................................................. 111
I.7 Variao do nmero de condio, (E(
1
,
2
)), referente combinao de
direes DP1 = 5, DU1 = 5, DLP2 = 1, DLU2 = 5, DHP2 =
5 e DHU2 = 5. ................................................................................. 112
I.8 Variao do nmero de condio, (E(
1
,
2
)), referente combinao de
direes DP1 = 5, DU1 = 5, DLP2 = 2, DLU2 = 5, DHP2 =
5 e DHU2 = 5. ................................................................................. 113
I.9 Variao do nmero de condio, (E(
1
,
2
)), referente combinao de
direes DP1 = 5, DU1 = 5, DLP2 = 4, DLU2 = 5, DHP2 =
5 e DHU2 = 5. ................................................................................. 114
I.10 Variao do nmero de condio, (E(
1
,
2
)), referente combinao de
direes DP1 = 5, DU1 = 5, DLP2 = 6, DLU2 = 5, DHP2 =
5 e DHU2 = 5. ................................................................................. 115
I.11 Variao do nmero de condio, (E(
1
,
2
)), referente combinao de
direes DP1 = 5, DU1 = 5, DLP2 = 7, DLU2 = 5, DHP2 =
5 e DHU2 = 5. ................................................................................. 116
I.12 Variao do nmero de condio, (E(
1
,
2
)), referente combinao de
direes DP1 = 5, DU1 = 5, DLP2 = 9, DLU2 = 5, DHP2 =
5 e DHU2 = 5. ................................................................................. 117
LISTA DE SMBOLOS
1-D one-dimensional
2-D two-dimensional
3-D three-dimensional
M-D multi-dimensional
CCIR Consultative Committee for International Radio
CD Compact Disc
DCT Discrete Cousine Transform
DWT Discrete Wavelet Transform
D-DWT Directional Discrete Wavelet Transform
DFB Directional Filter Bank
FIR Finite Impulse Response
FPD Fundamental Parallelepiped
GB Gigabytes
IEC International Electrotechnical Commission
ISO International Organisation for Standardisation
ITU International Telecommunication Union
JPEG Joint Photographic Experts Group
MPEG Motion Picture Experts Group
MSE Mean Square Error
PSNR Peak Signal to Noise Ratio
QMF Quadrature Mirror Filters
RD Rate-Distortion
STFT Short Time Fourier Transform
SPIHT Set Partitioning in Hierarchical Trees
xiii
Captulo 1
Introduo
1.1 Contextualizao
Nas ltimas dcadas temos assistido uma enorme transformao no que se refere
prpria maneira de nos comunicarmos e, a cada dia, mais e mais rpidas mudanas
so vericadas. Essa transformao inclui a crescente utilizao da rede mundial de
computadores (Internet), bem como a variedade de aplicativos que dela se utilizam; o
desenvolvimento explosivo das comunicaes mveis; alm do crescimento cada vez maior
da importncia das vdeo-comunicaes. importante tambm notar que, nesse novo
cenrio que se forma, todos esses meios de comunicao se inter-relacionam. Por exemplo,
freqentemente um usurio deseja descarregar um vdeo via internet e assistir em seu
telefone celular. Uma aplicao complexa como essa, do ponto de vista da engenharia,
passou a integrar o conjunto de necessidades bsicas de um usurio que, poca da
implantao das comunicaes mveis, apenas desejava realizar e receber ligaes. Nesse
contexto, simples notar a tendncia de crescimento das demandas dos usurios por mais
e mais recursos, o que est intimamente ligado ao interesse do mercado em satisfaz-las,
desenvolvendo tecnologias que as suportem. Por trs de toda essa revoluo multimdia
esto as tcnicas de compresso de dados, que so essenciais para sua viabilizao. O
advento da TV digital com todas as funcionalidades que dela se espera, como, por exemplo,
a utilizao de um canal de retorno para que o prprio usurio possa mandar as informaes
que desejar, seria impossvel sem compresso. Com essa evoluo, compresso de dados
deixou de ser um assunto afeto apenas a um grupo seleto de engenheiros e cientistas para
se tornar ubquo.
Pode-se, ento, esclarecer um pouco mais o que compresso e, principalmente, para
que se precisa dela. Provavelmente, muitos j devem ter ouvido falar de JPEG (Joint
Photographic Experts Group) [1] e MPEG(Motion Picture Experts Group) [2], que so,
respectivamente, padres utilizados na representao de imagem e de vdeo. Em padres
como esses, so utilizados algoritmos de compresso de dados para reduzir o nmero de
1
bits necessrios representao de uma imagem ou de uma seqncia de vdeo a uma dada
qualidade. Assim, compresso de dados pode ser entendida como a cincia ou, at mesmo,
a arte de representar uma informao de maneira mais compacta. Essa representao
mais compacta obtida identicando-se e utilizando-se caractersticas da prpria estrutura
existente nos dados. Dados podem ser caracteres em um arquivo texto, nmeros que
representam amplitudes de um sinal de udio, de uma imagem ou de uma seqncia de
vdeo, ou seqncias de nmeros gerados por qualquer outro processo.
A razo pela qual necessitamos de compresso que cada vez mais geramos e utilizamos
informaes em formato digital, isto , na forma de nmeros representados por bytes de
dados, e a quantidade de dados envolvidos pode ser muito grande. Por exemplo, para que se
possa representar digitalmente um segundo de vdeo sem compresso (usando-se o formato
CCIR 601 ou qualidade de vdeo Broadcast), necessita-se de mais que 20 MB (megabytes).
Isso signicaria que um disco DVD-5 (Digital Video Disc), que possui capacidade de 4,7 GB
(gigabytes), poderia guardar apenas 3,7 minutos de vdeo sem compresso. Se considerarmos
que a durao mdia de um lme de 120 minutos, se torna fcil perceber porque precisamos
de compresso. Para representarmos 2 minutos de msica sem compresso e em qualidade
de CD (Compact Disc), com taxa de 44.100 amostras por segundo e 16 bits por amostra,
seriam necessrios mais de 84 milhes de bits para represent-la. Assim, descarregar uma
msica de um stio da Internet demoraria muito tempo, pelo menos muito mais tempo do
que usurios tpicos desejariam esperar.
Surge, ento, um questionamento pertinente: dado o crescimento explosivo da quanti-
dade de dados que precisamos transmitir ou armazenar, por que ento no se coloca o foco no
desenvolvimento de melhores tecnologias de transmisso e de armazenagem? Isso tambm
tem acontecido, mas no tem sido suciente. Vrios avanos signicativos permitem que
um volume cada vez maior de informao possa ser armazenado ou transmitido, incluindo
a mais nova mdia para armazenamento de dados de alta densidade chamada BD (Blu-ray
Disc). A capacidade dessa nova mdia varia de 25 GB (camada simples) a 50 GB (camada
dupla), ou seja, em apenas um disco podem ser armazenados lmes Full HD (resoluo de
19201080 pixels), de at 4 horas de durao, sem perdas perceptveis. Para que possamos
ter idia de quo grande foi o salto dessa nova tecnologia em relao sua antecessora,
a mdia DVD, compararemos as capacidades de armazenamento. Os DVDs possuem a
capacidade de armazenar 4,7 GB de dados, enquanto que um CD armazena em mdia de
700 MB. J os chamados DVDs de camada dupla (dual-layer), podem armazenar at 8,5
GB. Para o novo disco ptico BD, o salto foi muito maior, visto que sua capacidade varia de
25GB (camada simples) a 50GB (camada dupla). No entanto, importante observar que,
ainda hoje, a mdia BD sucessora ainda no se popularizou no Brasil, dado que a prpria
mdia e seus reprodutores (Blu-ray players), so ainda muito caros. Por m, deve-se tambm
notar que existem situaes em que a capacidade de transmisso e de armazenagem no
passvel de ser signicativamente aumentada, o que d ainda maior destaque s tcnicas
de compresso. Um exemplo bem simples de aplicao com essa restrio a que envolve
2
transmisso por radiodifuso, j que a quantidade de informao que pode ser transmitida
ser sempre limitada pelas caractersticas da atmosfera.
Sendo assim, mesmo com os esforos efetivos destinados a aumentar a capacidade dos
meios de transmisso e de armazenagem de dados, as tcnicas de compresso possuem papel
fundamental para que novos servios possam ser ofertados aos usurios ou, at mesmo, para
baixar os custos desses servios e, consequentemente, expandir o acesso. por essas razes
que vrias empresas da rea de tecnologia realizam grandes investimentos na pesquisa de
compresso de dados, majoritariamente de vdeo e de imagem, buscando atender demandas
relacionadas a entretenimento.
Como ser visto no Captulo 2, um mdulo importante de um sistema de compresso
de imagens o que realiza uma transformao nos dados, isto , um mdulo capaz de
representar os mesmos dados em um formato diferente, porm com maior concentrao de
energia em uma quantidade menor de smbolos. Dessa maneira, pode-se, at mesmo, optar
por descartar alguns smbolos para se economizar na quantidade total de bits, incorrendo em
menor perda de informao do que se dispensssemos alguns dos dados originais. Em outras
palavras, a transformao dos dados originais permite que se incorra em uma diminuio
da taxa necessria para represent-los acompanhada de uma reduo desproporcionalmente
menor na qualidade do sinal recuperado. Existem muitas ferramentas capazes de representar
um sinal de maneira mais compacta, favorecendo a sua compresso. Entre elas, destacam-
se a transformada de Fourier e a transformada discreta de cossenos. No entanto, tambm
ser discutido que o grau de compactao observado nos elementos transformados por uma
dada ferramenta depende das caractersticas do prprio sinal. Essa sentena expe uma
informao importante: no se pode dizer que exista um tipo de transformada tima para
qualquer sinal. Como consequncia, v-se que importante buscar uma transformada que
possa ser adaptada ao sinal de interesse.
Nesse trabalho, ser dado enfoque a uma ferramenta que se tornou muito popular nos
ltimos anos: as transformadas wavelet. Convencionalmente, uma transformada wavelet
aplicada a imagens, portanto, bidimensional, implementada de forma separvel, resultando
da aplicao em cascata de duas transformadas wavelet unidimensionais. Ser visto que esse
tipo de implementao no o mais adequado para representar sinais com direcionalidades
localizadas. Usualmente, imagens naturais contm informaes direcionais signicantes,
que podem ser aproximadas por bordas lineares em nvel local. Essas bordas podem no
ser horizontais ou verticais, e se isso no for considerado, sero obtidos coecientes de
alta freqncia com maior amplitude nos dados transformados. Dado que quanto maior
a compactao de energia, maior a possibilidade de compresso de uma imagem, nesse
caso restar prejudicada a capacidade de compresso. Busca-se, ento, uma maneira de se
rotacionar as bases de representao, alinhando-as com as direes predominantes de uma
imagem. Sabe-se que uma transformada wavelet pode ser implementada de forma eciente
pelo mtodo denominado lifting scheme [3],[4]. Nesse mtodo, cada ltro FIR da wavelet
3
pode ser fatorado em diversos passos de lifting, denominados separao (do ingls, split),
predio (do ingls, prediction) e atualizao (do ingls, update). Dessa maneira, pode-se
inserir a informao direcional em cada um dos passos, promovendo uma representao
adaptativa ao contedo da imagem.
Considerando a necessidade em se obter uma representao compacta de uma imagem, o
presente projeto tem a funo de evidenciar a escolha adequada dos parmetros direcionais
afetos a transformadas wavelet bidimensionais no-separveis cujas direes de ltragem
sejam adaptveis a direcionalidades localizadas, provendo melhoria na capacidade de
compresso desses sinais. Para esse m, desenvolveu-se um novo mtodo de anlise da
estabilidade numrica dessas transformadas, baseada na variao em frequncia do nmero
de condio da matriz polifsica de sntese do banco de ltros correspondente.
1.2 Organizao
O presente trabalho organizado da seguinte maneira: o segundo captulo discute
conceitos introdutrios em compresso de imagens, enumerando os principais componentes
de um sistema dessa natureza e suas funcionalidades. Nesse captulo, dado enfoque no
mdulo de transformao de imagens, dada a sua fundamental importncia para o trabalho.
No captulo 3 feito um estudo sobre banco de ltros, desde a modelagem de sistemas
unidimensionais com M bandas at o caso multidimensional. No m desse captulo feita
a associao de transformadas wavelet com uma estrutura especial de banco de ltros. J
no captulo 4 feita uma anlise sobre transformadas direcionais, destacando o mtodo de
fatorao lifting. Nessa oportunidade feita uma importante discusso sobre a problemtica
da escolha das direes de cada estgio de lifting. O captulo 5 mostra os resultados obtidos
na implementao da transformada direcional, alm de descrever uma nova abordagem
para a avaliao de sua estabilidade numrica, fundamentada na variao em frequncia do
nmero de condio de matrizes polifsicas. Por m, no sexto captulo feito um sumrio
do trabalho, juntamente com uma avaliao crtica dos resultados obtidos, terminando com
sugestes para trabalhos futuros.
4
Captulo 2
Compresso de Imagens
2.1 Conceitos
Compresso a arte ou a cincia de se representar dados com a menor quantidade
de informao possvel a uma qualidade aceitvel, aproveitando-se para isso das prprias
caractersticas dos dados ou, at mesmo, dos usurios da informao. Assim, compresso
de imagens nada mais do que a aplicao das tcnicas de compresso a imagens digitais.
Uma imagem pode ser denida como uma funo bidimensional f(x, y), em que x e
y so coordenadas espaciais, e o valor da funo em cada ponto coordenado chamado
intensidade ou nvel de cinza da imagem. Quando as coordenadas x e y assumem nitos
valores, ou seja, quantidades discretas, diz-se que a imagem digital. Logo, pode-se notar
que uma imagem digital composta por um nmero nito de elementos, que possuem uma
localizao particular em um plano e um valor associado. Estes elementos so conhecidos
como pixels (do ingls, picture element).
Para os propsitos de processamento e de compresso de imagens, apenas imagens
digitais devem ser consideradas, j que pressuposto destas reas a possibilidade de
tratamento computacional dos dados. O processo de digitalizao das coordenadas
conhecido como amostragem, enquanto a da amplitude, como quantizao. Assim, para os
propsitos desta tese, uma imagem ser considerada uma sequncia de valores amostrados:
x[n
1
, n
2
], 0 n
1
< N
1
, 0 n
2
< N
2
(2.1)
A primeira coordenada n
1
entendida como ndice para as linhas da imagem, enquanto
n
2
, como ndice para as colunas. Isto ilustrado na Figura 2.1.
5

n
d
i
c
e

d
e

c
o
l
u
n
a
ndicedelinha

n
d
i
c
e

d
e

c
o
l
u
n
a
ndicedelinha
Figura 2.1: Ilustrao de uma imagem digitalizada e a interpretao das coordenadas das
amostras
2.2 Compresso com ou sem perdas
A principal questo a ser respondida em compresso de sinais como se pode representar
o sinal de interesse com a menor quantidade possvel de bits, incorrendo em uma perda de
informao aceitvel. Considerando que o sinal original tenha sido digitalizado com B bits
por amostra, todos estes seriam, em princpio, necessrios reconstruo perfeita do sinal.
No entanto, pode-se considerar a estatstica das amostras, e se obter uma representao sem
perdas com menos bits por amostra, baseada, por exemplo, na correlao entre amostras
vizinhas. Em se tratando especicamente de imagens, alguma perda de informao
normalmente aceita por trs razes principais:
a Perdas signicantes podem ser toleradas pelo sistema visual humano sem prejudicar
o entendimento das cenas.
b Na maioria dos casos, a imagem digitalizada j uma representao imperfeita do
mundo real.
c Mtodos de compresso sem perdas normalmente no so sucientes para se atingir
os requisitos de altas taxas de compresso demandada pelas aplicaes.
Apesar de, na maioria das vezes, ser recomendado o uso de compresso com perdas, em
algumas aplicaes perdas so inaceitveis. Na rea mdica, por exemplo, uma pequena
perda de informao capaz de ocultar ou inserir artefatos na imagem, sucientes para
invalidar o diagnstico do especialista. A compresso sem perdas tambm deve ser utilizada
em aplicaes em que a imagem ser repetidamente editada e recomprimida, de tal sorte
que a acumulao dos erros de compresso com perdas se tornaria inaceitvel. Note que
6
apenas se torna vantajoso aceitar a introduo de pequenos erros se uma representao mais
eciente do sinal de interesse puder ser obtida, isto , se menos bits forem gastos. Assim,
quanto maior a distoro aceita, espera-se que menor seja quantidade de bits necessrios
na representao, ou seja, maior a compresso da informao. denido o limiar de perda
aceitvel, deve-se ento procurar a representao que incorra na menor quantidade de bits.
Para analisar a soluo de compromisso entre taxa e distoro, deve-se obter uma medida
adequada desta.
As medidas de distoro podem ser divididas em dois grupos: subjetivas e objetivas.
A medida dita subjetiva quando a qualidade avaliada por pessoas. No entanto,
essas observaes so necessariamente parciais, prejudicando a objetividade, e tambm
apresentam certa instabilidade, j que os sentimentos de cada pessoa inuenciam no
processo. Alm disso, a denio da distoro est ligada aplicao, no sendo, na maioria
dos casos, to menor ou aceitvel quanto as pessoas possam achar.
No que se refere a medidas objetivas, existem diferentes maneiras de se calcular a
distoro por uma funo predenida D(x, x), entre a imagem original x[n
1
, n
2
], e a imagem
reconstruda x[n
1
, n
2
]. A medida mais utilizada o erro quadrtico mdio (MSE - do ingls
"Mean Squared Error"), denido por:
MSE

=
1
N
1
N
2
N
1
1

n
1
=0
N
2
1

n
2
=0
(x(n
1
, n
2
) x(n
1
, n
2
))
2
(2.2)
Na rea de processamento de imagens, o MSE normalmente utilizado no clculo de
uma grandeza conhecida como PSNR (do ingls, "Peak-to-peak Signal to Noise Ratio"),
denida por:
PSNR

= 10 log
10
(2
B
1)
2
MSE
(2.3)
A PSNR expressa em dB (decibels). Imagens reconstrudas com qualidade geralmente
apresentam PSNR em torno de 30 dB. Esta medida bastante difundida na literatura,
mas, infelizmente, nem sempre coincide com a opinio de um especialista. O olho humano,
por exemplo, no observa pequenas variaes de intensidade entre pixels vizinhos, sendo,
no entanto, sensvel variaes no valor mdio e ao contraste em regies maiores. Uma
outra decincia desta funo a de considerar apenas medidas locais, ou seja, diferena
entre pixels, no capturando artefatos globais como efeito de bloco, "ringing", entre outras
degradaes estruturais.
7
2.3 Explorando a redundncia
Sem qualquer compresso, a imagem da Figura 2.1, por exemplo, pode ser representada
com N
1
N
2
B bits. Porm, caso a imagem apresente informaes redundantes, torna-se vivel
representar a mesma informao com um nmero menor de bits. Isso compresso. Nesta
seo discutiremos brevemente a natureza da redundncia para motivar a o entendimento
de um sistema completo de compresso de imagens, que ser apresentado na prxima seo.
2.3.1 Redundncia Estatstica
Considere dois inteiros x
1
e x
2
[0, 1, ..., 2
B
1], correspondendo a duas amostras
adjacentes de uma imagem. Sem compresso, os dois inteiros poderiam ser representados
por 2B bits. Suponha, no entanto, que o descompressor sabe a priori que a imagem
binria, ou seja, s apresenta valores 0 ou 1. Claramente, suciente indicar apenas um
bit, obtendo uma compresso de B : 1. Suponha ainda, que tambm informao a priori
que os dois valores so sempre iguais. Neste caso, obtm-se uma compresso ainda maior
de 2B : 1. Na maioria dos casos, o descompressor no ter todo o conhecimento prvio
descrito. Mais comum, no entanto, saber que um conjunto de valores apresenta maior
probabilidade de ocorrncia que outros. Por exemplo, sabendo que existe uma probabilidade
muito alta que x
1
{0, 1}, espera-se gastar pouco mais de 1 bit para indicar o seu valor
atual. Como veremos, espera-se gastar tantos bits quanto H(X
1
), em que X
1
uma varivel
aleatria que representa o conhecimento a priori do descompressor a respeito dos valores
assumidos de x
1
e H(X
1
) a funo de distribuio estatstica de X
1
, conhecida como sua
entropia. Uma suposio razovel a de que x
1
e x
2
sejam iguais, pois representam pixels
vizinhos e, provavelmente, a imagem deva ser suave e, portanto, mudanas bruscas no so
muito comuns. Neste caso, no se deve gastar muitos bits para indicar x
2
, dado que x
1
j
foi identicado na seqncia de bits comprimida. Uma importante forma de se obter uma
informao a priori se considerar, por exemplo, a estatstica conjunta das variveis X
1
e
X
2
, que correspondem aos valores assumidos, e o nmero de bits necessrios para representar
x
2
,dado que x
1
conhecido, pode ser dado pela entropia condicional H(X
2
|X
1
). Por hora,
suciente notar que o nmero mdio de bits utilizados na representao sem erro de uma
imagem depende de suas propriedades estatsticas, isto , quanto maior a correlao entre
os pixels, menor deve ser a quantidade de bits gastos para represent-los. No pior caso, em
que nenhuma redundncia observada, todos os valores so equiprovveis e independentes,
nenhuma compresso possvel, e os N
1
N
2
Bbits devero ser usados. No outro extremo,
quando um pequeno conjunto de valores for suente para prever os demais, podem ser
obtidas elevadas taxas de compresso.
8
2.3.2 Informaes Irrelevantes
O aproveitamento da redundncia entre as amostras descrito uma das maneiras capazes
de permitir uma representao exata da informao, porm com um nmero reduzido de bits.
No entanto, em muitos casos, parte da informao das amostras irrelevante, escolhendo-se
uma representao inexata, porm bem menos custosa. Os dois exemplos ilustram situaes
em que isto se verica.
Irrelevncia visual: Se a densidade de amostras ultrapassar a resoluo perceptvel
pelo usurio humano, o excesso de informao irrelevante.
Irrelevncias para uma aplicao especca: Em algumas aplicas, especialmente
mdicas ou militares, existem partes da imagem que deve ter uma resoluo muito
maior que outras. No primeiro caso, caso o especialista deseje analisar uma parte de
um rgo, por exemplo, todos os outros componentes do quadro so irrelevantes, e
este excesso de informao deve ser eliminado.
Uma maneira de explorar esta irrelevncia transformar as amostras originais em um
novo conjunto de valores capaz de capturar a informao em poucos bits. No caso mais
simples, a transformao pode apenas envolver sub-amostragem ou o descarte das partes
menos relevantes. Pode-se ainda explorar a redundncia das amostras restantes para se
obter maior compresso, como a caracterstica de suavidade j mencionada. Mais detalhes
sobre transformaes sero vistos no Captulo 4.
2.3.3 Irrelevcia na representao em espao de cores
Um exemplo interessante de irrelevncia ocorre na representao a cores de imagens. O
observador humano apresenta menor sensibilidade a variaes de cor e saturao do que a
mudanas na intensidade. Para os propsitos de compresso de imagens, esta propriedade
usualmente aproveitada mapeando-se a imagem originalmente representada no espao de
cores RGB em um outro espao de luminncias e crominncias Y C
b
C
r
, utilizando-se uma
popular transformao linear usada em padres como JPEG e JPEG2000 [5], [6]. Esta
converso entre esses espaos de cor tranformao dada por:
_

_
x
Y
x
Cb
x
Cr
_

_
=
_

_
0, 299 0, 587 0, 114
0, 169 0, 0331 0, 5
0, 5 0, 419 0, 0813
_

_
_

_
x
R
x
G
x
B
_

_
(2.4)
Pode-se ento notar que o primeiro componente de crominncia x
Cb
uma verso
escalonada da diferena entre a original componente azul (B - do ingls "Blue") e a
luminncia (Y), mais especicamente:
9
x
Cb
= 0, 564(x
B
x
Y
) (2.5)
De maneira similar, a outra crominncia x
Cr
obtida da diferena entre o vermelho (R
- do ingls "Red"):
x
Cr
= 0, 713(x
R
x
Y
) (2.6)
A Figura 2.2ilustra as componentes no espao RGB, bem como as componentes do
espao Y C
b
Cr para a imagem Lena.
RGB YCbCr
Figura 2.2: Componentes nos espaos de cores RGB e Y C
b
C
r
para a imagem Lena
comum, portanto, modelar a reduzida sensibilidade do sistema visual humano a
variaes rpidas nas cores reduzindo a resoluo das crominncias. Mais detalhadamente,
costuma-se trabalhar com a representao no espao Y C
b
C
r
e ainda sub-amostrar as
crominncias por um fator 2 em cada uma das direes, horizontal e vertical. Neste sentido,
as informaes consideradas irrelevantes para a representao a cores de uma imagem,
considerando a falta de sensibilidade do usurio da informao, teriam sido eliminadas.
Por m, no se pode esquecer a principal questo a ser considerada em um sistema
de compresso com perdas: a de minimizar a distoro para uma dada taxa de bits ou,
equivalentemente, mimizar a taxa para uma dada distoro. Uma medida adequada de
distoro dever, portanto, reetir a informao relevante. Mais precisamente, se as imagens
original x e reconstruda x diferirem apenas em aspectos irrelevantes, ento D(x, x) dever
ser nula.
10
2.4 Elementos de um sistema de compresso
A Figura 2.3 mostra a concatenao dos sistemas de compresso e de descompresso em
termos de dois mapeamentos, M
1
e M
1
2
, respectivamente. Para que a compresso seja sem
perdas, exige-se que M
1
2
= M
1
1
. Existem, porm, casos em que M
1
no inversvel, caso
de compresso com perdas, em que ser utilizada a notao M
1
2
para reforar a idia de
que o sistema descompressor apenas uma aproximao de inversa do sistema compressor.
Uma maneira alternativa de entender o sistema compressor como uma enorme tabela
de referncia (lookup table) com 2
N
1
N
2
B
entradas, j que, em princpio, toda a vizinhana
dever ser includa no contexto.
) (
1
x M c = ) (
1
2
c M x
-
=
Imagem Compressor
Bit-stream
Descompressor
Reconstruo
x c x
Figura 2.3: Viso global de um sistema de compresso
Pode-se, ento, detalhar cada um destes sistemas em seus componentes. Como mostrado
na Figura 2.4, o primeiro passo o que transforma as amostras originais componentes
da imagem em um novo conjunto, com caractersticas mais adequadas compresso.
Formalizando-se este passo, tem-se: y = T(x), em que y {y(k
1
, k
2
)} uma outra
seqncia bidimensional e nita, tendo K
1
K
2
elementos. As propriedades do operador
T sero discutidas no Captulo 4, por ora basta ressaltar que, normalmente, esta operao
inversvel. Assim, o descompressor capaz de utilizar uma transformada inversa, T
1
,
sem que qualquer distoro seja inserida nesta etapa. O segundo passo o que permite
representar, de uma maneira aproximada, a seqncia de amostras transformadas por uma
seqncia de ndices quantizados. Assim, obtm-se q = Qy, e q q(p
1
, p
2
) representa
uma seqncia bidimensional e nita com P
1
P
2
elementos. Geralmente, a quantidade de
amostras P
1
P
2
no maior e , provavelmente, at menor que o nmero de amostras
transformadas K
1
K
2
. Essa etapa de quantizao, sim, insere distoro no sistema de tal
forma que o descompressor utiliza apenas uma inversa aproximada Q
1
2
. Finalmente, os
ndices de quantizao so codicados entropicamente para formar o bit-stream nal, que
ser transmitido ou armazenado, por exemplo. Escreve-se c = C(q). Este passo inversvel,
no acrescentando distoro no processo, e o descompressor pode, ento, recuperar os ndices
de quantizao por q = C
1
(c). Veremos com um pouco mais de detalhe os passos de
Codicao, Quantizao e Transformao.
2.4.1 Codicao de entropia
O propsito da codicao de entropia o de explorar a redundncia estatstica dos
ndices de quantizao q(p
1
, p
2
). As amostras transformadas e, por conseqncia, as
11
Imagem
Transformada Quantizador
Codificador
deentropia
Decodificador
deentropia
Dequantizador
Transformada
Inversa
amostras ndices reconstruo
amostras ndices bit-stream
Figura 2.4: Evidenciao dos elementos de um sistema de compresso
quantizadas foram concebidas de forma a garantir que esta redundncia seja espacialmente
localizada. Dessa maneira, espera-se que a maior parte da energia esteja concentrada
nos coecientes de baixa frequncia. Idealmente, as variveis Q(p
1
, p
2
) deveriam ser
estatisticamente independentes, isto , os passos de transformao e quantizao deveriam
ser sucientes para aproveitar toda a redundncia da seqncia, descorrelacionando
totalmente as amostras. Como um simples exemplo, considere que existam quatro ndices
de quantizao possveis, com suas probabilidades de ocorrncia associadas:
P(Q = q) =
_

_
1/2 se q = 0
1/4 se q = 1
1/8 se q = 2
1/8 se q = 3
(2.7)
A partir das estatsticas, pode-se ento determinar um cdigo timo, isto , capaz de
prover uma representao mdia com menor nmero de bits.
q = 0
q = 1
q = 2
q = 3

1
01
001
000
(2.8)
O nmero mdio de bits gastos na codicao de cada amostra seria:
1
2
.1 +
1
4
.2 +
1
8
.3 +
1
8
.3 = 1
3
4
bits. (2.9)
Nota-se que o nmero de bits gasto com a codicao tima menor do que se apenas
gastssemos 2 bits para indicar cada uma das quatro amostras. Normalmente, em aplicaes
prticas de compresso de imagens, pode-se ainda obter maior reduo na taxa de bits.
V-se, portanto, que a etapa de transformao realmente reduz a redundncia dos dados,
12
permitindo que a etapa de quantizao reduza bastante a quantidade de bits a ser usada
na representao.
2.4.2 Quantizao
A quantizao, por si s, responsvel por introduzir distoro no sistema. Logo, em
sistemas de compresso sem perdas, no pode existir quantizao. No caso mais simples,
pode-se mapear cada amostra transformada, y(k
1
, k
2
), independentemente, em um ndice de
quantizao correspondente, q(k
1
, k
2
). Este processo conhecido como quantizao escalar.
A quantizao escalar associa cada ndice de quantizao com um intervalo no eixo real, de
acordo com:
q(k
1
, k
2
) = i, se y(k
1
, k
2
) I
i
,
em que os intervalos, I
i
, so disjuntos e cobrem todo o eixo real. A Figura 2.5,
por exemplo, sugere uma diviso em quatro intervalos. Nesse caso, ter-se-o quatro
ndices correpondentes. Conclui-se ento que a inversa aproximada da quantizao
deve, a partir do ndice q(k
1
, k
2
), fornecer alguma representao pertencente ao intervalo
correspondente, y(k
1
, k
2
). Uma maneira bem imediata atribuir a y(k
1
, k
2
) o ponto mdio
do intervalo I
q(k
1
,k
2
)
.
}} } } }
q(k ,k )=2
1 2
y(k ,k )
1 2
Figura 2.5: Quantizador escalar simples com quatro smbolos de sada
2.4.3 Transformao
A transformada responsvel por manipular as amostras originais da imagem em
uma forma que simplique as operaes de codicao e de quantizao. Por outro
lado, a transformada deve capturar a dependncia existente entre as amostras originais,
para que as amostras transformadas y(k
1
, k
2
) e os ndices de quantizao q(k
1
, k
2
) exibam
dependncias fortemente localizadas. Para tal, a transformada deve ser capaz de separar as
13
informaes relevantes das no-relevantes, para que as irrelevantes possam ser identicadas
e mais fortemente quantizadas ou, at mesmo, descartadas. Felizmente, possvel
construir transformadas capazes de atingir esses objetivos, pelo menos parcialmente.
Idealmente, como j mencionado, se desejaria que as amostras transformadas se tornassem
estatisticamente independentes.
Apenas para motivar o entendimento dos conceitos apresentados, ser mostrado um
simples exemplo. Mais precisamente, considere que os componentes x(0), x(1), x(2) e x(3)
de um sinal sero substitudos por outros quatro nmeros, y(0), y(1), y(2) e y(3), que sero
combinaes lineares dos elementos de {x}. Por exemplo, as combinaes podero ser somas
e diferenas:
y(0) = x(0) +x(1) y(2) = x(2) +x(3)
y(1) = x(0) x(1) y(2) = x(2) x(3) (2.10)
Ser, ento, analisado como podero ser recuperados os componentes originais do sinal
e qual o propsito dessa nova representao. Primeiramente, nota-se que a transformao
pode ser invertida utilizando-se tambm somas e subtraes, alm da multiplicao por um
fator de escala:
x(0) = 0, 5(y(0) +y(1)) x(2) = 0, 5(y(2) +y(3))
x(1) = 0, 5(y(0) y(1)) x(3) = 0, 5(y(2) y(3)) (2.11)
Adiantando-se um pouco o assunto, as transformadas podem ser classicadas em trs
categorias:
(a) Transformadas sem perdas (ortogonais): matrizes de transformao ortogonais e
unitrias
(b) Transformadas inversveis (biortogonais): matrizes de transformao inversveis
(c) Transformadas com perdas: matrizes de transformao no inversveis
Uma transformada unitria sem perdas pode ser representada por uma matriz de
rotao, como em 2.12, que mostra a chamada matriz de rotao de Givens. Portanto, o
sinal transformado possui o mesmo comprimento que o sinal original. Em outras palavras,
o sinal original simplesmente ser representado em novos eixos perpendiculares. Isto se
aplica, por exemplo, Transformada de Fourier e suas verses puramente reais, como a
DCT (do ingls, Discrete Cosine Transform).
14
M =
_
cos() sin()
sin() cos()
_
(2.12)
Diferentemente, nas transformaes biortogonais, podem ser alterados comprimentos
e ngulos. Assim, os novos eixos no sero necessariamente perpendiculares, mas ainda
assim nenhuma informao perdida, ou seja, pode-se ainda obter o sinal original a partir
dos coecientes transformados. Um passo irreversvel, por exemplo, seria o de eliminar
os componentes de baixa amplitude, passo conhecido na rea de compresso de sinais
como quantizao, j descrito. Desse modo, j se pode inferir que tambm as chamadas
transformadas wavelet ortogonais podero ser representadas por matrizes ortogonais e
unitrias, enquanto as biortogonais podero ser representadas por matrizes inversveis,
conservando, ainda, a caractertica de reconstruo perfeita.
Prope-se adotar uma representao matricial do exemplo apresentado. Considerando-
se x e y como vetores, obtm-se:
_

_
y(0)
y(1)
y(2)
y(3)
_

_
=
_

_
1 1 0 0
1 1 0 0
0 0 1 1
0 0 1 1
_

_
_

_
x(0)
x(1)
x(2)
x(3)
_

_
(2.13)
A matriz que recupera o vetor original, neste caso, a de transformao dividida por
dois:
_

_
x(0)
x(1)
x(2)
x(3)
_

_
= 1/2
_

_
1 1 0 0
1 1 0 0
0 0 1 1
0 0 1 1
_

_
_

_
y(0)
y(1)
y(2)
y(3)
_

_
(2.14)
importante observar que, ao se multiplicar as matrizes de transformao direta e
inversa, obtm-se uma matriz identidade 4 4, o que conrma o fato de a transformada
ser inversvel. Note que ao dividir a matriz de transformao direta por

2, as linhas desta
matriz sero vetores unitrios, ou seja, a matriz deixar de ser biortogonal para se tornar
ortogonal.
Considerando-se ento a transformada de um sinal como uma nova representao desse,
essa nova representao somente ser til se, nos coecientes transformados, for possvel
identicar padres que no seriam evidentes nas amostras originais. Isto signica que
o novo padro deve ser mais bem aproveitado pelos algoritmos computacionais que, em
regra, possuem melhor desempenho quando o sinal apresenta amplitudes grandes e baixas
em seqncia. Considere, por exemplo, a seguinte seqncia x de nmeros:
15
x(0) = 1, 2 x(1) = 1, 0 x(2) = 1, 0 x(3) = 1, 2.
Pode-se ento obter sua representao y, computando-se as somas e as diferenas entre
as amostras:
y(0) = 2, 2 y(1) = 0, 2 y(2) = 2, 2 y(3) = 0, 2.
1.2
1.0
-1.0
-1.2
2.2
0.2 0.2
-2.2
sinaloriginal
(n) x
sinaltransformado
(n) y
Figura 2.6: Transformao do sinal original x no sinal y por simples somas e diferenas.
Dada a nova representao, podem-se notar algumas peculiaridades do novo sinal. As
diferenas y(1) e y(3) so muito maiores que as somas y(2) e y(4), ou seja, as amostras 2
e 4 foram praticamente ceifadas. verdade que, para se reconstruir perfeitamente o sinal
original, necessita-se das quatro amostras. Porm, considere uma verso comprimida y
c
do
sinal y, em que as amostras abaixo do limiar 0,2 foram ceifadas:
y
c
(0) = 2, 2 y
c
(1) = 0 y
c
(2) = 2, 2 y
c
(3) = 0.
O sinal reconstrudo a partir dessa verso comprimida ento seria:
x
c
(0) = 1, 1 y
c
(1) = 1, 1 y
c
(2) = 1, 1 y
c
(3) = 1, 1.
A partir do simples exemplo apresentado, v-se que pode ser bastante desejado trocar
a reconstruo perfeita em favor da eliminao de amostras transformadas e conseqente
reduo da taxa de informao. Assim, torna-se importante utilizar transformaes capazes
16
1.1 1.1
sinalreconstrudo
(n) x
c
2.2
0 0
-2.2
sinalcomprimido
(n) y
c
-1.1 -1.1
Figura 2.7: Os sinais x
c
e y
c
muito se assemelham aos sinais x e y, quando as amostras
pequenas foram ceifadas.
de concentrar ao mximo a informao em poucas amostras, podendo-se ento eliminar as
demais, incorrendo-se em menor perda do que se ceifssemos amostras do sinal original.
Observe que o sinal reconstrudo no exemplo ainda apresenta caractersticas semelhantes
s do sinal original.
Desde j, pode-se, portanto, observar que no existe uma nica transformada tima
para todos os sinais. Logo, deve-se adequar o tipo de transformada s peculiaridades do
sinal de interesse. Alguns tipos de sinais j possuem peculiaridades reconhecidas. Um sinal
de voz, por exemplo, tem variaes irregulares exigindo, portanto, intervalos no uniformes
de amostragem. J as imagens, que so sinais de comprimento nito, requerem tratamento
especial para reduzir efeito de bloco. Neste caso, extenses simtricas combinam com ltros
tambm simtricos.
Isto posto, pode-se novamente identicar a questo central em compresso de sinais:
representar sinais tpicos com o menor nmero de funes convenientes, obtendo-se a menor
taxa de informao possvel para uma dada qualidade ou obtendo-se a mxima qualidade
para uma dada taxa. Bases tradicionais, como Bessel, Legendre e Fourier, decorrem de
equaes diferenciais. J as wavelet no. Uma razo evidente que essas equaes no
incluem dilataes.
importante observar que, na maioria das aplicaes, o sinal a ser transformado
ilimitado ou, pelo menos, excede o tamanho da transformada. Como conseqncia, a
informao dever ser processada em blocos e a escolha pela utilizao de transformadas
nitas implica no processo de diviso em blocos, como j mencionado na seo anterior.
Sinais bidimensionais como, por exemplo, imagens, so usualmente particionados em blocos
quadrados com m m amostras cada. Assim, as transformadas bidimensionais de bloco
17
representam cada bloco da imagem como uma combinao de blocos prottipos, s
q
1
,q
2
(n).
Nesse processo, como cada um dos blocos transformado independentemente, de se esperar
que efeitos de bloco possam ser observados na imagem reconstruda.
Apenas para motivar o entendimento da observao feita ser mostrado um exemplo.
Dividindo-se uma imagem em blocos de 2 2 pixels, cada um dos blocos pode ser
representado pela mdia das amostras que o compe e as diferenas entre as trs outras
amostras originais do bloco e a mdia, isto :
_

_
1
4

i,j0,1
x(m+ i, n + j), para m,n pares
x(m, n) y(2
_
m
2
_
, 2
_
n
2
_
) , para os demais casos
(2.19)
Esta transformao ilustrada na Figura 2.8
}
}
mdia
-
+
+
+
-
-
Imagem,x
Transformadas,y
Figura 2.8: Exemplo de transformao simples, considerando a mdia das amostras de um
bloco
Neste caso, as amostras transformadas y(k
1
, k
2
) com m ou n mpares contm detalhes
de alta resoluo que, dependenedo da acuidade do observador, podem ser descartados.
Assim, esta transformao to simples j capaz de expor potenciais formas de irrelevncia
na imagem. Como a maioria das imagens possuem substanciais regies suaves, espera-se que
grande quantidade das amostras de detalhe, y(k
1
, k
2
) com m ou n mpares, tenham valores
muito pequenos, seno zero. Como conseqncia, o ndice de quantizao correspondente
ao valor zero tambm ocorrer com alta probabilidade, devendo-se atribuir cdigos simples
capazes de explorar pelo menos parte desta redundncia.
Uma questo chave do padro JPEG2000 [7], por exemplo, a sua escalabilidade. Um
bit-stream escalonvel aquele que pode ser parcialmente descartado para se obter uma
representao eciente da imagem original ou uma verso com resoluo mais baixa da
imagem em taxas diferentes. Para que um sistema como esse possa ser eciente, necessria
uma separao adequada das informaes relevantes e irrelevantes de tal sorte que, quanto
18
maior a necessidade em se descartar amostras, formando um bit-stream cada vez menor,
deve-se ir descartando as informaes em ordem decrescente de irrelevncia. Portanto,
provendo uma representao escalonvel da imagem de interesse.
2.5 Modelagem
Nesse trabalho, apenas sero consideradas transformaes nitas e lineares, isto ,
transformaes que mapeiam um vetor de entrada n-dimensional x em um sinal de sada
m-dimensional y, de acordo com:
y = Ax, x =
_

_
x
0
x
1
.
.
.
x
n1
_

_
y =
_

_
y
0
y
1
.
.
.
y
m1
_

_
, (2.20)
em que A uma matriz m n com coecientes reais ou complexos. Um exemplo de
tranformada complexa muito conhecido a Transformada Discreta de Fourier (DFT - do
ingls, Discrete Fourier Transform). De outra maneira, dada a modelagem de operao
de transformada, tambm possvel entender essa operao como um sistema MIMO (do
ingls, Multi-Input Multi-Output).
Restringiremos o escopo s matrizes de transformao inversveis, tal que:
x = Sy
em que S
nm
a inversa generalizada da matriz A, isto , SA = I, a matriz identidade de
ordem n n. Logo, S no necessariamente nica. No entanto, nos concentraremos em
transformaes no-expansivas, em que m = n. Nesse caso, S se torna nica. Observe que
os coecientes transformados podem sem expressos da seguinte maneira:
y
q
= a
q
x, q = 0, 1, . . . , m1 (2.21)
em que a
q
a q-sima linha da matriz mm A. Diz-se que a
q
o q-simo vetor de anlise,
j que esse analisa o vetor original x para compor o q-simo coeciente transformado. Por
extenso, chama-se A de matriz de anlise. A transformada inversa tambm pode ser
expressa por:
m1

q=0
y
q
s
q
(2.22)
19
em que s
q
a q-sima linha da matriz m n S. Diz-se que s
q
o q-simo vetor de
sntese, dado que x sintetizado por uma combinao linear de s
q
, tendo como pesos
os coecientes transformados. Por extenso, chama-se S de matriz de sntese. Tambm
comum se referir a cada s
q
como vetor da base de sntese porque, necessariamente, o
conjunto desses forma uma base do espao linear de todos os possveis vetores de entrada.
Em resumo, os vetores de anlise e de sntese so as colunas das matrizes de anlise (A) e
de sntese (S), respectivamente. Os vetores de sntese formam uma base de prottipos do
sinal e a transformada decompe sua entrada em uma combinao linear desses prottipos.
Daremos ento um exemplo simples e prtico. A DFT, j mencionada, denida pelas
seguintes equaes:
y
q
=
1

m
m1

p=0
x
p
e
j
2
m
pq
, 0 q < m
x
p
=
1

m
m1

q=0
y
q
e
j
2
m
pq
, 0 p < m
Nesse caso, os vetores de anlise e de sntese so iguais, os elemntos a
q
= s
q
so amostras
do espao unitrio das senides com freqncia f
q
=
q
m
. Em outras palavras, a DFT
decompe o vetor de entrada em uma combinao linear de exponenciais complexas, com
freqncias uniformemente espaadas.
2.5.1 Transformadas separveis
Da perspectiva de banco de ltros, existem dois modos de se chegar construo de
transformadas bidimensionais: mtodo separvel e o no separvel. O jeito mais natural
de se construir uma transformada bidimensional A fazendo-se uma extenso separvel
de uma transformada unidimensional A

.Cada vetor de anlise a


q
1
,q
2
de uma transformda
separvel pode ser obtido pelo produto tensorial dos vetores unidimensionais de anlise a

q
1
e a

q
2
. De maneira similar, tambm poderiam ser obtidos os vetores de sntese. A vantagem
mais evidente das transformadas separveis que podem ser implentadas aplicando-se
primeiramente a transformao unidimensional s linhas e, em seguida, s colunas ou vice-
versa. Esse procedimento ilustrado na Figura 2.9. Alm disso, transformadas separveis
envolvem reduo substancial na complexidade. De uma maneira simples, para se obter
cada coeciente de uma transformada no-separvel seriam necessrias m
2
multiplicaes e
adies. Diferentemente, quando a implementao for separvel, apenas seriam necessrias
2m multiplicaes e adies.
Pode-se ento representar matricialmente uma transformada bidimensional separvel,
de forma anloga equao 2.20:
20
y = A

xA

T
(2.23)
x
p1p2
y
p1q2
y
q1q2
Figura 2.9: Implementao separvel de uma transformao bidimensional, aplicada
unidimensionalmente s linhas e, em seguida, s colunas
No entanto, deve-se notar que transformadas separveis tm a tendncia a priorizar o
aproveitamento de direes horizontais, verticais e diagonais. No caso da decomposio
bidimensional separvel por wavelets, um arranjo tradicional das sub-bandas , inclusive, o
que evidencia a sub-banda de mais baixa frequncia, que considerada uma aproximao
(A) da imagem original, ao lado das sub-bandas que representam os detalhes verticais (V),
horizontais (H) e diagonais (D), como ilustrado na Figura 2.10. Nessa gura, tambm
feita a correspondncia do tipo de detalhe evidenciado para cada sequncia de ltragens
passa-baixa, passa-alta realizada. Por exemplo, considerando-se que essa transformao
tenha sido realizada primeiramente ao longo das linhas e depois ao longo das colunas de
uma imagem, a sequncia de ltragem LH (L, do ingls, Low-Pass; e H, do ingls High-
pass), seria responsvel por privilegiar o aparecimento de detalhes verticais, visto que as
alta frequncias das colunas foram preservadas. De maneira anloga, pode-se relacionar as
demais sub-bandas.
Uma soluo alternativa a de se utilizar bancos de ltros no separveis, cujo exemplo
bastante conhecido o banco de ltros quincunx [8][9]. Nesse contexto multidimensional,
o termo no separvel pode se referir tanto aos ltros, quanto ao tipo de amostragem dos
dados.
Cada um desses mtodos apresenta vantagens e tambm desvantagens. Enquanto
os ltros separveis oferecem baixa complexidade de processamento, os no separveis
apresentam maiores graus de liberdade e, portanto, projetos melhores. Desde j torna-
se importante destacar que a transformada direcional implementada nesse trabalho possui
natureza no separvel. Esse assunto ser retomado no Captulo 4.
21
LL LH
HL HH
A V
H D
(a) (b)
Figura 2.10: (a) das sub-bandas de uma tranformada wavelet bidimensional: LL -
simbolizando duas ltragens passa-baixa (do ingls, Low-pass); LH - simbolizando uma
ltegem passa-baixa (do ingls, Low-pass), seguida de uma ltragem passa-alta (do ingls,
High-pass); HL - simbolizando uma ltragem passa-alta (do ingls, High-pass), seguida
de uma ltragem passa-baixa (do ingls, Low-pass); HH - simbolizando duas ltragens
passa-alta (do ingls, High-pass).(b) Organizao evidenciando os detalhes destacados em
cada sub-banda:A - aproximao; V - detalhe vertical; H - detalhe horizontal; D - detalhe
diagonal.
.
22
Captulo 3
Bancos de Filtros
3.1 Banco de ltros e reconstruo perfeita
Um banco de ltros nada mais do que um arranjo de ltros, e estudar esses sistemas
como um todo signica se importar, fundalmentalmente, com duas questes: reconstruo
sem aliasing,[10],[11],[12] e reconstruo perfeita. Esse sistema utilizado para separar um
sinal de entrada em vrios componentes, cada um contendo uma faixa de frequncia do
sinal original. igualmente desejado que o projeto desse banco permita que o sinal original
possa ser reconstrudo a partir de seus componentes passa-faixa. O primeiro processo
chamado anlise, enquanto o segundo chamado sntese [10].
Do ponto de vista sistmico, um banco de ltros digital com M canais pode ser entendido
como um arranjo de M ltros digitais com uma entrada em comum, o que corresponde ao
processo de anlise, ou com uma sada em comum, o que corresponde ao processo de sntese.
Ambos os casos so ilustrados na Figura 3.1. Assim, o nmero de bandas (canais ou faixas)
de um banco de ltros nada mais do que a quantidade de ltros que compe cada banco.
O sistema da Figura 3.1 (a) chamado banco de ltros de anlise, e os ltros H
k
(z) so
os ltros de anlise. Esse sistema separa o sinal de entrada x(n) em M sinais passa-faixa
x
k
(n). J o sistema da Figura 3.1 (b) chamado banco de ltros de sntese, e os ltros
F
k
(z) so os ltros de sntese. Esse outro sistema ento combina os M sinais passa-faixa
em um sinal x(n), que , em princpio, uma aproximao do sinal de entrada x(n).
O intervalo que separa o bancos de ltro de anlise do de sntese indica a possibilidade
de os sinais passa-faixa serem codicados ou transmitidos at que sejam sintetizados. Nesse
ponto, ressalta-se a existncia de fonte de erro na reconstruo, que afeta codicao
e quantizao dos sinais subamostrados. Os sinais de sada do banco de anlise podem
ser codicados por vrias tcnicas de compresso e em seguida podero ser transmitidos.
Fundamentalmente, no processo de compresso os sinais sero quantizados, inserindo
23
H (z)
0
H (z)
1
H (z)
M-1
(a)
F (z)
0
F (z)
1
F (z)
M-1
(b)
Figura 3.1: Banco de Filtros Digitais: (a) banco de anlise; (b) banco de sntese.
uma distoro no linear no sistema. Dessa maneira, no receptor sero reconstrudas
aproximaes desses sinais. O erro de decodicao, obtido pela diferena entre os sinais
transmitidos e os reconstrudos, chamado erro de quantizao de subbandas. Como
o assunto compresso com perdas j foi abordado no Captulo 2, toda discusso sobre
reconstruo perfeita abranger apenas condies sobre os ltros componentes dos bancos,
isto , assumiremos que o intervalo no existe e que, portanto, no existem perdas associadas
compresso na conexo entre os bancos de anlise e de sntese.
Uma maneira simples de se denir um banco de ltros consiste em discriminar seus
componentes, isto , um banco de ltros um conjunto de ltros, unidos por operadores de
amostragem e, s vezes, tambm por operadores que geram atrasos. A Figura 3.2 mostra a
congurao de um banco de ltros com M bandas.
M M
H (z)
0
F (z)
0
M M
H (z)
1
F (z)
1
M M
H (z)
M-1
F (z)
M-1
) (
0
n v ) (
0
n u ) (
0
n x
) (
1
n x ) (
1
n v ) (
1
n u
) (
1
n u
M-
) (
1
n v
M-
) (
1
n x
M-
) (n x
) (
^
n x
Figura 3.2: Banco de Filtros com M faixas criticamente decimado.
Os operadores de amostragem so responsveis por alterar a taxa de amostragem por um
fator inteiro e, portanto, o nmero de amostras do sinal de entrada. Logo, esses operadores
24
podem subamostrar o sinal, descartando parte de suas amostras e, portanto, reduzindo
a taxa de amostragem, quando sero chamados decimadores ou dizimadores (processo
conhecido em ingls como downsampling); ou podero sobreamostrar o sinal, inserindo
novas amostras e, portanto, aumentando a taxa de amostragem, quando sero chamados
expansores ou sobreamostradores (processo conhecido em ingls como upsampling). A
Figura 3.3 mostra os smbolos para essas operaes, bem como a relao entre os sinais
de entrada e de sada. Desde j, pode ser evidenciada a importncia desses operadores.
Observando-se o arranjo da Figura 3.1 nota-se que cada um dos sinais passa-faixa x
k
ter, no mnimo, o mesmo nmero de amostras do sinal original, j que a operao de
ltragem uma operao de convoluo no domnio temporal. Logo, caso no existissem
operadores para descartar amostras, na sada do banco de anlise teriam-se M vezes a
quantidade de amostras do sinal original. Como esses sinais passa-faixa, em regra, sero
armazenados ou transmitidos, essa expanso notadamente indesejvel, visto que mdias
com maior capacidade e que maiores faixas de transmisso implicam em custos mais altos.
Se assumirmos que os ltros so ideais e que cada sinal passa-faixa tem, portanto, largura
de banda de /M rads, cada um desses sinais pode ser subamostrado de M : 1 sem perda
de informao. Esse o princpio dos bancos de ltros criticamente decimados [10],[13],
[14].
M
M
) (m y ) (n x
) (m y ) (n x
) (mM x =
M
Figura 3.3: Operaes bsicas para a converso da taxa de amostragem. O sobreamostrador
ou expansor (a) insere M 1 amostras nulas entre cada par de amostras originais,
aumentando a taxa de amostragem por um fator M. O decimador (b) retm uma a cada
M amostras do sinal original, reduzindo a taxa de amostragem por um fator M.
Inicialmente, pode-se ento fazer o nmero de faixas do banco de ltros da Figura 3.1
igual a 2, M = 2, simplicando-se a estrutura geral e obtendo-se a Figura 3.4.
Nessa estrutura, popularmente chamada banco de ltros espelhados em quadratura
(QMF, do ingls Quadrature Mirror Filters)[15], o sinal de entrada x(n) ltrado por
dois ltros H
0
e H
1
, que so tipicamente ltros passa-baixa e passa-alta, como mostrado
na parte (b) da Figura 3.4. Alm disso, o ltro de anlise passa-alta projetado de forma
a reverter os sinais de resposta ao impulso:
H
1
(z) = H
0
(z). (3.1)
25
2 2
H (z)
0
F (z)
0
2 2
H (z)
1
F (z)
1
Banco
de
Anlise
Banco
de
Sntese
Decimador Expansor
) (
0
n y
) (
1
n y
(a)
H (z)
0
H (z)
1
p w
2
p
(b)
Figura 3.4: (a) Banco de Filtros Espelhados em Quadratura;(b) repostas tpicas de
magnitude.
Aps o sinal digital de entrada ter sido decomposto em duas faixas de frequncia, os
sinais em cada faixa x
k
(n), para k = 0, 1, sero ento subamostrados por um fator de 2
para produzir os sinais v
k
(n).
Cada sinal decimado v
k
(n) ser ento codicado de maneira que possam ser aproveitadas
caractersticas especiais desses sinais, como, por exemplo, nvel de energia ou, at mesmo,
a sensibilidade do receptor. No receptor nal, os sinais recebidos sero decodicados,
produzindo aproximaes dos sinais v
0
(n) e v
1
(n), que sero expandidos ou superamostrados
por um fator de 2. Os sinais resultantes y
0
(n) e y
1
(n) sero ltrados por F
0
(z) e F
1
(z) para
dar origem ao sinal de sada x(n).
Os ltros H
0
e H
1
indicados no incio da estrutura so chamados ltros de anlise, e o par
[H
0
H
1
] conhecido como banco de ltros de anlise. Esse par, seguido dos subamostradores
(2) forma o chamado banco de ltros de anlise decimado. De forma anloga, os ltros
F
0
e F
1
so os ltros de sntese ou de reconstruo, e o par [F
0
F
1
] o banco de ltros de
sntese. importante notar que o sinal reconstrudo x(n) difere do sinal original x(n) por
trs principais motivos: aliasing, distoro de amplitude e distoro de fase. No entanto,
essa seo tem por nalidade esclarecer que ainda assim possvel se obter reconstruo
perfeita, desde que o banco de reconstruo seja projetado para anular os erros inseridos
26
pelo banco de anlise. Note-se que para o caso de um banco de ltros de M faixas as
condies de projeto para reconstruo perfeita so bem mais complicadas. Uma tcnica
para o projeto de sistemas de M faixas com reconstruo perfeita foi desenvolvida [16], [17],
baseada na propriedade paraunitria de matrizes polifsicas.
3.2 Anlise dos erros gerados em um banco QMF
Nessa seo, sero melhor analisadas as trs principais fontes de erros gerados em bancos
de ltros QMF: aliasing e imaging, distores de amplitude e de fase.
3.2.1 Erros de aliasing e de imaging
A Figura 3.4 mostra um esboo da resposta em frequncia dos ltros de anlise. Como
apenas ltros factveis sero considerados, logo, no-ideais, v-se que a resposta dos ltros
se sobrepem pois existe uma faixa de transio e um pequeno ganho na faixa de rejeio.
Assim, os sinais x
k
(n) no sero limitados em cada uma das bandas e a operao de
decimao gerar aliasing. Para que esse efeito seja melhor entendido, considere a Figura
3.5, que ilustra duas situaes interessantes.
Na Figura 3.5 (a), as respostas |H
1
(e
j
)| e |H
0
(e
j
)| no se sobrepem. Assumindo que
a atenuao da banda rejeio de cada um dos ltros seja sucientemente grande, o efeito
de aliasing no ser to srio. No entanto, na Figura 3.5 (b) as respostas dos dois ltros se
sobrepem e cada um dos ltros tem energia suciente na faixa de frequncia que excede
ideal. Nesse caso, a decimao dos sinais causar aliasing independentemente de quo
atenuadas sejam as faixas de rejeio dos ltros. Em princpio, a escolha sem superposio
da Figura 3.5(a) evitaria o aliasing. No entanto, respostas no sobrepostas implicariam em
uma forte atenuao do sinal de entrada em torno de =

2
. Pode-se ento pensar que
pr-amplicar os componentes do sinal de entrada nessa faixa de frequncia compensaria a
excessiva atenuao. Porm, isso tambm amplicaria rudos (como o rudo de codicao
ou o rudo de canal), o que seria indesejvel. Uma outra soluo seria tornar cada um dos
ltros com a mnima faixa de transio possvel, porm isso tornaria o sltros excessivamente
grandes. A resposta sobreposta apresenta-se, ento, como a soluo mais prtica, mesmo
que cause aliasing, visto que esse efeito ainda pode ser anulado por um projeto adequado
dos ltros de sntese, como ser mostrado.
27
H (z)
0
H (z)
1
p w
2
p
(a)
H (z)
0
H (z)
1
p w
2
p
(b)
Figura 3.5: Duas possveis repostas em magnitude para os ltros de anlise: (a)sem
sobreposio, e (b)com sobreposio.
Expresso matemtica do sinal reconstrudo
Usando resultados conhecidos da rea de anlise de sistemas multitaxa, se chegar a
uma expresso para descrever o sinal reconstrudo x(n). A partir da Figura 3.4 (a), tem-se:
X
k
(z) = H
k
(z)X(z), k = 0, 1 (3.2)
A transformada z dos sinais decimados v
k
(n) pode ser escrita em funo de X
k
(z):
V
k
(z) =
1
2
[X
k
(z
1
2
) + X
k
(z
1
2
)], k = 0, 1 (3.3)
O segundo termo da equao acima representa o efeito de aliasing, que se deseja eliminar.
A transformada z do Y
k
(z) V
k
(z
2
), ento:
Y
k
(z) = V
k
(z
2
) =
1
2
[X
k
(z) + X
k
(z)], k = 0, 1 (3.4)
O sinal reconstrudo

X(z) :
28

X(z) = F
0
(z)Y
0
(z) +F
1
(z)Y
1
(z). (3.5)
Substituindo (3.4) em (3.5) e rearranjando os termos, vem:

X(z) =
1
2
[H
0
(z)F
0
(z) + H
1
(z)F
1
(z)]X(z) +
1
2
[H
0
(z)F
0
(z) + H
1
(z)F
1
(z)]X(z). (3.6)
Em notao matricial:
2

X(z) =
_
X(z) X(z)
_
_
H
0
(z) H
1
(z)
H
0
(z) H
1
(z)
_
. .
H(z)
_
F
0
(z)
F
1
(z)
_
. (3.7)
A matriz H(z) chamada matriz de componentes de aliasing. O termo que contm
X(z) originado pelos decimadores. Sobre o crculo unitrio, X(z) = X(e
j()
), que
representa um deslocamento do espectro de para a direita. Esse termo representa tanto
o efeito de aliasing, provocado pelos decimadores, quanto o efeito de imaging, provocado
pelos sobreamostradores.
Cancelamento de aliasing
A partir da equao 3.6, pode-se perceber que possvel cancelar o efeito de aliasing
projetando-se adequadamente os ltros de sntese F
0
(z) e F
1
(z) para que H
0
(z)F
0
(z) +
H
1
(z)F
1
(z) seja zero. Ento, pode-se ver que a seguinte escolha adequada ao
cancelamento:
F
0
(z) = H
1
(z), F
1
(z) = H
0
(z) (3.8)
Logo, dados H
0
e H
1
completamente possvel anular-se o efeito de aliasing escolhendo-
se os ltros de sntese como em (3.8). Assim, ainda que os ltros de anlise tenham grandes
faixas de transio e baixa atenuao nas faixas de rejeio, o que provoca grande efeito de
aliasing, esses erros sero cancelados pela escolha adequada dos ltros de sntese.
A idia bsica do projeto de banco de ltros QMF a de permitir a gerao do efeito de
aliasing no banco de ltros de anlise ao invs de tentar evit-lo. Segue-se ento o projeto
do banco de ltros de sntese para que o componente de aliasing do canal passa-baixa de
anlise seja cancelado pelo canal passa-alta de sntese e vice-versa.
29
3.2.2 Distoro de amplitude e de fase
Inicialmente ser feita uma breve discusso sobre os conceitos de distoro de amplitude
e de fase baseada na teoria de sistemas lineares.
A distoro de amplitude ocorre quando a reposta em mdulo do sistema no constante
dentro das faixas de frequncia de interesse. Nesse caso, os diferentes componentes em
frequncia do sinal de entrada recebero diferentes valores de ganho ou de atenuao. J
a distoro de fase caracterizada por provocar retardos diferentes aos componentes de
frequncia, dado que a reposta em fase do sistema no linear. Como consequncia, o sinal
de sada ter uma forma de onda diferente da do sinal de entrada.
Da teoria de sistemas multitaxa, sabe-se que os operadores de subamostragem e de
sobreamostragem so lineares, mas variantes ao deslocamento [10]. Desta maneira, em
princpio, um banco de ltros tambm um sistema linear variante ao deslocamento. Alm
disso, j foi visto que esses operadores tambm so responsveis por gerar efeitos de aliasing
e de imaging. No entanto, se considerarmos que o banco de ltros QMF foi projetado de
maneira a se obter o cancelamento do efeito de aliasing, o sistema globalmente deixar de
ser variante ao deslocamento. Dessa maneira, o sistema passar a ser representado por uma
funo de transferncia T(z), tal que:

X(z) = T(z)X(z). (3.9)


Assim, ainda que o sistema esteja livre do efeito de aliasing, o sinal x(n) sofrer de
distoro linear e invariante a deslocamento T(z). No caso do banco de ltros QMF, tem-
se:
T(z) =
1
2
[H
0
(z)F
0
(z) + H
1
(z)F
1
(z)]. (3.10)
Substituindo-se 3.8 em 3.11, tem-se:
T(z) =
1
2
[H
0
(z)H
1
(z) H
1
(z)H
0
(z)]. (3.11)
Avaliando-se T(z) sobre o crculo unitrio, T(e
j
) = |T(e
j
)|e
j()
, tem-se:

X(e
j
) = |T(e
j
)|e
j()
X(e
j
). (3.12)
Os conceitos apresentados no incio da seo podem ento ser aplicados ao sistema com
a funo de transferncia acima. Assim, a menos que T(z) seja um ltro passa-tudo, isto
, |T(e
j
)| = d = 0 para todo , diz-se que

X(e
j
) apresentar distoro de amplitude.
Analogamente, a no ser que T(z) tenha fase linear, isto , () = a + b para a e b
constantes,

X(e
j
) tambm apresentar distoro de fase.
30
3.2.3 Um sistema QMF simples com cancelamento de alias
Em um dos mais antigos bancos de ltros QMF os ltros de anlise se relacionam da
seguinte maneira:
H
1
(z) = H
0
(z). (3.13)
Com a restrio de projeto 3.8 para se obter o cancelamento de alias, e com a escolha
3.13, os outros ltros sero assim determinados:
F
0
(z) = H
0
(z), F
1
(z) = H
1
(z) = H
0
(z). (3.14)
Nota-se que, nesse caso, os quatro ltros sero determinados pela escolha de um nico
ltro H
0
(z). Com os ltros escolhidos da maneira descrita, obtm-se a seguinte funo de
distoro:
T(z) =
1
2
(H
2
0
(z) H
2
1
(z)) =
1
2
(H
2
0
(z) H
2
0
(z)). (3.15)
3.2.4 Representao Polifsica
Normalmente conveniente, conceitual e computacionalmente, representar os bancos de
anlise e de sntese em funo de suas componentes polifsicas. Para que se possa entender a
idia bsica dessa representao, considere um ltro H(z) =

n=
h(n)z
n
. Separando-se
os coecientes pares dos mpares, vem:
H(z) =

n=
h(2n)z
2n
+ z
1

n=
h(2n + 1)z
2n
. (3.16)
Pode-se denir:
E
0
(z) =

n=
h(2n)z
n
, E
1
(z) =

n=
h(2n + 1)z
n
. (3.17)
Pode-se, ento, reescrever o ltro em funo de suas componentes polifsicas E
0
e E
1
:
H(z) = E
0
(z
2
) + z
1
E
1
(z
2
). (3.18)
Considere, como exemplo, um banco com os seguintes ltros de anlise: H
0
(z) = h
0
+
h
1
z
1
+h
2
z
2
+h
3
z
3
e H
1
(z) = h
3
z
2
+h
2
z
1
h
1
+h
0
z
1
. Cada um desses ltros poderia
31
ento ser decomposto em suas polifsicas. Primeiramente, pode-se decompor H
0
:
E
00
(z
2
) = h
0
+ h
2
z
2
, E
01
(z
2
) = h
1
+ h
3
z
2
. (3.19)
Em seguida, H
1
ser decomposto:
E
10
(z
2
) = h
3
z
2
h
1
, E
11
(z
2
) = h
2
z
2
+h
0
. (3.20)
Por m, os componentes polifsicos dos ltros de anlise comporo a matriz que mais
tarde ser chamada de matriz polifsica de anlise:
E(z) =
_
E
00
(z) E
01
(z)
E
10
(z) E
11
(z)
_
=
_
h
0
+ h
2
z
1
h
1
+h
3
z
1
h
3
z
1
h
1
h
2
z
1
+ h
0
_
. (3.21)
Observa-se que, ao serem considerados os dois ltros do banco de anlise, inseriu-se
no subscrito do identicador da componente polifsica o nmero correspondente ao ltro
decomposto. Dessa maneira, o elemento E
00
indica a polifsica E
0
do ltro H
0
, enquanto
E
10
indica a mesma polifsica E
0
, porm do ltro H
1
.
Desde j, pode-se ento estender o conceito de decomposio em polifsicas a um banco
de ltros com M faixas, que ser amplamente discutido na seo 3.3:
H(z) =

n=
h(nM)z
nM
+z
1

n=
h(nM + 1)z
nM
(3.22)
.
.
.
+z
(M1)

n=
h(nM +M 1)z
nM
.
De maneira mais compacta:
H(z) =
M1

l=0
z
l
E
l
(z
M
), (3.23)
em que:
E
l
(z) =

n=
e
l
(n)z
n
, (3.24)
com:
32
e
l
(n) h(Mn + l), 0 l (M 1). (3.25)
Aps a breve discusso sobre a representao polifsica de um ltro, aplicaremos ento
essa decomposio aos ltros de anlise de um banco QMF. Assim, comearemos pelo ltro
passa-baixa de anlise:
H
0
(z) = E
0
(z
2
) + z
1
E
1
(z
2
). (3.26)
Dado que H
1
(z) = H
0
(z), tem-se H
1
(z) = E
0
(z
2
) z
1
E
1
(z
2
). Logo:
_
H
0
(z)
H
1
(z)
_
=
_
1 1
1 1
__
E
0
(z
2
)
z
1
E
1
(z
2
)
_
. (3.27)
3.2.5 Limitaes impostas pela restrio H
1
(z) = H
0
(z), em um
banco QMF
Relacionando-se os ltros de anlise de forma que H
1
(z) = H
0
(z), e escolhendo-se
os ltros de sntese para que haja o cancelamento de aliasing, conforme 3.8, a funo
de distoro tem a forma 3.15. Pode-se ento reescrever essa funo em termos das
componentes polifsicas de cada ltro:
T(z) = 2z
1
E
0
(z
2
)E
1
(z
2
). (3.28)
Desta maneira, se o ltro H
0
for FIR, ento E
0
(z) e E
1
(z) tambm sero e,
consequentemente, T(z) tambm ser. Logo, nota-se que somente ser possvel eliminar
a distoro de amplitude se cada uma das funes FIR E
0
(z) e E
1
(z) forem atrasos puros,
isto , E
0
(z) = c
0
z
n
0
e E
1
(z) = c
1
z
n
1
. Isso signica que os ltros sero expressos por:
H
0
(z) = c
0
z
2n
0
+ c
1
z
2n
1
+1
, H
1
(z) = c
0
z
2n
0
c
1
z
2n
1
+1
. (3.29)
Em resumo, no caso QMF, em que os ltros de anlise se relacionam como H
1
(z) =
H
0
(z), e quando H
0
(z) um ltro FIR, a distoro de amplitude somente ser eliminada
se os ltros forem simples atrasadores. Como consequncia, v-se que esses ltros no
podero regio de corte abrupta, nem grandes atenuaes na faixa de rejeio, condies
caractersticas de ltros ideais. No entanto, como j discutido, ainda assim possvel se
obter reconstruo perfeita com a restrio H
1
(z) = H
0
(z).
33
3.3 Bancos de ltros com M faixas
Nas sees anteriores, ao se estudar o banco QMF de duas faixas, foi considerado o caso
especco em que os ltros se relacionam como H
1
(z) = H
0
(z). Torna-se importante
analisar o caso mais geral, em que, a priori, nenhuma restrio imposta, para que
possam ser feitas consideraes a respeito de condies para cancelamento de aliasing e para
reconstruo perfeita. Para tal estudo, ser considerado o banco de ltros com M faixas
criticamente decimado, ilustrado na Figura 3.2, repetida na Figura 3.6 por convenincia.
M M
H (z)
0
F (z)
0
M M
H (z)
1
F (z)
1
M M
H (z)
M-1
F (z)
M-1
) (
0
n v ) (
0
n u ) (
0
n x
) (
1
n x ) (
1
n v ) (
1
n u
) (
1
n u
M-
) (
1
n v
M-
) (
1
n x
M-
) (n x
) (
^
n x
Figura 3.6: Banco de Filtros com M faixas criticamente decimado
Na Figura 3.6, o sinal x(n) separando em M sinais passa-faixa pelos M ltros de
anlise H
k
(z). Cada um dos sinais x
k
(n) ento decimado para se obter os sinais v
k
(n).
Os sinais v
k
(n) nalmente sero passados pelos expansores, constituindo os sinais u
k
(n), e
recombinados pelos ltros F
k
(z) para originar o sinal reconstrudo x(n).
O objetivo dessa seo generalizar as importantes propriedades anteriormente discu-
tidas para um banco QMF com M = 2, sobretudo s relacionadas ao cancelamento de
aliasing e reconstruo perfeita. Para tal, ser conveniente denir os seguintes vetores:
h(z) =
_

_
H
0
(z)
H
1
(z)
.
.
.
H
M1
_

_
. .
Banco de Anlise
, f (z) =
_

_
F
0
(z)
F
1
(z)
.
.
.
F
M1
_

_
. .
Banco de Sntese transposto
, e(z) =
_

_
1
z
1
.
.
.
z
M1
_

_
. .
Cadeia de atrasos
,
(3.30)
Note que o banco de anlise um sistema com uma nica entrada e M sadas,
representado pela matriz de transferncia h(z); j o banco de sntese um sistema com
M entradas e uma nica sada, representado pela matriz de transferncia f
T
(z). O vetor
denominado cadeia de atrasos ser utilizado nas representaes polifsicas, assunto discutido
no tpico correspondente da seo anterior.
34
3.3.1 Expresso matemtica do sinal reconstrudo - M faixas
Primeiramente, o sinal reconstrudo x(n) ser escrito em termos de x(n), ignorando-se
a presena de erros de codicao e de quantizao. Dessa maneira, cada sinal passa-faixa,
resultante da ltragem do sinal de entrada pelo respectivo ltro de anlise, obtido por:
X
k
(z) = H
k
(z)X(z). (3.31)
Ento, utilizando-se propriedade conhecida em sistemas multitaxa, os sinais decimados
tero a seguinte transformada z:
V
k
(z) =
1
M
M1

l=0
H
k
(z
1/M
W
l
)X(z
1/M
W
l
), (3.32)
em que W = W
M
= e
j2/M
. A sada dos expansores ser dada por:
U
k
(z) = V
k
(z
M
) =
1
M
M1

l=0
H
k
(zW
l
)X(zW
l
). (3.33)
Assim, o sinal reconstrudo ser:

X(z) =
M1

k=0
F
k
(z)U
k
(z) =
1
M
M1

l=0
X(zW
l
)
M1

k=0
H
k
(zW
l
)F
k
(z). (3.34)
Essa equao pode ser reescrita de maneira mais conveniente:

X(z) =
M1

l=0
A
l
(z), (3.35)
em que
A
l
(z) =
1
M
M1

k=0
H
k
(zW
l
)F
k
(z), 0 l M 1. (3.36)
Para z = e
j
, X(zW
l
) pode ser escrito como:
X(e
j
W
l
) = X(e
j(
2l
M
)
). (3.37)
A partir da equao acima, para l = 0, v-se que X(e
j
W
l
) representa uma verso
deslocada de X(e
j
). Portanto, considerando a informao em (3.34), pode-se dizer que o
espectro do sinal reconstrudo

X(e
j
) uma combinao linear de X(e
j
) e suas M 1
verses uniformemente deslocadas.
35
3.3.2 Representao Polifsica - M Faixas
Na seo 3.2.4 foi introduzido o conceito de representao polifsica, muito til tanto
para estudos tericos quanto para implementao prtica. Nessa mesma seo, foi visto que
qualquer funo de transferncia H
k
(z) pode ser expressa em funo de suas componentes
polifsicas como:
H
k
(z) =
M1

l=0
E
kl
(z
M
) (3.38)
Em notao matricial:
_

_
H
0
(z)
.
.
.
H
M1(z)
_

_
=
_

_
E
00
(z
M
) E
01
(z
M
) . . . E
0,M1
(z
M
)
.
.
.
.
.
.
.
.
.
.
.
.
E
M1,0
(z
M
) E
M1,1
(z
M
) . . . E
M1,M1
(z
M
)
_

_
_

_
1
z
1
.
.
.
z
(M1)
_

_
. (3.39)
Isto :
h(z) = E(z
M
)e(z), (3.40)
em que
E(z) =
_

_
E
00
(z) E
01
(z) . . . E
0,M1
(z)
E
10
(z) E
11
(z) . . . E
1,M1
(z)
.
.
.
.
.
.
.
.
.
.
.
.
E
M1,0
(z) E
M1,1
(z) . . . E
M1,M1
(z)
_

_
, (3.41)
e h(z) e e(z) foram denidos em 3.30. Note que a matriz montada na seo 3.2.4
pode ser obtida apenas fazendo-se M = 2 em 3.41. A Figura 3.7 ilustra a equivalncia
na representao do banco de ltros de anlise quando esses so substitudos pelas suas
polifsicas. A matriz E(z) a matriz polifsica de ordem M M do banco de anlise.
De maneira anloga, os ltros de sntese tambm podem ser expressos em suas
componentes polifsicas:
F
k
(z) =
M1

l=0
z
(M1l)
R
lk
(z
M
). (3.42)
Em notao matricial:
36
H (z)
0
H (z)
1
H (z)
M-1
E(z )
M
Z
-1
Z
-1
Z
-1

Figura 3.7: Representao polifsica de um banco de anlise com M faixas


_
F
0
(z) . . . F
M1
(z)
_
=
_
z
(M1)
z
(M2)
. . . 1
_
_

_
R
00
(z
M
) . . . R
0,M1
(z
M
)
R
10
(z
M
) . . . R
1,M1
(z
M
)
.
.
.
.
.
.
.
.
.
R
M1,0
(z
M
) . . . R
M1,M1
(z
M
)
_

_
.
(3.43)
Em termos de e(z) e do vetor f
T
(z) que representa o banco de sntese, vem:
f
T
(z) = z
(M1)
e
T
(z)R(z
M
), (3.44)
em que:
R(z) =
_

_
R
00
(z) . . . R
0,M1
(z)
R
10
(z) . . . R
1,M1
(z)
.
.
.
.
.
.
.
.
.
R
M1,0
(z) . . . R
M1,M1
(z)
_

_
. (3.45)
A matriz R(z) a matriz polifsica de ordem M M do banco de sntese. A Figura
3.8 ilustra a representao em polifsicas de um banco de sntese de M bandas.
Utilizando-se essa representao em polifsicas para os ltros de anlise e de sntese
do banco da Figura 3.6, ser obtida a representao equivalente ilustrada na Figura
3.9(a). Utilizando-se identidades nobres de sistemas multitaxa [14], pode-se redesenhar
o sistema na forma mostrada na Figura 3.9(b). Essa estrutura simplicada apresenta
vantagem, inclusive, sob o aspecto de implementao, dado que, nessa congurao, os
ltros trabalham em taxas mais baixas, pois suas entradas so sinais subamostrados. Por
m, as matrizes E(z) e R(z) podem ser combinadas em uma nica matriz P(z), obtendo-se
a representao da Figura 3.9(c), ou seja:
37

F (z)
0
F (z)
1
F (z)
M-1
R(z )
M
Z
-1
Z
-1
Z
-1
Figura 3.8: Representao polifsica de um banco de sntese com M faixas
P(z) = R(z)E(z) (3.46)
3.3.3 Reconstruo Perfeita - M Faixas
Um sistema com reconstruo perfeita , antes de tudo, um sistema que satisfaz x(n) =
cx(nn
0
). Isto , o sinal reconstrudo uma verso escalonada e atrasada do sinal original.
Isso signica que se conseguiu eliminar o efeito de aliasing e que, portanto, a funo de
transferncia T(z) caracterizada por um simples atraso. Nessa seo avaliaremos sob que
condies sistemas como o da Figura 3.9(b) podem apresentar reconstruo perfeita.
A discusso ser iniciada baseando-se em aspectos intuitivos que sero, posteriormente,
generalizados. Considerando-se o sistema ilustrado na Figura 3.9(b), pode-se notar que,
fazendo-se:
E(z)R(z) = I, (3.47)
a sada x(n) no ser modicada, garantindo a desejada caracterstica de reconstruo
perfeita. Em seguida, as matrizes podem ser rearranjadas para se obter o sistema
equivalente da Figura 3.9(a), que continuar, portanto, com reconstruo perfeita.
Agora pode-se ento pensar de uma outra maneira: suponha que sejam dados os ltros de
anlise H
k
(z), 0 k M1. Assim, a matriz E(z) j estar completamente determinada.
Assumindo-se que E(z) possa ser invertida, poder-se-ia obter um sistema com reconstruo
perfeita pela simples escolha R(z) = E
1
(z). Finalmente, os ltros de sntese seriam obtidos
pelas suas componentes polifsicas j determinadas. No entanto, surgem novas questes a
respeito da inversibilidade da matriz polinomial E(z). Felizmente, a inverso direta dessa
matriz pode ser evitada de diferentes maneiras. Uma dessas maneiras restringi-la a ser
38
E(z )
M
Z
-1
Z
-1
Z
-1
R(z )
M
Z
-1
Z
-1
Z
-1
M M
M M
M M
(a)
E(z)
Z
-1
Z
-1
Z
-1
R(z)
Z
-1
Z
-1
Z
-1
M M
M
M
M
M
(b)
P(z)
Z
-1
Z
-1
Z
-1
Z
-1
Z
-1
Z
-1
M M
M
M
M
M
(c)
Figura 3.9: Banco de Filtros Digitais: (a) Representao Polifsica de um banco de ltros
com M faixas criticamente decimado; (b) Rearranjo a partir de identidades nobres; (c)
Simplicao, em que P(z) = R(z)E(z).
39
paraunitria. Nesse caso, tem-se:

E(z)E(z) = dI, isto , E


1
(z) =

E(z)/d, para todo z, e d > 0. (3.48)
Nesse caso especial, a inversa de E(z) a sua matriz paraconjugada

E(z) [10].
A condio (3.47), suciente para que se obtenha reconstruo perfeita, pode ser
generalizada. Assim, ainda se ter reconstruo perfeita com:
E(z)R(z) = cz
m
0
I, (3.49)
para algum algum inteiro 0 r M1, qualquer inteiro m
0
, e para uma constante c = 0.
Nesse caso, ser associada uma funo de transferncia com atraso, T(z) = cz
(Mm
0
+M1)
.
Nessas condies, o sinal reconstrudo ser uma verso atrasada do sinal de entrada, isto ,
x(n) = cx(n n
0
), com n
0
= Mm
0
+ r + M 1.
Pode-se generalizar um pouco mais esses resultados observando-se que um sistema com
reconstruo perfeita nada mais que um sistema sem efeito de aliasing com funo de
transferncia T(z) = atraso, como j mencionado. Para se assegurar que o efeito de aliasing
seja eliminado, basta se impor que a matriz P(z) seja pseudocirculante. O prximo tpico
explicar esse conceito de maneira breve.
Matrizes Pseudocirculantes
Uma matriz dita circulante quando cada uma de suas linhas obtida pelo deslocamento
em uma posio de cada elemento da linha anterior, lembrando-se que o elemento mais
direita quando deslocado deve aparecer na primeira coluna da linha seguinte. Um exemplo
de matriz circulante :
_

_
P
0
(z) P
1
(z) P
2
(z)
P
2
(z) P
0
(z) P
1
(z)
P
1
(z) P
2
(z) P
0
(z)
_

_
. (3.50)
Na verdade, talvez fosse mais adequado chamar a matriz circulante de matriz circulante
direita, visto que apenas deslocamentos nessa direo so admitidos em sua conceituao.
J a matriz pseudocirculante essencialmente uma matriz circulante, com a caracterstica
adicional de que os elementos situados abaixo da diagonal principal devem ser multiplicados
por z
1
. Um simples exemplo:
40
_

_
P
0
(z) P
1
(z) P
2
(z)
z
1
P
2
(z) P
0
(z) P
1
(z)
z
1
P
1
(z) z
1
P
2
(z) P
0
(z)
_

_
. (3.51)
A partir do exposto, v-se que todos os elementos de uma matriz pseuocirculante
podem ser determinados pela sua primeira linha. Considere ento uma matriz P
MM
(z)
pseudocirculante, cuja primeira linha seja dada por:
_
P
0
(z) P1(z) . . . P
M1
(z)
_
(3.52)
Sabe-se que a condio de a matriz polifsica ser pseudocirculante necessria e
suciente para que o banco de ltros com M faixas criticamente decimado seja livre do
efeito de aliasing. Satisfazendo-se essa condio, portanto, tem-se

X(z) = T(z)X(z), e a
funo de transferncia T(z) pode ser expressa como:
T(z) = z
(M1)
(P
0
(z
M
) + z
1
P
1
(z
M
) + . . . + z
(M1)
P
M1
(z
M
)), (3.53)
em que P
m
(z) so os elementos da primeira linha da matriz P(z).
Como dito, para que um sistema tenha reconstruo perfeita, necessrio e suciente
que acumule as caracterstica de ser livre de efeito de aliasing e de ter funo de transferncia
igual a um atraso. A primeira questo j se sabe que possvel garantir fazendo-se P(z)
pseudocirculante, o que resulta na funo de transferncia de 3.53. Basta, ento, impor
condies para que essa funo de transferncia se torne apenas um atraso. Considerando-se
que j se imps a restrio de que a matriz seja pseudocirculante, apenas um atraso poder
ser obtido se P
m
(z) = 0, exceto para um nico valor de m no intervalo 0 m M 1.
Alm disso, o termo no-nulo deve ter a forma cz
m
0
. Resumindo, um sistema sem efeito de
aliasing e com reconstruo perfeita deve ter a primeira linha da matriz pseudocirculante
P(z) igual a:
_
0 . . . 0 cz
m
0
0 . . . 0
_
. (3.54)
De forma equivalente, P(z) ter a seguinte forma:
P(z) = R(z)E(z) = cz
m
0
_
0 I
Mr
z
1
I
r
0
_
, (3.55)
para algum r no intervalo 0 r M 1. Com essa ltima restrio, a funo de
transferncia da equao 3.53, se torna:
T(z) = cz
r
z
(M1)
z
m
0
M
. (3.56)
41
Nessas condies, nota-se que o sinal reconstrudo ser x(n) = cx(n n
0
), em que
n
0
= Mm
0
+r + M 1. Pode-se perceber que satisfazer a equao 3.55, equivale a:
det R(z) det E(z) = c
0
z
k
0
, (3.57)
para c
0
= 0 e para k
0
inteiro. Logo, qualquer sistema com reconstruo perfeita obedece a
essa restrio do determinante.
Bancos de ltros com reconstruo perfeita, compostos por ltros FIR H
k
(z) e F
k
(z),
so de grande interesse prtico. Nesses sistemas, as matrizes polifsicas E(z) e R(z) sero
tambm FIR, visto que seus elementos so os componentes polifsicos dos ltros. Essa
natureza FIR das matrizes implica determinantes igualmente FIR. Se o produto dessas
duas matrizes tem de ser um atraso, como evidenciado em (3.57), ento o determinante de
cada uma delas tambm assim deve ser. Logo:
det E(z) = z
K
, = 0, K = inteiro. (3.58)
R(z) tambm deve ter forma similar para que todo o sistema FIR tenha reconstruo
perfeita. Torna-se ento importante para o projeto de um banco de ltros dessa natureza
estudar que tipos de matrizes so capazes de garantir 3.58. Um tipo particular de matrizes
FIR causais chamadas paraunitrias satisfazem 3.58 com K igual ao grau de McMillan
[10] de E(z). Tambm existe uma outra famlia de matrizes chamadas unimodulares que,
por denio, satisfazem 3.58 com K = 0 . De maneira geral, foi mostrado em [18] que
qualquer matriz causal que satisfaa 3.58 pode ser decomposta em um produto de uma
matriz paraunitria e de uma matriz unimodular. Isso motivou grande estudo sobre esses
tipos especiais de matrizes, que pode ser encontrado de forma detalhada em [10].
3.4 Bancos de Filtros Multidimensionais
3.4.1 Consideraes iniciais
Enquanto muitas pesquisas a respeito de bancos de ltros unidimensionais (1-D) tm
sido feitas, bem como sobre a construo das bases a esses relacionadas, existem limitados
resultados sobre o caso multidimensional (M-D). Nesse caso, a prtica mais frequente tem
sido a de generalizar sistemas (1-D) para maiores dimenses de uma maneira separvel. Por
outro lado, vrios estudos [19][9][8] indicam que bancos de ltros no separveis interessantes
podem ser construdos em (M-D). Porm, vale lembrar que o projeto dos ltros (M-D) no
separveis muito mais complexo, como preliminarmente discutido no Captulo 2.
Recentemente, tem existido grande esforo na busca por uma verdadeira representao
42
bidimensional de imagens [20]. Um dos maiores espaos a serem preenchidos no que j foi
desenvolvido para o processamento de imagens sobre como se pode explorar a estrutura
geomtrica intrnseca a esses sinais. Dentre desenvolvimentos atuais em representaes (2-
D) multiescalonveis etso as construes ridgelet e curvelet [21], [22], e seus resultados
indicam que o aproveitamento da direcionalidade crucial para a representao eciente
de uma imagem. Isso tanto suportado por estudos mais antigos como os realizados
sobre o sistema visual humano [23], tanto por estudos mais recentes sobre identicao
de componentes esparsos em imagens naturais [24].
Na literatura sobre bancos de ltros, Bamberger e Smith ainda em 1992 [25] j tinham
desenvolvido um banco de ltros (2-D) direcional (DFB - do ingls, Directional Filter
Bank), que poderia ser criticamente decimado, permitindo reconstruo perfeita.
3.4.2 Conceitos bsicos sobre sinais multidimensionais
Um sinal D-dimensional x
a
(t
0
, t
1
, . . . , t
D1
) uma funo de D variveis reais t
0
, t
1
, . . . , t
D1
.
Pode-se, ento, denir o seguinte vetor coluna:
t =
_
t
0
, t
1
, . . . , t
D1
_
T
, (3.59)
como tambm se pode abreviar a escrita do sinal para {x
a
(t)}. O subscrito a indica que o
sinal analgico, porque as variveis t
i
foram consideradas contnuas. Analogamente, se o
sinal for discreto, pode-se denir outro vetor coluna:
n =
_
n
0
, n
1
, . . . , n
D1
_
T
. (3.60)
Nesse caso, escreve-se o sinal {x(n)} uma funo de D variveis inteiras n
k
, 0 k
D 1, ou seja, dos elementos do vetor n. A transformada de Fourier, se existir, denida
por analogia ao caso (1-D), e funo de D variveis de frequncia
k
, 0 k D 1.
Considerando-se:
=
_

0
,
1
, . . . , n
D1
_
T
, (3.61)
a transformada de Fourier denida por:
X( ) =

nN
x(n)e
j
T
n
, (3.62)
em que N denota o conjunto de todos os vetores com D componentes inteiros.
Pode-se tambm denir a transformada z do sinal {x(n)}:
43
X(z) =

nN
x(n)z
n
0
0
z
n
1
1
. . . z
n
D1
D1
, (3.63)
em que z denota o vetor:
z =
_
z
0
z
1
. . . z
D1
_
T
. (3.64)
Introduzindo a notao:
Z(n) z
n
0
0
z
n
1
1
. . . z
n
D1
D1
, (3.65)
a transformada z se torna:
X(z) =

nN
x(n)Z(n). (3.66)
Essa notao ser utilizada na denio dos expansores multidimensionais. A partir do
exposto, nota-se que, para o caso especial D = 2, a seguinte notao pode ser utilizada:
{x(n
0
, n
1
)}, para representar o sinal digital, e X
z
(z
0
, z
1
), sua transformada z.
3.4.3 Filtros Digitais Multidimensionais
Um ltro digital multidimensional um sistema linear invariante ao deslocamento
caracterizado pela seguinte funo de transferncia:
H(z) =

nN
h(n)Z(n), (3.67)
em que h(n) a resposta impulsional do ltro. Assim, a sada de um sistema com essa
resposta impulsional poder ser obtida da seguinte forma, em funo das transformadas z:
Y (z) = H(z)X(z), (3.68)
que equivale seguinte operao de convoluo:
y(n) =

kN
x(k)h(n k) =

kN
h(k)x(n k). (3.69)
importante observar que, no caso de sinais {x(n)} nitos, como uma imagem, a
operao de convoluo em (3.69) resultar em um sinal {y(n)} de tamanho maior que
o do sinal original. No entanto, vrias tcnicas para reduzir o tamanho de {y(n)} j so
conhecidas promovendo o adequado tratamento das bordas.
A resposta em frequncia H( ) do ltro dada por:
44
H( ) =

nN
h(n)e
j
T
n
. (3.70)
Essa resposta H(z) avaliada em z
k
= e
j
k
, 0 k D 1 . J no caso de ltros
separveis, (3.70) deve ser reescrita como:
H() = H
0
(e
j
0
)H
1
(e
j
1
) . . . H
D1
(e
j
D1
), (3.71)
isto , a resposta multifrequencial o produto de funes de uma nica frequncia.
A vantagem dos ltros separveis que esses podem ser facilmente obtidos a partir de
ltros unidimensionais. No entanto, tambm existem ltros no separveis que podem ser
obtidos a partir de verses 1-D por mapeamentos simples. Um exemplo um ltro com
resposta em frequncia 1 H(), que no necessariamente separvel, ainda que H()
seja.
3.4.4 Amostragem de sinais Multidimensionais
Como mencionado no Captulo 2, uma das maneiras de se obter um sistema no separvel
realizar uma amostragem no separvel, como, por exemplo, a amostragem em quincunx
[10]. Diferentemente do caso 1-D, em que existe apenas uma maneira de se amostrar o
sinal, a base terica da amostragem de sinais multidimensionais fundamentalmente mais
complicada porque existem inmeras maneiras de se denir a geometria de amostragem.
Assim, em um sistema multitaxa multidimensional, operaes de amostragem so denidas
em reticulados (do ingls, Lattice). Um reticulado L, em D dimenses representada por
uma matriz D D no-singular M como:
L(M) =
_
m : m = Mn, n Z
D
_
, (3.72)
em outras palavras, as coordenadas dos pontos pertencentes ao reticulado L(M) so
obtidas por combinaes lineares das colunas de M. Apenas para ilustrar, considere o caso
2-D. Dado um sinal dessa natureza, x
a
(t
0
, t
1
), o jeito mais imediato de se amostr-lo seria:
x(n
0
, n
1
) = x
a
(n
0
T
0
, n
1
T
1
), (3.73)
em que n
0
e n
1
so inteiros.
Os pontos amostrados podem ento ser arranjados em um padro retangular, o que
confere a esse mtodo o termo amostragem retangular. Em geral, pode-se notar que o caso
retangular representado por matrizes diagonais como:
45
M =
_
T
0
0
0 T
1
_
. (3.74)
Deve-se ressaltar, porm, a importncia em se apresentar padres mais gerais de
amostragem, visto que a amostragem retangular frequentemente no o jeito mais eciente
de se amostrar um sinal passa-faixa. Antes que se proceda generalizao, ser dado um
outro exemplo ilustrativo, dessa vez para que se possa entender como podem ser obtidas as
coordenadas dos pontos amostrados por meio dos vetores da matriz de amostragem.
Considere a sequncia gerada por:
x(n
0
, n
1
) = x
a
(n
0
n
1
, n
0
+ 2n
1
). (3.75)
Os pontos de amostragem so mostrados na Figura 3.10. Para entender melhor como
os pontos foram obtidos, basta se notar que as localizaes das amostras, composta pelas
coordenadas t
0
= n
0
n
1
e t
1
= n
0
+ 2n
1
, podem ser escritas na seguinte forma compacta:
t
_
t
0
t
1
_
=
_
1 1
1 2
_
. .
M
_
n
0
n
1
_
. (3.76)
Cada localizao t da amostra pode, ento, ser escrita na forma:
t = n
0
m
0
+ n
1
m
1
, (3.77)
em que m
0
=
_
1
1
_
e m
1
=
_
1
2
_
.
Dessa maneira, dada a matriz M, os pontos amostrados podem ser obtidos traando-se,
inicialmente, os vetores dessa matriz e, em seguida, retas paralelas a esses vetores, formando
paralelogramos. Os pontos estaro localizados onde as retas se cruzam, como ilustrado na
Figura 3.10.
Apenas para ilustrar, no caso da amostragem quincunx, cujo conjunto de amostras
mostrado na Figura 3.11, a matriz de amostragem Q seria dada por:
Q =
_
1 1
1 1
_
. (3.78)
Como visto no exemplo, a amostragem de um sinal D-dimensional pode ser representada
em funo da matriz de amostragem:
x(n) = x
a
(Mn), (3.79)
46
t
0
t
1
v
1
v
0
2 1
3
2
Figura 3.10: Conjunto de pontos resultante da amostragem x(n
0
, n
1
) = x
a
(n
0
n
1
, n
0
+2n
1
)
n
1
n
0
Figura 3.11: Conjunto de amostras quincunx.
47
em que M
DD
uma matriz no-singular, contendo os D vetores em suas colunas:
M =
_
m
0
, m
1
, . . . , m
D1
,
_
(3.80)
e n N. O conjunto de todas as amostras :
t = Mn, n N, (3.81)
isto , o conjunto dos vetores
D1

k=0
n
k
m
k
. Esse o conjunto de todas as combinaes
lineares inteiras das colunas m
0
, . . . , m
D1
de M. A matriz M tanto chamada matriz
de amostragem quanto de base geradora do reticulado LAT(M). Note que o conjunto
LAT(M) discreto, possuindo, porm, innitos elementos.
Aps a apresentao da matriz de amostragem, torna-se oportuno denir o vetor coluna
z
(M)
, obtido a partir do vetor dcoluna z = [z
0
, . . . , z
D1
]
T
.
Pode-se ento denir z
(M)
, que um vetor coluna com D componentes obtido a partir
do vetor z = [z
0
, . . . , z
D1
]
T
. O k-simo elemento de z
(M)
dado por:
(z
(M)
)
k
= z
M
0,k
0
z
M
1,k
1
. . . z
M
D1,k
D1
, (3.82)
em que M
0,k
, M
1,k
, . . . , M
D1,k
, com 0 k D 1 so os elementos da matriz de
amostragem M.
3.5 Fundamentos de sistemas multitaxa multidimension-
ais
De forma anloga aos sistemas unidimensionais discutidos nas sees anteriores, sero
denidos, para o caso multidimensional, conceitos de decimao, interpolao, estruturas
de bancos de ltros, representaes polifsicas, entre outros relacionados composio de
sistemas multitaxas.
3.5.1 Componentes Bsicos
Primeiramente sero denidos os operadores responsveis por alterarem a taxa de
amostragem do sinal de entrada: os decimadores, que a diminuem; e os expansores (ou
sobreamostradores), que a elevam.
48
Dada uma sequncia (1-D) {x(n)}, sua verso decimada por um fator M, foi denida
como sendo x
d
(n) = x(nM). Analogamente, dada uma sequncia D-dimensional {x(n)}, a
relao entre esse sinal de entrada e sua verso decimada por uma matriz M, x
d
(n) ser:
x
d
(n) = x(Mn)
X
d
() =
1
|det(M)|

kN(M
T
)
X(M
T
2M
T
k). (3.83)
.
Aqui, N(M) denido como o conjunto dos vetores inteiros na forma Mt, em que t
[0, 1)
D
. O nmero de elementos J(M) em N(M) dado por:
J(M) = | det(M)|, (3.84)
e a matriz M
T
= (M
T
)
1
que a gera o reticulado recproco L(M), consistindo,
portanto, de pontos que representam o espectro replicado em frequncia.
A partir do exposto na seo 3.4.4, j se sabe que existem inmeros tipos de amostragem,
no apenas a amostragem retangular. Essa generalizao bastante importante, pois,
dependendo da resposta em frequncia do sinal a ser subamostrado, dado um fator de
decimao J(M), possvel que o mtodo retangular gere aliasing, por exemplo, enquanto
uma amostragem do tipo hexagonal no [10].
Para o caso unidimensional, um expansor ou sobreamostrador foi denido como sendo:
x
e
(n) =
_
x(n/M), n mltiplo de M;
0, demais casos.
(3.85)
O expansor multidimensional ser denido de maneira semelhante, porm em termos
de uma matriz M. Mais precisamente, a relao entre o sinal de entrada x(n) e sua verso
expandida pela matriz M, x
e
(n) ser:
x
e
(n) =
_
x(M
1
n), se n L(M),
0, demais casos.
X
u
() = X(M
T
),
X
u
(z) = X(z
(M)
). (3.86)
Observa-se que, na equao acima, foi utilizada a simbologia explicitada em 3.82. Para
que se possa entender melhor esse conceito aplicado aos expansores, ser considerado um
exemplo de amostragem retangular. Assim, dada a matriz de amostragem diagonal M =
_
2 0
0 3
_
, se ter X
u
(z
0
, z
1
) = X(z
2
0
, z
3
1
).
49
Existem casos especiais em que as operaes de amostragem usam matrizes unimodulares
inteiras, isto , matrizes com determinante igual a 1. Amostragem por matrizes
unimodulares inteiras no alteram a taxa de amostragem dos dados, apenas rearranjam
as amostras de entrada, o que comumente chamado de reamostragem (ou, em ingls,
resampling).
3.5.2 Representao Polifsica - Multidimensional
Dada uma sequncia unidimensional x(n), essa pode ser decomposta em seus compo-
nentes polifsicos x
k
(n) = x(nM + k), 0 k M 1, como mostrado na Seo 3.2.4.
Pode-se ento expressar X(z) =

M1
k=0
z
k
X
k
(z
M
), como utilizado na representao dos
ltros de um banco com M bandas na seo 3.3.2. Essa decomposio se baseia no fato de
que qualquer inteiro n pode ser representado da seguinte maneira:
n = k + Mq
0
, (3.87)
em que k e q
0
so inteiros, tais que 0 k M 1. De outra maneira, pode-se perceber
que k o resto e q
0
o quociente da diviso de n por M. Esse mesmo teorema da diviso
para escalares inteiros pode ser aplicado vetores de inteiros. Assim, seja M uma matriz
no-singular inteira de ordem DD, e seja n um inteiro Ddimensional. Pode-se expressar
n como:
n = k +Mq
0
, (3.88)
em que k N(M) e q
0
um vetor inteiro. Assim, dada uma sequncia x(n) e uma matriz
M, podem ser identicadas J(M) subsequncias nicas, tais que:
x
k
(n) = x(Mn +k), k N(M). (3.89)
Os sinais {x
k
(n)} so os componentes polifsicos de {x(n)}. Note que x
k
(n) ,
simplesmente, a verso decimada de x(n +k).
Denindo-se y
k
(n) como a verso M-expandida de x
k
(n):
y
k
(n) =
_
x
k
(M
1
n), n LAT(M)
0, demais casos,
(3.90)
pode-se expressar cada amostra x(n) em termos de um dos y
k
(n). Em outras palavras,
dada uma amostra de x(n), sempre se pode achar um, e apenas um, componente polifsico
do sinal para represent-la. Para tal, deve-se calcular k = n mod M, isto , o nico inteiro
em N(M) que satisfaz 3.89, para, ento, se obter:
50
x(n) = y
k
(n k). (3.91)
Considere a seguinte matriz de amostragem, correspondente a um padro hexagonal:
M =
_
1 1
2 2
_
. (3.92)
Deseja-se encontrar os componentes polifsicos relacionados a esse tipo de amostragem.
Por inspeo, sabe-se que o conjunto N(M) ter 4 elementos, visto que J(M) = | det(M)| =
| 4| = 4. Sabe-se, tambm, que esses quatro elementos so vetores inteiros pertencentes ao
que se chama paraleleppedo fundamental (FPD, do ingls Fundamental Parallelepiped).
De maneira simples, o FPD pode ser obtido traando-se os vetores de base m
k
, isto ,
as colunas da matriz M e, em seguida completando-se o paraleleppedo usando os vetores
como arestas. A Figura 3.12 mostra o FPD(M) e os quatro vetores dentro dele. O conjunto
N(M) dado por:
k
0
=
_
0
0
_
, k
1
=
_
1
0
_
, k
2
=
_
1
1
_
, k
3
=
_
1
1
_
. (3.93)
Por denio, os vetores k
i
possuem a forma Mx
i
, com x
i
[0, 1)
2
. Assim, a partir dos
vetores k
i
e da matriz M
1
podem ser obtidos os componentes polifsicos x
i
:
x
0
=
_
0
0
_
, x
1
=
_
0.5
0.5
_
, x
2
=
_
0.75
0.25
_
, x
3
=
_
0.25
0.75
_
. (3.94)
No entanto, tambm desejvel escrever a decomposio polifsica multidimensional
no domnio z para obter uma expresso anloga a (3.23). Lembrando que o ksimo
componente polifsico, x
k
(n), de x(n) foi denido em (3.89), e que x(n) pode ser
escrito unicamente em termos de componentes y
k
(n) como em (3.91),obtm-se as relaes
mostradas, em termos de diagramas de blocos no domnio z, na Figura 3.13. Combinando-
se essas relaes, chega-se Figura 3.14, que meramente mostra a decomposio de x(n)
em seus componentes polifsicos, e a sua recomposio a partir desses.
A partir dos diagramas, percebe-se que:
X(z) =

kN(M)
Z(k)X
z,k
(z
(M)
). (3.95)
Assim, para a seguinte matriz de decimao retangular:
M =
_
2 0
0 2
_
.
51
n
0
FPD( ) M
k
3
k
0
k
1
k
2
0
n
1
Figura 3.12: Demostrao dos quatro componentes polifsicos gerados para amostragem do
tipo hexagonal, localizados no interior do FPD(M).
M
X
k
( ) n Y
k
( ) n
M x( ) n
x( ) n+k
X ( )=x( + ) n Mn k
k Z k ( )
Z k (- ) +
Y
k
( ) n
Y
k
( - ) n k
X( ) n
somatrioem
todo kN(m)
Figura 3.13: Representao em diagrama de blocos das relaes entre os sinais x(n), x
k
(n)
e y
k
(n).
52
Tem-se ento J(M) = 4, e os vetores inteiros em N(M) so:
_
0
0
_
,
_
1
0
_
,
_
0
1
_
, e
_
1
1
_
.
Assim, as variveis Z(k) em (3.95) sero:
Z(k
0
) = 1, Z(k
1
) = z
1
0
, Z(k
2
) = z
1
1
, Z(k
3
) = z
1
0
z
1
1
. (3.98)
Tem-se tambm que z
(M)
=
_
z
2
0
z
2
1
_
, de tal forma que (3.95) se torna:
X
z
(z
0
, z
1
) = X
z,k
0
(z
2
0
, z
2
1
)+z
1
0
X
z,k
1
(z
2
0
, z
2
1
)+z
1
1
X
z,k
2
(z
2
0
, z
2
1
)+z
1
0
z
1
1
X
z,k
3
(z
2
0
, z
2
1
). (3.99)
Agora, considere que X
z
(z) seja a transformada z de um ltro bidimensional componente
de um banco com D bandas (ou D ltros). Cada um desses ltros poderia ser decomposto
em seus componentes polifsicos como em (3.100). Apenas se reescrever essa equao para
que se possa fazer referncia a cada um dos ltros E
i
(z
0
, z
1
), com i = 0, . . . , D 1:
E
i
(z
0
, z
1
) = E
i,k
0
(z
2
0
, z
2
1
) + z
1
0
E
i,k
1
(z
2
0
, z
2
1
) +z
1
1
E
i,k
2
(z
2
0
, z
2
1
) + z
1
0
z
1
1
E
i,k
3
(z
2
0
, z
2
1
) (3.100)
Assim, de maneira anloga ao caso unidimensional mostrado em 3.41, pode-se montar
a matriz polifsica referente a esse banco de ltros:
E(z) =
_

_
E
0,k
0
(z
0
, z
1
) E
0,k
1
(z
0
, z
1
) E
0,k
2
(z
0
, z
1
) E
0,k
3
(z
0
, z
1
)
E
1,k
0
(z
0
, z
1
) E
1,k
1
(z
0
, z
1
) E
1,k
2
(z
0
, z
1
) E
1,k
3
(z
0
, z
1
)
E
2,k
0
(z
0
, z
1
) E
2,k
1
(z
0
, z
1
) E
2,k
2
(z
0
, z
1
) E
2,k
3
(z
0
, z
1
)
E
3,k
0
(z
0
, z
1
) E
3,k
1
(z
0
, z
1
) E
3,k
2
(z
0
, z
1
) E
3,k
3
(z
0
, z
1
)
_

_
(3.101)
.
Pode-se notar que a diferena fundamental entre a matriz polifsica multidimensional
acima e aquela mostrada em (3.41) consiste no fato de que cada um dos elementos em
(3.101) uma funo de z
0
e de z
1
, enquanto, claramente, no caso unidimensional tem-se
apenas z.
Considerando toda a notao desenvolvida para o caso multidimensional e o exemplo
acima, pode-se ento generalizar a composio da matriz polifsica de um banco multidi-
mensional com D ltros para:
53
E(z) =
_

_
E
0,k
0
(z) E
0,k
1
(z) . . . E
0,k
J(M)1
(z)
E
1,k
0
(z) E
1,k
1
(z) . . . E
1,k
J(M)1
(z)
.
.
.
.
.
.
.
.
.
.
.
.
E
D1,k
0
(z) E
D1,k
1
(z) . . . E
D1,k
J(M)1
(z)
_

_
(3.102)
,
em que M a matriz de amostragem; J(M) a quantidade de polifsicas, denida em
(3.84); e k
0
, . . . , k
J(M)1
o conjunto de elementos em N(M).
Esse exemplo parte fundamental para o entendimento da montagem da matriz
polifsica de uma transformada bidimensional no-separvel. Esse tambm o cerne deste
trabalho, porque a anlise da estabilidade numrica recai sobre essa importante matriz.
3.6 Transformadas wavelet e bancos de ltros
3.6.1 Histrico
Bancos de ltros e transformadas wavelet so novas maneiras de ver e representar um
sinal, alternativamente anlise de Fourier. Apesar de as transformadas wavelet terem
se tornado muito populares e amplamente utilizadas como ferramenta de anlise e de
processamento de sinais recentemente, na dcada de 80, as bases para sua concepo j
se encontravam escondidas em trabalhos de matemticos h mais de um sculo. Em 1873,
Karl Weierstrass descreveu como uma famlia de funes poderia ser obtida a partir da
superposio de verses escalonadas de uma dada funo de base. Matematicamente, uma
onda representada por uma funo oscilante no tempo ou no espao. A anlise de Fourier
expande um sinal arbitrio em innitas funes senoidais e suas harmnicas, e tem sido
muito estudada pela comunidade de processamento de sinais por dcadas. sabido que a
representao de Fourier bastante eciente na anlise de sinais peridicos e invariantes
no tempo. Diferentemente da onda senoidal longa, utlizada na representao de Fourier, a
wavelet uma onda pequena, cuja energia concentrada no tempo.
O termo wavelet foi originalmente utilizado no campo de estudo sismolgico para
descrever os distrbios decorrentes de um impulso ssmico. Em 1982, Morlet et al.
primeiramente descreveu como wavelets ssmicas podiam ser matematicamente modeladas.
Em 1984, Crossman e Morlet extenderam este trabalho para mostrar como um sinal
arbitrrio pode ser decomposto em verses escalonadas e transladadas de uma nica funo
de base, chamda wavelet me (ou, em ingls, mother wavelet). Propriedades das wavelets
permitem, simultaneamente, anlise no tempo e na freqncia de um sinal, dado que
as wavelets possuem energia concentrada no tempo, mas ainda preservam caractersticas
peridicas das ondas. Em outras palavras, estas novas transformadas so mais localizadas
54
nestes dois domnios, diferentemente, por exemplo, das bases senoidais da anlise de Fourier.
Quanto resoluo tempo-frequencial, podem-se apresentar dois casos extremos: um
impulso instantneo, que possui exata localizao no tempo, mas espectro espalhado; e uma
onda senoidal, de frequncia denida, mas energia espalhada no tempo. A transformada
wavelet se apresenta como uma soluo de compromisso entre estas caractersticas extremas:
permite melhor localizao na freqncia do que o impulso, mas tambm possui melhor
localizao no tempo que a senide, como ilustrado na Figura 3.15. Pode-se ento dizer que
existe uma relao recproca entre a localizao espacial e em frequncia de uma funo,
de natureza similar ao princpio da incerteza de Heisenberg. De maneira simples, o preo
que se paga pelo suporte compacto das wavelets a perda de sua localizao exata em
frequncia.
3.6.2 Modelagem
Wavelets so ondas localizadas, isto , ao invs de oscilarem sempre sem qualquer
decaimento (como uma senide pura), caem para zero. Estas ondaletas, como so tambm
chamadas, so obtidas da iterao ou cascateamento de ltros (com reescalonamento). A
ligao entre wavelets contnuas no tempo e banco de ltros discretos recai no limite de uma
rvore logartmica de ltros como ilustrado na Figura 3.16. Funes de escala - (t) (ou,
em ingls, Scaling functions), e wavelets - (t), funes resultantes da reiterao dos canais
passa-baixa e passa-alta, respectivamente, possuem propriedades desejveis. Por exemplo,
possuem a biortogonalidade (ou ortogonalidade) inerente ao banco de ltros que as originou.
Do ponto de vista matemtico, wavelets so funes de base
jk
(t) no tempo contnuo.
Uma base um conjunto de funes linearmente independentes que podem ser combinadas
para se obter qualquer funo admissvel f(t):
f(t) =

j,k
b
jk

jk
Para vrios propsitos til expandir uma dada funo como uma combinao linear
de algumas funes de base em particular. Um exemplo bastante conhecido a anlise de
Fourier, em que as bases so {1, sin(nx), cos(nx) : n N}. fato que a anlise de Fourier
uma ferramenta inestimvel na anlise de sinais peridicos como, por exemplo, vibraes.
No entanto, para sinais no-peridicos ou para sinais com suporte compacto como, por
exemplo, imagens, esse tipo de anlise j no a mais adequada. Isso se deve ao fato de as
bases de Fourier no possurem boa localizao espacial, como mencionado. Assim, como
as bases no decaem e desejado que se anulem fora de um intervalo nito, a convergncia
se tornaria muito lenta.
Em casos como esse, uma abordagem melhor seria usar wavelets. A caracterstica
especial das bases wavelet que todas as funes
jk
(t) so construdas a partir de uma
55
M M Z(k )
0
M M
Z(k )
1
M M
Z(k )
S
x( ) n
x ( )
k0
n
x ( )
k1
n
x ( )
ks
n
y ( )
k0
n
y ( )
k1
n
y ( )
ks
n
Z(-k )
S
Z(-k )
0
Z(-k )
1
x( ) n
^
=x( ) n
S=J( )-1 m
k n(m)
i

Componentes
Polifsicos
Figura 3.14: Decomposio de x(n) em componentes polifsicos e sua recomposio.
f
t
T 0
t
f
t
T 0
t
f
T 0
t
Figura 3.15: Representao tempo-frequencial para (a)impulso, (b)senide pura e
(c)wavelet.
56
2 H (z)
0
H (z)
1
2
2 H (z)
0
H (z)
1
2
2 H (z)
0
H (z)
1
2
2 H (z)
0
H (z)
1
2
2 H (z)
0
H (z)
1
2
2 H (z)
0
H (z)
1
2
Figura 3.16: Estrutura em rvore logartmica que origina as wavelets.
nica wavelet me (t) por translao inteira (ou deslocamento), (t) (t 1), ou
por dilatao didica (ou reescalonamento), (t) (2t). Essa wavelet um pulso, isto
, normalmente comea no instante t = 0 e termina em um instante t = N. Os dois
ndices jk das funes de base
jk
(t) representam, respectivamente, os deslocamentos e
reescalonamentos da funo me. Assim, as funes resultantes apenas de deslocamentos
da funo me sero representadas por
0k
(t), comeando no instante t = k e terminando
em t = N + k. J as funes
j0
(t), que resultam apenas de reescalonamentos da funo
me, se iniciam em t = 0 e terminam em t = N/2
j
. O grco dessas funes reescalonadas
, portanto, uma verso comprimida por um fator 2
j
, enquanto o grco das wavelets
deslocadas apenas transladado de k:
wavelet reescalonada (grco comprimido):
j0
(t) = (2
j
t)
wavelet deslocada (grco deslocado):
0k
(t) = (t k)
Como consequncia do repetido escalonamento, as wavelets decompem um sinal em
detalhes de vrias escalas. Dada uma wavelet (t) e seu deslocamento puro (t k), diz-se
que ambas esto em escala unitria. J as wavelets (2
j
t) e (2
j
t k) estaro na escala
2
j
. por essa propriedade que se diz que as wavelets produzem uma representao em
multiresoluo de uma imagem, preservando todos os detalhes importantes nela contidos.
Uma consequncia desse tipo de representao que a sada do canal de mais baixa
frequncia da wavelet uma verso compreensvel do sinal de entrada, por isso tambm
chamada de aproximao, diferentemente do que ocorre com a transformada de Fourier,
por exemplo, em que a parte de mais baixa frequncia normalmente borrada. Essa idia
de multiresoluo uma caracterstica importante das transformadas wavelets. Nessas
transformadas, os sinais so decompostos em diferentes escalas de resoluo, e no apenas
em diferentes frequncias. A tradicional anlise "tempo-frequncia"comumente aplicada
a diferentes tipos de transformadas ento substituda por uma outra anlise "tempo-
escala"ao se tratar de wavelets. A multiresoluo divide as frequncias em oitavas, de a
2, ao invs de dividir em bandas uniformes, de a + .
Pode-se ento considerar o caso mais geral, o da wavelet tpica
jk
(t), que comprimida
j vezes e escalonada k vezes. A frmula que a descreve :

jk
(t) = (2
j
t k)
57
A uma dada resoluo j, pode-se dizer que as funes de escala (2
j
t k) formam as
bases para a representao de um sinal ou de uma imagem. J os detalhes obtidos nesse
nvel sero representados pelas wavelets (2
j
tk). Logo, o sinal suave mais os seus detalhes,
as funes e , so combinados para se obter a representao em multiresoluo do sinal
para o prximo nvel j + 1. Dessa maneira, mdias podem ser associadas s funes de
escala, enquanto os detalhes derivam das funes wavelet.
J foi visto que as wavelets podem ser originadas de bancos de ltros organizados em
rvore logartmica como o da Figura 3.16. Nessa estrutura, nota-se que apenas a sada
do canal passa-baixa foi sucessivamente decomposta. Logo, ao se optar por esse tipo
de decomposio, pressupe-se que a informao contida nas baixas frequncias do sinal
seria mais importante que a contida nas altas frequncias. Para vrios sinais isso no
necessariamente verdade. Por isso, pode-se optar por qualquer estrutura em rvore didica,
obtendo-se as chamadas bases wavelet packet. Nesse caso mais geral, em cada ponto da
rvore tem-se a opo de enviar o sinal de sada do canal passa-baixa ou a do canal passa-
alta, ou no enviar nada. A Figura 3.17 ilustra algumas dessas estruturas de decomposio.
A primeira opo ilustrada a j conhecida rvore logartmica em que apenas o canal
passa-baixa decomposto novamente, correspondendo, portanto estrutura mostrada na
Figura 3.16. A segunda opo o que se chama de rvore completa, anloga STFT (do
ingls, Short Time Fourier Transform). O mtodo Wavelet packets permite que se origine
toda essa famlia de bases. Cada partio pode ser associada a uma quadtree, dado que
caracterizada, em cada passo, por uma deciso de dividir ou no em dois cada canal. No
caso de compresso de sinais, a deciso de dividir ou, eventualmente, fundir cada ramo deve
ser motivada por critrios de taxa-distoro (ou, em ingls, rate-distortion).
rvore Completa
(Walsh)
rvore Wavelet
(Haar)
rvore Wavelet
Packet
Figura 3.17: Cada estrutura wavelet packet origina um conjunto de bases, incluindo Walsh
e Haar.
58
Captulo 4
Transformadas direcionais
implementadas via lifting
4.1 Histrico
Durante a ltima dcada, aumentou-se a sosticao e a maturidade dos mtodos de
compresso de imagens baseados em wavelets. Com essa evoluo, inicialmente pensou-
se que a antiga transformada DCT teria sido denitivamente substituda pelas wavelets.
O padro internacional de codicao de imagens estticas JPEG 2000 [7], basedo em
wavelets, no s apresentou melhor desempenho que o antigo padro JPEG [5], baseado
em DCT, como tambm passou a oferecer vantagens de escalabilidade em qualidade de
reconstruo e em resoluo espacial. Caractersticas essas desejveis para vrias aplicaes
em rede.
No entanto, a maioria das aplicaes que utilizam wavelets bidimensionais (2-D DWT,
do ingls, Discrete Wavelet Transforms), o fazem como um legado da transformada (2-D
DCT), isto , de forma separvel. Como j discutido no Captulo 2, esse mtodo tradicional
no to bom para representar elementos da imagem com direes arbitrrias, isto ,
direes que no sejam horizontais ou verticais. Nesses casos, sero gerados coecientes
transformados de alta-frequncia com grandes amplitudes, o que prejudica o desempenho
dos algoritmos de compresso.
Note que, apesar da tendncia em se considerar a wavelet uma verdadeira sucednea da
DCT, o mais novo padro de codicao de vdeo H.264/AVC [26] baseado em DCT.
V-se que o uso dessa transformada se justica, principalmente, pelo clculo de baixa
complexidade e tambm pelo fato de sua pegada (ou em ingls, footprint), ser menor
que a das wavelets, ou seja, seu cmpto envolve uma vizinhana menor, possibilitanto
59
eciente transformao de blocos. Assim, no se pode dizer que a DCT foi superada pelas
wavelets, mas sim que cada transformada possui caractersticas peculiares que devem ser
compatibilizadas com a aplicao de interesse.
Como explorar a correlao direcional de uma imagem no domnio espacial ou frequencial
tem sido um tpico de pesquisa h vrios anos. Basicamente, os mtodos direcionais de
codicao baseados em wavelets podem ser divididos em duas grandes categorias:
(a) Filtragem Direcional: Ikonomopoulos et al. [27] primeiro propuseram um banco de
ltros 2-D que produz um componente passa-baixa da imagem e N componentes
direcionais contendo altas frequncias em uma dada direo. Li et al. [28]
incorporaram a decomposio em sub-bandas ao trabalho de Ikonomopoulos, de
tal forma que cada subbanda retangular contivesse detalhes em uma dada direo.
Bamberger et al. [29] propuseram um banco de ltros criticamente decimado e regies
em formato de cunha (do ingls, wedge) para descrever a informao direcional,
que recebeu bastante ateno por oferecer as caractersticas de decimao crtica e
de reconstruo perfeita. Alm desses, vrios novos mtodos foram propostos para
preservar a informao direcional no domnio wavelet, como as ridgelets [30],[31],
curvelets [22], brushlets [32], dentre outros. Esses ltros direcionais oferecem
boas representaes da informao direcional no domnio transformado, isto , no
domnio da frequncia. Normalmente, esses mtodos so utilizados em extrao
de caractersticas (ou, em ingls, feature extraction), no realce de imagens [33](ou,
em ingls, image enhancement), e em extrao de rudos (ou, em ingls, denoising).
No entanto, no so muito adequados para compresso, pois faltam codicadores de
entropia ecientes para explorar a informao direcional em cada regio da wavelet.
(b) Predio Direcional: A questo central ao se aplicar predio direcional em decom-
posies wavelet o conito entre transformada global e direcionalidades localizadas.
Imagens naturais normalmente apresentam fortes direcionalidades localizadas. Pode-
se ento partir uma imagem em vrias regies pequenas, aproveitando-se a correlao
entre as direes. No entanto, note que isso causar severos efeitos de borda,
prejudicando a ecincia da codicao por wavelets. Taubman et al. [34] pro-
puseram uma tcnica para reamostrar a imagem antes de realizar uma decomposio
convencional em sub-bandas, rotacionando as bordas da imagem para alinh-las
horizontal ou verticalmente. Outros mtodos propem separar a imagem em partes
e utilizar cada parte para prever a outra. Normalmente, esses mtodos levam a
transformaes no-separveis. A transformada implementada nesse trabalho insere
tcnicas de predio em direes arbitrrias no contexto de transformadas wavelet
(2D) baseadas em lifting. A estrutura lifting, baseada em estgios cannicos obtidos
atravs da decomposio de Smith [10], uma maneira eciente de se implementar
uma transformada wavelet em que a reposta impulsional de cada ltro FIR pode
ser fatorada em alguns estgios [35]. Recentemente, abordagens em que as direes
60
de ltragem so selecionadas de maneira adaptativa e explicitamente por lifting tm
sido propostas [36], [37], [38], [39], [40]. Ding et al. [40] props uma transformada
direcional adaptativa implementada via lifting (ADL, do ingls Adaptive Directional
Lifting), incorporando a informao direcional aos estgios de lifting, abordagem
similar utilizada nesse trabalho. O mtodo ADL permite que se insira a informao
direcional em qualquer ltro de wavelet unidimensional, como os populares 5/3-taps
ou o 9/7-taps [7], para se realizar decomposies direcionais bidimensionais. Algumas
das abordagens se utilizam apenas de deslocamentos inteiros para rotacionarem os
ltros convencionais, enquanto outras se utilizam de mtodos sub-pixel, que requerem
interpolaes igualmente direcionais.
Terminado o histrico recente sobre o desenvolvimento de transformadas wavelets
direcionais, ser dada nfase no entendimento do esquema lifting, pois nessa abordagem
em que o trabalho desenvolvido se baseia.
4.2 Lifting
Lifting um procedimento utilizado para projetar DWTs, que garante reconstruo
perfeita [3], [4]. Foi mostrado [3] que qualquer DWT biortogonal de duas bandas pode
ser fatorada em pares de etapas de lifting. Nessa pesquisa, no entanto, apenas sero
consideradas transformadas wavelet que podem ser implementadas com apenas um par
de etapas de lifting, isto , uma etapa de predio (ou, em ingls, Prediction), e uma de
atualizao (ou, em ingls, Update). Exemplos de wavelets que se inserem nessa categoria
so a wavelet de Haar, a wavelet 5/3 e a famlia de wavelets interpolantes [41]. Note que
a difundida wavelet cdf 9/7 no foi citada, visto que sua fatorao envolve dois pares de
etapas [3]. Esse detalhe ser evidenciado mais frente em um exemplo de decomposio.
Esse mtodo de implementao de transformadas wavelet permite adaptar localmente
a direo dos ltros, aproveitando melhor as direcionalidades contidas nas imagens. A
Figura 4.1 ilustra o resultado da ltragem da imagem Brbara por um ltro de Gabor.
Filtros de Gabor possuem, simultaneamente, seletividade na freqncia e na orientao,
alm de apresentar resoluo tima conjunta espao-temporal [42], carctersticas desejveis
para ressaltar as direcionalidades existentes em uma imagem. A Figura 4.2, ilustra
as direcionalidades espaciais encontradas nos blocos de uma imagem exemplicativa,
identicadas aps procedimentos de pr-processamento e ltragem de Gabor. Deve-se notar
que h um nmero considervel de blocos com direcionalidades dominantes diferentes. Logo,
v-se que realmente existe potencial em se tentar representar melhor essas direcionalidades.
61
Imagem filtrada com filtro de Gabor
Figura 4.1: Resultado da ltragem de um ltro adaptativo de Gabor da Imagem Brbara.
4.2.1 Modelagem
A idia bsica das transformadas wavelet a de explorar a correlao existente na
maioria dos sinais reais, representando-os de maneira esparsa. A estrutura de correlao
tipicamente localizada em espao e em frequncia, isto , amostras espacialmente vizinhas
e amostras de frequncias vizinhas so mais correlacionadas do que se estivessem distantes.
O projeto tradicional de wavelets usa a transformada de Fourier para construir a localizao
espao-frequencial. No entanto, como ser mostrado no um exemplo unidimensional abaixo,
isso tambm pode ser feito no domnio espacial.
Considere um sinal {x(n)} que, de forma anloga ao que foi feito com ltros no
Captulo 3, pode ser separado em dois conjuntos disjuntos, que so chamados componentes
polifsicos: o conjunto das amostras com ndices pares X
p
= {x(2n)}, e o conjunto de
amostras com ndices mpares X
i
= {x(2n + 1)}. Essa etapa conhecida como passo
de separao (ou, em ingls, Split). Tipicamente, esses dois conjuntos so bastante
correlacionados, de forma que possa construir um bom preditor P para um dos conjuntos, o
mpar, por exemplo, a partir do outro, o par. Dicilmente ser obtido um preditor perfeito,
logo, torna-se necessrio armazenar o resduo ou o detalhe d(n):
d(n) = x(2n + 1) P
n
(X
p
). (4.1)
62
Figura 4.2: Imagem Brbara binarizada com vetores indicando as direes predominantes
nos blocos, obtidas por meio de ltros de Gabor.
Assim, dado o detalhe d(n) e as amostras mpares, essas podem ser perfeitamente
recuperadas por:
x(2n + 1) = P
n
(X
p
) +d(n). (4.2)
Quanto melhor for o preditor P, mais esparso ser o conjunto D = {d(n)}. Em outras
palavras, espera-se que a entropia de D seja menor que a de X
i
. Um preditor bem simples
para uma amostra mpar x
2k+1
seria a mdia de suas amostras pares vizinhas. O coeciente
de detalhe seria, ento:
d(n) = x(2n + 1) (x(2n) + x(2n + 2))/2. (4.3)
Pode-se perceber que, nesse caso, se o sinal for localmente linear, o coeciente de detalhe
ser nulo. A operao de calcular a predio e de guardar o resduo o que se chama estgio
ou passo de predio de lifting. A idia de se guardar o coeciente de detalhe d(n) ao invs
63
da prpria amostra mpar x(2n + 1) bastante conhecida, e a base para os chamados
mtodos DPCM (do ingls, Dierencial Pulse Code Modulation) [43],[44]. O passo de
predio j consegue aproveitar parte da correlao espacial, porm, para se constituir uma
wavelet, ainda se deve obter alguma separao em frequncia. No momento, tem-se uma
transformao de (X
p
, X
i
) em (X
p
, D). Logo, a separao em frequncia ainda pobre, visto
que X

foi obtido por simples subamostragem, o que causa o j citado efeito de aliasing.
Para corrigir isso, foi proposto um segundo passo de lifting, o chamado passo de atualizao,
que usa um operador U aplicado aos detalhes para substituir as amostras pares por valores
suaves s(n):
s(n) = x(2n) + U
n
(D). (4.4)
Novamente, esse um passo inversvel: dados (s, d), x
e
pode ser recuperado por:
x(2n) = s(n) U
n
(D), (4.5)
enquanto x(2n + 1) pode ser recuperado como em 4.2. Isso ilustra uma das caractersticas
mais importantes do lifting: no importa como sejam escolhidos P e U, as operaes so
sempre inversveis, o que implica bancos de ltros com reconstruo perfeita. O diagrama
de blocos da Figura 4.3 ilustra os trs passos de lifting: Split, Prediction-P e Update-U.
Split
+
-P
U
+
x
p
x
x
i
d
s
Figura 4.3: Representao em diagrama de blocos dos trs passos de lifting: Split,
Prediction-P e Update-U.
Uma questo pertinente quais tipos de wavelets poderiam ser decompostas em passos
de lifting. De fato, qualquer wavelet ou banco de ltros FIR pode ser decomposto dessa
maneira. Isso pode ser vericado escrevendo-se a transformada em sua forma polifsica,
estudada no Captulo 3. Assim, consideraes sobre reconstruo perfeita ou lifting podero
ser feitas utilizando-se matrizes contendo polinmios (simplesmente), ou polinmios de
64
Laurent. O chamado passo de lifting se torna ento uma matriz elementar, isto , uma
matriz triangular (superior ou inferior), com os elementos da diagonal unitrios. um
resultado bastante conhecido em lgebra de matrizes que qualquer matriz com elementos
polinomias e determinante unitrio pode ser fatorada em matrizes elementares. A prova
recai sobre o algoritmo de Euclides, desenvolvido h 2000 anos. Na literatura de bancos
de ltros, vrios trabalhos se utilizam desse algoritmo para construir transformadas em
sub-bandas a partir de matrizes elementares. Por exemplo, Vetterli e Herley [45] usam o
algoritmo de Euclides, e sua conexo com equaes Diofantinas, para achar todos os ltros
passa-alta que, dado um ltro passa-baixa, resultam em transformadas wavelets com ltros
nitos.
Por m, ser feito um exemplo de fatorao da matriz polifsica em passos de lifting,
usando-se a popular transformada wavelet cdf 9/7. Sabe-se que 9 e 7 so, respectivamente,
a quantidade de taps ou de coecientes dos ltros passa-baixa (h) e passa-alta (g) de anlise.
Assim, seja o ltro simtrico no-causal:
h(z) = h
4
(z
4
+ z
4
) + h
3
(z
3
+ z
3
) + h
2
(z
2
+ z
2
) + h
1
(z + z
1
) + h
0
. (4.6)
Como mostrado no Captulo 3, esse ltro pode ser decomposto em seus componenes
polifsicos:
h(z) = h
p
(z
2
) + z
1
h
i
(z
2
), (4.7)
em que h
p
(z) = h
4
(z
2
+ z
2
) + h
2
(z + z
1
) + h
0
e h
i
(z) = h
3
(z
2
+ z
1
) +h
1
(z + 1).
De forma similar, seja o seguinte ltro passa-alta:
g(z) = g
3
(z
2
+ z
4
) + g
2
(z + z
3
) + g
1
(1 +z
2
) +g
0
z
1
, (4.8)
segue-se sua decomposio polifsica:
g(z) = g
p
(z
2
) + z
1
g
i
(z
2
), (4.9)
em que g
p
(z) = g
3
(z +z
2
) +g
1
(1 +z
1
) e g
i
(z) = g
2
(z + z
1
) + g
0
.
Prossegue-se ento montagem da matriz polifsica de anlise P(z). De acordo com o
exposto no Captulo 3, para esse banco de ltros, com M = 2, tem-se:
P(z) =
_
h
p
(z) h
i
(z)
g
p
(z) g
i
(z)
_
=
_
h
4
(z
2
+ z
2
) + h
2
(z + z
1
) +h
0
h
3
(z
2
+z
1
) +h
1
(z + 1)
g
3
(z + z
2
) + g
1
(1 +z
1
) g
2
(z + z
1
) + g
0
_
.
(4.10)
65
Aplicando-se o algoritmo de Euclides [4], foram obtidos os seguintes restos das divises
dos polinmios:
r
0
= h
0
2h
4
h
1
/h
3
r
1
= h
2
h
4
h
4
h
1
/h
3
s
0
= h
1
h
3
h
3
r
0
/r
1
t
0
= r
0
2r
1
.
Denindo-se os parmetros:
= h
4
/h
3
1, 586134342
= h
3
/r
1
0, 05298011854
= r
1
/s
0
0, 8829110762
= s
0
/t
0
0, 4435068522
= t
0
= r
0
2r
1
1, 149604398
Chega-se seguinte fatorao da matriz polifsica de anlise:
P(z) =
_
0
0 1/
__
1 (1 +z)
0 1
__
1 0
(1 +z
1
) 1
__
1 (1 +z)
0 1
__
1 0
(1 +z
1
) 1
_
.
(4.13)
A fatorao leva seguinte implementao espacial, em que os ndices sobrescritos
representam o nmero da iterao:
s(n)
(0)
= x(2n)
d(n)
(0)
= x2n + 1
d(n)
(1)
= d(n)
(0)
+ (s(n)
(0)
+ s
(
n + 1)
(0)
)
s(n)
(1)
= s(n)
(0)
+ (d(n)
(1)
+ d(n 1)
(1)
)
d(n)
(2)
= d(n)
(1)
+ (s(n)
(1)
+ s
(
n + 1)
(1)
)
s(n)
(2)
= s(n)
(1)
+ (d(n)
(2)
+ d(n 1)
(2)
)
s(n) = s(n)
(2)
d(n) = d(n)
(2)
/
(4.14)
A partir do exposto, podem ser identicados dois passos de predio, P1 e P2, e dois
passos de atualizao, U1 e U2, tais que:
P1 = (s(n)
(0)
+s(n + 1)
(0)
) P2 = (s(n)
(1)
+ s(n + 1)
(1)
)
U1 = (d(n)
(1)
+ d(n 1)
(1)
) U2 = (d(n)
(2)
+ d(n 1)
(2)
)
(4.15)
Nesse exemplo, puderam ser relembrados os conceitos de decomposio polifsica,
montando-se a matriz polifsica de anlise de um banco de ltros unidimensional com 2
66
bandas a partir desses componentes. Em seguida, procedeu-se fatorao dessa matriz em
matrizes elementares, que compem os chamados passos de lifting. Por m, evidenciou-se
a implementao espacial dessa transformada. Na prxima seo, ser feita uma extenso
desses conceitos para o caso bidimensional, dado o foco central do trabalho ser a aplicao
desse mtodo de implementao de transformadas wavelet em imagens.
4.3 Lifting bidimensional convencional
Relembrando o procedimento descrito no Captulo 2, uma DWT bidimensional imple-
mentada de forma separvel, em geral, consiste de dois estgios. No primeiro estgio, uma
DWT unidimensional 1D-DWT aplicada imagem seguida de subamostragem vertical,
por exemplo, para se obter a sub-banda passa-baixa, L, e a sub-banda passa-alta H. No
segundo estgio, novamente ser aplicada uma (1D-DWT) s sub-bandas L e H seguida de
subamostragem horizontal, resultando, respectivamente, nas sub-bandas LL e LH, e nas
sub-bandas HL e HH.
A modelagem matemtica desse procedimento ser iniciada com a representao da
imagem original digitalizada, considerando-se que foi realizada uma amostragem do tipo
retangular. Assim, seja n = (n
x
, n
y
)
T
, o vetor que representa a localizao de uma amostra
da grade bidimensional G =
_
(n
x
, n
y
)
T
Z
2
_
, cuja intensidade x(n), o conjunto de
amostras pode ser representado por X = {x(n)|n G}. Pode-se, ento, decompor a grade
G em quatro sub-grades G
pq
=
_
(n
x
, n
y
)
T
G|n
y
mod2 = p, n
x
mod2 = q
_
, com p = 0, 1 e
q = 0, 1. Separao essa que conveniente, pois agrupa amostras localizadas em linhas
pares e colunas pares na sub-grade (G
00
); linhas pares e colunas mpares na sub-grade (G
01
);
linhas mpares e colunas pares na sub-grade (G
10
); e linhas mpares e colunas mpares na
sub-grade (G
11
).
Para se aplicar a (2-D DWT) via lifting, inicia-se aplicando a transformada entre
as linhas pares e mpares, isto , entre X
0
= {x(n
0
)|n
0
G
0
= G
00
G
01
} e X
1
=
{x(n
1
)|n
1
G
1
= G
10
G
11
}. Designando-se a sub-banda passa-baixa resultante por W
0
=
{w
0
(n
0
)|n
0
G
0
}, e a sub-banda passa-alta por W
1
= {w
1
(n
1
)|n
1
G
1
}, esse primeiro
estgio da transformada em X pode ser genericamente expresso por:
w
1
(n
1
) = g
H
(x(n
1
) P
n
1
(X
0
)) , n
1
G
1
(4.16)
w
0
(n
0
) = g
L
_
x(n
0
) + g
H
1
U
n
0
(X
1
)
_
, n
0
G
0
(4.17)
em que as funes de Predio e de Atualizao, P
n
1
(.) e U
n
0
(.) so, respectivamente,
funes das amostras de entrada com sada escalar, e g
H
e g
L
so fatores de escala.
67
De maneira anloga, o segundo estgio aplicar a transformada entre as colunas pares
e mpares, decompondo nalmente W
0
em W
00
(denida em G
00
), e em W
01
(denida em
G
01
); e W
1
em W
10
(denida em G
10
), e em W
11
(denida em G
11
). Portanto, W
00
, W
01
, W
10
e W
11
equivalem, respectivamente, s sub-bandas LL, LH, HL e HH. Todo o processo
descrito para decompor o conjunto das amostras originais de uma imagem X em quatro
sub-bandas, conhecido como um nvel completo de (2-D DWT). Mltiplos nveis podem
ser obtidos pela decomposio sucessiva da sub-banda LL resultante.
Note que, nessa seo, considerou-se a ltragem bidimensional como resultante de duas
ltragens unidimensionais sucessivas, isto , um procedimento separvel. Dessa maneira,
quando as linhas pares foram separadas das mpares, por exemplo, ao se obter um preditor
para uma dada amostra x(n) = x(n
k1
, n
k2
), a funo de predio correspondente apenas
pde acessar amostras em linhas diferentes, localizadas, porm, sob a mesma coluna n
k2
. O
mesmo se aplica funo de atualizao. Situao anloga vericada quando se realiza a
transformada entre as colunas. No entanto, dessa vez as funes de predio e de atualizao
tero seus domnios restritos a amostras localizadas na mesma linha da amostra a ser predita
ou atualizada. A Figura 4.4 mostra possveis amostras a serem acessadas nessas duas etapas.
Na prxima seo ser mostrado um mtodo direcional em que essas restries no sero
observadas. Isso permitir melhor aproveitamento das direcionalidades da imagem, porm,
tornar o mtodo no-separvel.
(a) (b)
Figura 4.4: Representao das direes de predio e de atualizao de uma (2-D DWT)
convencional separvel. As circunferncias slidas no preenchidas representam G
00
, as
tracejadas no preenchidas G
01
, as slidas preenchidas G
10
e as tracejadas preenchidas G
11
.
Em destaque encontram-se as amostram a serem preditas ou atualizadas. (a)Transformao
entre linhas: Apenas amostras localizadas sob a mesma coluna podero compor as funes
de predio e de atualizao.(b)Transformao entre colunas: Apenas amostras localizadas
sob a mesma linha podero compor as funes de predio e de atualizao.
68
4.4 Lifting bidimensional direcional
Em uma 2D-DWT convencional, as funes de Predio em 4.16 e de Atualizao em
4.17 podem ser expressas por:
P
n
1
(X
0
) =
K
P
1

k=K
P
c
P,k
.x(n
1,x
, n
1,y
(2k + 1)) (4.18)
U
n
0
(W
1
) =
K
U
1

k=K
U
c
U,k
.w
1
(n
0,x
, n
0,y
(2k + 1)) (4.19)
em que K
P
, cP, k, K
P
e cU, k so determinados pelo ncleo ou kernel da wavelet adotada.
Observe que, nesse caso, as funes foram expressas de forma a atender a restrio
mencionada: no primeiro estgio da transformao, realizada ao longo das linhas, por
exemplo, apenas amostras localizadas em uma mesma coluna so envolvidas. Para que
se possa atingir a nalidade de compresso e considerando-se cada amostra da sub-banda
passa-alta, w
1
(n
1
), desejado obter uma funo de predio P
n
1
(X
0
) em 4.16 que seja
capaz de predizer x(l
1
) a partir das amostras em X
0
com um resduo de menor amplitude
possvel. No mtodo adaptativo proposto, denem-se ltros direcionais de predio em
funo da direo d = (d
x
, d
y
), que deve ser selecionada adaptativamente por:
P
n
1
,d
(S
0
) =
K
P
1

k=K
P
c
P,k
.x(n
1
(2k + 1) d) (4.20)
em que d denida tal que:
n
1
(2k + 1) d G
0
, n
1
G
1
, k = K
P
, . . . , K
P
1. (4.21)
O ltro direcional de predio corresponde realizao do passo de predio ao longo da
direo d, ou seja, as amostras de entrada dessa funo sero selecionadas ao longo dessa
direo escolhida. Desta maneira, identicando-se uma regio mais homognea na imagem
ao longo de uma direo predominante, deve-se adotar essa direo para compor o ltro de
predio, implicando em resduos menores, j que os pixels pertencentes a essa regio so
mais parecidos entre si do que com os vizinhos localizados abaixo e acima, ou aos lados.
De 4.21, v-se que d Z
2
e d
y
sempre mpar. Estabeleceremos uma restrio a d, de tal
forma que o segmento de reta de (0, 0) at (d
x
, d
y
) no intercepte qualquer outra amostra
da grade, isto , que d
x
e d
y
sejam primos entre si. Tipicamente, utilizaremos nove direes
a serem testadas:
69
d
4
= (3, 1)
T
, d
3
= (2, 1)
T
, d
2
= (1, 1)
T
,
d
1
= (1, 3)
T
, d
0
= (0, 1)
T
, d
1
= (1, 3)
T
,
d
2
= (1, 1)
T
, d
3
= (2, 1)
T
e d
4
= (3, 1)
T
.
(4.22)
A disposio dessas direes na grade est ilustrada na Figura 4.5.
Figura 4.5: Conjunto de direes propostas para a (2-D DWT) direcional adaptativa. as
echas slidas representam os vetores d e d, enquanto os tracejados representam

d e

d.
As circunferncias slidas no preenchidas representam G
00
, as tracejadas no preenchidas
G
01
, as slidas preenchidas G
10
, e as tracejadas preenchidas G
11
.
Designa-se d
n
1

a direo escolhida na localizao n


1
para P
n
1
(S
0
). Assim, aps
completar o passo de predio para todas as amostras, segue o passo de atualizao, com a
correspondente funo denida por:
U
n
0
(W
1
) =
K
U
1

k=K
U
c
U,k

{
n
1
|n
1
(2k+1)d
n
1

=n
0}
w
1
(n
1
). (4.23)
Em outras palavras, enquanto uma amostra da imagem predita por c
P,k
x(n
0
), x[n
0
]
atualizada por c
U,k
w
1
(n
1
). Note que, se a direo d
0
for sempre selecionada, as equaes
4.20 e 4.23 equivalem, respectivamente, a 4.18 e a 4.19, e o lifting direcional se torna
igual ao convencional. Dito de outra maneira, o lifting direcional uma generalizao do
convencional. O segundo estgio de DWT, ou a transformao ao longo das colunas, deve
ser aplicado a W
0
e a W
1
, e a transformao deve ser feita ao longo de novas direes

d,
70
que decorrem do conjunto de direes d do primeiro estgio, como mostrado na Figura 4.5.
O novo conjunto de direes ento especicado por:

d = (

d
x
,

d
y
)
T
= (d
y
, 2d
x
)
T
, isto ,

d
4
= (1, 6)
T
,

d
3
= (1, 4)
T
,

d
2
= (1, 2)
T
,

d
1
= (3, 2)
T
,

d
0
= (1, 0)
T
,

d
1
= (3, 2)
T
,

d
2
= (1, 2)
T
,

d
3
= (1, 4)
T
e

d
4
= (1, 6)
T
. Consequentemente,

d
y
par e

d
x
mpar, e assim:
n
01
(2k + 1)

d G
00
, n
11
(2k + 1)

d G
10
n
01
G
01
, n
11
G
11
k = K
P
, . . . , K
P
1.
(4.24)
Em princpio, as direes de transformao de w
0
(n) e w
1
(n) podem ser diferentes, e as
funes de predio e atualizao so denidas de forma anloga a 4.20 e 4.23. Dado que

d = (

d
x
,

d
y
)
T
= (d
y
, 2d
x
)
T
, a implementao do lifting direcional em W
0
e W
1
, ao longo
de

d
i
, pode ser entendida como a mesma implementao do lifting direcional em X, ao
longo de d
i
, se primeiro W
0
e W
1
forem verticalmente subamostrados por um fator de 2 e
transpostos.
Na denio do ncleo (ou, em ingls, kernel ), de wavelet a ser utilizado, adotou-se a
wavelet interpolante (6,6), como sugerido em [37]. Assim, obtm-se: K
P
= 3, com c
p0
= c
p

1
= 150/256, c
p
1
= c
p

2
= -25/256, c
p
2
= c
p

3
= 3/256, e K
U
= 3, com c
u0
= c
u

1
= 150/512,
c
u
1
= c
u

2
= -25/512, c
u
2
= c
u

3
= 3/512. Correspondentemente, fez-se g
L
=

1.706 e
g
H
=

0.626 a partir dos ltros de sntese, de tal forma que, se o rudo de quantizao
dos coecientes transformados for descorrelacionado, a energia do rudo preservada na
imagem reconstuda.
Existem outras abordagens na literatura, tambm capazes de prover adaptaes
direcionais via lifting, que adotam um conjunto de direes sub-pixel, isto , o deslocamento
na grade no inteiro como no conjunto de direes d apresentado [46], [40]. Nessas
abordagens, normalmente, o deslocamento na grade associado tangente de uma
inclinao espacial, como sugerido na Figura 4.6. Note que a quantidade de possveis
ngulos a serem considerados depende da quantidade de amostras a serem acrescentadas,
isto , para uma preciso de meio pixel se ter uma quantidade menor de ngulos se
comparada preciso de quarto de pixel. Em princpio, poder-se-ia imaginar que as
abordagens sub-pixel seriam capazes de prover uma representao mais acurada. No
entanto, preciso notar que, nesse caso, torna-se necessrio interpolar os pixels originais da
imagem, o que pode descaracterizar a direcionalidade original. Existem alguns trabalhos
propondo resolver esse problema por meio de uma interpolao igualmente direcional, o que
tambm implica um descasamento (ou em ingls, mismatch) entre os passos de predio e de
atualizao [46]. Alm disso, dado que a abordagem adotada no realiza interpolaes, essa
, computacionalmente, menos complexa. Logo, no to evidente dizer qual abordagem
a mais precisa.
71
X + X +
X + X +
X + X +
X +
X +
X +
X +
X +
X +
X
X
X
X
X
X
X
X
X
X
X
X
v
q
v
q
Figura 4.6: Representao de mtodos de implementao de 2-D DWTs direcionais
adaptativas em que a direo escolhida a partir da tangente de uma inclinao espacial
v
,
envolvendo, portanto, localizaes sub-pixel. As posies inteiras so marcadas por O, as
posies half-pixel so marcadas por +, enquanto as posies quarter-pixel so marcadas
por x.
4.4.1 Escolha adaptativa das direes
Para ns de compresso de imagem, as direes de ltragem na 2-D DWT devem
ser escolhidas de forma a minimizar a distoro da imagem reconstruda para uma dada
taxa, algoritmo bastante conhecido como otimizao taxa-distoro (ou, em ingls, Rate-
Distotion Optimization). Observe que, no caso da transformada wavelet adaptativa, a
taxa deve indicar tambm a direo escolhida, alm de representar os prprios coecientes
transformados. No entanto, deve-se lembrar que, no momento em que se deseja escolher a
melhor direo em um bloco, no se dispe da imagem inteira decomposta, inviabilizando
que sejam includos na taxa os bits gastos na representao dos coecientes. Assim, achar
a direo tima similar ao que se faz em codicao de vdeo, estimando-se a direo de
movimento dos blocos de um quadro (ou, em ingls, frame) para outro, com restrio de
taxa [47],[48].
Considerando-se o primeiro estgio de transformada em s, a grade original pode ser
dividida em N
b
blocos no sobrepostos, cada um designado por B
b
, b = 0 . . . N
b
1. Para
cada bloco, a direo tima

d
b
pode ser escolhida minimizando-se uma funo de custo
Lagrangeana:

d
b
= arg min
d
_

n
1
G
1
B
b
D(g
H
(x[n
1
] P
n
1
,d
(S
0
))) +R
b,d
_
, (4.25)
em que D(.) uma funo que mede a distoro, > 0 o multiplicador de Lagrange, e
R
b,d
a quantidade de bits gastos para indicar a direo selecionada. Note que D(.) deve
reetir a distoro na imagem reconstruda. Como uma aproximao, D(.) = (.)
2
pode ser
72
usada como medida, assumindo-se que a maior parte dos coecientes de alta frequencia ser
quantizado para zero e que a distoro no domnio transformado ser igual a nodomnio
espacial (com a normalizao apropriada). Tambm pode-se notar que D(.) = (.)
2
e D(.) =
|.| resultam em desempenho similar em codicao de vdeo [48]. Para a implementao
adotada nesse trabalho, a medida de distoro foi adotada como descrito.
4.4.2 Correlao entre as direes de ltragem
Aps a descrio da metodologia de implementao de uma (2-D DWT) direcional via
lifting adotada, conclui-se que, para se completar um nvel dessa transformada, seis direes
devem ser escolhidas. Primeiramente, deve-se realizar o passo de predio entre as linhas,
por exemplo, originando uma sub-banda de alta frequncia H. Para tal, deve-se ter escolhido
uma direo DP1 em (4.20), dentre os nove candidatos em (4.22). Em seguida, o primeiro
passo de atualizao ser realizado, ao longo da direo escolhida DU1, obtendo-se uma sub-
banda de baixa frequncia L. Cada uma dessas sub-bandas passar por passos de predio
e de atualizao para se completar um nvel de decomposio de uma DWT direcional,
dessa vez, portanto, por meio de ltragens entre as colunas. Assim, a sub-banda L ser
decomposta em LH ao longo de DLP2 e, em LL ao longo de DLU2. J a sub-banda H
ser decomposta em HH ao longo de DHP2 e, em HL ao longo de DHU2. A Figura 4.7
mostra apenas um esquemtico dessas decomposies. Nota-se, ento, que para se obter
um nvel completo de decomposio direcional tm-se 9
6
possveis combinaes de direes.
No entanto, importante relembrar que as direcionalidades das imagens so localizadas,
exigindo que as regies em decomposio sejam sucientemente pequenas. Sugere-se a
diviso mais simples: em blocos. Em princpio, natural pensar que se poderia fazer um
teste exaustivo, considerando, portanto, todas as possveis combinaes em cada bloco para
escolher a tima. Porm, deve-se notar que a decomposio de um bloco interfere na do
outro. Assim, optou-se por realizar cada passo de lifting em todos os blocos da imagem,
porm com direes individualizadas, antes de se passar para o prximo passo.
Observe, por ora, que existe uma grande complexidade na determinao da combinao
tima de direes. Alm disso, na literatura, no claro se existe qualquer correlao entre
as direes de cada estgio. Frequentemente, opta-se por escolher, de maneira injusticada,
a direo do passo de atualizao igual adotada para o passo de predio antecedente.
Nesse trabalho, vrios estudos e testes, que sero discutidos no Captulo 5, foram realizados
para elucidar essa questo central.
73
Original
L
H
LL
LH
HL
HH
DP1
DU1
DLP2
DLU2
DHP2
DHU2
Figura 4.7: Esquemtico da decomposio direcional em sub-bandas, considerando-se um
nvel completo de 2-D DWT. Os indicadores ao longo das setam referem-se s direes
adotadas em cada passo de predio e de atualizao realizado: DP1 - Direo de Predio
1; DU1 - Direo de Update 1; DLP2 - Direo de Predio da sub-banda Low-pass 2; DLU2
- Direo de Update da sub-banda Low-pass 2; DHP2 - Direo de Predio da sub-banda
High-pass 2; DHU2 - Direo de Update da sub-banda High-pass 2.
74
Captulo 5
Resultados
Nesse captulo sero apresentados os resultados obtidos da implementao da transfor-
mada wavelet direcional, segundo a metodologia descrita no Captulo 4, aqui chamada de
D-DWT (do ingls, Directional Discrete Wavelet Transfrom). Para que se pudesse testar
o mtodo direcional nas imagens de interesse, ilustradas na Figura 5.1, os mdulos de
transformao de dois codicadores de imagem baseados em wavelet foram substitudos: o
JPEG-2000 [49] e o SPIHT(do ingls, Set Partitioning in Hierarchical Trees)[50].
5.1 Validao
Inicialmente, apenas para se testar a adequao da substituio dos mdulos de transfor-
mao, optou-se por realizar em separado a transformao padro dos codicadores SPIHT
e JPEG-2000, o banco cdf 9/7 [7], e, ento, sobrescrever os coecientes transformados
originais. Nessa situao, os resultados obtidos a partir dos cdigos modicados coincidiram
com os resultados dos codicadores originais. Note que o JPEG-2000 apresenta uma
alternativa a essa tansformada, uma transformao inteira baseada no banco spline 5/3
[7], que no foi utilizada por se aplicar a casos de compresso sem perdas. Prosseguiu-se,
ento, realizao dos testes, propriamente ditos.
5.2 Implementao da transformada wavelet direcional
(D-DWT)
Como visto no Captulo 4, a transformada direcional implementada nesse trabalho
baseada na wavelet interpolante (6,6) [37]. A Seo 4.4.1, discute preliminarmente a
75
problemtica da escolha das direes, informao difcil de ser depreendida dos artigos sobre
o assunto. A proposta inicial desse trabalho era realizar a decomposio mais exaustiva
possvel. No entanto, durante os testes, notou-se que o fato de a decomposio de blocos
vizinhos ser interdependente seria um bice a essa estratgia. Prosseguiu-se, ento,
insero de restries e utilizao de novos critrios de escolha.
5.2.1 Primeira abordagem: direo de atualizao igual de
predio
A primeira abordagem consiste em impor a restrio de que a direo do passo de
atualizao seja a mesma do passo de predio que o antecede. Dessa maneira, o algoritmo
de otimizao baseado em distoro seleciona a direo de predio que a minimiza, que ser
herdada pelo passo de atualizao. Alm disso, observou-se que a decomposio adaptativa
da sub-banda de alta frequncia H em HH e HL poderia ser negligenciada sem muita
perda no desempenho, visto que esses coecientes j so bastante descorrelacionados, no
apresentando orientaes signicativas a serem exploradas. Nesse caso, optou-se por sempre
utilizar a direo

d
0
= (1, 0)
T
. Aproveitando a oportunidade, justicativa semelhante pode
ser apontada para o insucesso na decomposio direcional de resduos de compensao
de movimento. De forma similar, nos ltimos nveis de transformao, d
0
= (1, 0)
T
e

d
0
= (1, 0)
T
tambm eram sempre utilizadas. Assim, nos testes realizados, foram feitos 5
nveis de decomposio, no mximo, 3 desses eram direcionais. Quanto maior a quantidade
de nveis, menor a quantidade de pixels em cada nova sub-banda, no justicando o gasto
em que se incorreria para indicar as direes selecionadas.
Todas as imagens de teste possuem tamanho 512512, e foram divididas em blocos xos
de tamanho 16 16. Os resultados apresentadoss ilustram curvas em que foram utilizados,
em cada um dos codicadores: (i) 5 nveis de decomposio com a tradicional wavelet
cdf 9/7; (ii) 5 nveis de decomposio com a tradicional wavelet interpolante (6,6); (iii) 3
nveis de decomposio utilizando a transformada direcional implementada (D-DWT) mais
2 nveis de decomposio com a tradicional wavelet interpolante (6,6). Os resultados esto
ilustrados nas Figuras 5.2, 5.3, 5.4 e 5.5. As curvas sinalizadas com (S) foram codicadas
pelo SPIHT, enquanto as sinalizadas com (J) foram codicadas pelo JPEG-2000.
A partir das curvas obtidas, nota-se que os resultados so muito bons para a imagem
Brbara. Essa imagem apresenta forte contedo direcional, principalmente no canto inferior
direito em que se encontram listras. J para as outras trs imagens, nota-se que o
mtodo direcional equipara-se ao tradicional, visto que essas imagens j no apresentam
contedo direcional localizado signicativo. Diferentes artigos sobre o assunto, como, por
exemplo, [37] e [46], reportam resultados semelhantes: o mtodo direcional apresenta
desempenho muito superior que o tradicional para um pequeno conjunto de imagens com
76
direcionalidades bastante localizadas. Infelizmente, os resultados aqui exibidos no puderam
ser diretamente comparados aos expostos em [37], pois, mesmo utilizando igual conjunto
de possveis direes e igual banco de wavelet, o codicador utilizado pelos autores (o
TCE embedded bitplane coder), no foi encontrado de forma disponvel para testes. Uma
questo interessante de se observar, motivada pelos resultados em [46], que wavelets com
deslocamentos menores (ou menor pegada), como a 5/3, parecem fornecer resultados ainda
melhores. Note que, na D-DWT, a composio do banco direcional com os deslocamentos
propostos permite que as funes de predio e de atualizao utilizem vizinhos distantes
at 15 pixels da amostra de interesse (ou uma pegada de 30 pixels), o que diculta um
pouco o aproveitamento das direcionalidades mais localizadas.
Considerando as restries adotadas nessa primeira abordagem, props-se uma variao
para se considerar, diretamente, a direo espacial da imagem como direo de predio.
Nessa verso, a imagem original era submetida a um pr-processamento para ressaltar
bordas e, em seguida, era realizada uma ltragem por um ltro de Gabor para que se
pudesse identicar as direcionalidaes espaciais. O conjunto de direes identicados era
utilizado como a primeira direo de predio de cada bloco, ao invs de se considerar o
algoritmo de distoro. Os resultados se mostram piores do que os obtidos pelo algoritmo
de minimizao de distoro.
5.2.2 Segunda abordagem: novo critrio de suavizao para se
escolher a direo de atualizao independentemente
Sabe-se que a direo de predio determinar os coecientes da sub-banda de alta
frequncia (H), enquanto a direo de atualizao determinar os coecientes da sub-banda
de baixa frequncia (L). A segunda abordagem se baseia nessa caracterstica e prope que a
direo de predio continue sendo determinada pelo algoritmo de minimizao de distoro
e que a direo de atualizao, porm, seja determinada por um novo critrio que maximize
a suavidade de L. Considerando que quanto mais suave, menor a varincia, adotou-se como
critrio de maximizao da suavidade a minimizao da varincia dos coecientes da sub-
banda L. Os resultados tambm se mostraram piores do que os da primeira abordagem, como
se pode ver nas Figuras 5.6, 5.7, 5.8 e 5.9. Os resultados comparam decomposies com 1
nvel direcional mais 5 nveis de wavelet cdf 9/7, com a tradicional decomposio em 6 nveis
com a cdf 9/7, variando-se, porm, o tamanho de bloco. Observe que ambos os critrios so
determinados no domnio transformado. Ora, dado que um bom resultado caracterizado
por boa qualidade de reconstruo (medida pela PSNR) a uma dada taxa (medida em bits
gastos na representao), notou-se que o critrio de distoro realmente assegurava taxas
menores na codicao. Faltava, porm, analisar a qualidade de reconstruo das bases,
visto que as curvas eram piores. Procedeu-se, ento, anlise da estabilidade numrica da
matriz polifsica para se entender melhor o que acontece com as bases da transformada
77
medida em que as direes de atualizao so escolhidas separadamente das de predio.
5.3 Anlise da Estabilidade Numrica
A qualidade de reconstruo de um banco de ltros depende da inversibilidade de suas
matrizes polifsicas. Uma maneira bastante utilizada para se analisar a sensibilidade ou a
estabilidade de uma matriz, ou do sistema linear que ela representa, atravs do clculo de
seu nmero de condio (ou em ingls, condition number)[51]. O nmero de condio de
uma matriz A quadrada, em relao a uma norma denido por:
(A) = AA
1
(5.1)
se A uma matriz no-singular; e (A) = + se A for singular.
Note que (.) depende da norma utilizada. Ao se utlizar, na denio acima, a norma
L
2
, tem-se:

2
(A) = A
2
A
1

2
=

1
(A)

n
(A)
, (5.2)
em que
1
(A) e
n
(A) so, respectivamente, o maior e o menor autovalor de A. Matrizes
com nmero de condio prximo de 1 so chamadas matrizes bem condicionadas, enquanto
matrizes com nmero de condio muito maior que um (como, por exemplo, da ordem de
10
5
), so chamadas matrizes mal condicionadas.
Desde j, pode-se perceber que a multiplicao da matriz A por um escalar no altera
seu nmero de condio. Seja:
Av = v, (5.3)
em que um autovalor da matriz A com autovetor correspondente v. Pode-se multiplicar
a matriz A por um escalar k, obtendo-se:
(kA)v = (k)v. (5.4)
Dessa maneira, note que cada um dos autovalores car multiplicado por k, no
alterando a razo que representa o nmero de condio.
Considerando-se o exposto sobre o nmero de condio, pode-se aplicar essa anlise de
estabilidade numrica s matrizes polifsicas de sntese para investigar a baixa qualidade
de reconstruo de algumas bases. Mais diretamente, considere que um sinal {x(n)} seja
quebrado em blocos e codicado aps ser transformado por T. Um dado bloco pode ser
78
representado pelo vetor x, tal que seus coecientes transformados sejam y = Tx. O sinal
transformado ser quantizado, resultando em y, que pode ser entendido como sendo a
soma de y com um rudo descorrelacionado r, cuja varincia seja proporcional energia
dos coecientes transformados, isto :

2
r
=
2
y
, (5.5)
em que
2
r
e
2
y
so, respectivamente, a varincia do rudo e do bloco transformado, e
um escalar que representa fatores de normalizao e de quantizao. O sinal reconstrudo
x, pode, ento, ser obtido por:
x = T
1
(r +y) = T
1
(r +Tx) = T
1
r +x, (5.6)
de maneira que o erro de reconstruo, representado por {(n)}, seja:
= x x = T
1
r. (5.7)
A varincia do erro dada por:

= E[
t
] = E[r
t
T
1,t
T
1
r] = E[Tr
_
T
1
rr
t
T
1,t
_
] = E[Tr{T
1
R
rr
T
1,t
}], (5.8)
em que R
rr
a matriz de auto-correlao de {r(n)}. Dado que {r(n)} no-correlacionado,
tem-se R
rr
=
2
y
I. Logo:

=
2
y
Tr{T
1
T
1,t
} = E[x
t
T
t
Tx]||T
1
|| = Tr{TR
xx
T
t
}||T
1
|| = Tr{R
xx
TT
t
}||T
1
||.
(5.9)
Assumindo-se que {x(n)} um sinal descorrelacionado, tem-se:

= ||T||||T
1
|| = (T), (5.10)
em que () o nmero de condio de uma matriz.
Logo, nota-se que o erro de reconstruo diretamente proporcional ao nmero de
condio da matriz de transformao. Dessa maneira, transformaes com nmero de
condio maiores apresentaro erros de reconstruo tambm maiores. Pode-se, portanto,
estender a modelagem desenvolvida para uma transformao linear T para bancos de ltros
unidimensionais, inicialmente. Nesse caso, como visto no Captulo 3, tem-se um vetor X(z),
com as transformadas das componentes polifsicas do sinal de entrada {x(n)}, e um vetor
de sada Y(z), com os componentes passa-faixa resultantes da anlise do sinal de entrada
79
por cada um dos M ltros E
k
(z), isto , Y(z) = [y
0
(z), y
1
(z), . . . , y
M1
(z)], em que cada
y
k
(z) = x
k
(z)E
k
(z), para 0 k M. Matricialmente, Y(z) = X(z)E(z), em que E(z)
a matriz polifsica de anlise. Assim, note que um banco de ltros uma transformao
linear para cada ponto z = z
0
, de particular interesse em z = e
j
0
. Continuam sendo
aplicveis, portanto, as equaes (5.5) a (5.10) com as modicaes aproriadas. Nesse caso,
em que se tero funes de z, o erro de reconstruo ser descrito por:
(z) = x(z) x(z). (5.11)
em que os vetores x(z) e x(z) contm, respectivamente, as polifsicas do sinal reconstrudo
e do sinal de entrada. Assim, tem-se que:
E[
t
(z)(z)] = (E(z)), (5.12)
em que E(z) a matriz polifsica de anlise. Note que (T) = (T
1
), assim como
(E(z)) = (R(z)), em que R(z) a polifsica de sntese.
Observe que o nmero de condio agora uma funo de z e, por consequncia, o erro
de reconstruo tambm o ser. Pode-se, portanto, avaliar a variao em frequncia de
ambos, fazendo-se z = e
j
:
E[
t
(e
j
)(e
j
)] = (E(e
j
)). (5.13)
Utilizando-se a notao desenvolvida na Seo 3.4 para bancos de ltros multidimen-
sionais, pode-se, por m, aplicar a modelagem descrita a sistemas dessa natureza. Nesse
caso, tem-se:
E[
t
(z)(z)] = (E(z)). (5.14)
Novamente, fazendo-se z = e
j
, vem:
E[
t
()()] = (E()). (5.15)
Prossegue-se, ento, descrio detalhada da metodologia utilizada, desde o processo
de composio da matriz polifsica polinomial a partir dos coecientes da transformada
inversa, at a avaliao do nmero de condio para diferentes frequncias.
5.3.1 Metodologia
Para se realizar a anlise da estabilidade numrica das matrizes polifsicas direcionais,
realizou-se, para cada possvel combinao de direes, a transformada inversa de uma
80
imagem transformada ctcia nula, com apenas um pixel no nulo em cada uma das sub-
bandas por vez. A partir desse procedimento, foram obtidas as bases LL, LH, HL e HH
referentes a cada combinao de direes. Dado que cada base tem suporte compacto,
foi possvel identicar a regio no nula da imagem ctcia reconstruda, regio essa que
efetivamente representa a base de transformao. Considere, ento, que os elementos dessa
regio de suporte tenham sido armazenados em uma matriz. Os elementos da matriz
foram arranjados para compor as quatro submatrizes polifsicas de cada base. Para que se
pudesse obter os polinmios em z de uma maneira consistente, com coecientes dados pelas
submatrizes, essas foram alinhadas em cima e esquerda (ou, em ingls, Top-left). Por m,
cada um dos quatro polinmios passou a compor a linha correspondente sua sub-banda
na matriz polifsica, como mostrado na equao 3.102 do Captulo 3. A Figura 5.10 mostra
um esquemtico do procedimento realizado, utilizando como exemplo o mtodo aplicado
sub-banda LL.
Ao m dessa parte do procedimento, obtm-se a matriz polifsica polinomial, isto ,
uma matriz cujos elementos so polinmios em z
1
e em z
2
. Fez-se z
1
= e
j
1
e z
2
= e
j
2
e, variando-se cada uma das frequncias de 0 a , em dez pontos igualmente espaados,
pde-se avaliar a variao em frequncia do nmero de condio, para cada combinao de
direes.
Para se fazer referncia s direes consideradas em cada anlise, sero utilizados os
identicadores apresentados no nal do Captulo 4: DP1, DU1, DLP2, DLU2, DHP2 e
DHU2. Alm disso, apenas para caracterizar a direo adotada dentre as nove candidatas
d
4
a d
4
, sero tambm atribudos nmeros inteiros, isto , ao dizer que DP1 = 1, por
exemplo, equivalente a dizer que a direo de predio do primeiro estgio foi a d
4
.
Destaca-se que a direo d
0
, horizontal ou vertical, dependendo do estgio de aplicao,
recebe o indicador 5. A Tabela 5.1 ilustra a correspondncia entre a notao adotada no
Captulo 4 e a que ser utilizada nesse captulo para designar as possveis direes, alm de
mostrar o deslocamento na grade correspondente a cada uma delas.
Considere, como exemplo, a seguinte combinao de direes: DP1=5, DU1=5,
DLP2=5, DLU2=5, DHP2=5 e DHU2=5. Nesse caso, que equivale wavelet interpolante
(6,6) separvel, obteve-se a variao ilustrada na Figura 5.11. J para DP1=8, DU1=5,
DLP2=5, DLU2=5, DHP2=5 e DHU2=5, foi obtida a variao ilustrada na Figura 5.12.
Nessas guras, mostra-se, na parte de cima, um grco tridimensional das matrizes
com os nmeros de condio obtidos e, na parte de baixo, uma representao grca
dessas matrizes. Observe que as linhas apresentam, de cima para baixo, variaes em

2
= 0, 0.1 . . . , 0.9, enquanto as colunas apresentam, da esquerda para a direita, variaes
em
1
= 0, 0.1 . . . , 0.9. No anexo I encontram-se matrizes com os nmeros de condio e
suas representaes grcas para diversas combinaes de direes.
Olhando-se as guras do anexo I, pode-se notar que a base resultante da escolha de
todas as direes iguais a 5, isto , a combinao que representa a wavelet interpolante (6,6)
81
Tabela 5.1: Equivalncia de notaes
Notao do Captulo 4 Notao para apresentao dos resultados Deslocamento na grade
d
4
1 (3, 1)
T
d
3
2 (2, 1)
T
d
2
3 (1, 1)
T
d
1
4 (1, 3)
T
d
0
5 (0, 1)
T
d
1
6 (1, 3)
T
d
2
7 (1, 1)
T
d
3
8 (2, 1)
T
d
4
9 (3, 1)
T
separvel, a que apresenta maior estabilidade. Nesse caso, pode-se dizer que a matriz
bem condicionada em toda faixa de frequncias. No entanto, ao se escolher a direo de
predio diferente da de atualizao, casos em que DP1 = DU1 ou DLP2 = DLU2, as
bases apresentam nmeros de condio maiores em faixas variadas do espectro.
Dessa maneira, dada uma combinao de direes, possvel que o nmero de condio
varie de maneira abrupta em frequncia. Isso uma caracterstica relevante, pois, mesmo
que uma base seja extremamente biortogonal possvel que, simplesmente, se divida os
coecientes transformados pela energia de suas bases, normalizando-os de forma a no
prejudicar o desempenho na codicao. No entanto, dada a abrupta variao vericada
em vrias das bases, esse procedimento no suciente para assegurar o bom desempenho,
pois, j na introduo do conceito de nmero de condio, foi visto que esse procedimento de
normalizao no altera o nmero de condio de uma transformao. Seriam necessrios,
portanto, mtodos mais complexos de compensao em frequncia. Essa anlise justica
o mau desempenho obtido em testes realizados com critrios independentes de escolha das
direes de predio e de atualizao em que os coecientes transformados de cada sub-
banda foram normalizados.
Em resumo, aps os testes de anlise da estabilidade numrica, pde-se perceber
que, dependendo da escolha das direes, as bases apresentam diferentes variaes
em frequncia do nmero de condio, o que provoca condies ruins de reconstruo
em certas combinaes, especialmente quando as direes de predio so escolhidas
independentemente das de atualizao.
82
(a) (b)
(c) (d)
Figura 5.1: Imagens de Teste: (a) Barbara; (b) Lena; (c) GoldHill; (d) Baboon.
83
0 0.2 0.4 0.6 0.8 1 1.2 1.4
24
26
28
30
32
34
36
38
taxa
P
S
N
R
Brbara
3nveisDirecionais+2nveisinterp.(6,6)(S)
5nveiscdf9/7(S)
5nveisinterp.(6,6)(S)
5nveiscdf9/7(JPEG-2000Original)
5nveisinterp.(6,6)(J)
3nveisDirecionais+2nveisinterp.(6,6)(J)
Figura 5.2: Curvas de PSNR taxa resultantes da codicao da imagem Brbara,
utilizando-se a D-DWT com direes de predio e de atualizao iguais.
84
0 0.2 0.4 0.6 0.8 1 1.2 1.4
28
30
32
34
36
38
40
42
taxa
P
S
N
R
Lena
3nveisDirecionais+2nveisinterp.(6,6)(S)
5nveiscdf9/7(S)
5nveisinterp.(6,6)(S)
5nveiscdf9/7(JPEG-2000Original)
5nveisinterp.(6,6)(J)
3nveisDirecionais+2nveisinterp.(6,6)(J)
Figura 5.3: Curvas de PSNRtaxa resultantes da codicao da imagem Lena, utilizando-
se a D-DWT com direes de predio e de atualizao iguais.
85
0.5 0.6 0.7 0.8 0.9 1 1.1
23.5
24
24.5
25
25.5
26
26.5
27
27.5
28
28.5
29
taxa
P
S
N
R
Baboon
3nveisDirecionais+2nveisinterp.(6,6)(S)
5nveiscdf9/7(S)
5nveisinterp.(6,6)(S)
5nveiscdf9/7(JPEG-2000Original)
5nveisinterp.(6,6)(J)
3nveisDirecionais+2nveisinterp.(6,6)(J)
Figura 5.4: Curvas de PSNR taxa resultantes da codicao da imagem Baboon,
utilizando-se a D-DWT com direes de predio e de atualizao iguais.
86
0 0.2 0.4 0.6 0.8 1 1.2 1.4
27
28
29
30
31
32
33
34
35
36
37
taxa
P
S
N
R
Goldhill
3nveisDirecionais+2nveisinterp.(6,6)(S)
5nveiscdf9/7(S)
5nveisinterp.(6,6)(S)
5nveiscdf9/7(JPEG-2000Original)
5nveisinterp.(6,6)(J)
3nveisDirecionais+2nveisinterp.(6,6)(J)
Figura 5.5: Curvas de PSNR taxa resultantes da codicao da imagem Goldhill,
utilizando-se a D-DWT com direes de predio e de atualizao iguais.
87
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1
22
24
26
28
30
32
34
36
Barbara-comcritriodesuavizao
taxa
P
S
N
R
6nveiscdf9/7
1nvelDirecional+5nveiscdf9/7bloco=32
1nvelDirecional+5nveiscdf9/7bloco=16
1nvelDirecional+5nveiscdf9/7bloco=8
(a)
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
22
24
26
28
30
32
34
36
38
Brbara-semcritriodesuavizao
taxa
P
S
N
R
6nveiscdf9/7
1nvelDirecional+5nveiscdf9/7bloco=32
1nvelDirecional+5nveiscdf9/7bloco=16
1nvelDirecional+5nveiscdf9/7bloco=8
(b)
Figura 5.6: Testes de suavizao - imagem Brbara: (a) com critrio de suavizaao; (b)
sem critrio de suavizaao.
88
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1
28
30
32
34
36
38
40
Lena-comcritriodesuavizao
taxa
P
S
N
R
6nveiscdf9/7
1nvelDirecional+5nveiscdf9/7bloco=32
1nvelDirecional+5nveiscdf9/7bloco=16
1nvelDirecional+5nveiscdf9/7bloco=8
(a)
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1
28
30
32
34
36
38
40
Lena-semcritriodesuavizao
taxa
P
S
N
R
6nveiscdf9/7
1nvelDirecional+5nveiscdf9/7bloco=32
1nvelDirecional+5nveiscdf9/7bloco=16
1nvelDirecional+5nveiscdf9/7bloco=8
(b)
Figura 5.7: Testes de suavizao - imagem Lena: (a) com critrio de suavizaao; (b) sem
critrio de suavizaao.
89
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1
20
21
22
23
24
25
26
27
28
29
Baboon-comcritriodesuavizao
taxa
P
S
N
R
6nveiscdf9/7
1nvelDirecional+5nveiscdf9/7bloco=32
1nvelDirecional+5nveiscdf9/7bloco=16
1nvelDirecional+5nveiscdf9/7bloco=8
(a)
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1
20
21
22
23
24
25
26
27
28
29
Baboon-semcritriodesuavizao
taxa
P
S
N
R
6nveiscdf9/7
1nvelDirecional+5nveiscdf9/7bloco=32
1nvelDirecional+5nveiscdf9/7bloco=16
1nvelDirecional+5nveiscdf9/7bloco=8
(b)
Figura 5.8: Testes de suavizao - imagem Baboon: (a) com critrio de suavizaao; (b) sem
critrio de suavizaao.
90
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1
27
28
29
30
31
32
33
34
35
36
Goldhill-comcritriodesuavizao
taxa
P
S
N
R
6levels9/7
1levelDirectional+5levels9/7blksze=32
1levelDirectional+5levels9/7blksze=16
1levelDirectional+5levels9/7blksze=8
(a)
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1
27
28
29
30
31
32
33
34
35
36
Goldhill-semcritriodesuavizao
taxa
P
S
N
R
6nveiscdf9/7
1nvelDirecional+5nveiscdf9/7bloco=32
1nvelDirecional+5nveiscdf9/7bloco=16
1nvelDirecional+5nveiscdf9/7bloco=8
(b)
Figura 5.9: Testes de suavizao - imagem Goldhill: (a) com critrio de suavizaao; (b) sem
critrio de suavizaao.
91
p (z)
LH4
T ( )
-1
d
Z
2
Z
1
BaseLL
p (z)
LL1
p (z)
LL2
p (z)
LL3
p (z)
LL4
p (z)
LL1
p (z)
LL2
p (z)
LL3
p (z)
LL4
p (z)
LH1
p (z)
LH2
p (z)
LH3
p (z)
HL1
p (z)
HL2
p (z)
HL3
p (z)
HL4
p (z)
HH1
p (z)
HH2
p (z)
HH3
p (z)
HH4
Figura 5.10: Esquemtico da metodologia de composio da matriz polifsica de sntese a
partir dos coecientes da transformada inversa, considerando a aplicao sub-banda LL
como exemplo.
92
2
4
6
8
10
2
4
6
8
10
2
4
6
8


1.4
1.6
1.8
2
2.2
2.4
2.6
(a)


2 4 6 8 10
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
(b)
Figura 5.11: Variao do nmero de condio, (E(
1
,
2
)), referente Wavelet interpolante
(6,6) convencional: DP1 = 5, DU1 = 5, DLP2 = 5, DLU2 = 5, DHP2 = 5 e DHU2 = 5.
(a)Representao tridimensional, onde
1
e
2
so os eixos horizontais. (b)Representao
bidimensional a cores da variao de (E(
1
,
2
)), contendo
1
e
2
nas linhas e colunas.
93
2
4
6
8
10
2
4
6
8
10
2
4
6
8


2
3
4
5
6
7
8
(a)


2 4 6 8 10
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
(b)
Figura 5.12: Variao do nmero de condio, (E(
1
,
2
)), referente combinao de
direes DP1 = 8, DU1 = 5, DLP2 = 5, DLU2 = 5, DHP2 = 5 e DHU2 = 5, contendo,
portanto, direo de predio diferente da de atualizao. (a)Representao tridimensional,
onde
1
e
2
so os eixos horizontais. (b)Representao bidimensional a cores da variao
de (E(
1
,
2
)), contendo
1
e
2
nas linhas e colunas.
94
Captulo 6
Concluses
6.1 Sumrio do trabalho e avaliao dos resultados
O objetivo principal do trabalho foi desenvolver uma metodologia adequada para
a anlise da estabilidade numrica de transformadas wavelet direcionais adaptativas
implementadas via lifting, buscando melhorar o desempenho na codicao de imagens.
Para tal, procedeu-se implementao de uma transformada dessa natureza baseada no
banco interpolante (6,6).
A estrutura lifting de implementao nada mais do que uma maneira de se decompor
uma matriz polifsica, portanto, polinomial, em um produto de matrizes elementares.
A estrutura lifting, baseada em estgios cannicos obtidos atravs da decomposio de
Smith, um jeito eciente de se implementar uma transformada wavelet, em que a reposta
impulsional de cada ltro FIR pode ser fatorada em alguns estgios. Popularmente, esses
estgios so denominados separao (ou, em ingls, Split), predio (ou, em ingls,
Prediction) e atualizao (ou, em ingls, Update). O passo de separao divide as
amostras de um sinal em pares e mpares. O passo de predio se utiliza das amostras pares,
por exemplo, para resultar em um bom preditor para cada uma das amostras mpares. O
resduo entre a amostra e seu valor predito chamado de detalhe. J o passo de atualizao
se utiliza dos coecientes de detalhe do conjunto mpar para atualizar as amostras pares.
O mtodo adotado nesse trabalho para a insero da informao direcional na
transformada se baseia na alterao da vizinhana considerada nos operadores de predio e
de atualizao, sendo, portanto, considerado um mtodo com foco espacial e no frequencial.
Dessa maneira, cada direo selecionada capaz de alterar o domnio das funes de
predio e de atualizao. No entanto, uma informao difcil de ser depreendida dos
artigos sobre o assunto como as direes dos passos sucessivos podem ser escolhidas de
maneira tima, isto , de maneira a garantir uma melhor qualidade na reconstruo de
95
uma imagem, objeto central do trabalho, a uma dada taxa. Identica-se, ento, a grande
problemtica: como escolher as direes dos passos de lifting para oferecer uma melhoria
no desempenho da codicao de uma imagem. Para responder a essa questo, buscou-se
uma mtrica adequada para encontrar critrios e restries capazes de determinar que tipo
de escolha seria capaz de promover o melhoramento desejado.
Primeiramente, adotou-se um critrio de minimizao de distoro, no domnio trans-
formado, capaz de determinar as direes de predio. Decidiu-se por, simplesmente, fazer
com que o passo de atualizao herdasse a direo de predio. Os resultados obtidos com
essa estratgia muito se assemelham aos mostrados em artigos recentes sobre o assunto: um
pequeno conjunto de imagens com direcionalidades fortemenente localizadas apresentam
desempenho muito superior quando decompostas por mtodos direcionais, se comparados
ao mtodo tradicional separvel.
Sabendo-se que o passo de atualizao origina a sub-banda de baixa frequncia, seria
razovel supor que critrios de maximizao da suavidade dessa sub-banda oferecessem
melhor desempenho. No entanto, ao escolher as direes dos dois passos de maneira
independente, foram obtidos resultados piores do que os obtidos com direes de predio
e de atualizao iguais. Adotou-se, ento, uma mtrica capaz de evidenciar aspectos afetos
reconstruo ou, de forma equivalente, inversibilidade das transfromadas direcionais: o
nmero de condio.
Desenvolveu-se, portanto, uma nova metodologia para avaliar a qualidade de re-
construo das transformadas aps a insero do rudo de quantizao, fundamentada
no nmero de condio. Considerando que uma matriz polifsica representa o banco
de ltros do qual se originou, decidiu-se utilizar esse escalar, bastante difundido em
anlise de estabilidade de sistemas, para avaliar a sensibilidade do banco de sntese para
cada conjunto de direes arbitrrias escolhidas. Constatou-se que o caso tradicional
separvel bem condicionado em toda a faixa de frequncias. Igual comportamento
pde ser vericado nos casos direcionais em que as direes de predio e de atualizao
eram iguais. Diferentemente, portanto, foram os casos em que essas direes foram
escolhidas independentemente. Nesses casos, as variaes em frequncia do nmero de
condio se mostraram abruptas, restando prejudicada a inversibilidade da transformada
correspondente, considerando a injeo do rudo de quantizao no processo.
6.2 Sugesto para trabalhos futuros
Os resultados obtidos nesse trabalho apontam para a adequao do mtodo implemen-
tado na representao de imagens com fortes direcionalidades localizadas. No entanto, dada
a importncia em compresso de imagens e, portanto, em compresso de vdeo de se extrair
o contedo direcional de uma cena, sugerem-se as seguintes contribuies para trabalhos
96
futuros:
Considerando-se a problemtica da escolha do conjunto timo de direes no contexto
lifting, sugere-se o desenvolvimento de mtodos adequados de compensao em
frequncia para aumentar a qualidade de reconstruo de transformadas em que as
direes de predio e de atualizao tenham sido escolhidas de maneira independente,
ampliando a quantidade de escolhas competitivas;
Ainda considerando o tipo de abordagem utilizada nesse trabalho para a implemen-
tao de transformadas direcionais, aconselha-se o desenvolvimento analtico, a partir
dos operadores direcionais de predio e de atualizao, da matriz polifsica de sntese
para que se tenha um entendimento ainda maior sobre a inuncia da correlao entre
as direes na qualidade de reconstruo da transformada, bem como a sua relao
com a caracterstica de biortogonalidade;
Considera-se igualmente importante comparar os resultados obtidos com a rotao
do banco da interpolante (6,6) com outros bancos conhecidos e com menores pegadas
como, por exemplo, os bancos da cdf 9/7 e da spline 5/3;
cabvel uma comparao entre mtodos cujas possveis direes de rotao do banco
restringem-se a deslocamentos inteiros com outros mtodos em que abordagens sub-
pixel so admitidas;
Encoraja-se, por m, a comparao da ecincia na codicao de imagens e de vdeos
entre mtodos baseados em rotao de bancos de wavelets, como o utilizado nesse
trabalho, mtodos de transformadas direcionais de bloco (como a DCT), e mtodos
puramente espacias de predio intra-quadros.
97
REFERNCIAS BIBLIOGRFICAS
[1] INTERNATIONAL TELECOMMUNICATIONS UNION. ITU-T T.81 - Information
Technology - Digital Compression and Coding of Continuous-Tone Still Images -
Requirements and Guidelines. Setembro 1992.
[2] INTERNATIONAL TELECOMMUNICATIONS UNION. ITU-T Recommendation
H.262 : Information technology - Generic coding of moving pictures and associated audio
information: Video. Julho 1995.
[3] SWELDENS, W. The lifting scheme: A construction of second generation wavelets.
SIAM J. Math. Anal., v. 29, 1998.
[4] DAUBECHIES, I.; SWELDENS, W. Factoring wavelet transforms into lifting steps. J.
Fourier Anal. Appl., v. 4, 1998.
[5] PENNEBAKER, W. B.; MITCHELL, J. L. JPEG: Still Image Compression Standard.
Second. [S.l.]: Van Nostrand Reinhold, 1993.
[6] QUEIROZ, R. L. de. Compression of color images. In: Handbook on Transforms and
Data Compression, G. Sharma. [S.l.]: Ed. Boca Raton.
[7] TAUBMAN, D. S.; MARCELLIN, M. M. JPEG2000:Image Compression Fundamentals,
Standards, and Practice. Second. [S.l.]: Springer, 2001.
[8] KOVACEVIC, J.; VETTERLI, M. Nonseparable multidimensional perfect reconstruc-
tion lter banks and wavelet bases for rn. IEEE Transactions on Information Theory, v.
38 no. 2, 1992.
[9] COHEN, A.; DAUBECHIES, I. Nonseparable bidimensional wavelet bases. Rev. Mat.
Iberoamericana, v. 9 no. 1, 2008.
[10] VAIDYANAYHAN, P. Multirate Systems ans Filter Banks. Second. [S.l.]: Prentice-Hall
Signal Processing Series, 2001.
[11] OPPENHEIM R.W. SCHAFER, J. B. A. Discrete-Time Signal Processing. 2.ed. ed.
Upper Saddle River, NJ, EUA: Prentice-Hall, 1997. ISBN 0-13-814757-4.
99
[12] LATHI, B. P. Modern Digital and Analog Communication Systems. 3.ed. ed. New York,
NY, USA: Oxford University Press, Inc., 1998. ISBN 0195110099.
[13] CROCHIERE, R. E.; RABINER, L. R. Digital Image Processing. Second. [S.l.]:
Prentice Hall, 2001.
[14] DINIZ E. A. B. DA SILVA, S. L. N. P. S. R. Processamento digital de sinais: projeto
e anlise de sistemas. Porto Alegre: Bookman, 2004. 590p. p. ISBN 85-363-0418-9.
[15] CROISIER, D. E. A.; GALAND, C. Perfect-channel splitting by use of
interpolationldecimation tree decomposition technique. Int. Symp. on Info., Circuits ans
Systems.
[16] VAIDYANATHAN, P. P. Theory and design of m-channel maximally decimated
quadrature mirror lters with arbitrary m, having perfect reconstruction property. IEEE
Trans. on Acoustics, Speech and Signal Processing, ASSP-35.
[17] VAIDYANATHAN, P. P. Quadrature mirror lter banks, m-band extensions and
perfect-reconstruction techiniques. IEEE ASSP magazine, v. 4.
[18] VAIDYANATHAN, P. P. How to capture all r perfect reconstruction qmf banks with
unimodular matrices? Proc. IEEE Symp. Circuits and Sys.
[19] CHEN, T.; VAIDYANATHAN, P. P. Recent developments in multidimensional
multirate systems. IEEE Transactions on CSVT, v. 3 no. 2, 1993.
[20] VETTERLI, M. Wavelets, approximation and compression. IEEE Signal Processing
Magazine, Sep., 2001.
[21] CANDS, E. J.; DONOHO, D. L. Ridgelets: a key to higher-dimensional
intermittency? Phil. Trans. R. Soc. Lond. A, 1999.
[22] CANDS, E. J.; DONOHO, D. L. Curvelets a suprisingly eective nonadaptive
representation for objects with edges. A. Cohen, C. Rabut, and L. L. Schumaker, editors,
Curve and Surface Fitting, Saint-Malo, 1999.
[23] DAUGMAN, J. Two-dimensional spectral analysis of cortical receptive eld prole.
Vision Research, 1980.
[24] OLSHAUSEN, B. A.; FIELD, D. J. Emergence of simple-cell receptive eld properties
by learning a sparse code for natural images. Nature, v. 381, 1996.
[25] BAMBERGER, R. H.; SMITH, M. J. T. A lter bank for the directional decomposition
of images: Theory and design. Nature, v. 40 no. 4, 1992.
[26] WIEGAND G. J. SULLIVAN, G. B. T.; LUTHRA, A. Overview of the h.264/avc video
coding standard. IEEE Trans. Circuits Syst. Video Technol., v. 13 no. 7, 2003.
100
[27] IKONOMOPOULOS, A.; KUNT, M. High compression image coding via directional
ltering. Signal Processing, v. 3 no. 4, 1985.
[28] LI, H.; HE, Z. Directional subband coding of images. Proc. ICASSP, v. 3, 1989.
[29] BAMBERGER, R. H.; SMITH, M. A lter bank for the directional decomposition:
Theory and design. IEEE Trans. Signal Process., v. 40 no. 4, 1992.
[30] CANDS, E. J.; DONOHO, D. L. Monoscale ridegelets for the representation of images
with edges. Tec. Rep., Dept. Statist., Stanford Univ., Stanford, CA, 1999.
[31] DO, M. N.; VETTERLI, M. The nite ridgelet transform for image representation.
IEEE Trans. Image Process., v. 12 no. 1, 2003.
[32] MEYER, F. G.; COIFMAN, R. R. Brushlets: a tool for directional image analysis and
image compression. J. Appl. Comput. Harmon. Anal., v. 5, 1997.
[33] GONZALEZ, R. C.; WOODS, R. E. Processamento de imagens digitais. Second. [S.l.]:
Edgard Blucher, 2000.
[34] TAUBMAN, D.; ZAKHOR, A. Orientation adaptive subband coding of images. IEEE
Trans. Image Process., v. 3 no. 4, 1994.
[35] SWELDENS, W. The lifting scheme: A custom-design construction of biorthogonal
wavelets. Appl. Comput. Harmon. Anal., v. 3, n. 2, p. 186200, 1996.
[36] CHANG, A. M. C.-L.; GIROD, B. Adaptive wavelet transform for image compression
via directional quincunx lifting. Proc. IEEE International Workshop on Multimedia Signal
Processing, MMSP 2005, Shanghai, China, 2005.
[37] CHANG, C.-L.; GIROD, B. Direction-adaptive discrete wavelet transform via
directional lifting and bandeletization. Proc. IEEE International Conference on Image
Processing, Atlanta, GA, 2006.
[38] CHANG, C.-L.; GIROD, B. Direction-adaptive discrete wavelet transform for image
compression. IEEE International Conference on Image Processing, v. 16 no.5, 2007.
[39] DING, F. W. W.; LI, S. Lifting-based wavelet transform with directionally spatial
prediction. Picture Coding Symp., San Francisco, CA, Dec. 2004.
[40] DING F. WU, X. W. S. L. W.; LI, H. Adaptive directional lifting-based wavelet
transform for image coding. IEEE Trans. Image Process., v. 16 no. 2, Feb. 2007.
[41] CALDERBANK, R. et al. Wavelet transforms that map integers to integers. Appl.
Comput. Harmon. Anal., v. 5, 1998.
101
[42] JAIN, A. K.; FARROKHNIA, F. Unsupervised texture segmentation using gabor
lters. Pattern Recognition, v. 24, 1991.
[43] JAIN, A. K. Fundamentals of Digital Image Processing. [S.l.]: Prentice Hall, 1989.
[44] JAYANT, N. S.; NOLL, P. Digital coding of waveforms. [S.l.]: Prentice Hall,Englewood
Clis,NJ, 1984.
[45] VETTERLI, M.; HERLEY, C. Wavelets and lter banks: Theory and design. IEEE
Trans. Acoust. Speech Signal Process., v. 40 no. 9, 1992.
[46] LIU, Y.; NGAN, K. Weighted adaptive lifting-based wavelet transform for image
coding. IEEE International Conference on Image Processing, v. 17, 2008.
[47] GIROD, B. Rate-constrained motion estimation. in Proc. SPIE Visual Communica-
tions and Image Processing, Chicago, IL, 1994.
[48] WIEGAND, T.; GIROD, B. Lagrange multiplier selection in hybrid video coder control.
in Proc. IEEE Int. Conf. Image Process., v. 3, Thessalonik, Greece, Oct. 2001.
[49] ISO/IEC 15444-1. JPEG2000 image coding system. 2000.
[50] SAID, W. A. P. A. A new, fast, and ecient image codec based on set partitioning
in hierarchical trees. IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR
VIDEO TECHNOLOGY, v. 6, 1996.
[51] GOLUB, G. H.; LOAN, C. F. V. Matrix Computations. Third. [S.l.]: The Johns
Hopkins University Press, 1996.
102
ANEXOS
103
I. MATRIZES COM AS VARIAES EM
FREQUNCIA DO NMERO DE
CONDIO E SUAS REPRESENTAES
GRFICAS
As imagens contidas nesse anexo mostram as matrizes de variao em frequncia do
nmero de condio e suas representaes grcas para diferentes combinaes de direes.
105
_

_
1.47 1.47 1.47 1.46 1.43 1.38 1.41 1.62 1.88 2.00
1.47 1.47 1.47 1.46 1.43 1.38 1.41 1.62 1.88 2.00
1.47 1.47 1.47 1.46 1.43 1.38 1.40 1.62 1.88 2.00
1.46 1.46 1.46 1.45 1.42 1.37 1.40 1.61 1.87 1.99
1.43 1.43 1.43 1.42 1.40 1.34 1.37 1.58 1.83 1.95
1.38 1.38 1.38 1.37 1.34 1.29 1.32 1.52 1.76 1.88
1.41 1.41 1.40 1.40 1.37 1.32 1.35 1.55 1.80 1.92
1.62 1.62 1.62 1.61 1.58 1.52 1.55 1.79 2.08 2.21
1.88 1.88 1.88 1.87 1.83 1.76 1.80 2.08 2.41 2.56
2.00 2.00 2.00 1.99 1.95 1.88 1.92 2.21 2.56 2.73
_

_
(a)


2 4 6 8 10
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
(b)
Figura I.1: Variao do nmero de condio, (E(
1
,
2
)), referente Wavelet interpolante
(6,6) convencional: DP1 = 5, DU1 = 5, DLP2 = 5, DLU2 = 5, DHP2 = 5 e DHU2 = 5.
106
_

_
1.47 1.47 1.43 1.40 1.83 1.73 1.27 1.58 1.88 2.00
1.47 1.47 1.46 1.38 1.61 1.95 1.50 1.31 1.61 1.88
1.47 1.47 1.47 1.43 1.40 1.87 1.83 1.30 1.37 1.62
1.45 1.47 1.47 1.46 1.38 1.62 1.99 1.58 1.29 1.40
1.40 1.46 1.47 1.47 1.43 1.41 1.88 1.87 1.37 1.34
1.29 1.42 1.46 1.47 1.46 1.38 1.62 2.00 1.61 1.34
1.27 1.34 1.43 1.46 1.47 1.43 1.41 1.88 1.88 1.40
1.73 1.31 1.37 1.43 1.46 1.46 1.38 1.62 2.00 1.62
2.38 1.52 1.37 1.38 1.43 1.46 1.43 1.41 1.88 1.88
2.73 2.06 1.51 1.40 1.38 1.43 1.45 1.38 1.62 2.00
_

_
(a)


2 4 6 8 10
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
(b)
Figura I.2: Variao do nmero de condio, (E(
1
,
2
)), referente combinao de
direes DP1 = 3, DU1 = 3, DLP2 = 3, DLU2 = 3, DHP2 = 3 e DHU2 = 3.
107
_

_
1.47 1.47 1.47 1.46 1.43 1.38 1.41 1.62 1.88 2.00
1.46 1.43 1.38 1.41 1.62 1.88 2.00 1.88 1.62 1.41
1.40 1.62 1.88 2.00 1.88 1.62 1.40 1.38 1.43 1.46
1.99 1.87 1.61 1.40 1.37 1.42 1.45 1.46 1.46 1.46
1.37 1.34 1.40 1.42 1.43 1.43 1.43 1.43 1.43 1.42
1.37 1.38 1.38 1.38 1.38 1.38 1.37 1.34 1.29 1.31
1.41 1.41 1.40 1.40 1.37 1.30 1.27 1.52 1.79 1.92
1.61 1.58 1.50 1.43 1.73 2.06 2.21 2.06 1.73 1.43
1.64 1.99 2.38 2.56 2.38 1.99 1.64 1.73 1.83 1.87
2.73 2.53 2.11 1.73 1.84 1.95 1.99 2.00 2.00 2.00
_

_
(a)


2 4 6 8 10
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
(b)
Figura I.3: Variao do nmero de condio, (E(
1
,
2
)), referente combinao de
direes DP1 = 9, DU1 = 9, DLP2 = 5, DLU2 = 5, DHP2 = 5 e DHU2 = 5.
108
_

_
1.47 1.35 4.39 5.14 4.39 1.27 1.41 1.48 4.48 5.14
1.47 1.49 4.82 5.14 3.74 1.32 1.41 1.60 4.91 5.14
1.47 1.70 5.04 5.14 2.96 1.36 1.40 1.81 5.13 5.14
1.46 2.21 5.10 5.11 2.21 1.37 1.40 2.32 5.20 5.10
1.43 2.92 5.05 4.95 1.63 1.36 1.37 3.03 5.14 4.95
1.38 3.55 4.86 4.56 1.39 1.35 1.32 3.67 4.95 4.56
1.41 3.84 4.47 3.84 1.37 1.40 1.35 3.98 4.57 3.84
1.62 3.65 3.87 2.90 1.64 1.62 1.55 3.81 4.03 3.25
1.88 3.10 3.16 2.15 2.01 1.98 1.80 3.31 3.53 2.94
2.00 2.45 2.45 1.99 2.46 2.49 1.92 2.77 3.13 2.73
_

_
(a)


2 4 6 8 10
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
(b)
Figura I.4: Variao do nmero de condio, (E(
1
,
2
)), referente combinao de
direes DP1 = 5, DU1 = 5, DLP2 = 9, DLU2 = 9, DHP2 = 5 e DHU2 = 5.
109
_

_
5.14 5.14 5.14 5.10 4.95 4.56 3.84 2.90 2.16 2.00
5.12 5.14 5.14 5.13 5.05 4.85 4.45 3.80 2.99 2.64
4.39 4.82 5.04 5.10 5.05 4.86 4.47 3.87 3.16 2.96
2.67 2.96 3.74 4.38 4.74 4.76 4.45 3.87 3.16 2.96
4.39 3.74 2.96 2.61 2.92 3.55 3.84 3.65 3.10 2.89
5.14 5.05 4.83 4.39 3.69 2.85 2.30 2.39 2.44 2.45
5.22 5.22 5.22 5.18 5.03 4.63 3.90 2.97 2.16 1.92
5.43 5.45 5.45 5.43 5.35 5.14 4.71 4.03 3.19 2.57
5.05 5.50 5.73 5.80 5.73 5.51 5.06 4.39 3.60 3.04
3.66 3.96 4.61 5.24 5.61 5.61 5.23 4.56 3.74 3.14
_

_
(a)


2 4 6 8 10
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
(b)
Figura I.5: Variao do nmero de condio, (E(
1
,
2
)), referente combinao de
direes DP1 = 1, DU1 = 5, DLP2 = 5, DLU2 = 5, DHP2 = 5 e DHU2 = 5.
110
_

_
1.47 1.47 1.47 1.46 1.43 1.38 1.41 1.62 1.88 2.00
1.47 1.46 1.43 1.35 1.23 1.48 1.86 2.26 2.48 2.37
1.43 1.35 1.24 1.51 1.96 2.58 3.20 3.51 3.34 2.83
1.24 1.50 1.97 2.67 3.52 4.28 4.62 4.40 3.74 2.95
1.93 2.62 3.50 4.40 5.10 5.39 5.18 4.56 3.73 2.90
3.37 4.25 4.99 5.46 5.63 5.50 5.07 4.40 3.59 2.79
5.09 5.60 5.85 5.92 5.86 5.63 5.18 4.49 3.66 2.84
6.75 6.85 6.88 6.86 6.76 6.50 5.97 5.16 4.15 3.12
7.98 7.98 7.98 7.96 7.84 7.51 6.80 5.67 4.29 3.04
8.49 8.49 8.49 8.43 8.18 7.52 6.34 4.79 3.37 2.73
_

_
(a)


2 4 6 8 10
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
(b)
Figura I.6: Variao do nmero de condio, (E(
1
,
2
)), referente combinao de
direes DP1 = 8, DU1 = 5, DLP2 = 5, DLU2 = 5, DHP2 = 5 e DHU2 = 5.
111
_

_
1.47 1.35 4.39 5.14 4.39 1.27 1.41 1.48 4.48 5.14
1.47 1.41 3.74 5.14 4.83 1.38 1.41 1.55 3.82 5.14
1.47 1.45 2.96 5.14 5.04 1.65 1.40 1.60 3.06 5.14
1.46 1.46 2.21 5.11 5.11 2.23 1.40 1.61 2.51 5.10
1.43 1.45 1.67 4.95 5.05 2.93 1.37 1.60 2.13 4.95
1.38 1.43 1.43 4.56 4.86 3.57 1.32 1.58 1.82 4.56
1.41 1.49 1.40 3.84 4.47 3.86 1.35 1.65 1.80 3.84
1.62 1.72 1.68 2.90 3.88 3.67 1.55 1.90 2.15 3.25
1.88 2.08 2.06 2.15 3.16 3.13 1.80 2.30 2.64 2.94
2.00 2.45 2.45 1.99 2.46 2.49 1.92 2.77 3.13 2.73
_

_
(a)


2 4 6 8 10
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
(b)
Figura I.7: Variao do nmero de condio, (E(
1
,
2
)), referente combinao de
direes DP1 = 5, DU1 = 5, DLP2 = 1, DLU2 = 5, DHP2 = 5 e DHU2 = 5.
112
_

_
1.47 1.45 1.70 4.39 5.14 5.16 4.46 1.82 1.86 2.00
1.47 1.46 1.49 3.74 5.13 5.16 4.90 2.32 1.80 2.00
1.47 1.47 1.35 2.96 5.04 5.16 5.12 3.07 1.72 2.00
1.46 1.46 1.40 2.21 4.81 5.15 5.18 3.84 1.89 1.99
1.43 1.45 1.43 1.67 4.32 5.07 5.13 4.44 2.13 1.95
1.38 1.43 1.43 1.42 3.55 4.86 4.93 4.69 2.41 1.88
1.41 1.49 1.49 1.40 2.65 4.40 4.55 4.53 2.84 1.92
1.62 1.72 1.72 1.67 1.89 3.67 3.96 4.02 3.18 2.21
1.88 2.06 2.07 2.05 1.83 2.79 3.25 3.36 3.26 2.56
2.00 2.38 2.46 2.45 2.13 2.07 2.56 2.78 3.06 2.73
_

_
(a)


2 4 6 8 10
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
(b)
Figura I.8: Variao do nmero de condio, (E(
1
,
2
)), referente combinao de
direes DP1 = 5, DU1 = 5, DLP2 = 2, DLU2 = 5, DHP2 = 5 e DHU2 = 5.
113
_

_
1.47 1.47 1.45 1.34 1.66 2.98 4.46 5.18 5.23 5.14
1.46 1.47 1.47 1.46 1.37 1.38 2.27 3.86 4.91 5.12
1.35 1.45 1.47 1.46 1.43 1.36 1.31 1.81 3.06 4.39
2.21 1.48 1.40 1.45 1.43 1.37 1.40 1.55 1.89 2.70
4.32 2.92 1.67 1.32 1.40 1.36 1.39 1.60 1.83 1.81
4.84 4.56 3.55 2.13 1.39 1.29 1.37 1.58 1.84 1.95
4.47 4.46 4.38 3.84 2.65 1.57 1.35 1.63 1.91 2.03
3.86 3.87 3.87 3.86 3.65 2.92 1.97 1.79 2.15 2.34
2.76 3.10 3.16 3.16 3.16 3.13 2.86 2.41 2.41 2.68
2.00 2.18 2.38 2.45 2.47 2.50 2.56 2.68 2.79 2.73
_

_
(a)


2 4 6 8 10
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
(b)
Figura I.9: Variao do nmero de condio, (E(
1
,
2
)), referente combinao de
direes DP1 = 5, DU1 = 5, DLP2 = 4, DLU2 = 5, DHP2 = 5 e DHU2 = 5.
114
_

_
1.47 1.47 1.45 1.34 1.66 2.98 4.46 5.18 5.23 5.14
1.46 1.41 1.49 2.22 3.74 4.84 5.20 5.28 5.23 5.12
1.35 1.70 2.96 4.39 5.04 5.16 5.22 5.28 5.13 4.39
2.21 3.73 4.81 5.11 5.13 5.15 5.18 4.94 3.81 2.70
4.32 4.95 5.05 5.05 5.05 4.97 4.39 3.03 2.13 1.81
4.84 4.86 4.86 4.84 4.56 3.57 2.19 1.55 1.76 1.95
4.47 4.46 4.38 3.84 2.65 1.57 1.35 1.63 1.91 2.03
3.86 3.65 2.90 1.90 1.58 1.58 1.65 1.90 2.21 2.34
2.76 2.16 1.88 1.96 2.01 1.98 2.04 2.30 2.64 2.68
2.00 2.18 2.38 2.45 2.47 2.50 2.56 2.68 2.79 2.73
_

_
(a)


2 4 6 8 10
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
(b)
Figura I.10: Variao do nmero de condio, (E(
1
,
2
)), referente combinao de
direes DP1 = 5, DU1 = 5, DLP2 = 6, DLU2 = 5, DHP2 = 5 e DHU2 = 5.
115
_

_
1.47 1.47 1.45 1.34 1.66 2.98 4.46 5.18 5.23 5.14
1.47 1.46 1.41 1.48 2.22 3.76 4.90 5.26 5.23 5.14
1.47 1.45 1.35 1.69 2.96 4.41 5.12 5.28 5.23 5.14
1.46 1.40 1.48 2.21 3.73 4.83 5.18 5.26 5.22 5.10
1.43 1.33 1.67 2.92 4.32 4.97 5.13 5.19 5.14 4.95
1.38 1.43 2.13 3.55 4.56 4.86 4.93 5.00 4.93 4.56
1.41 1.62 2.64 3.84 4.38 4.49 4.55 4.61 4.49 3.84
1.62 1.91 2.90 3.65 3.86 3.90 3.96 4.02 3.82 3.25
1.88 2.16 2.76 3.10 3.16 3.18 3.25 3.31 3.26 2.94
2.00 2.18 2.38 2.45 2.47 2.50 2.56 2.68 2.79 2.73
_

_
(a)


2 4 6 8 10
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
(b)
Figura I.11: Variao do nmero de condio, (E(
1
,
2
)), referente combinao de
direes DP1 = 5, DU1 = 5, DLP2 = 7, DLU2 = 5, DHP2 = 5 e DHU2 = 5.
116
_

_
1.47 1.35 4.39 5.14 4.39 1.27 1.41 1.48 4.48 5.14
1.47 1.49 4.82 5.14 3.74 1.32 1.41 1.60 4.91 5.14
1.47 1.70 5.04 5.14 2.96 1.36 1.40 1.81 5.13 5.14
1.46 2.21 5.10 5.11 2.21 1.37 1.40 2.32 5.20 5.10
1.43 2.92 5.05 4.95 1.63 1.36 1.37 3.03 5.14 4.95
1.38 3.55 4.86 4.56 1.39 1.35 1.32 3.67 4.95 4.56
1.41 3.84 4.47 3.84 1.37 1.40 1.35 3.98 4.57 3.84
1.62 3.65 3.87 2.90 1.64 1.62 1.55 3.81 4.03 3.25
1.88 3.10 3.16 2.15 2.01 1.98 1.80 3.31 3.53 2.94
2.00 2.45 2.45 1.99 2.46 2.49 1.92 2.77 3.13 2.73
_

_
(a)


2 4 6 8 10
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
(b)
Figura I.12: Variao do nmero de condio, (E(
1
,
2
)), referente combinao de
direes DP1 = 5, DU1 = 5, DLP2 = 9, DLU2 = 5, DHP2 = 5 e DHU2 = 5.
117

Vous aimerez peut-être aussi