Vous êtes sur la page 1sur 61

i

UNIVERSIDADE FEDERAL DO PAR


INSTITUTO DE TECNOLOGIA
FACULDADE DE ENGENHARIA DA COMPUTAO

CARACTERIZAO DA LEGIBILIDADE DE DOCUMENTOS


DIGITALIZADOS

Fabrcio Santos Pinheiro

BELM - PAR
2010

UNIVERSIDADE FEDERAL DO PAR


INSTITUTO DE TECNOLOGIA
FACULDADE DE ENGENHARIA DA COMPUTAO

Fabrcio Santos Pinheiro

CARACTERIZAO DA LEGIBILIDADE DE DOCUMENTOS


DIGITALIZADOS

Trabalho de Concluso de Curso apresentado


como requisito avaliativo para a obteno do
grau de Engenheiro em Engenharia da
Computao, pelo Instituto de Tecnologia da
Universidade Federal do Par.

BELM - PAR
2010

ii

CARACTERIZAO DA LEGIBILIDADE DE DOCUMENTOS


DIGITALIZADOS

Este trabalho foi julgado em ____/____/______ adequado para a obteno do Grau de


Engenheiro da Computao aprovado em sua forma pela banca examinadora que
atribuiu o conceito ___________________ .

___________________________________________
Prof. Ronaldo de Freitas Zampolo (Orientador)
Faculdade de Engenharia da Computao
Universidade Federal do Par

___________________________________________
Prof. Eurpedes Pinheiro dos Santos (Membro da banca)
Faculdade de Engenharia da Computao
Universidade Federal do Par

___________________________________________
Prof. Evaldo Gonalves Pelaes (Membro da banca)
Faculdade de Engenharia da Computao
Universidade Federal do Par

___________________________________________
Prof. Aldebaro Barreto da Rocha Klautau Jnior
Diretor da Faculdade de Engenharia da Computao
Universidade Federal do Par

iii

"Grandes realizaes no so
feitas por impulso, mas por uma
soma de pequenas realizaes."
(Vincent Van Gogh)

iv

Dedico este TCC a minha me.

Agradecimentos
Agradeo primeiramente a Deus por sempre me ajudar de forma indireta nos
momentos difceis.
minha me Maria Eufrasia, que desde o incio da jornada batalhou muito para
me propiciar boa educao e estudo.
s minhas tias Brasilina Santos e Maria Santana, por todo apoio dado.
Ao meu orientador Ronaldo Zampolo, por toda sua ajuda e por confiar no
trabalho que eu poderia desenvolver.
minha namorada Priscila, pela pacincia, carinho e apoio dado nesta etapa.
Aos meus primos Luiz e Solange, pelos conselhos e pelo companheirismo.
A todos os integrantes do LaPS que me propiciaram um bom ambiente de
trabalho e imensa ajuda nos experimentos.
A todos que participaram do experimento subjetivo pela sua voluntariedade,
pacincia e contribuio.
Meus sinceros agradecimentos.

vi

Sumrio
Dedicatria

iv

Agradecimentos

Sumrio

vi

Lista de Figuras

viii

Lista de Tabelas

ix

Lista de Acrnimos

xi

Resumo

xiii

Abstract

xiv

1 Introduo .....................................................................................................................1
1.1 Objetivo....................................................................................................................2
1.2 Organizao do trabalho ..........................................................................................3
2 Processamento Digital de Imagens..............................................................................4
2.1 Histrico e aplicaes ..............................................................................................4
2.2 Representao de imagens digitais ..........................................................................6
2.3 Componentes de um sistema de processamento de imagens ...................................7
2.3.1 Aquisio...........................................................................................................8
2.3.2 Armazenamento ..............................................................................................10
2.3.3 Processamento .................................................................................................10
2.3.4 Visualizao ....................................................................................................11
3 Avaliaes subjetivas e objetivas de qualidade visual .............................................12
3.1 Avaliao subjetiva ................................................................................................12
3.1.1 Single Stimulus ...............................................................................................13

vii

3.1.2 Double Stimulus Continuous Quality Score (DSCQS) ...................................13


3.1.3 Double Stimulus Impairment Scale (DSIS) ....................................................14
3.2 Avaliao Objetiva.................................................................................................14
3.2.1 Razo Sinal-Rudo (Signal-to-Noise Ratio - SNR) .......................................15
3.2.2 Razo Sinal-Rudo de Pico (Peak Signal-to-Noise-Ratio - PSNR).................16
3.2.3 ndice de Similaridade Estrutural (Structural Similarity Index - SSIM).......17
3.2.4 Critrio de Fidelidade de Informao (Information Fidelity Criterion IFC)..........................................................................................................................18
3.2.5 Fidelidade de Informao Visual (Visual Information Fidelity - VIF) ...........19
3.2.6 C4 ...................................................................................................................19
3.2.8 Mtricas propostas ..........................................................................................16
3.2.7 Entropia ...........................................................................................................17
4 Procedime nto Experimental ......................................................................................21
4.1 Conjunto de teste....................................................................................................21
4.2 Implementao do sistema .....................................................................................26
4.3 Metodologia do teste ..............................................................................................26
5 Resultados....................................................................................................................29
5.1 Caracterizao estatstica .......................................................................................30
6 Concluso ....................................................................................................................44

Referncias.....................................................................................................................45

viii

Lista de Figuras

2.1

Imagem transmitida pelo mtodo Bartlane [5].......................................................4

2.2

Exemplos de imagens mdicas: a) Ultrassom, b) Raio-X, c) Ressonncia


Magntica [22].......................................................................................................5

2.3

Conveno dos eixos para a representao de imagens digitais............................6

2.4

Esquema genrico de um sistema de processamento de imagens.........................7

2.5

Ilustrao do sistema de tomografia computadorizada [9]....................................8

2.6

a) Exemplo de sinal contnuo. b) Sinal resultante do processo de amostrage m


[12].........................................................................................................................9

2.7

a) Sinal amostrado no quantizado. b) Sinal amostrado e quantizado (digital)


[12].........................................................................................................................9

3.1

Escala de avaliao DSCQS................................................................................13

3.2
Diagrama da implementao do C4
2003)...............................................................19

(CARNEC; CALLET; BARBA,

4.1

Duas das imagens originais usadas para gerar o conjunto de


teste......................................................................................................................22

4.2

Imagens degradadas por a) Compresso JPEG, b) Compresso JPEG 2000 e c)


Filtragem passa-baixas gaussiana, derivadas da imagem original 2....................23

4.3

Identificao das imagens derivadas da imagem img1d_original com degradao


passa-baixas gaussiana, conforme a intensidade da distoro.............................25

4.4

Imagem degradada com rudo sal e pimenta (salt and pepper), utilizada na etapa
de aquecimento....................................................................................................27

4.5

Tela do experimento de legibilidade....................................................................28

5.1

Correlaes entre a) RMOS versus C4sim e b) RMOS versus PSNR.................35

5.2

Grfico de disperso entre Entropia versus DMOS.............................................39

ix

Lista de Tabelas

3.1

Faixa de valores da nota dada a qualidade da imagem degradada de acordo com


a intensidade da degradao presente na imagem de teste em comparao a com
a imagem de referncia para o DSIS...................................................................14

4.1

Elementos de identificao das imagens e suas descries.................................24

5.1

Coeficientes de correlao de Pearson e Spearman entre mtricas e raw


data......................................................................................................................32

5.2

Coeficientes de correlao de Pearson e Spearman entre mtricas e


MOS.....................................................................................................................33

5.3

Coeficientes de correlao de Pearson e Spearman entre mtricas e


DOS.....................................................................................................................33

5.4

Coeficientes de correlao de Pearson e Spearman entre mtricas e


DMOS..................................................................................................................34

5.5

Coeficientes de correlao de Pearson e Spearman entre mtricas e


ROS......................................................................................................................34

5.6

Coeficiente de correlao de Pearson e Spearman entre mtricas e


RMOS..................................................................................................................36

5.7

Coeficientes de correlao de Pearson e Spearman entre mtricas e


Classes.................................................................................................................37

5.8

Coeficientes de correlao de Pearson e Spearman entre mtricas e


MClasses..............................................................................................................37

5.9

Coeficientes de correlao por degradao entre mtricas e dados


brutos...................................................................................................................38

5.10

Coeficientes
de
correlao
por
degradao
entre
mtricas
e
MOS.....................................................................................................................39

5.11

Coeficientes
de
correlao
por
degradao
entre
mtricas
e
DOS.....................................................................................................................40

5.12

Coeficientes
de
correlao
por
degradao
entre
mtricas
e
DMOS..................................................................................................................40

5.13

Coeficientes
de
correlao
por
degradao
entre
mtricas
e
ROS......................................................................................................................41

5.14

Coeficientes
de
correlao
por
degradao
entre
mtricas
e
RMOS..................................................................................................................41

5.15

Coeficientes
de
correlao
por
degradao
entre
mtricas
e
Classes.................................................................................................................42

5.16

Coeficientes
de
correlao
por
degradao
entre
mtricas
e
MClasses..............................................................................................................43

xi

Lista de Acrnimos
CC: Coeficiente de Correlao Linear de Pearson
CRT: Tubo de Raios Catdicos (cathode ray tubes)
CSF: Funo de Sensibilidade ao Contraste (contrast sensitivity function)
DMOS: Mdia das Diferenas das Pontuaes de Opinio (Difference Mean Opinion
Score)
DOS: Diferena das Pontuaes de Opinio (Difference Opinion Score)
IEEE: Instituto de Engenheiros Eletricistas e Eletrnicos (Institute of Electrical and
Electronics Engineers)
IFC: Critrio de Fidelidade de Informao (information fidelity criterion)
ITU: Unio Internacional de Telecomunicaes (International Telecommunication
Union)
JDBC: Java Database Connectivity
LaPS: Laboratrio de Processamento de Sinais
LCD: Tela de Cristal Lquido (liquid crystal display)
LED: Diodo Emissor de Luz (light emitting diod)
MClasses: Moda das Classes (Mode Classes)
MOS: Mdia das Pontuaes de Opinio (Mean Opinion Score)
ODBC: Open Data Base Connectivity
OLED: Diodo Orgncio Emissor de Luz (organic light emitting diode)
PDI: Processamento Digital de Imagem
PSNR: Razo Sinal-Rudo de Pico (peak signal-to-noise ratio)
RMOS: Mdia das Razes de Pontuao (Ratio Mean Opinion Score)
ROS: Razo das Pontuaes de Opinio (Ratio Opinion Score)
SNR: Razo Sinal-Rudo (signal-to-noise ratio)

xii

SROCC: Coeficiente de Correlao de Postos de Spearman (Spearman Rank Order


Correlation Coefficient)
SSIM: ndice de Similaridade Estrutural (structural similarity index)
SVH: Sistema Visual Humano
VIF: Fidelidade de Informao Visual (visual information fidelity)

xiii

Resumo
Neste trabalho apresentado um estudo sobre a consistncia de algumas
mtricas de qualidade visual aplicadas caracterizao da legibilidade de documentos
digitalizados. Para a avaliao subjetiva usado um conjunto teste composto por 64
imagens. Destas, 4 imagens constituem a base de referncia e as 60 imagens restantes
base de teste que apresenta degradaes do tipo JPEG, JPEG2000 e passa-baixas
gaussiana. A fim de automatizar o experimento foi desenvolvido um software em
linguagem de programao JAVA, que armazenava os dados coletados no banco de
dados Mysql. As mtricas usadas nas anlises so de referncia completa (SNR, PSNR,
DACOV, DACC, SSIM, IFC, VIF, VIFp e C4) e sem referncia (Entropia). Os
resultados exibidos mostram o desempenho de cada mtrica na caracterizao da
legibilidade segundo as condies do experimento.

Palavras-Chave: Comparao entre Mtricas, caracterizao de legibilidade, qualidade


visual

xiv

Abstract
This work presents a study on the consistency of some visual quality metrics
applied to the characterization of the readability of scanned documents. For subjective
assessment we used a test set composed by 64 images. From this test set, 4 images
constitute the reference base and the 60 remaining constitute the test base, which are
degraded by JPEG, and JPEG 2000 coding as well as Gaussian low-pass filtering. In
order to automate the experiment, a software, developed with JAVA programming
language and MySQL, was implemented for collecting and storing subjective data. The
metrics used in the analysis are of full reference (SNR, PSNR, DACOV, DACC, SSIM,
IFC, VIF, VIFp e C4) and no reference types (Entropy). The results address
performance of each metric in the characterization of readability, regarding the adopted
experimental conditions.
Keywords: Metric comparison, characterization of readability, visual quality

Captulo 1

Introduo
A cada dia que passa a comunicao fica mais digital. Chega-se a essa concluso
quando se olha ao redor e encontra-se informaes nos mais diversos locais e das mais
diversas formas.
A forma de comunicao que mais cresce atualmente a mdia digital, que o
conjunto de veculos e aparelhos de comunicao baseados em tecnologia digital, os
quais possibilitam a distribuio ou comunicao digital das obras intelectuais escritas,
sonoras ou visuais.
Uma das aplicaes mais presentes no cotidiano consiste nas telas informativas
onde os contedos so exibidos em looping e comumente apresentam propagandas de
marcas ou produtos, notcias, cotaes, entre outros. Geralmente tais telas so
encontradas em shopping centers, aeroportos e academias.
Um fato interessante no uso desta tecnologia que ela auxilia de forma direta na
sustentabilidade ecolgica, pois substituem os antigos cartazes, outdoors e banners de
PDV, que so constitudos de papel e plstico, que depois de serem utilizados, so
muitas vezes descartados no meio ambiente.
Sobre as mdias digitais Avelino Querido comenta:
Nesta nova era de Comunicao Digital, alm da rapidez de substituio das
mensagens, economiza-se tempo e dinheiro, pois tudo feito de forma
virtual, com direito a movimento das imagens, efeitos digitais e som, quando
necessrio. E em funo das imagens serem dinmicas (com movimento) e
com brilho, so facilmente percebidas pelo sentido da viso dos
consumidores que acabam passando mais tempo em frente tela, prestando
ateno no contedo. Mas para que a ateno dos consumidores seja
arrebatada, esse contedo deve ser de alta qualidade, observando tambm o
tamanho das letras, tempo de leitura, contraste de cores e relevncia para o
pblico-alvo. Outro fator importante para o sucesso da midia digital o
posicionamento. As telas devem ser instaladas sempre em locais de grande
visibilidade e de preferncia na altura dos olhos dos consumidores.
(QUERIDO, 2010)

Outro ponto importante do uso de mdias digitais, a cada vez mais frequente
publicao de E-books (electronic books) pelas editoras. E-books so livros virtuais,
que dentre outras vantagens em relao a mdia impressa tm-se: rapidez e baixo custo
de publicao, isto acarreta uma diminuio no preo final da obra; O editor no corre
risco de encalhes de obras nas prateleiras e no necessita pagar di stribuidores; O
recebimento do livro pelo computador imediato e podem ser transmitidos rapidamente

para qualquer ponto do globo terrestre via Internet, sem necessidade de intermedirios,
como ocorre na obra impressa; facilidade de visualizao e interatividade com o texto
por intermdio do uso de leitores de E-books (E-book readers); e possibilita armazenar
inmeros textos no computador e transferi-los de um aparelho para o outro sem a
necessidade de descartar algum.
As aplicaes das mdias digitais citadas anteriormente so algumas dentre as
muitas destinadas ao consumo humano. Por isso, importante avaliar a qualidade da
imagem que ser percebida pelo usurio final e para isso a forma mais eficaz atravs
de avaliaes subjetivas de qualidade visual em que as pessoas emitem suas opinies
acerca da qualidade das imagens que lhes so apresentadas. Ainda que apresente
resultados satisfatrios, tal estratgia demanda muito tempo alm de ser dispendioso. A
fim de contornar tais problemas vm sendo desenvolvidas mtricas de qualidade visual,
que so expresses matemticas que realizam uma avaliao automtica da qualidade
visual.
A proposta deste trabalho assume importncia face quantidade crescente de
mdias digitais para a visualizao de textos, e se concentra em uma aplicao ainda
pouco explorada em avaliao de qualidade visual que possui consequncias
importantes em codificao e restaurao de imagens.

1.1 Objetivo
Este trabalho tem como objetivo encontrar uma mtrica de qualidade visual que
seja representativa da legibilidade. Dentre as vrias metas, tm-se:
a) a criao de uma base de imagens formada por documentos digitalizados. As
imagens de referncia so degradadas por codificao JPEG, JPEG 2000 e
filtragem passa-baixas gaussiana;
b) a implementao de um software para automatizar o experimento subjetivo de
legibilidade;
c) a criao de um banco de dados para armazenar os dados da etapa de aquisio;
d) e a anlise dos dados.
e) clculo do desempenho de cada mtrica na representatividade da legibilidade
segundo as condies do experimento.

1.2 Organizao do trabalho


No captulo 2 ser apresentada uma breve introduo ao Processamento Digital
de Imagens (PDI), seu histrico, a representao de imagens digitais e os componentes
que formam um sistema de processamento de imagens.
O captulo 3 expe as formas de avaliao da qualidade de imagem, abordando
os diferentes mtodos de avaliao subjetiva e as mtricas de qualidade visual
(avaliao objetiva) utilizadas no trabalho.
O captulo 4 apresenta o procedimento experimental utilizado neste trabalho
para o teste subjetivo de qualidade, que consiste na definio do contexto e da
caracterizao do experimento, no processo de concepo da base de imagens, na
implementao do software para a automatizao do experimento e na metodologia
utilizada no teste.
No captulo 5 so analisados os resultados obtidos com a caracterizao
estatstica da legibilidade.
O captulo 6 apresenta as concluses e as propostas para trabalhos futuros.

Captulo 2

Processamento Digital de Imagens


2.1 Histrico e aplicaes
O termo Processamento Digital de Imagens (PDI) refere-se aplicao de vrios
algoritmos computacionais para processar imagens digitais e o resultado deste processo
so outras imagens ou conjuntos de caractersticas e propriedades das imagens originais.
Os principais objetivos do PDI so a melhoria da informao visual para a interpretao
humana e o processamento de dados de cenas em sistemas de viso computacional.
Historicamente as primeiras aplicaes de tcnicas de processamento de imagens
tiveram incio na indstria de jornais, atravs do melhoramento de imagens
digitalizadas, enviadas por meio de cabo submarino de Londres para New York. No
incio dos anos 20 era utilizado o sistema Bartlane de transmisso, que reduziu de uma
semana para 3 horas o tempo de transporte de uma imagem atravs do oceano Atlntico.
A figura 2.1 ilustra uma imagem transmitida pelo mtodo Bartlane. Inicialmente, esse
sistema codificava imagens em 5 tons de brilho distintos. Em 1929 houve um aumento
dessa capacidade para 15 tons.

Figura 2.1: Imagem transmitida pelo mtodo Bartlane (GONZALES; WOODS, 2000).

O PDI teve um grande impulso na dcada de 60, devido ao desenvolvimento de


computadores de grande porte e ao programa espacial norte americano. Em 1964
imagens da lua enviadas pela sonda espacial Ranger 7 foram submetidas a tcnicas
computacionais de correo de distores. Essas tcnicas mais tarde serviriam de base
para mtodos melhorados de realce e restaurao de imagens em misses posteriores.
Da dcada de 60 at os dias atuais o PDI expandiu-se para diversas reas. Dentre
as reas de aplicao as mais comuns esto:

Leitura remota: utilizada para reunir informaes sobre o planeta via satlites e
estaes espaciais.
Percia forense: aplicao do processamento de imagens contra crimes ou
atividades maliciosas. Usada frequentemente para reconhecimento de suspeitos.
Militar: geralmente utilizada para deteco de objetos (minas
terrestre/armadilhas) e reconstruo tridimensional do territrio.
Industrial: utilizada para a anlise morfolgica em imagens para a seleo
automtica de peas no processo de produo.
Imagens mdicas: consiste na gerao, processamento e armazenamento de
imagens do corpo humano ou de partes dele. Ultrassom, raio-X, ressonncia
magntica e tomografia computadorizada so os exemplos mais observados
desta aplicao. A figura 2.2 ilustra exemplos dessa rea de aplicao.

Figura 2.2 : Exemplos de imagens mdicas: a) Ultrassom , b) Raio-X , c) Ressonncia


Magntica (ZHOU; ZHANG, 2010).

2.2 Representao de imagens digitais


Imagem a representao grfica, plstica ou fotogrfica de pessoa ou de
objeto (FERREIRA, 2000).
J imagens digitais so funes discretas bidimensionais f(i,j), sendo i e j
coordenadas espaciais da imagem. Cada par (i,j) representa o menor elemento que
forma uma imagem digitalizada. Esse elemento denominado de elemento da imagem,
pixel ou pel, estes dois ltimos termos so acrnimos de picture elements. Na figura 2.3
mostrada a conveno dos eixos para a representao de imagens digitais. Note que a
origem tradicionalmente localizada no canto superior esquerdo.
O valor da funo f(i,j) indica a intensidade luminosa ou nvel de cinza do pixel
na coordenada determinada. Por exemplo, para imagens em tons de cinza com
8 bits/pixel os valores dos pixels variam entre 0 e 255.

Figura 2.3 : Conveno dos eixos para a representao de imagens digitais.

2.3 Componentes de um sistema de processamento de


imagens
O modelo mais simplificado de um sistema de processamento de imagens,
ilustrado na figura 2.4, consiste em um conjunto de dispositivos especializados capazes
de desempenhar as seguintes operaes:

Aquisio
Processamento
Armazenamento
Visualizao

A tomografia computadorizada, um exemplo de sistema de processamento de


imagens. O tubo de raio-X emite feixes de radiao em forma laminar de fina espessura
que ao atravessar o paciente sensibiliza um conjunto de detectores (aquisio). Estes
transmitem os sinais em forma de pequenos impulsos eltricos para o conversor
analgico/digital. Essa tcnica utiliza vrias projees feitas de diferentes ngulos e o
computador de posse dos dados obtidos constri (processamento) uma imagem digital .
Isto possibilita a sua exibio no monitor (visualizao). O esquema da tomografia
computadorizada ilustrado na figura 2.5.

Figura 2.4: Esquema genrico de um sistema de processamento de imagens.

Figura 2.5: Ilustrao do sistema de tomografia computadorizada (PEREIRA, 2001).

2.3.1 Aquisio
A primeira etapa no processamento de imagens a aquisio da imagem. Nesta
fase feita a converso da cena para uma representao numrica adequada aos passos
posteriores do sistema.
Dois elementos so necessrios para a aquisio de imagens digitais. O
primeiro um dispositivo fsico que seja sensvel a uma banda do espectro de
energia eletromagntica (como raios X, ultravioleta, visvel ou banda
infravermelha) e que produza um sinal eltrico de sada proporcional a um
nvel de energia percebida. O segundo, chamado de digitalizador, um
dispositivo para a converso de sada eltrica de um dispositivo de
sensoriamento fsico para a forma digital. (GONZALES; WOODS, 2000,
p.7).

O primeiro dispositivo descrito na citao o sensor. Que produz na sada um


sinal de natureza contnua, como o ilustrado na figura 2.6 (a).
O computador s capaz de armazenar bits, logo no possvel a um
processador digital manipular dados de natureza contnua, sendo, portanto, necessria a
discretizao desse sinal. E tal tarefa realizada pelo digitalizador (conversor
analgico/digital).
O digitalizador atribui valores pr-definidos tanto para o eixo x quanto para o
eixo f(x). A ao de determinar valores no eixo x denominada amostragem. Este
processo faz com que o sinal tenha valores definidos apenas para mltiplos do perodo
de amostragem (T 0). A figura 2.6 (b) ilustra uma funo discreta resultante da
amostragem. J a ao de determinar valores no eixo f(x) denominada quantizao,

etapa que envolve representar cada nmero produzido na etapa de amostragem no nvel
mais prximo escolhido dentre um nmero finito de nveis de amplitude discreta. A
figura 2.7(b) ilustra uma funo resultante do processo de amostragem e quantizao.

Figura 2.6 : a) Exemplo de sinal contnuo. b) Sinal resultante do processo de amostragem


(SCURI, 2002).

Figura 2.7 : a) Sinal amostrado no quantizado. b) Sinal amostrado e quantizado (digital)


(SCURI, 2002).

10

Diferente da amostragem, a quantizao um processo irreversvel, pois sempre


resulta numa perda de informao que pode ser pequena ao se utilizar um quantizador
com um nmero suficientemente grande de nveis de amplitude distintos.

2.3.2 Armazenamento
Foi visto anteriormente que uma imagem digital uma funo discreta
bidimensional e cada ponto (x,y) da funo denominado pixel. Os possveis valores
f(x,y) de cada pixel, depende do nmero de componentes da imagem e do nmero de
bits usados para representar cada componente, em geral cada componente quantizada
com 8 bits/pixel.
Quando se refere a 8 bits/pixel, fala-se de 28 (256) possibilidades de valores
diferentes. Assim, se so 3 componentes, como as imagens coloridas no sistema RGB,
temos 28x2 8x2 8 = 2 24, totalizando mais de 16 milhes de cores possveis.
Uma imagem colorida no sistema RGB (24 bits/pixel) com resoluo 2392 x
1680 requer 12.055.680 bytes (11,5 Mbytes) para o seu armazenamento, no formato
original, ou seja, sem qualquer tipo de processamento.
O armazenamento digital para aplicaes em processamento de imagens pode
ser classificado em trs principais categorias:
I.

II.

III.

Armazenamento por curto tempo: utilizado durante o processamento, atravs do


uso de memria cache. Um outro modo se faz atravs de Frame Buffers, que so
memrias especializadas, as quais armazenam uma ou mais imagens e podem
ser acessados rapidamente, a taxas de vdeo (30 frames/second);
Armazenamento on-line: esse tipo de armazenamento caracterizado pelo
frequente acesso aos dados, devido a isto geralmente so usados disco rgidos
para armazenar a informao;
Armazenamento em arquivo: caracterizado pela necessidade de armazenamento
de grandes volumes de dados sem necessidade frequente de acesso. Discos
pticos so usuais para aplicaes de arquivamento.

2.3.3 Processamento
O processamento de imagens digitais envolve procedimentos que so geralmente
expressos em forma algortmica. Assim, com exceo da aquisio e visualizao de
imagens, a maioria das funes de processamento de imagens pode ser implementada

11

em software. A nica razo para se ter hardware especializado para processamento de


imagens, a necessidade de velocidade em algumas aplicaes ou para contornar
algumas limitaes fundamentais da computao.

2.3.4 Visualizao
Monitores so os principais dispositivos de visualizao usados em sistemas de
processamento de imagens. Atualmente existem diferentes tecnologias de monitores, as
mais usadas so as de tubos de raios catdicos (cathode ray tubes - CRTs) e tela de
cristal lquido (liquid crystal display - LCDs).
Os monitores CRT so compostos por um canho que gera um raio (ou feixe) de
eltrons. O ctodo, dentro do canho, gera um feixe de eltrons ao ser aquecido. Tal
feixe atinge a tela plana na outra extremidade do tubo, que revestida de fsforo e
brilha quando atingida pelo raio. Aumentando ou diminuindo a intensidade do feixe,
consegue-se controlar o brilho dos pontos de fsforo da tela para gerar a imagem.
Monitores de cristal lquido so leves e finos, inicialmente usados em laptops.
Nesta tecnologia, um lquido polarizador iluminado por trs e controlado usando-se
eletrodos sobre o cristal e luz polarizada de forma a deixar passar apenas as cores
desejadas. Como a luz atravessa o cristal, bloquear totalmente a mesma nem sempre
eficiente, devido a isto um dos problemas ao ser usar LCD que no se consegue um
preto absoluto.
Alm dos tipos supramencionados, monitores de LED (light emitting diod) e
OLED (organic light emitting diode) so outras tecnologias de exibio existente.
Monitores so alimentados pelas sadas de um mdulo de hardware conectado
no painel traseiro de um computador para exibio de imagens ou como parte do
hardware associado a um processador de imagens.
Outra forma de visualizao a reproduo em papel utilizando dispositivos de
impresso a jato de tinta e laser.

12

Captulo 3

Avaliaes subjetivas e objetivas de


qualidade visual
Nos ltimos anos houve um crescimento significativo de aplicaes em
processamento digital de imagens como meio de comunicao e representao da
informao. Como muitas dessas aplicaes so destinadas ao consumo humano,
importante que seus parmetros sejam otimizados a fim de intensificar a qualidade da
informao visual percebida pelos usurios finais. Neste contexto, a forma mais eficaz
de se determinar a qualidade visual atravs da avaliao subjetiva, onde so exibidas
imagens ou vdeos para um grupo de avaliadores que emitem julgamentos sobre a
qualidade do que est sendo exibido. Apesar de resultados satisfatrios, tal estratgia
demanda muito tempo alm de ser dispendioso. A fim de contornar tais problemas vm
sendo desenvolvidas mtricas de qualidade visual, que so expresses matemticas que
realizam uma avaliao automtica da qualidade visual.

3.1 Avaliao subjetiva


A avaliao subjetiva a forma mais eficaz de avaliar a qualidade da imagem.
Esse mtodo realizado atravs de experimentos onde os participantes emitem suas
opinies acerca da qualidade das imagens que so exibidas. Existem diversas formas de
realizao desses experimentos, como as descritas minuciosamente em (ITU-R BT.50011, 2002), (REVISION ITU-R BT.500-11, 2009) e (VIDEO QUALITY EXPERT
GROUP, 2004). O International Telecommunication Union (ITU) atravs do seu setor
de padronizao em telecomunicaes (ITU-T), prope formas para a execuo de
avaliaes subjetivas. As recomendaes vo do ambiente de execuo aos mtodos de
avaliao, que variam de acordo com a finalidade do experimento.
A priori tais mtodos so aplicados a avaliaes da qualidade de vdeos, porm
podem ser tambm aplicados na avaliao da qualidade de imagens.

13

3.1.1 Single Stimulus


Nos mtodos subjetivos de single stimulus (estmulo nico), uma nica image m
apresentada ao avaliador. As imagens utilizadas no experimento podem ser compostas
somente pelas imagens de teste ou podem incluir tanto as imagens de teste (imagens
degradadas) quanto quanto as imagens de referncia (imagens sem degradao)
correspondentes. A incluso das imagens sem degradao no experimento permite, o
clculo de uma diferena de pontuao (difference score), que definida como a
diferena entre a avaliao de uma imagem de referncia e a avaliao de sua image m
de teste (REVISION ITU-R BT.500-11, 2009).

3.1.2 Double Stimulus Continuous Quality Score


(DSCQS)
No DSCQS as imagens so apresentadas aos pares sendo uma sem degradao e
a outra degradada, exibidas de forma aleatria, ou seja, o avaliador no sabe
antecipadamente qual das imagens de referncia e nem a de teste, devendo avaliar
ambas.
As avaliaes so emitidas atravs de uma escala contnua, figura 3.1, e
dependendo da nota dada pelo participante, a imagem avaliada em uma das cinco
classes seguintes: Ruim 0-19, Baixa 20-39, Regular 40-59, Bom 60-79,
Excelente 80-100.

Figura 3.1: Escala de avaliao DSCQS.

14

3.1.3 Double Stimulus Impairment Scale (DSIS)


Neste mtodo, imagens so apresentadas aos pares, porm diferente do DSCQS
a primeira imagem do par a imagem de referncia e a segunda uma imagem de teste.
Logo, de acordo com a intensidade da degradao, o observador avaliar a qualidade da
segunda imagem com base na qualidade da primeira que foi apresentada.
Aps tirar suas concluses, o avaliador deve dar uma nota para a qualidade da
segunda imagem baseado nos critrios da escala exibida na Tabela 3.1.
No DSIS, para a avaliao de qualidade de imagens, no h necessidade do par
ser exibido duas vezes.

Tabela 3.1: Faixa de valores da nota dada qualidade da imagem degradada de acordo
com a intensidade da degradao presente na imagem em comparao a com a image m
de referncia para o DSIS
Nota
5
4
3
2
1

Intensidade da Degradao
Imperceptvel
Perceptvel, mas no importuno
Levemente importuno
Importuno
Muito importuno

3.2 Avaliao Objetiva


A avaliao objetiva feita atravs de mtricas de qualidade visual, que so
modelos matemticos que automatizam a avaliao das imagens. Para que tenha m
utilidades, as medidas numricas de qualidade que um algoritmo fornece precisam ser
correlacionadas com a percepo humana (WANG; BOVIC, 2006).
O uso de mtricas de qualidade visual resulta em uma economia considervel de
tempo e dinheiro. Porm, a grande desvantagem deste tipo de avaliao que ainda no
conseguem simular fielmente a percepo do sistema visual humano (SVH).
De fato, muitas medidas de qualidade de imagem tm sido propostas ao longo
das ltimas dcadas. Em geral, trs critrios podem ser usados para a classificao das
mtricas. O primeiro considera a quantidade de informao necessria para realizar as
avaliaes da imagem degradada, de acordo com esse critrio a mtrica pode ser
classificada em:

15

Referncia completa (full-reference): uma imagem de referncia necessria


para que se possa mensurar a qualidade da imagem de teste.
Sem referncia (no-reference): no h disponibilidade de uma imagem de
referncia para avaliar a imagem de teste.
Referncia reduzida (Reduced-reference): a avaliao da qualidade da image m
de teste feita a partir de algumas caractersticas (features) da imagem de
referncia.

O segundo critrio leva em considerao o propsito da mtrica, que pode ser de


propsito geral ou de propsito especfico. As mtricas de propsito geral so
projetadas para serem usadas em diversos tipos de aplicao. Apesar da flexibilidade de
uso, esse tipo de formulao tem um desempenho inferior s mtricas de propsito
especfico que so projetadas para avaliar uma aplicao particular. Para isto os
parmetros que compem a mtrica devem ser otimizados de acordo com o contexto
caracterstico da aplicao pretendida. Em contrapartida essa mtrica no ter um bom
desempenho em outras situaes.
J o terceiro critrio leva em conta a utilizao das caractersticas do SVH, neste
caso as mtricas podem ser perceptuais ou no perceptuais. As no perceptuais no
utilizam caractersticas do SVH nas suas formulaes e tem como virtude a baixa
complexidade computacional. Todavia apresentam baixa correlao com a qualidade
visual percebida quando comparadas com as mtricas perceptuais (ZAMPOLO;
AZEVEDO; SEARA, 2008). Com o crescimento do nmero de aplicaes destinadas
aos consumidores humanos, maior interesse tem havido em relao s mtricas
perceptuais. Essas so formulaes matemticas de certa complexidade inspiradas em
caractersticas fisiolgicas e psicovisuais da viso que mensuram de forma automtica a
qualidade da imagem, com expressiva correlao com a percepo humana.
Sero apresentadas a seguir as mtricas de qualidade utilizadas neste trabalho.
Primeiro so expostas as mtricas no perceptuais e depois as perceptuais.

3.2.1 Razo Sinal-Rudo (Signal-to-Noise Ratio - SNR)


A SNR uma mtrica bastante conhecida, e contabiliza o quanto um sinal foi
corrompido, atravs do clculo da energia da diferena entre a imagem de referncia e a
imagem de teste.
A SNR em dB definida como

SNR = 10

(3.1)

onde X[i,j] representa o sinal de referncia e Y[i,j] representa o sinal de teste.

16

3.2.2 Razo Sinal-Rudo de Pico (Peak Signal-to-NoiseRatio - PSNR)


Tambm bastante conhecida em processamento de imagens, a PSNR
comumente utilizada para medir a qualidade da reconstruo da imagem ou vdeo aps
uma compresso com perdas.
A PSNR em dB definida como

PSNR = 10

(3.2)

onde X[i,j] representa o sinal de referncia, Y[i,j] representa o sinal de teste, N


representa o nmero total de pixels da imagem e K representa o valor mximo que um
bit pode atingir. No caso de uma imagem de 8 bits/pixel o valor de K 255.

3.2.3 Mtricas propostas


Para o trabalho foram propostas duas mtricas no-perceptuais e de referncia
completa:

a primeira a diferena absoluta entre covarincias (DACOV) e definida pela


seguinte expresso:
DACOV = |

(3.7)

onde,
a covarincia entre a imagem de referncia e a imagem teste;
covarincia entre a imagem de referncia e ela prpria.

a segunda a diferena absoluta entre coeficientes de correlao (DACC) e


definida pela seguinte expresso:
DACC = | (X,Y) (X,X) |

(3.8)

17

onde, (X,Y) o Coeficiente de Correlao Pearson, ver pgina 29, entre a imagem
de referncia e a imagem teste; e (X,X) o Coeficiente de Correlao de Pearson
entre a imagem de referncia e ela prpria.

3.2.4 Entropia
Em PDI, entropia mede a aleatoriedade dos valores dos pixels que compe a
imagem, e definida como:

H(X) = -

(3.9)

onde, p(X[i,j]) a probabilidade do valor do pixel.


Diferente das mtricas apresentadas at agora, para o clculo da entropia no
necessria a imagem de referncia.

3.2.5 ndice de Similaridade Estrutural (Structural


Similarity Index - SSIM)
O ndice de Similaridade Estrutural (SSIM) avalia o quanto da estrutura da
imagem de teste diferencia da estrutura da imagem de referncia. Grande interesse em
pesquisas tem havido nesta mtrica, pois obtm bons resultados na representao da
qualidade percebida, bem como pela sua baixa complexidade computacional quando
comparada com outras tcnicas perceptuais.

A SSIM definida como


SSIM = [

(3.3)

onde, > 0, > 0 e > 0 so parmetros que ajustam a importncia relativa dos
componentes
,
e
, que so respectivamente as componentes de
luminncia , contraste e estrutura.

18

A seguir so definidas as componentes que compe o SSIM:


l(X,Y) =

(3.4)

c(X,Y) =

(3.5)

s(X,Y) =

(3.6)

onde
e
so respectivamente a mdia e o desvio padro da imagem X;
e
so
respectivamente a mdia e o desvio padro da imagem Y; e
a covarincia entre as
imagens X e Y. Os parmetros ,
e
so parmetros inclusos a fim de evitar
instabilidades quando os valores dos denominadores se aproximam de zero.
A SSIM foi desenvolvida atendendo s seguintes condies:
1. Simetria: SSIM(X,Y) = SSIM(Y,X);
2. Limitada: 0 SSIM 1;
3. Mximo nico: SSIM(X,Y) = 1, se e somente se, X=Y.

3.2.6 Critrio
de
Fidelidade
de
Informao
(Information Fidelity Criterion - IFC)
Nas ultimas dcadas vrios mtodos de referncia completa fora m
desenvolvidos. Tais mtodos na tentativa de alcanar a consistncia na predio da
qualidade, geralmente so baseados nas caractersticas fisiolgicas e psico-visuais do
SVH ou utilizam tcnicas de fidelidade arbitrrias, na esperana que as mesmas
correlacionem bem com a qualidade perceptual (SHEIK; BOVIC, 2006). Tambm h
mtodos que empregam caractersticas estatsticas de cenas naturais para modelar
qualidade perceptual.
Imagens do ambiente visual obtidas por dispositivos de captura de alta qualidade
e operando no espectro visual so classificadas como cenas naturais. Tais cenas
divergem estatisticamente de outras, como: textos, cenas grficas geradas por
computadores, animaes, rudos aleatrios, imagens capturadas por radares e
ultrassom, entre outros (SHEIK; BOVIC, 2006).
Pesquisadores acreditam que os estmulos visuais emitidos por cenas naturais
fizeram parte da evoluo do sistema visual humano, que ficou sensvel s variaes das
estatsticas que caracterizam esse tipo de imagem (SHEIK; BOVIC; VECIANA, 2005).

19

O Critrio de Fidelidade de Informao (Information Fidelity Criterion - IFC) parte


desse pressuposto, possibilitando a caracterizao das estatsticas das imagens naturais
no domnio wavelet atravs do uso de GSM (Gaussian Scale Mixture).
O IFC define a qualidade visual como sendo a informao mtua entre a image m
perfeita e a imagem distorcida, levando em conta todas as sub-bandas, da decomposio
wavelet, envolvidas no processo de anlise. As formulaes do IFC podem ser
encontrada com mais detalhes em (SHEIK; BOVIC; VECIANA, 2005).

3.2.7 Fidelidade de Informao


Information Fidelity - VIF)

Visual

(Visual

A mtrica Fidelidade de Informao Visual (visual information fidelity - VIF)


tambm baseada no mtodo de estatsticas de cenas naturais, sendo consideradas as
mesmas suposies e modelos propostos ao IFC, porm para a VIF a qualidade visual
definida como o quanto de informao pode ser retirado do sinal distorcido em relao
s informaes que podem se retiradas do sinal de referncia.
A abordagem mais detalhada do VIF pode ser encontrada em (SHEIK; BOVIC, 2005) e
(SHEIK; BOVIC, 2006). Foi elaborada, pelos autores da VIF original, uma verso de
menor complexidade computacional, denominada VIF no domnio de pixel (VIFp).

3.2.8 C4
A C4 uma mtrica perceptual de alta complexidade computacional, e isto pode
ser observado na figura 3.2, que mostra as etapas necessrias da C4 para a definio da
qualidade visual.
O processo completo possui oito estgios: normalizao da faixa de cores da
imagem; transformao dos valores RGB em luminncias utilizando correo gamma;
converso para o espao de cores perceptual de Krauskopf (ACr1Cr2); filtragem usando
a funo de sensibilidade ao contraste (Contrast Sensitivity Function CFS);
decomposio em canais perceptuais; Extrao de segmentos orientados com contraste
em diferentes resolues (caractersticas estruturais); transformao das caractersticas
extradas para uma representao sem variaes de rotao, translao e zoom; e o
armazenamento da representao invariante da estrutura da imagem no banco de dados
para a posterior comparao entre a representao da imagem original e a representao
da imagem degradada.
A implementao da C4 utilizada neste trabalho gera dois tipo de resultados. O
primeiro consiste em uma medida de similaridade estrutural (denominada C4sim) e o
segundo consiste em um mapeamento no-linear dessa para uma medida de qualidade
(quality score, chamada C4qs) (ZAMPOLO; AZEVEDO; SEARA, 2008).

20

Esta mtrica proposta em (CARNEC; CALLET; BARBA, 2003), onde ela


ratificada experimentalmente.

Figura 3.2: Diagrama da implementao do C4 (CARNEC; CALLET; BARBA, 2003).

21

Captulo 4
Procedimento Experimental
Neste trabalho realizado um experimento de avaliao subjetiva, que tem como
finalidade coletar avaliaes feitas pelos participantes do experimento no teste de
legibilidade.
A primeira etapa no desenvolvimento do experimento consistiu na definio do
contexto e da caracterizao do experimento. Assim sendo, foram escolhidos, dentre
outros parmetros, a resoluo das imagens, o nmero de caracteres por ngulo de
visualizao e a distncia mdia entre o avaliador e o dispositivo de visualizao
(monitor LCD).

4.1 Conjunto de teste


O prximo passo foi a concepo do conjunto de teste (base de imagens) que
seria utilizado nas avaliaes subjetivas. Devido ao objetivo do teste, j citado
anteriormente, a base de imagens formada por imagens com as seguintes
caractersticas:

Imagens composta por textos.


Textos das imagens formados por fontes, sem textos manuscritos.
Background na cor branca e sem texturas.

Inicialmente, so selecionadas imagens da base de referncia. Duas das imagens


originais escolhidas so apresentadas na Figura 4.1, ambas imagens foram digitalizadas
em escala de cinza (8 bits/pixel) a partir de (CALDERBANK; HOWARD; MORAN,
2003). Outras duas imagens, geradas por dizimao (fator 2:1) das primeiras,
completam o conjunto de quatro imagens originais.
A base de teste foi obtida dessas quatro imagens, mediante a imposio de
diversos tipos de degradao em variados nveis. Cada imagem original gerou cinco
imagens de teste diferentes (imagens degradadas) para cada tipo distoro. As
degradaes utilizadas neste experimento so resultantes de:

Compresso JPEG.
Compresso JPEG 2000 (J2K).

22

Filtragem passa-baixas gaussiana.


A figura 4.2 mostra exemplos da imagem original 2.

a) Imagem original 1

b) Imagem original 2

Figura 4.1: Duas das imagens originais usadas para gerar o conjunto de teste.

Utilizou-se o software MATLAB no processo de degradao das imagens,


devido sua praticidade na manipulao.
Com quatro imagens originais e cada tipo de degradao gerando cinco novas
verses da imagem, ao todo o banco de imagens totalizava 64 imagens.

23

a) Compresso JPEG.

b) Compresso JPEG 2000.

c) Passa-baixas gaussiano.
Figura 4.2: Imagens degradadas por a) Compresso JPEG, b) Compresso JPEG 2000 e
c) Filtragem passa-baixas gaussiana, derivadas da imagem original 2.

24

Com a finalidade de organizar a base, bem como facilitar a identificao das


imagens que a compem, tais imagens so identificadas pela imagem que as originou,
tipo de degradao usada e um nmero na faixa de 1 a 5 que corresponde intensidade
da degradao, sendo o nmero 1 atribudo menos degradada e 5 atribudo image m
mais degradada. No atribudo nmero s imagens originais. A tabela 4.1 apresenta os
elementos de identificao usados na organizao das imagens que compe o conjunto
de teste.

Tabela 4.1: Elementos de identificao das imagens e suas descries

Imagem original

Identificao
img1g
img2g
img1d
img2d

Degradao

Intensidade da degradao

Original
DCT
J2K
Gauss
1
2
3
4
5

Descrio
Imagem original 1
Imagem original 2
Imagem original dizimada 1 (gerada a partir
da original 1)
Imagem original dizimada 2 (gerada a partir
da original 2)

Sem degradao, imagem perfeita.


Degradao JPEG
Degradao JPEG 2000
Filtragem passa-baixas gaussiana
Rudo imperceptvel
Rudo perceptvel, mas no importuno
Rudo levemente importuno
Rudo importuno
Rudo muito importuno

A figura 4.3 apresenta um exemplo do padro de identificao das imagens


adotado neste trabalho, as imagens possuem degradao resultante de filtragem do tipo
passa-baixas gaussiana e so derivadas da imagem img1d_original.

a) img1d_gauss_1.

25

b) img1d_gauss_2.

c) img1d_gauss_3.

d) img1d_gauss_4.

e) img1d_gauss_5.

Figura 4.3: Identificao das imagens derivadas da imagem img1d_original com degradao
passa-baixas gaussiana, conforme a intensidade da distoro.

26

4.2 Implementao do sistema

Aps ser concebida a base de imagens, foi feita a implementao do software


para a automatizao do experimento subjetivo de legibilidade e da base de dados para o
armazenamento dos dados experimentais. Para o desenvolvimento do software utilizouse a linguagem de programao JAVA, pois esta linguagem de programao possui a
JDBC, que uma biblioteca de classes para acesso a banco de dados, que permite
conexo remota a servidores SQL que possuam driver OBDC ou compatvel. O sistema
gerenciador de banco de dados escolhido foi o MySQL, que no s possui driver
OBDC, mas tambm em termos de desempenho considerado um dos mais rpidos na
manipulao de dados.

4.3 Metodologia do teste

Para o experimento foi usada a metodologia de single-stimulus na qual as


imagens de referncia so avaliadas na mesma sesso experimental que as imagens de
teste.
Os experimentos de avaliao subjetiva foram realizados no Laboratrio de
Processamento de Sinais (LaPS) da Universidade Federal do Par. Utilizou-se nas
sesses alm do software desenvolvido em JAVA, monitores de LCD (Liquid Cristal
Display) de 17 polegadas, com resoluo de 1280 x 1024 pixels. Os testes fora m
realizados em um ambiente com nveis normais de iluminao interna e com distncia
mdia de 50 cm entre o avaliador e o monitor. Os avaliadores eram indivduos de ambos
os sexos com idade entre 19 e 33 anos, todos os participantes tinham pouca ou nenhuma
experincia em processamento de imagens.
Antes do teste, o avaliador submetido a uma etapa de aquecimento (warm up),
que tem por objetivo familiarizar o usurio com o experimento a ser realizado. Em tal
etapa, inicialmente apresentado um resumo sobre o objetivo do teste, em seguida so
apresentados exemplos de imagens que sero utilizadas. As imagens apresentadas no
warm up no faziam parte da base de imagem, porm possuam as mesmas
caractersticas. Isto pode ser observado na figura 4.4, que mostra um exemplo das
imagens utilizadas nesta etapa.
No incio do experimento, o avaliador deve preencher o formulrio de cadastro
do software, onde so requisitados: nome, e-mail, data de nascimento e experincia em
processamento digital de imagens. Durante o experimento as 64 imagens so exibidas
de forma aleatria ao avaliador. Ao ser exibida a imagem, o participante deve emitir a

27

sua avaliao sobre a qualidade da legibilidade arrastando o slider na escala de


qualidade (quality scale) para a nota correspondente a qualidade percebida e depois
pressionar o boto "confirma", na tela do experimento (figura 4.5). A cada sesso todas
as imagens sero exibidas uma nica vez cada.

Figura 4.4: Imagem degradada com rudo sal e pimenta (salt and pepper), utilizada na etapa de
aquecimento.

A escala de qualidade dividida em cinco pores iguais, logo ao ser avaliada


com uma pontuao de qualidade (quality score) no intervalo de [0,100] a imagem ser
classificada em:
[ 80 , 100] - Excelente
[ 60 , 79] - Bom
[ 40 , 59] - Regular
[ 20 , 39] - Baixa
[ 0 , 19] - Ruim

28

A nota e a classe de cada imagem avaliada so armazenadas no banco de dados


para posterior anlise.

Figura 4.5: Tela do experimento de legibilidade.

O tempo mdio de execuo do experimento, incluindo o tempo da etapa de


aquecimento, em torno de 10 minutos, bem abaixo dos 30 minutos estabelecidos como
tempo mximo em recomendaes do ITU (ITU-R BT.500-11, 2002).

29

Captulo 5
Resultados
Em decorrncia de imperfeies do processo de aquisio dos dados, algumas
avaliaes podem apresentar-se contra-intuitivas ou destoantes. Essas avaliaes so
denominadas outliers e devem ser removidas antes da anlise de dados. Assumindo que
as notas dadas s imagens obedeciam a uma distribuio gaussiana, neste trabalho
considerado outlier toda avaliao fora da faixa 2 desvios padro da mdia das notas
dadas imagem. Por exemplo, as avaliaes da imagem img1d_J2K_2 tiveram mdia
de 47,7 e desvio padro de 18,8. Logo qualquer nota abaixo de 10 ou acima de 85
considerada um outlier, e por isso descartada na etapa de anlise de dados.
Para este trabalho so usados dois ndices estatsticos a fim de avaliar a
correlao dos dados adquiridos no experimento com os valores calculados pelas
mtricas de qualidade de imagem.

I.

Coeficiente de Correlao Linear de Pearson: o primeiro ndice o


Coeficiente de Correlao Linear de Pearson (CC) que mede o grau e a direo
da relao entre duas variveis. Quanto maior o grau de correlao entre as duas
variveis mais linear ser a relao entre elas. O CC retorna uma valor na faixa
de -1 a 1, onde:
a correlao igual a 1 significa uma correlao perfeita e positiva.

a correlao igual a -1 significa uma correlao perfeita e negativa.


a correlao igual a 0 significa que as variveis no depende m
linearmente uma da outra.

Quanto mais prximo de zero for o CC, mais fraca ser a correlao entre as
variveis. O CC calculado atravs da expresso:

(v,w) =

onde

so respectivamente as mdias de v(u) e w(u).

(5.1)

30

II.

Coeficiente de Correlao de Postos de Spearman (Spearman Rank Order


Correlation Coefficient - SROCC): o segundo ndice o Coeficiente de
Correlao de Postos de Spearman (Spearman Rank Order Correlation
Coefficient) que similar ao CC, porm se trata de um ndice de correlao noparamtrico que calcula a correlao dos postos das variveis, isto , avalia a
monotonicidade da relao entre as duas variveis. O SROCC calculado pela
expresso:

rs = 1-

(5.2)

onde d a diferena entre os postos dos valores das variveis e n o nmero de


postos.
Em geral os valores de SROCC so interpretados da seguinte forma:
0,9 | rs | 1 indica uma correlao muito forte.

0,7 | rs |< 0,9 indica uma correlao forte.


0,5 | rs |< 0,7 indica uma correlao moderada.

5.1 Caracterizao estatstica


As imagens utilizadas no experimento so avaliadas objetivamente pelas
mtricas de qualidade de imagem citadas no captulo 4. Os resultados das mtricas em
conjunto com os dados adquiridos na avaliao subjetiva, so avaliados estatisticamente
a fim de encontrar uma mtrica que seja representativa da legibilidade, para isso os
valores das mtricas precisam ser bem correlacionados com as pontuaes de qualidade
(quality score) emitidas pelos avaliadores.
Nas Tabelas 5.1 e 5.2, encontram-se os coeficientes de correlao entre os dados
brutos (raw data) e os valores das mtricas e MOS (Mean Opinion Score) e os valores
das mtricas. Entenda-se por dados brutos os dados obtidos no processo de aquisio
que no passaram por normalizaes ou outro tipo de processamento. O MOS a mdia
aritmtica dos dados brutos para cada imagem.

31

Os dados brutos podem ser submetidos a normalizaes, na tentativa de retirar


eventuais tendncias nas avaliaes feitas pelos usurios. Para este trabalho so feitas as
seguintes normalizaes:
I.

DMOS (Difference Mean Opinion Score): como mencionado anteriormente,


experimentos de single-stimulus possibilitam o clculo da diferena de
pontuao (difference score) da seguinte forma:

dij = q iref(j) - qij

(5.1)

onde q ij representa a qualidade atribuda pelo usurio i para a imagem j; q iref(j)


representa a qualidade atribuda pelo usurio i para a imagem de referncia da
imagem distorcida j. O DMOS da imagem j portanto, definida como a mdia
aritmtica das diferenas de pontuao da imagem:

DMOSj =

II.

(5.2)

ROS (Ratio Opinion Score) : a ROS calculada pela seguinte expresso:

rij =

(5.3)

onde, qij representa a qualidade emitida pelo usurio i para a imagem j; q iref(j)
representa a qualidade emitida pelo usurio i para a imagem de referncia
correspondente imagem distorcida j. Tambm foi calculada para cada image m
a RMOS (Ratio Mean Opnion Score), que a mdia aritmtica das ROS da
imagem:

RMOS j =

III.

(5.4)

Classes: a normalizao por classes parte do princpio que o avaliador no


consegue efetivamente emitir sua percepo da legibilidade com uma pontuao.
Por exemplo, um avaliador no consegue discernir de forma lgica entre uma
qualidade 97 e uma qualidade 98, contudo ele consegue perceber que a

32

qualidade da imagem excelente. A normalizao ocorre substituindo as


qualidades emitidas por ndices referentes s classes as quais a imagem foi
avaliada, sendo:

o ndice 1 referente a classe RUIM;


ndice 2 referente a classe BAIXA;
ndice 3 referente a classe REGULAR;
ndice 4 referente a classe BOM;
e o ndice 5 referente a classe EXCELENTE.

E ainda foi encontrada para cada imagem a MClasses (Mode Classes),


que corresponde a moda estatstica dos ndices da imagem. Para esta
normalizao no necessria a excluso dos outliers, visto que as amostras que
estiverem destoando das demais, sero automaticamente descartadas ao
encontrar a moda das amostras.

A partir dos resultados apresentados nas Tabelas 5.1 - 5.8 observa-se que as
mtricas perceptuais, ver pgina 15, obtiveram melhor consistncia e em geral tiveram
desempenho melhor que as no perceptuais, com exceo da Entropia.

Tabela 5.1: Coeficientes de correlao de Pearson e Spearman entre mtricas e dados


brutos
CC

SROCC

SNR

0,6223

0,6420

PSNR

0,6221

0,6433

DACOV

-0,6157

-0,6738

DACC

-0,5217

-0,6567

Entropia

-0,7729

-0,7906

SSIM

0,6773

0,7233

VIF

0,7262

0,7494

VIFp

0,7391

0,7412

IFC

0,6826

0,7402

C4qs

0,7831

0,7844

C4sim

0,8004

0,7941

33

Tabela 5.2: Coeficientes de correlao de Pearson e Spearman entre mtricas e MOS


CC

SROCC

SNR

0,6751

0,6932

PSNR

0,6747

0,6951

DACOV

-0,6692

-0,7297

DACC

-0,5665

-0,7083

Entropia

-0,8363

-0,8546

SSIM

0,7344

0,7788

VIF

0,7852

0,8102

VIFp

0,7996

0,8005

IFC

0,7397

0,8007

C4qs

0,8447

0,8416

C4sim

0,8648

0,8573

Tabela 5.3: Coeficientes de correlao de Pearson e Spearman entre mtricas e DOS


(diferena de pontuao de opinio)
CC

SROCC

SNR

-0,5954

-0,6203

PSNR

-0,5953

-0,6217

DACOV
DACC

0,6047
0,5080

0,6560
0,6342

Entropia

0,7322

0,7472

SSIM

-0,6433

-0,6870

VIF
VIFp

-0,7085
-0,7363

-0,7378
-0,7378

IFC

-0,6756

-0,7423

C4qs

-0,7411

-0,7596

C4sim

-0,7693

-0,7637

34

Tabela 5.4: Coeficientes de correlao de Pearson e Spearman entre mtricas versus


DMOS
CC

SROCC

SNR

-0,6615

-0,6861

PSNR

-0,6614

-0,6880

DACOV

0,6738

0,7284

DACC

0,5670

0,7017

Entropia

0,8139

0,8299

SSIM

-0,7176

-0,7604

VIF

-0,7868

-0,8178

VIFp

-0,8182

-0,8178

IFC

-0,7496

-0,8237

C4qs

-0,8242

-0,8393

C4sim

-0,8551

-0,8493

Tabela 5.5: Coeficientes de correlao de Pearson e Spearman entre mtricas versus


ROS
CC

SROCC

SNR

0,6157

0,6432

PSNR

0,6155

0,6444

DACOV

-0,6169

-0,6776

DACC

-0,5185

-0,6560

Entropia

-0,7495

-0,7687

SSIM

0,6700

0,7181

VIF

0,7277

0,7553

VIFp

0,7470

0,7553

IFC

0,6907

0,7536

C4qs

0,7702

0,7819

C4sim

0,7924

0,7892

35

A mtrica C4 alcanou resultados expressivos para todos os casos apresentados


neste trabalho e isto pode ser observado principalmente na Tabela 5.6 onde a C4sim
obteve uma correlao de 0,8835 e 0,8905 para CC e SROCC, respectivamente.
Consequentemente, esta mtrica fornece uma boa caracterizao da qualidade da
legibilidade. A figura 5.1 ilustra o grfico de disperso entre C4sim versus RMOS e
PSNR versus RMOS, ressaltando que esta ultima teve a menor correlao para o caso.

a) CC: 0,8835 SROCC: 0,8905

b) CC: 0,6892 SROCC: 0,7519


Figura 5.1: Grfico de disperso entre a) RMOS versus C4sim e b) RMOS versus PSNR

36

Tabela 5.6: Coeficiente de correlao de Pearson e Spearman entre mtricas versus


RMOS
CC

SROCC

SNR

0,6894

0,7499

PSNR

0,6892

0,7519

DACOV

-0,7232

-0,7809

DACC

-0,6318

-0,7625

Entropia

-0,8121

-0,8289

SSIM

0,7767

0,8243

VIF

0,7987

0,8486

VIFp

0,8330

0,8429

IFC

0,7502

0,8440

C4qs

0,8385

0,8729

C4sim

0,8835

0,8905

Dentre as mtricas no perceptuais, a Entropia teve o melhor desempenho. Este


resultado chama ateno, visto que a formulao uma mtrica sem referncia.
Inclusive seus resultados sugerem uma caracterizao da legibilidade superior a
mtricas perceptuais como SSIM, IFC e VIF.
Curiosamente as mtricas SSIM e IFC, apesar de serem concebidas sob
parmetros perceptuais, no fornecem boa caracterizao, alcanando correlaes
moderadas como pode ser visto nas Tabelas 5.1, 5.3 e 5.5 alcanaram somente
correlaes moderadas.
Outro resultado interessante sucede da comparao entre o VIF e o VIFp. Os
resultados apresentados nas Tabelas 5.3, 5.4, 5.5 e 5.7 indicam que esta ltima apresenta
uma melhor estimativa da qualidade percebida. Isto interessante, visto que a VIFp
uma aproximao de menor complexidade computacional da VIF original.
Na tabela 5.8 observa-se que a mtrica C4qs obteve um CC muito prximo ao da
C4sim com uma pequena vantagem para a primeira mtrica, porm tanto para a
normalizao classes quanto para a MClasses o ndice de maior relevncia para avaliar
o desempenho mtrica o SROCC, e para este a C4sim conseguiu melhores resultados.

37

Tabela 5.7: Coeficiente de correlao de Pearson e Spearman entre mtricas e Classes

CC

SROCC

SNR

0,6094

0,6288

PSNR

0,6091

0,6300

DACOV

-0,5985

-0,6602

DACC

-0,5081

-0,6431

Entropia

-0,7586

-0,7757

SSIM

0,6642

0,7111

VIF

0,7155

0,7339

VIFp

0,7240

0,7240

IFC

0,6718

0,7238

C4qs

0,7770

0,7781

C4sim

0,7852

0,7783

Tabela 5.8: Coeficiente de correlao de Pearson e Spearman entre mtricas e


MClasses

CC

SROCC

SNR

0,6646

0,6926

PSNR

0,6642

0,6943

DACOV

-0,6498

-0,7287

DACC

-0,5572

-0,7070

Entropia

-0,8022

-0,8208

SSIM

0,7304

0,7860

VIF

0,7789

0,8039

VIFp

0,7807

0,7924

IFC

0,7293

0,7978

C4qs

0,8552

0,8479

C4sim

0,8533

0,8507

38

Analisando os resultados finais nas Tabelas 5.1 - 5.8 verifica-se o bom


desempenho das mtricas C4, VIF, VIFp e Entropia, pois para todos os casos tiveram
fortes correlaes. Entretanto, isso no significa que tais mtricas tenham res ultados to
consistentes para cada tipo de degradao em particular ou que uma mtrica que no
teve uma boa caracterizao no geral, no tenha uma boa representatividade para uma
determinada degradao. Neste sentido, importante avaliar a correlao para cada tipo
de degradao.
As correlaes feitas para cada degradao e para cada circunstncia j
mencionada so encontradas nas Tabelas 5.9 - 5.16. Nota-se uma maior proximidade
dos valores dos coeficientes das mtricas perceptuais e no-perceptuais.

Tabela 5.9: Coeficientes de correlao por degradao entre mtricas e dados brutos
JPEG

JPEG 2000

Gauss

CC

SROCC

CC

SROCC

CC

SROCC

SNR

0,6713

0,6776

0,8901

0,8868

0,8523

0,9130

PSNR

0,6696

0,6777

0,8902

0,8868

0,8508

0,9061

DACOV

-0,6560

-0,6076

-0,8462

-0,8712

-0,7887

-0,7630

DACC

-0,7848

-0,7159

-0,8512

-0,9100

-0,8814

-0,9158

Entropia

-0,2057

-0,2156

-0,8693

-0,9021

-0,9124

-0,9187

SSIM

0,7759

0,7103

0,8952

0,9090

0,8300

0,7938

IFC

0,5595

0,5536

0,8874

0,8668

0,7663

0,8502

VIF

0,6578

0,6593

0,9029

0,8867

0,7793

0,8857

VIFp

0,6930

0,6386

0,9026

0,8700

0,8133

0,8285

C4qs

0,7708

0,7217

0,8614

0,8276

0,7001

0,6622

C4sim

0,7744

0,7217

0,9091

0,9058

0,8956

0,9211

possvel conferir nos resultados das tabelas 5.9 5.16 que todas as mtricas
utilizadas geram boas estimativas para a codificao JPEG 2000. Para a degradao
passa-baixas gaussiana somente a C4qs no obteve bons resultados, como pode ser visto
nas Tabelas 5.11, 5.13 e 5.15 onde a mtrica alcanou somente correlaes moderadas.

39

Tabela 5.10: Coeficientes de correlao por degradao entre mtricas e MOS


JPEG

JPEG 2000

Gauss

CC

SROCC

CC

SROCC

CC

SROCC

SNR

0,7902

0,8251

0,9457

0,9609

0,9250

0,9850

PSNR

0,7877

0,8251

0,9458

0,9609

0,9235

0,9820

DACOV

-0,7749

-0,7319

-0,8957

-0,9459

-0,8580

-0,8511

DACC

-0,9283

-0,8763

-0,9038

-0,9759

-0,9561

-0,9898

Entropia

-0,2478

-0,2693

-0,9247

-0,9549

-0,9874

-0,9895

SSIM

0,9172

0,8703

0,9498

0,9759

0,8994

0,8316

IFC

0,6596

0,6905

0,9427

0,9338

0,8361

0,9218

VIF

0,7746

0,8149

0,9585

0,9594

0,8491

0,9594

VIFp

0,8149

0,7890

0,9582

0,9459

0,8857

0,8913

C4qs

0,9082

0,8891

0,9146

0,8622

0,7635

0,6969

C4sim

0,9129

0,8891

0,9665

0,9744

0,9712

0,9910

Em geral as correlaes para a codificao JPEG foram mais fracas do que para
as demais degradaes. Porm, um fato que chamou ateno foram os resultados da
Entropia que aponta fraca correlao para a codificao em todos os casos, chegando a
apresentar coeficientes prximos de zero nas Tabelas 5.11, 5.12 e 5.13. A figura 5.2
ilustra o grfico de disperso entre Entropia versus DMOS, onde possvel observar a
fraca relao de linearidade.

CC: 0,0690

SROCC: 0,0917

Figura 5.2: Grfico de disperso entre Entropia versus DMOS.

40

Tabela 5.11: Coeficientes de correlao por degradao entre mtricas e DOS


JPEG

JPEG 2000

Gauss

CC

SROCC

CC

SROCC

CC

SROCC

SNR

-0,5937

-0,6076

-0,8431

-0,8282

-0,8062

-0,8619

PSNR

-0,5921

-0,6076

-0,8434

-0,8282

-0,8057

-0,8561

DACOV

0,5805

0,5531

0,8265

0,8248

0,7514

0,7245

DACC

0,7148

0,6431

0,8315

0,8516

0,8335

0,8595

Entropia

0,0542

0,0729

0,8179

0,8423

0,8627

0,8608

SSIM

-0,6835

-0,6223

-0,8601

-0,8372

-0,7494

-0,6913

IFC

-0,5901

-0,5982

-0,8548

-0,8565

-0,7432

-0,8456

VIF

-0,6390

-0,6515

-0,8682

-0,8510

-0,7481

-0,8601

VIFp

-0,6829

-0,6268

-0,8876

-0,8512

-0,8078

-0,8289

C4qs

-0,6768

-0,6370

-0,8155

-0,7953

-0,6568

-0,6486

C4sim

-0,6783

-0,6370

-0,8670

-0,8468

-0,8596

-0,8750

Tabela 5.12: Coeficientes de correlao por degradao entre mtricas e DMOS


JPEG

JPEG 2000

Gauss

CC

SROCC

CC

SROCC

CC

SROCC

SNR

-0,7559

-0,8075

-0,9193

-0,9113

-0,9020

-0,9504

PSNR

-0,7539

-0,8075

-0,9196

-0,9113

-0,9015

-0,9474

DACOV

0,7391

0,7353

0,9017

0,9128

0,8422

0,8000

DACC

0,9121

0,8571

0,9072

0,9414

0,9325

0,9455

Entropia

0,0690

0,0917

0,8923

0,9308

0,9649

0,9474

SSIM

-0,8721

-0,8256

-0,9384

-0,9248

-0,8396

-0,7368

IFC

-0,7535

-0,8015

-0,9325

-0,9459

-0,8331

-0,9474

VIF

-0,8147

-0,8725

-0,9467

-0,9383

-0,8385

-0,9519

VIFp

-0,8714

-0,8421

-0,9674

-0,9429

-0,9046

-0,9214

C4qs

-0,8631

-0,8511

-0,8924

-0,8622

-0,7380

-0,6883

C4sim

-0,8647

-0,8511

-0,9462

-0,9429

-0,9617

-0,9714

41

Tabela 5.13: Coeficientes de correlao por degradao entre mtricas e ROS


JPEG

JPEG 2000

Gauss

CC

SROCC

CC

SROCC

CC

SROCC

SNR

0,6221

0,6303

0,8791

0,8920

0,8339

0,9105

PSNR

0,6206

0,6303

0,8793

0,8920

0,8332

0,9049

DACOV

0,7222

0,6483

-0,8602

-0,8825

-0,7832

-0,7693

DACC

-0,7464

-0,6647

-0,8604

-0,9102

-0,8677

-0,9107

Entropia

-0,0964

-0,1079

-0,8537

-0,8997

-0,8974

-0,9113

SSIM

0,7222

0,6483

0,9005

0,9070

0,8071

0,7742

IFC

0,5900

0,5911

0,8848

0,8761

0,7701

0,8600

VIF

0,6513

0,6591

0,9003

0,8916

0,8071

0,7742

VIFp

0,6959

0,6360

0,9090

0,8769

0,8249

0,8414

C4qs

0,7130

0,6633

0,8572

0,8268

0,6837

0,6607

C4sim

0,7159

0,6633

0,9062

0,9052

0,8867

0,9172

Tabela 5.14: Coeficientes de correlao por degradao entre mtricas e RMOS


JPEG

JPEG 2000

Gauss

CC

SROCC

CC

SROCC

CC

SROCC

SNR

0,7787

0,8211

0,8585

0,8977

0,9087

0,9414

PSNR

0,7764

0,8211

0,8584

0,8977

0,9089

0,9383

DACOV

-0,7689

-0,7429

-0,8599

-0,8947

-0,8720

-0,8391

DACC

-0,9340

-0,8722

-0,8927

-0,9113

-0,9364

-0,9387

Entropia

-0,1583

-0,2000

-0,8566

-0,9173

-0,9545

-0,9338

SSIM

0,9059

0,8481

0,9401

0,9203

0,8619

0,7985

IFC

0,7286

0,7504

0,8575

0,8511

0,8476

0,9068

VIF

0,8071

0,8349

0,8842

0,8722

0,8541

0,9293

VIFp

0,8468

0,8060

0,9079

0,8586

0,9067

0,8838

C4qs

0,8939

0,8662

0,8565

0,8690

0,7569

0,6862

C4sim

0,8949

0,8662

0,9195

0,9308

0,9570

0,9429

42

A DACC conseguiu a melhor caracterizao para imagens com degradao


JPEG para as circunstncias apresentadas nas tabelas 5.9 - 5.14, j nos casos mostrados
nas tabelas 5.15 e 5.16 os melhores resultados foram obtidos pela C4sim e C4qs, pois
obtiveram melhor SROCC.

Tabela 5.15: Coeficientes de correlao por degradao entre mtricas e Classes


JPEG

JPEG 2000

Gauss

CC

SROCC

CC

SROCC

CC

SROCC

SNR

0,6428

0,6548

0,8858

0,8584

0,8296

0,8864

PSNR

0,6413

0,6549

0,8859

0,8584

0,8279

0,8772

DACOV

-0,6395

-0,5888

-0,8229

-0,8488

-0,7647

-0,7424

DACC

-0,7682

-0,6922

-0,8227

-0,8740

-0,8625

-0,8940

Entropia

-0,1883

-0,1952

-0,8632

-0,8700

-0,8919

-0,8951

SSIM

0,7546

0,6844

0,8747

0,8748

0,8215

0,7991

IFC

0,5524

0,5496

0,8836

0,8353

0,7484

0,8181

VIF

0,6399

0,6436

0,898

0,8516

0,7619

0,8589

VIFp

0,6774

0,6241

0,8874

0,8379

0,7872

0,7914

C4qs

0,7473

0,6973

0,8648

0,8490

0,6851

0,6568

C4sim

0,7487

0,6973

0,8999

0,8691

0,8751

0,8929

43

Tabela 5.16: Coeficientes de correlao por degradao entre mtricas e MClasses


JPEG

JPEG 2000

Gauss

CC

SROCC

CC

SROCC

CC

SROCC

SNR

0,7709

0,8129

0,9447

0,9239

0,9027

0,9468

PSNR

0,7690

0,8129

0,9447

0,9239

0,9011

0,9374

DACOV

-0,8075

-0,7504

-0,8721

-0,9137

-0,8475

-0,8041

DACC

-0,9242

-0,8402

-0,8751

-0,9546

-0,9466

-0,9550

Entropia

-0,2938

-0,3069

-0,9207

-0,9546

-0,9593

-0,9593

SSIM

0,9111

0,8402

0,9348

0,9546

0,9217

0,8700

IFC

0,6227

0,6232

0,9540

0,9137

0,8511

0,8762

VIF

0,7422

0,7687

0,9673

0,9137

0,8609

0,9139

VIFp

0,7890

0,7582

0,9600

0,9137

0,8647

0,8452

C4qs

0,9116

0,8676

0,9319

0,8871

0,7784

0,7175

C4sim

0,9082

0,8676

0,9645

0,9483

0,9584

0,9499

44

Captulo 6
Concluso

Neste trabalho foi apresentado um estudo sobre a avaliao do desempenho de


onze mtricas de qualidade visual empregadas na caracterizao da legibilidade. O
estudo envolveu 60 imagens degradadas derivadas de quatro imagens originais usando a
codificao JPEG, JPEG 2000 e filtragem passa-baixas Gaussiana. O banco de imagens
era formado por imagens de textos digitalizados. Os dados obtidos na etapa de aquisio
foram submetidos s normalizaes DOS, DMOS, ROS, RMOS, Classes e MClasses. O
critrio utilizado para a avaliao das mtricas mais adequadas foram os coeficientes de
Pearson e Spearman aplicados entre os dados experimentais e os valores das mtricas.
Em geral, as mtricas perceptuais tiveram melhor desempenho do que as mtricas noperceptuais com exceo Entropia. Esta, apesar de ser uma mtrica no-perceptual e
sem referncia, obteve uma boa caracterizao do banco de imagens, alcanando
correlaes de CC: -0,8364 e SROCC: -0,8546. Inclusive seus resultados sugerem uma
caracterizao da legibilidade superior a mtricas perceptuais como SSIM, IFC e VIF.
Curiosamente, as mtricas SSIM e IFC, apesar de serem concebidas sob parmetros
perceptuais, no apresentaram consistncia compatvel, em algumas situaes suas
correlaes foram moderadas. Uma ateno especial deve ser dada a mtrica C4sim que
teve a melhor caracterizao da legibilidade, segundo as condies do experimento .
Tambm foi feita a anlise do desempenho das mtricas para cada degradao em
particular, onde todas apresentaram representatividade satisfatria para a codificao
JPEG 2000. Para a degradao passa-baixas gaussiana somente a C4qs no conseguiu
bons resultados em todas as condies. No caso da JPEG, a Entropia se mostrou
inadequada, pois obteve correlaes baixas em todos os casos, chegando prximo a zero
em alguns deles. J a DACC alcanou os melhores resultados para a codificao em
algumas circustncias, nos casos das normalizaes Classes e MClasses C4sim e C4qs
tiveram melhor desempenho.
Como proposta para trabalhos futuros, pretende-se ampliar a robustez do
conjunto de teste agregando imagens com diferentes tipos de fontes, diferentes
tamanhos da fonte e tambm aumentar o nmero de degradaes utilizadas nas imagens.

45

Referncias

R. Calderbank, S. D. Howard, and B. Moran, "Waveform Diversity in Radar Signal


Processing", IEEE Signal Processing Magazine, pp. 33-41, January 2009.
S. Boslaugh and P. A. Watters, Statistics in a nutshell, O'Reilly Media, 2008.
M. Carnec, P. L. Callet, and D. Barba, An image quality assessment method based on
perception of structural information, in Proc. IEEE Int. Conf. Image Processing, vol. 3,
Barcelona, Spain, Sept. 2003, pp. 185188.
A. B. H. Ferreira, "Dicionrio Aurlio", Nova Fronteira, 2000.
R.C. Gonzales e R.E. Woods, Processamento digital de imagens, Edgar Blucher, 2000
S. Haykin e B. V. Veen, Sinais e Sistemas, Bookman, 2001

ITU-R Recommendation BT.500-11, "Methodology for the Subjective Assessment for


the Television Pictures", Int. Telecomm. Union, Geneva, Switzerland, 2002.
B. W. Keelan, Handbook of Image Quality, Marcel Dekker, 2002.
F. C. Pereira. Breve Introduo Tomografia Computadorizada. Disponvel em:
<http://f_crepaldi.sites.uol.com.br/port/Pesquisa/Doutorado/tese-html/ect_intro.html>.
Visitado em: 6 de outubro de 2010.

A. Querido, "Aplicaes e formas de mdia digital", 2010, Disponvel em:


<http://www.digitalsignagebrasil.com/2010/04/07/as-aplicacoes-e-formas-de-midiadigital/>, Visitado em : 09 de dezembro de 2010.
Revision ITU-R Recommendation BT.500-11, "Methodology for the Subjective
Assessment for the Television Pictures", Int. Telecomm. Union, Geneva, Switzerland,
2009.
A. E. Scuri, Fundamentos da imagem digital, PUC, 2002

46

H. R. Sheikh and A. C. Bovik, A visual information fidelity approach to video quality


assessment, First International Workshop on Video Processing and Quality Metrics for
Conusmer Electronics, Jan. 2005.
H. Sheikh, A. Bovik, and G. de Veciana, An information fidelity criterion for image
quality assessment using natural scene statistics, IEEE Transactions on Image
Processing, vol. 14, no. 12, pp. 21172128, Dec. 2005.
H. Sheikh and A. Bovik, Image information and visual quality IEEE Transactions on
Image Processing, vol. 15, no. 2, pp. 430444, Feb. 2006.
H. R. Sheikh and A. C. Bovik, A Statistical Evaluation of Recent Full Reference
Image Quality Assessment Algorithms, IEEE Transactions On Image Processing, vol.
15, no. 11, November 2006.
Video Quality Expert Group, "Object perceptual assessment of video quality: full
reference television", Int. Telecomm. Union, Geneva, Switzerland, 2004.
Z. Wang e A. C. Bovic, Modern Image Quality Assessment, M&C, 2006

Z. Wang, A. C. Bovik, H. R. Sheikh, and E. P. Simoncelli, "Image quality assessment:


From error visibility to structural similarity", IEEE Transactions on Image Processing,
vol. 13, no. 4, pp. 600612, Apr. 2004.
A. B. Watson and A. E. Fitzhugh, " Modelling character legibility ", Society for
Information Display Digest of Technical Papers, vol. 20, pp. 360-363, 1989.
R.F. Zampolo, D. G. Azevedo e R. Seara, "Avaliao e comparao de mtricas de
referncia completa na caracterizao de limiares de deteco de imagens", XXVI
Simpsio Brasileiro de Telecomunicaes, Rio de Janeiro, art. 42803, Setembro de
2008.
H. Zhou, J. Wu e J. Zhang, Digital image processing part 1, Ventus Publishing, 2010.

Vous aimerez peut-être aussi