Académique Documents
Professionnel Documents
Culture Documents
BELM - PAR
2010
BELM - PAR
2010
ii
___________________________________________
Prof. Ronaldo de Freitas Zampolo (Orientador)
Faculdade de Engenharia da Computao
Universidade Federal do Par
___________________________________________
Prof. Eurpedes Pinheiro dos Santos (Membro da banca)
Faculdade de Engenharia da Computao
Universidade Federal do Par
___________________________________________
Prof. Evaldo Gonalves Pelaes (Membro da banca)
Faculdade de Engenharia da Computao
Universidade Federal do Par
___________________________________________
Prof. Aldebaro Barreto da Rocha Klautau Jnior
Diretor da Faculdade de Engenharia da Computao
Universidade Federal do Par
iii
"Grandes realizaes no so
feitas por impulso, mas por uma
soma de pequenas realizaes."
(Vincent Van Gogh)
iv
Agradecimentos
Agradeo primeiramente a Deus por sempre me ajudar de forma indireta nos
momentos difceis.
minha me Maria Eufrasia, que desde o incio da jornada batalhou muito para
me propiciar boa educao e estudo.
s minhas tias Brasilina Santos e Maria Santana, por todo apoio dado.
Ao meu orientador Ronaldo Zampolo, por toda sua ajuda e por confiar no
trabalho que eu poderia desenvolver.
minha namorada Priscila, pela pacincia, carinho e apoio dado nesta etapa.
Aos meus primos Luiz e Solange, pelos conselhos e pelo companheirismo.
A todos os integrantes do LaPS que me propiciaram um bom ambiente de
trabalho e imensa ajuda nos experimentos.
A todos que participaram do experimento subjetivo pela sua voluntariedade,
pacincia e contribuio.
Meus sinceros agradecimentos.
vi
Sumrio
Dedicatria
iv
Agradecimentos
Sumrio
vi
Lista de Figuras
viii
Lista de Tabelas
ix
Lista de Acrnimos
xi
Resumo
xiii
Abstract
xiv
1 Introduo .....................................................................................................................1
1.1 Objetivo....................................................................................................................2
1.2 Organizao do trabalho ..........................................................................................3
2 Processamento Digital de Imagens..............................................................................4
2.1 Histrico e aplicaes ..............................................................................................4
2.2 Representao de imagens digitais ..........................................................................6
2.3 Componentes de um sistema de processamento de imagens ...................................7
2.3.1 Aquisio...........................................................................................................8
2.3.2 Armazenamento ..............................................................................................10
2.3.3 Processamento .................................................................................................10
2.3.4 Visualizao ....................................................................................................11
3 Avaliaes subjetivas e objetivas de qualidade visual .............................................12
3.1 Avaliao subjetiva ................................................................................................12
3.1.1 Single Stimulus ...............................................................................................13
vii
Referncias.....................................................................................................................45
viii
Lista de Figuras
2.1
2.2
2.3
2.4
2.5
2.6
2.7
3.1
3.2
Diagrama da implementao do C4
2003)...............................................................19
4.1
4.2
4.3
4.4
Imagem degradada com rudo sal e pimenta (salt and pepper), utilizada na etapa
de aquecimento....................................................................................................27
4.5
5.1
5.2
ix
Lista de Tabelas
3.1
4.1
5.1
5.2
5.3
5.4
5.5
5.6
5.7
5.8
5.9
5.10
Coeficientes
de
correlao
por
degradao
entre
mtricas
e
MOS.....................................................................................................................39
5.11
Coeficientes
de
correlao
por
degradao
entre
mtricas
e
DOS.....................................................................................................................40
5.12
Coeficientes
de
correlao
por
degradao
entre
mtricas
e
DMOS..................................................................................................................40
5.13
Coeficientes
de
correlao
por
degradao
entre
mtricas
e
ROS......................................................................................................................41
5.14
Coeficientes
de
correlao
por
degradao
entre
mtricas
e
RMOS..................................................................................................................41
5.15
Coeficientes
de
correlao
por
degradao
entre
mtricas
e
Classes.................................................................................................................42
5.16
Coeficientes
de
correlao
por
degradao
entre
mtricas
e
MClasses..............................................................................................................43
xi
Lista de Acrnimos
CC: Coeficiente de Correlao Linear de Pearson
CRT: Tubo de Raios Catdicos (cathode ray tubes)
CSF: Funo de Sensibilidade ao Contraste (contrast sensitivity function)
DMOS: Mdia das Diferenas das Pontuaes de Opinio (Difference Mean Opinion
Score)
DOS: Diferena das Pontuaes de Opinio (Difference Opinion Score)
IEEE: Instituto de Engenheiros Eletricistas e Eletrnicos (Institute of Electrical and
Electronics Engineers)
IFC: Critrio de Fidelidade de Informao (information fidelity criterion)
ITU: Unio Internacional de Telecomunicaes (International Telecommunication
Union)
JDBC: Java Database Connectivity
LaPS: Laboratrio de Processamento de Sinais
LCD: Tela de Cristal Lquido (liquid crystal display)
LED: Diodo Emissor de Luz (light emitting diod)
MClasses: Moda das Classes (Mode Classes)
MOS: Mdia das Pontuaes de Opinio (Mean Opinion Score)
ODBC: Open Data Base Connectivity
OLED: Diodo Orgncio Emissor de Luz (organic light emitting diode)
PDI: Processamento Digital de Imagem
PSNR: Razo Sinal-Rudo de Pico (peak signal-to-noise ratio)
RMOS: Mdia das Razes de Pontuao (Ratio Mean Opinion Score)
ROS: Razo das Pontuaes de Opinio (Ratio Opinion Score)
SNR: Razo Sinal-Rudo (signal-to-noise ratio)
xii
xiii
Resumo
Neste trabalho apresentado um estudo sobre a consistncia de algumas
mtricas de qualidade visual aplicadas caracterizao da legibilidade de documentos
digitalizados. Para a avaliao subjetiva usado um conjunto teste composto por 64
imagens. Destas, 4 imagens constituem a base de referncia e as 60 imagens restantes
base de teste que apresenta degradaes do tipo JPEG, JPEG2000 e passa-baixas
gaussiana. A fim de automatizar o experimento foi desenvolvido um software em
linguagem de programao JAVA, que armazenava os dados coletados no banco de
dados Mysql. As mtricas usadas nas anlises so de referncia completa (SNR, PSNR,
DACOV, DACC, SSIM, IFC, VIF, VIFp e C4) e sem referncia (Entropia). Os
resultados exibidos mostram o desempenho de cada mtrica na caracterizao da
legibilidade segundo as condies do experimento.
xiv
Abstract
This work presents a study on the consistency of some visual quality metrics
applied to the characterization of the readability of scanned documents. For subjective
assessment we used a test set composed by 64 images. From this test set, 4 images
constitute the reference base and the 60 remaining constitute the test base, which are
degraded by JPEG, and JPEG 2000 coding as well as Gaussian low-pass filtering. In
order to automate the experiment, a software, developed with JAVA programming
language and MySQL, was implemented for collecting and storing subjective data. The
metrics used in the analysis are of full reference (SNR, PSNR, DACOV, DACC, SSIM,
IFC, VIF, VIFp e C4) and no reference types (Entropy). The results address
performance of each metric in the characterization of readability, regarding the adopted
experimental conditions.
Keywords: Metric comparison, characterization of readability, visual quality
Captulo 1
Introduo
A cada dia que passa a comunicao fica mais digital. Chega-se a essa concluso
quando se olha ao redor e encontra-se informaes nos mais diversos locais e das mais
diversas formas.
A forma de comunicao que mais cresce atualmente a mdia digital, que o
conjunto de veculos e aparelhos de comunicao baseados em tecnologia digital, os
quais possibilitam a distribuio ou comunicao digital das obras intelectuais escritas,
sonoras ou visuais.
Uma das aplicaes mais presentes no cotidiano consiste nas telas informativas
onde os contedos so exibidos em looping e comumente apresentam propagandas de
marcas ou produtos, notcias, cotaes, entre outros. Geralmente tais telas so
encontradas em shopping centers, aeroportos e academias.
Um fato interessante no uso desta tecnologia que ela auxilia de forma direta na
sustentabilidade ecolgica, pois substituem os antigos cartazes, outdoors e banners de
PDV, que so constitudos de papel e plstico, que depois de serem utilizados, so
muitas vezes descartados no meio ambiente.
Sobre as mdias digitais Avelino Querido comenta:
Nesta nova era de Comunicao Digital, alm da rapidez de substituio das
mensagens, economiza-se tempo e dinheiro, pois tudo feito de forma
virtual, com direito a movimento das imagens, efeitos digitais e som, quando
necessrio. E em funo das imagens serem dinmicas (com movimento) e
com brilho, so facilmente percebidas pelo sentido da viso dos
consumidores que acabam passando mais tempo em frente tela, prestando
ateno no contedo. Mas para que a ateno dos consumidores seja
arrebatada, esse contedo deve ser de alta qualidade, observando tambm o
tamanho das letras, tempo de leitura, contraste de cores e relevncia para o
pblico-alvo. Outro fator importante para o sucesso da midia digital o
posicionamento. As telas devem ser instaladas sempre em locais de grande
visibilidade e de preferncia na altura dos olhos dos consumidores.
(QUERIDO, 2010)
Outro ponto importante do uso de mdias digitais, a cada vez mais frequente
publicao de E-books (electronic books) pelas editoras. E-books so livros virtuais,
que dentre outras vantagens em relao a mdia impressa tm-se: rapidez e baixo custo
de publicao, isto acarreta uma diminuio no preo final da obra; O editor no corre
risco de encalhes de obras nas prateleiras e no necessita pagar di stribuidores; O
recebimento do livro pelo computador imediato e podem ser transmitidos rapidamente
para qualquer ponto do globo terrestre via Internet, sem necessidade de intermedirios,
como ocorre na obra impressa; facilidade de visualizao e interatividade com o texto
por intermdio do uso de leitores de E-books (E-book readers); e possibilita armazenar
inmeros textos no computador e transferi-los de um aparelho para o outro sem a
necessidade de descartar algum.
As aplicaes das mdias digitais citadas anteriormente so algumas dentre as
muitas destinadas ao consumo humano. Por isso, importante avaliar a qualidade da
imagem que ser percebida pelo usurio final e para isso a forma mais eficaz atravs
de avaliaes subjetivas de qualidade visual em que as pessoas emitem suas opinies
acerca da qualidade das imagens que lhes so apresentadas. Ainda que apresente
resultados satisfatrios, tal estratgia demanda muito tempo alm de ser dispendioso. A
fim de contornar tais problemas vm sendo desenvolvidas mtricas de qualidade visual,
que so expresses matemticas que realizam uma avaliao automtica da qualidade
visual.
A proposta deste trabalho assume importncia face quantidade crescente de
mdias digitais para a visualizao de textos, e se concentra em uma aplicao ainda
pouco explorada em avaliao de qualidade visual que possui consequncias
importantes em codificao e restaurao de imagens.
1.1 Objetivo
Este trabalho tem como objetivo encontrar uma mtrica de qualidade visual que
seja representativa da legibilidade. Dentre as vrias metas, tm-se:
a) a criao de uma base de imagens formada por documentos digitalizados. As
imagens de referncia so degradadas por codificao JPEG, JPEG 2000 e
filtragem passa-baixas gaussiana;
b) a implementao de um software para automatizar o experimento subjetivo de
legibilidade;
c) a criao de um banco de dados para armazenar os dados da etapa de aquisio;
d) e a anlise dos dados.
e) clculo do desempenho de cada mtrica na representatividade da legibilidade
segundo as condies do experimento.
Captulo 2
Figura 2.1: Imagem transmitida pelo mtodo Bartlane (GONZALES; WOODS, 2000).
Leitura remota: utilizada para reunir informaes sobre o planeta via satlites e
estaes espaciais.
Percia forense: aplicao do processamento de imagens contra crimes ou
atividades maliciosas. Usada frequentemente para reconhecimento de suspeitos.
Militar: geralmente utilizada para deteco de objetos (minas
terrestre/armadilhas) e reconstruo tridimensional do territrio.
Industrial: utilizada para a anlise morfolgica em imagens para a seleo
automtica de peas no processo de produo.
Imagens mdicas: consiste na gerao, processamento e armazenamento de
imagens do corpo humano ou de partes dele. Ultrassom, raio-X, ressonncia
magntica e tomografia computadorizada so os exemplos mais observados
desta aplicao. A figura 2.2 ilustra exemplos dessa rea de aplicao.
Aquisio
Processamento
Armazenamento
Visualizao
2.3.1 Aquisio
A primeira etapa no processamento de imagens a aquisio da imagem. Nesta
fase feita a converso da cena para uma representao numrica adequada aos passos
posteriores do sistema.
Dois elementos so necessrios para a aquisio de imagens digitais. O
primeiro um dispositivo fsico que seja sensvel a uma banda do espectro de
energia eletromagntica (como raios X, ultravioleta, visvel ou banda
infravermelha) e que produza um sinal eltrico de sada proporcional a um
nvel de energia percebida. O segundo, chamado de digitalizador, um
dispositivo para a converso de sada eltrica de um dispositivo de
sensoriamento fsico para a forma digital. (GONZALES; WOODS, 2000,
p.7).
etapa que envolve representar cada nmero produzido na etapa de amostragem no nvel
mais prximo escolhido dentre um nmero finito de nveis de amplitude discreta. A
figura 2.7(b) ilustra uma funo resultante do processo de amostragem e quantizao.
10
2.3.2 Armazenamento
Foi visto anteriormente que uma imagem digital uma funo discreta
bidimensional e cada ponto (x,y) da funo denominado pixel. Os possveis valores
f(x,y) de cada pixel, depende do nmero de componentes da imagem e do nmero de
bits usados para representar cada componente, em geral cada componente quantizada
com 8 bits/pixel.
Quando se refere a 8 bits/pixel, fala-se de 28 (256) possibilidades de valores
diferentes. Assim, se so 3 componentes, como as imagens coloridas no sistema RGB,
temos 28x2 8x2 8 = 2 24, totalizando mais de 16 milhes de cores possveis.
Uma imagem colorida no sistema RGB (24 bits/pixel) com resoluo 2392 x
1680 requer 12.055.680 bytes (11,5 Mbytes) para o seu armazenamento, no formato
original, ou seja, sem qualquer tipo de processamento.
O armazenamento digital para aplicaes em processamento de imagens pode
ser classificado em trs principais categorias:
I.
II.
III.
2.3.3 Processamento
O processamento de imagens digitais envolve procedimentos que so geralmente
expressos em forma algortmica. Assim, com exceo da aquisio e visualizao de
imagens, a maioria das funes de processamento de imagens pode ser implementada
11
2.3.4 Visualizao
Monitores so os principais dispositivos de visualizao usados em sistemas de
processamento de imagens. Atualmente existem diferentes tecnologias de monitores, as
mais usadas so as de tubos de raios catdicos (cathode ray tubes - CRTs) e tela de
cristal lquido (liquid crystal display - LCDs).
Os monitores CRT so compostos por um canho que gera um raio (ou feixe) de
eltrons. O ctodo, dentro do canho, gera um feixe de eltrons ao ser aquecido. Tal
feixe atinge a tela plana na outra extremidade do tubo, que revestida de fsforo e
brilha quando atingida pelo raio. Aumentando ou diminuindo a intensidade do feixe,
consegue-se controlar o brilho dos pontos de fsforo da tela para gerar a imagem.
Monitores de cristal lquido so leves e finos, inicialmente usados em laptops.
Nesta tecnologia, um lquido polarizador iluminado por trs e controlado usando-se
eletrodos sobre o cristal e luz polarizada de forma a deixar passar apenas as cores
desejadas. Como a luz atravessa o cristal, bloquear totalmente a mesma nem sempre
eficiente, devido a isto um dos problemas ao ser usar LCD que no se consegue um
preto absoluto.
Alm dos tipos supramencionados, monitores de LED (light emitting diod) e
OLED (organic light emitting diode) so outras tecnologias de exibio existente.
Monitores so alimentados pelas sadas de um mdulo de hardware conectado
no painel traseiro de um computador para exibio de imagens ou como parte do
hardware associado a um processador de imagens.
Outra forma de visualizao a reproduo em papel utilizando dispositivos de
impresso a jato de tinta e laser.
12
Captulo 3
13
14
Tabela 3.1: Faixa de valores da nota dada qualidade da imagem degradada de acordo
com a intensidade da degradao presente na imagem em comparao a com a image m
de referncia para o DSIS
Nota
5
4
3
2
1
Intensidade da Degradao
Imperceptvel
Perceptvel, mas no importuno
Levemente importuno
Importuno
Muito importuno
15
SNR = 10
(3.1)
16
PSNR = 10
(3.2)
(3.7)
onde,
a covarincia entre a imagem de referncia e a imagem teste;
covarincia entre a imagem de referncia e ela prpria.
(3.8)
17
onde, (X,Y) o Coeficiente de Correlao Pearson, ver pgina 29, entre a imagem
de referncia e a imagem teste; e (X,X) o Coeficiente de Correlao de Pearson
entre a imagem de referncia e ela prpria.
3.2.4 Entropia
Em PDI, entropia mede a aleatoriedade dos valores dos pixels que compe a
imagem, e definida como:
H(X) = -
(3.9)
(3.3)
onde, > 0, > 0 e > 0 so parmetros que ajustam a importncia relativa dos
componentes
,
e
, que so respectivamente as componentes de
luminncia , contraste e estrutura.
18
(3.4)
c(X,Y) =
(3.5)
s(X,Y) =
(3.6)
onde
e
so respectivamente a mdia e o desvio padro da imagem X;
e
so
respectivamente a mdia e o desvio padro da imagem Y; e
a covarincia entre as
imagens X e Y. Os parmetros ,
e
so parmetros inclusos a fim de evitar
instabilidades quando os valores dos denominadores se aproximam de zero.
A SSIM foi desenvolvida atendendo s seguintes condies:
1. Simetria: SSIM(X,Y) = SSIM(Y,X);
2. Limitada: 0 SSIM 1;
3. Mximo nico: SSIM(X,Y) = 1, se e somente se, X=Y.
3.2.6 Critrio
de
Fidelidade
de
Informao
(Information Fidelity Criterion - IFC)
Nas ultimas dcadas vrios mtodos de referncia completa fora m
desenvolvidos. Tais mtodos na tentativa de alcanar a consistncia na predio da
qualidade, geralmente so baseados nas caractersticas fisiolgicas e psico-visuais do
SVH ou utilizam tcnicas de fidelidade arbitrrias, na esperana que as mesmas
correlacionem bem com a qualidade perceptual (SHEIK; BOVIC, 2006). Tambm h
mtodos que empregam caractersticas estatsticas de cenas naturais para modelar
qualidade perceptual.
Imagens do ambiente visual obtidas por dispositivos de captura de alta qualidade
e operando no espectro visual so classificadas como cenas naturais. Tais cenas
divergem estatisticamente de outras, como: textos, cenas grficas geradas por
computadores, animaes, rudos aleatrios, imagens capturadas por radares e
ultrassom, entre outros (SHEIK; BOVIC, 2006).
Pesquisadores acreditam que os estmulos visuais emitidos por cenas naturais
fizeram parte da evoluo do sistema visual humano, que ficou sensvel s variaes das
estatsticas que caracterizam esse tipo de imagem (SHEIK; BOVIC; VECIANA, 2005).
19
Visual
(Visual
3.2.8 C4
A C4 uma mtrica perceptual de alta complexidade computacional, e isto pode
ser observado na figura 3.2, que mostra as etapas necessrias da C4 para a definio da
qualidade visual.
O processo completo possui oito estgios: normalizao da faixa de cores da
imagem; transformao dos valores RGB em luminncias utilizando correo gamma;
converso para o espao de cores perceptual de Krauskopf (ACr1Cr2); filtragem usando
a funo de sensibilidade ao contraste (Contrast Sensitivity Function CFS);
decomposio em canais perceptuais; Extrao de segmentos orientados com contraste
em diferentes resolues (caractersticas estruturais); transformao das caractersticas
extradas para uma representao sem variaes de rotao, translao e zoom; e o
armazenamento da representao invariante da estrutura da imagem no banco de dados
para a posterior comparao entre a representao da imagem original e a representao
da imagem degradada.
A implementao da C4 utilizada neste trabalho gera dois tipo de resultados. O
primeiro consiste em uma medida de similaridade estrutural (denominada C4sim) e o
segundo consiste em um mapeamento no-linear dessa para uma medida de qualidade
(quality score, chamada C4qs) (ZAMPOLO; AZEVEDO; SEARA, 2008).
20
21
Captulo 4
Procedimento Experimental
Neste trabalho realizado um experimento de avaliao subjetiva, que tem como
finalidade coletar avaliaes feitas pelos participantes do experimento no teste de
legibilidade.
A primeira etapa no desenvolvimento do experimento consistiu na definio do
contexto e da caracterizao do experimento. Assim sendo, foram escolhidos, dentre
outros parmetros, a resoluo das imagens, o nmero de caracteres por ngulo de
visualizao e a distncia mdia entre o avaliador e o dispositivo de visualizao
(monitor LCD).
Compresso JPEG.
Compresso JPEG 2000 (J2K).
22
a) Imagem original 1
b) Imagem original 2
Figura 4.1: Duas das imagens originais usadas para gerar o conjunto de teste.
23
a) Compresso JPEG.
c) Passa-baixas gaussiano.
Figura 4.2: Imagens degradadas por a) Compresso JPEG, b) Compresso JPEG 2000 e
c) Filtragem passa-baixas gaussiana, derivadas da imagem original 2.
24
Imagem original
Identificao
img1g
img2g
img1d
img2d
Degradao
Intensidade da degradao
Original
DCT
J2K
Gauss
1
2
3
4
5
Descrio
Imagem original 1
Imagem original 2
Imagem original dizimada 1 (gerada a partir
da original 1)
Imagem original dizimada 2 (gerada a partir
da original 2)
a) img1d_gauss_1.
25
b) img1d_gauss_2.
c) img1d_gauss_3.
d) img1d_gauss_4.
e) img1d_gauss_5.
Figura 4.3: Identificao das imagens derivadas da imagem img1d_original com degradao
passa-baixas gaussiana, conforme a intensidade da distoro.
26
27
Figura 4.4: Imagem degradada com rudo sal e pimenta (salt and pepper), utilizada na etapa de
aquecimento.
28
29
Captulo 5
Resultados
Em decorrncia de imperfeies do processo de aquisio dos dados, algumas
avaliaes podem apresentar-se contra-intuitivas ou destoantes. Essas avaliaes so
denominadas outliers e devem ser removidas antes da anlise de dados. Assumindo que
as notas dadas s imagens obedeciam a uma distribuio gaussiana, neste trabalho
considerado outlier toda avaliao fora da faixa 2 desvios padro da mdia das notas
dadas imagem. Por exemplo, as avaliaes da imagem img1d_J2K_2 tiveram mdia
de 47,7 e desvio padro de 18,8. Logo qualquer nota abaixo de 10 ou acima de 85
considerada um outlier, e por isso descartada na etapa de anlise de dados.
Para este trabalho so usados dois ndices estatsticos a fim de avaliar a
correlao dos dados adquiridos no experimento com os valores calculados pelas
mtricas de qualidade de imagem.
I.
Quanto mais prximo de zero for o CC, mais fraca ser a correlao entre as
variveis. O CC calculado atravs da expresso:
(v,w) =
onde
(5.1)
30
II.
rs = 1-
(5.2)
31
(5.1)
DMOSj =
II.
(5.2)
rij =
(5.3)
onde, qij representa a qualidade emitida pelo usurio i para a imagem j; q iref(j)
representa a qualidade emitida pelo usurio i para a imagem de referncia
correspondente imagem distorcida j. Tambm foi calculada para cada image m
a RMOS (Ratio Mean Opnion Score), que a mdia aritmtica das ROS da
imagem:
RMOS j =
III.
(5.4)
32
A partir dos resultados apresentados nas Tabelas 5.1 - 5.8 observa-se que as
mtricas perceptuais, ver pgina 15, obtiveram melhor consistncia e em geral tiveram
desempenho melhor que as no perceptuais, com exceo da Entropia.
SROCC
SNR
0,6223
0,6420
PSNR
0,6221
0,6433
DACOV
-0,6157
-0,6738
DACC
-0,5217
-0,6567
Entropia
-0,7729
-0,7906
SSIM
0,6773
0,7233
VIF
0,7262
0,7494
VIFp
0,7391
0,7412
IFC
0,6826
0,7402
C4qs
0,7831
0,7844
C4sim
0,8004
0,7941
33
SROCC
SNR
0,6751
0,6932
PSNR
0,6747
0,6951
DACOV
-0,6692
-0,7297
DACC
-0,5665
-0,7083
Entropia
-0,8363
-0,8546
SSIM
0,7344
0,7788
VIF
0,7852
0,8102
VIFp
0,7996
0,8005
IFC
0,7397
0,8007
C4qs
0,8447
0,8416
C4sim
0,8648
0,8573
SROCC
SNR
-0,5954
-0,6203
PSNR
-0,5953
-0,6217
DACOV
DACC
0,6047
0,5080
0,6560
0,6342
Entropia
0,7322
0,7472
SSIM
-0,6433
-0,6870
VIF
VIFp
-0,7085
-0,7363
-0,7378
-0,7378
IFC
-0,6756
-0,7423
C4qs
-0,7411
-0,7596
C4sim
-0,7693
-0,7637
34
SROCC
SNR
-0,6615
-0,6861
PSNR
-0,6614
-0,6880
DACOV
0,6738
0,7284
DACC
0,5670
0,7017
Entropia
0,8139
0,8299
SSIM
-0,7176
-0,7604
VIF
-0,7868
-0,8178
VIFp
-0,8182
-0,8178
IFC
-0,7496
-0,8237
C4qs
-0,8242
-0,8393
C4sim
-0,8551
-0,8493
SROCC
SNR
0,6157
0,6432
PSNR
0,6155
0,6444
DACOV
-0,6169
-0,6776
DACC
-0,5185
-0,6560
Entropia
-0,7495
-0,7687
SSIM
0,6700
0,7181
VIF
0,7277
0,7553
VIFp
0,7470
0,7553
IFC
0,6907
0,7536
C4qs
0,7702
0,7819
C4sim
0,7924
0,7892
35
36
SROCC
SNR
0,6894
0,7499
PSNR
0,6892
0,7519
DACOV
-0,7232
-0,7809
DACC
-0,6318
-0,7625
Entropia
-0,8121
-0,8289
SSIM
0,7767
0,8243
VIF
0,7987
0,8486
VIFp
0,8330
0,8429
IFC
0,7502
0,8440
C4qs
0,8385
0,8729
C4sim
0,8835
0,8905
37
CC
SROCC
SNR
0,6094
0,6288
PSNR
0,6091
0,6300
DACOV
-0,5985
-0,6602
DACC
-0,5081
-0,6431
Entropia
-0,7586
-0,7757
SSIM
0,6642
0,7111
VIF
0,7155
0,7339
VIFp
0,7240
0,7240
IFC
0,6718
0,7238
C4qs
0,7770
0,7781
C4sim
0,7852
0,7783
CC
SROCC
SNR
0,6646
0,6926
PSNR
0,6642
0,6943
DACOV
-0,6498
-0,7287
DACC
-0,5572
-0,7070
Entropia
-0,8022
-0,8208
SSIM
0,7304
0,7860
VIF
0,7789
0,8039
VIFp
0,7807
0,7924
IFC
0,7293
0,7978
C4qs
0,8552
0,8479
C4sim
0,8533
0,8507
38
Tabela 5.9: Coeficientes de correlao por degradao entre mtricas e dados brutos
JPEG
JPEG 2000
Gauss
CC
SROCC
CC
SROCC
CC
SROCC
SNR
0,6713
0,6776
0,8901
0,8868
0,8523
0,9130
PSNR
0,6696
0,6777
0,8902
0,8868
0,8508
0,9061
DACOV
-0,6560
-0,6076
-0,8462
-0,8712
-0,7887
-0,7630
DACC
-0,7848
-0,7159
-0,8512
-0,9100
-0,8814
-0,9158
Entropia
-0,2057
-0,2156
-0,8693
-0,9021
-0,9124
-0,9187
SSIM
0,7759
0,7103
0,8952
0,9090
0,8300
0,7938
IFC
0,5595
0,5536
0,8874
0,8668
0,7663
0,8502
VIF
0,6578
0,6593
0,9029
0,8867
0,7793
0,8857
VIFp
0,6930
0,6386
0,9026
0,8700
0,8133
0,8285
C4qs
0,7708
0,7217
0,8614
0,8276
0,7001
0,6622
C4sim
0,7744
0,7217
0,9091
0,9058
0,8956
0,9211
possvel conferir nos resultados das tabelas 5.9 5.16 que todas as mtricas
utilizadas geram boas estimativas para a codificao JPEG 2000. Para a degradao
passa-baixas gaussiana somente a C4qs no obteve bons resultados, como pode ser visto
nas Tabelas 5.11, 5.13 e 5.15 onde a mtrica alcanou somente correlaes moderadas.
39
JPEG 2000
Gauss
CC
SROCC
CC
SROCC
CC
SROCC
SNR
0,7902
0,8251
0,9457
0,9609
0,9250
0,9850
PSNR
0,7877
0,8251
0,9458
0,9609
0,9235
0,9820
DACOV
-0,7749
-0,7319
-0,8957
-0,9459
-0,8580
-0,8511
DACC
-0,9283
-0,8763
-0,9038
-0,9759
-0,9561
-0,9898
Entropia
-0,2478
-0,2693
-0,9247
-0,9549
-0,9874
-0,9895
SSIM
0,9172
0,8703
0,9498
0,9759
0,8994
0,8316
IFC
0,6596
0,6905
0,9427
0,9338
0,8361
0,9218
VIF
0,7746
0,8149
0,9585
0,9594
0,8491
0,9594
VIFp
0,8149
0,7890
0,9582
0,9459
0,8857
0,8913
C4qs
0,9082
0,8891
0,9146
0,8622
0,7635
0,6969
C4sim
0,9129
0,8891
0,9665
0,9744
0,9712
0,9910
Em geral as correlaes para a codificao JPEG foram mais fracas do que para
as demais degradaes. Porm, um fato que chamou ateno foram os resultados da
Entropia que aponta fraca correlao para a codificao em todos os casos, chegando a
apresentar coeficientes prximos de zero nas Tabelas 5.11, 5.12 e 5.13. A figura 5.2
ilustra o grfico de disperso entre Entropia versus DMOS, onde possvel observar a
fraca relao de linearidade.
CC: 0,0690
SROCC: 0,0917
40
JPEG 2000
Gauss
CC
SROCC
CC
SROCC
CC
SROCC
SNR
-0,5937
-0,6076
-0,8431
-0,8282
-0,8062
-0,8619
PSNR
-0,5921
-0,6076
-0,8434
-0,8282
-0,8057
-0,8561
DACOV
0,5805
0,5531
0,8265
0,8248
0,7514
0,7245
DACC
0,7148
0,6431
0,8315
0,8516
0,8335
0,8595
Entropia
0,0542
0,0729
0,8179
0,8423
0,8627
0,8608
SSIM
-0,6835
-0,6223
-0,8601
-0,8372
-0,7494
-0,6913
IFC
-0,5901
-0,5982
-0,8548
-0,8565
-0,7432
-0,8456
VIF
-0,6390
-0,6515
-0,8682
-0,8510
-0,7481
-0,8601
VIFp
-0,6829
-0,6268
-0,8876
-0,8512
-0,8078
-0,8289
C4qs
-0,6768
-0,6370
-0,8155
-0,7953
-0,6568
-0,6486
C4sim
-0,6783
-0,6370
-0,8670
-0,8468
-0,8596
-0,8750
JPEG 2000
Gauss
CC
SROCC
CC
SROCC
CC
SROCC
SNR
-0,7559
-0,8075
-0,9193
-0,9113
-0,9020
-0,9504
PSNR
-0,7539
-0,8075
-0,9196
-0,9113
-0,9015
-0,9474
DACOV
0,7391
0,7353
0,9017
0,9128
0,8422
0,8000
DACC
0,9121
0,8571
0,9072
0,9414
0,9325
0,9455
Entropia
0,0690
0,0917
0,8923
0,9308
0,9649
0,9474
SSIM
-0,8721
-0,8256
-0,9384
-0,9248
-0,8396
-0,7368
IFC
-0,7535
-0,8015
-0,9325
-0,9459
-0,8331
-0,9474
VIF
-0,8147
-0,8725
-0,9467
-0,9383
-0,8385
-0,9519
VIFp
-0,8714
-0,8421
-0,9674
-0,9429
-0,9046
-0,9214
C4qs
-0,8631
-0,8511
-0,8924
-0,8622
-0,7380
-0,6883
C4sim
-0,8647
-0,8511
-0,9462
-0,9429
-0,9617
-0,9714
41
JPEG 2000
Gauss
CC
SROCC
CC
SROCC
CC
SROCC
SNR
0,6221
0,6303
0,8791
0,8920
0,8339
0,9105
PSNR
0,6206
0,6303
0,8793
0,8920
0,8332
0,9049
DACOV
0,7222
0,6483
-0,8602
-0,8825
-0,7832
-0,7693
DACC
-0,7464
-0,6647
-0,8604
-0,9102
-0,8677
-0,9107
Entropia
-0,0964
-0,1079
-0,8537
-0,8997
-0,8974
-0,9113
SSIM
0,7222
0,6483
0,9005
0,9070
0,8071
0,7742
IFC
0,5900
0,5911
0,8848
0,8761
0,7701
0,8600
VIF
0,6513
0,6591
0,9003
0,8916
0,8071
0,7742
VIFp
0,6959
0,6360
0,9090
0,8769
0,8249
0,8414
C4qs
0,7130
0,6633
0,8572
0,8268
0,6837
0,6607
C4sim
0,7159
0,6633
0,9062
0,9052
0,8867
0,9172
JPEG 2000
Gauss
CC
SROCC
CC
SROCC
CC
SROCC
SNR
0,7787
0,8211
0,8585
0,8977
0,9087
0,9414
PSNR
0,7764
0,8211
0,8584
0,8977
0,9089
0,9383
DACOV
-0,7689
-0,7429
-0,8599
-0,8947
-0,8720
-0,8391
DACC
-0,9340
-0,8722
-0,8927
-0,9113
-0,9364
-0,9387
Entropia
-0,1583
-0,2000
-0,8566
-0,9173
-0,9545
-0,9338
SSIM
0,9059
0,8481
0,9401
0,9203
0,8619
0,7985
IFC
0,7286
0,7504
0,8575
0,8511
0,8476
0,9068
VIF
0,8071
0,8349
0,8842
0,8722
0,8541
0,9293
VIFp
0,8468
0,8060
0,9079
0,8586
0,9067
0,8838
C4qs
0,8939
0,8662
0,8565
0,8690
0,7569
0,6862
C4sim
0,8949
0,8662
0,9195
0,9308
0,9570
0,9429
42
JPEG 2000
Gauss
CC
SROCC
CC
SROCC
CC
SROCC
SNR
0,6428
0,6548
0,8858
0,8584
0,8296
0,8864
PSNR
0,6413
0,6549
0,8859
0,8584
0,8279
0,8772
DACOV
-0,6395
-0,5888
-0,8229
-0,8488
-0,7647
-0,7424
DACC
-0,7682
-0,6922
-0,8227
-0,8740
-0,8625
-0,8940
Entropia
-0,1883
-0,1952
-0,8632
-0,8700
-0,8919
-0,8951
SSIM
0,7546
0,6844
0,8747
0,8748
0,8215
0,7991
IFC
0,5524
0,5496
0,8836
0,8353
0,7484
0,8181
VIF
0,6399
0,6436
0,898
0,8516
0,7619
0,8589
VIFp
0,6774
0,6241
0,8874
0,8379
0,7872
0,7914
C4qs
0,7473
0,6973
0,8648
0,8490
0,6851
0,6568
C4sim
0,7487
0,6973
0,8999
0,8691
0,8751
0,8929
43
JPEG 2000
Gauss
CC
SROCC
CC
SROCC
CC
SROCC
SNR
0,7709
0,8129
0,9447
0,9239
0,9027
0,9468
PSNR
0,7690
0,8129
0,9447
0,9239
0,9011
0,9374
DACOV
-0,8075
-0,7504
-0,8721
-0,9137
-0,8475
-0,8041
DACC
-0,9242
-0,8402
-0,8751
-0,9546
-0,9466
-0,9550
Entropia
-0,2938
-0,3069
-0,9207
-0,9546
-0,9593
-0,9593
SSIM
0,9111
0,8402
0,9348
0,9546
0,9217
0,8700
IFC
0,6227
0,6232
0,9540
0,9137
0,8511
0,8762
VIF
0,7422
0,7687
0,9673
0,9137
0,8609
0,9139
VIFp
0,7890
0,7582
0,9600
0,9137
0,8647
0,8452
C4qs
0,9116
0,8676
0,9319
0,8871
0,7784
0,7175
C4sim
0,9082
0,8676
0,9645
0,9483
0,9584
0,9499
44
Captulo 6
Concluso
45
Referncias
46