Académique Documents
Professionnel Documents
Culture Documents
Résumé
La compression d’images numériques permet de réduire la taille d’une image dans le but
d’augmenter la capacité des supports de stockage et d’optimiser l’utilisation de la bande passante
d’un réseau. L’objet de cet article est le codage d’images numériques par compactage d’énergie
dans le domaine des valeurs singulières ou SVD. Notre contribution consiste en l’évaluation de la
qualité des images compactées en utilisant l’indice de similarité structurelle SSIM et le ratio
énergétique.
Les résultats montrent que sur des images de 512×512 pixels, pour un rang k = 64 correspondant à
un indice SSIM = 0.9832, l’énergie est restituée à 99,9496 %.
I. Introduction
La compression d’images numériques a connu une évolution incessante, depuis les années 60,
parallèlement à celle des télécommunications et du multimédia. Elle permet de réduire la taille
d’une image dans le but d’augmenter la capacité des supports de stockage (limités en capacité) et
d’optimiser l’utilisation de la bande passante d’un réseau. Depuis la normalisation de l’algorithme
JPEG basé sur la transformée en cosinus discrète [1], le volume des données multimédias (son,
image, vidéo, etc.) n’a cessé d’augmenter. La norme JPEG2000 basée sur la transformée par
ondelettes [2] a permis d’augmenter le taux de compression des images avec une qualité supérieure
à celle de JPEG. L’objet de cet article est le codage d’images numériques par compactage d’énergie
dans le domaine des valeurs singulières ou SVD. La SVD consiste à décomposer une matrice en un
produit de 3 matrices U, S et V (S est appelée matrice des valeurs singulières). Chen [3],
Abrahamsen [4], ainsi que Kahu [5] ont déjà proposé une méthode de compression d’images à
niveaux de gris ne retenant que les k premières valeurs singulières. L’évaluation de leur méthode
était basée seulement sur la mesure des erreurs quadratiques MSE ou PSNR.
Notre contribution consiste en l’évaluation de la qualité basée sur l’indice de similarité
structurelle SSIM qui permet une mesure de la qualité visuelle des images compressées et une
nouvelle métrique consistant à mesurer le ratio énergétique des images après compactage de la
matrice des valeurs singulières. Les bases de l’algorithme seront d’abord décrites, nous détaillerons
ensuite la métrique proposée et les résultats obtenus seront discutés.
II. La décomposition en valeurs singulières
II.1. Principe
Toute matrice I de taille m × n de rang r peut être décomposée en une somme pondérée de matrices
unitaires m × n par Décomposition en Valeurs Singulières (SVD : Singular Value Decomposition).
Les matrices U et V sont unitaires et I peut donc s’écrire :
n
I =U × S ×V =∑ ( σ i ×ui × v i )
T T
(1)
i=1
S est une matrice dont les r premiers termes diagonaux sont positifs, tous les autres étant nuls. Les r
termes σi non nuls sont appelés valeurs singulières de I.
( )
σi ⋯ 0
S= ⋮ ⋱ ⋮ (2)
0 ⋯ σn
Où σ1 ≥ σ2 ≥ … ≥ σr et σr+1 ≥ σr+2 ≥ … ≥ σn = 0
II.2. Application de la SVD en compression d’images
Les valeurs singulières représentent l’énergie de l’image. Sadek [6] parle de la décomposition SVD
comme une approche orientée énergie. En effet, l’énergie totale de l’image I est représentée dans la
formule suivante :
m n n
‖I ‖=trace [ I T × I ] =∑ ∑ I 2 ( i , j )=¿ ∑ σ 2i ¿ (3)
i=1 j=1 i=1
La compression d’une image à niveau de gris vient donc intuitivement en forçant les valeurs
singulières les plus faibles à zéro. En ne sélectionnant que les k (k ≤ n) premières valeurs
singulières, on peut approximer la matrice I par la formule :
k
I k =U × S k ×V T =∑ σ i × ui × v Ti (4)
i=1
Sk représente la matrice des k valeurs singulières compressée. L’énergie correspondant est :
k
‖I k‖=trace [ I Tk × I k ] =∑ σ 2i (5)
i=1
II.4. Evaluation
PSNR : Le PSNR (Peak Signal to Noise Ratio) a été longtemps utilisé pour mesurer la distorsion
correspondant à un ratio donné. Soit I l’image originale et Ik l’image compressée.
( )
2
Max [ I ( i, j ) ]
PSNR=10 × log 10 (6)
EQM
L’EQM est l’erreur quadratique moyenne :
m n
1 2
EQM= ∑ ∑
m ×n i=1 j =1
[ I ( i , j ) − I k ( i, j ) ] (7)
Mais il est depuis quelques années remplacé par SSIM qui reproduit mieux la Perception Visuelle
Humaine.
SSIM : L’idée de SSIM [7] (Structural Similarity) est de mesurer la similarité de structure entre les
deux images, plutôt qu’une différence pixel à pixel comme le fait le PSNR
( 2 μ I μ J +C1 ) ( 2 σ I σ J +C 2 ) ( 2 cov IJ +C3 )
SSIM ( I , J ) = (8)
( μ 2I + μ 2J +C1 )( σ 2I +σ 2J +C 2) ( σ I σ J +C 3 )
Avec
I l’image originale, J l’image compressée ;
µI la moyenne de I, µJ la moyenne de J ;
σI2 la variance de I, σJ2 la variance de J, covIJ la covariance de I et J ;
C1 = (k1L)2, C2 = (k2L)2 deux variables destinées à stabiliser la division quand le dénominateur est
très faible ;
L = la dynamique des valeurs des pixels, soit 255 pour des images codées sur 8 bits ;
k1 = 0,01 et k2 = 0,03 par défaut.
‖ I k‖ ∑
2
σi
E= = i =1 (9)
‖I ‖ n
∑σ 2
i
i =1
Nous estimons que si l’énergie E est restituée à plus de 99,9 %, l’image sera considérée comme de
bonne qualité.
II.6. Résultats
Nous avons comparé les SSIM et E en faisant varier le nombre de valeurs singulières retenues pour
les images de test « lena, liftingbody et mandrill » de dimension 512 × 512 pixels.
Les graphiques suivants décrivent la variation de SSIM et E en fonction de k.
Nous remarquons qu’à partir de k = 40, nous obtenons déjà des images à 99,9 % restituées. On
assiste par contre à une faible variation du rapport de compression contrairement à SSIM.
Notons également la présence de 3 zones distinctes sur les graphiques correspondant à 3 niveaux de
qualité différents. Le tableau suivant décrit ces 3 zones avec les valeurs moyennes obtenues pour
toutes les images de test.
Tableau 1. Zones d'appréciation basée sur le ratio énergétique