Académique Documents
Professionnel Documents
Culture Documents
D ’IMAGES
Jean-François Lerallut*
Joaquín Azpiroz Leehan**
Veronica Medina**
*UTC
**UAM-Iztapalapa
Méthodes de compression
- sans perte ( texte, données, images )
=> basées sur les propriétés de la source
=> codage réversible
- avec pertes ( images, sons )
=> basées sur les limites de la perception
visuelle ou auditive
=> codage irréversible
- un signal de LuminanceY
- deux signaux de chrominances Cb et Cr (différences de couleur)
- norme 4.2.2: deux fois plus d'échantillons dans Y que dans Cb et Cr
- fréquences d’échantillonnage: 13.5 MHz en Y, 6.75 pour Cb et Cr
- fréquences de ligne:15.625 kHz et fréquence d'image 25Hz soit 720
points/lignes (Y) et 360 pour chaque chrominance et 576
lignes/image
- quantification linéaire 8 bits par échantillon
d' où : 72O x 576 x 8 +2(36O x 576 x 8) = 6.63 1O6 digits binaires,
donc 166 Mbits/s pour le débit net (sans signaux de service)
- soit 216 Mbit/s pour le débit brut total
Lerallut, Medina, Azpiroz
BM-06 Chapitre 8. Compression
6 © 1999 UTC-UAM
Quelques chiffres...
type d'image nombre de digits débit net/s
binaires/image
alors ? ? ?
Images Landsat
2340 x 3234 pixels
à 7 bits par pixel
4 canaux spectraux
30 plans par jour
•exemples:
•corrélation entre pixels voisins
•corrélation entre coupes voisines
•corrélation entre images successives
•exemple:
• échantillonnage trop serré / détails
• trop de niveaux de gris
• trop de plans par seconde
• trop de coupes par axe
• points isolés dans les documents N&B
Transformateur coefficients
Quantificateur symboles
direct
Retour d ’erreur
bruits
Définition:
S= ensemble de variables aléatoires indépendantes
S = { a1,a2,……..an } ai={0,1}
pi = probabilité d ’occurrence de ai
k =n
H 0( S ) = − ∑ pk. log 2( pk ) [en bits]
k =1
H2 fournit une limite du nombre de bits nécessaires pour coder une suite si
les symboles sont codés 2 par 2
Lerallut, Medina, Azpiroz
BM-06 Chapitre 8. Compression
19 © 1999 UTC-UAM
Mesures d’entropie pour différents types d ’image
Lerallut, Medina, Azpiroz
BM-06 Chapitre 8. Compression
20 © 1999 UTC-UAM
Evaluation des performances:
soit ai un symbole
pi sa probabilité
Bi la longueur du code associé
a1 1 1 1 1 0
a2 00 00 00 00 1
a3 011 011 010 01
a4 0100 0100 011
a5 01010 0101
a6 01011
Entropie H0=-0.4log2(0.4)-0.3log2(0.3)-0.1log2(0.1)
-0.1log2(0.1)-0.006log2(0.006)-0.04log2(0.04)
H0 = 2.14 bits
Longueur moyenne:
R=1(0.4)+2(0.3)+3(0.1)+4(0.1)+5(0.06)+5(0.04)
R = 2.20 bits
Remarque:
Huffman modifié (tables normalisées par le CCITT),et
Huffman adaptatif (fax et formats TIFF)
Lerallut, Medina, Azpiroz
BM-06 Chapitre 8. Compression
27 © 1999 UTC-UAM
Codage arithmétique (1987)
Pour une image, on balaie ligne à ligne ou en lacets: 512 x 512 pixels =
256k, 8 bits/pixel
100 220 15 200 pixels à 100 + 256 pixels à 220 + 56 à 15
99 220 15 220 pixels à 99 + 100 pixels à 220 +192 pixels à 15
Performances:
- peu efficace pour un texte ou une image très inhomogène,
sauf par plans de bits:
•Méthodes hybrides
Prédicteur d ’ordre 1:
x ’i =k xi-1 + (1-k)M
k = coefficient de corrélation
M = E{x}
Prédicteur 2D:
ligne précédente
ligne courante
pixel prédit
Prédicteur 3D:
Plan précédent
Plan courant
22 Ko 34 Ko 37 Ko
Entrée f(x,y)
symboles
Canal de Codeur canal
transmission
bruits
Image reconstruite
BM-06 Chapitre 8. Compression
reçue f ’(x,y) Lerallut, Medina, Azpiroz
41 © 1999 UTC-UAM
Transformations courantes:
• Fourier
• Cosinus
• Hadamard
• Haar
• Karhunen-Loeve
u u
v conserver v conserver
éliminer éliminer
On transmet l ’amplitude et
position des composantes
conservées
Image de l’erreur:
différences entre
l’image décompresée
et l’image originale (mul-
tipliée par 10).
Compression par TDC à
un taux de 13:1
Codage DC différentiel
Décomposition en sous-bandes
On réitère le processus autant de fois que nécessaire pour obtenir le nombre de sous-bandes voulu.
Lerallut, Medina, Azpiroz
BM-06 Chapitre 8. Compression
55 © 1999 UTC-UAM
Compression par ondelettes
Transformation Inverse
Système complet
Lerallut, Medina, Azpiroz
BM-06 Chapitre 8. Compression
57 © 1999 UTC-UAM
A chaque étape Ad2j+1f, l’image peut se décomposer en: Ad2jf
,D12jf ,D22jf, D32jf où Ad2jf est l’approximation discrète de l’image
ƒ(x,y) à la résolution 2j, et D2jf est l’image de détails à la
résolution 2j qui contient la différence d’information entre
Ad2j+1f, et Ad2jf.
Distance de Hausdorff:
H(R2): espace formé de sous-ensembles compacts (fermés, bornés, non vides).
La distance du point x de R2 à l’ensemble B de H(R2) est:
d(x,B)=Min{d(x,y):y ε B}
d(A,B)=Max{d(x,B):x ε A}
hd(A,B)=Max{d(A,B),d(B,A)}
Lerallut, Medina, Azpiroz
BM-06 Chapitre 8. Compression
61 © 1999 UTC-UAM
Codage Fractal
Transformation contractante:
(D ’après Y. Fisher)
Lerallut, Medina, Azpiroz
BM-06 Chapitre 8. Compression
64 © 1999 UTC-UAM
Exemples de compression / restitution par fractales
Φ (ρ ) +σ
2
x n
Φ ( ρ ) +σ n
2 2
x
Un filtre anisotrope H 3 [σ ,θ , φ (k , l )] =
Φx (ρ ) +σ n
2
256
Originale filtre gaussien PB différence
128
64
32 etc
Lerallut, Medina, Azpiroz
BM-06 Chapitre 8. Compression
71 © 1999 UTC-UAM
Filtrage directionnel
(Kunt, 1984)
Principe:
Un codage par transformation est utilisé pour l’image BF, la phase est
codée par des mots de longueur fixe, et le module par le codage de
Huffman.
Pour les images directionnelles HF, on code les contours (passages par
zéro du laplacien) avec Huffman.
∫ x − u( x ) Pu( x )dx = E ( u − u ) ]
[
uL+1
E= [ ] 2 2
u1
• La minimisation de cette erreur donne des niveaux de transition qui
restent au milieu des niveaux de reconstruction. Lerallut, Medina, Azpiroz
BM-06 Chapitre 8. Compression
76 © 1999 UTC-UAM
Quantification Vectorielle
∑ ∑ [x( m , n ) − x̂( m , n )]
1
≈
2 2
MN m =0 n=0
M −1 N −1
∑ ∑ [x( m , n ) − x̂( m , n )]
1 2
MN
ECM a = m =0 n =0
M −1 N −1
1
∑∑ [x ( m , n )]2
M −1 N −1
1
∑∑ [x ( m , n ) − x̂ ( m , n )]2
MN
ECM b = m =0 n=0
x max
∑ ∑ x( m , n ) x̂( m , n )
EMAN = m =0 n =0
1/ 2
M −1 N −1 M −1 N −1
2
∑ ∑ [x ( m , n )]2
∑ ∑ [x̂ ( m , n )]
m =0 n =0 m =0 n=0
Pour une reconstruction idéale, ccn=1.
•Les résultats sont notés sur une échelle qui va de 7 pour une image
sans dégradation perceptible, à 1 pour une image d'une qualité très
mauvaise.
Opinion Points
Imperceptible 7
A peine perceptible 6
Perceptible mais peu importante 5
Dégradation admisible 4
Dégradation très visible 3
Dégradation desagréable 2
Dégradation inadmissible 1
Lerallut, Medina, Azpiroz
BM-06 Chapitre 8. Compression
83 © 1999 UTC-UAM
Codage des Images avec des Critères Psycho - Visuels.
• image passe haut qui contient l'information sur les bords et contours de
l'image originelle
Principe:
3: Codage de la texture.
1: Prétraitement
•Homogénéisation de zones de texture: atténuer les
petites variations de niveaux de gris en conservant les
contours.
Dans le cas de sons et d’images fixes ou animées, on peut tolérer une perte
d’information SI celle-ci n’est pas perceptible par le système auditif ou visuel
humain. Les critères psychovisuels de quailté intervenant de manière subjective,
le choix d’une méthode est délicat, résultant d’un compromis entre vitesse,
taux et qualité.