Académique Documents
Professionnel Documents
Culture Documents
Chapitre V
Message Message
original Transformation Quantification Codage compressé
I. Quantification,
I.1 Quantification scalaire,
diviser la dynamique de la grandeur physique en un nombre fini d’intervalles
∆, et d’attribuer à toutes les valeurs du même intervalle une seule valeur (soit
par l’arrondi supérieur, l’arrondi inférieur, ou l’arrondi le plus proche), dite
valeur quantifiée.
1
17/12/2016
La Dynamique = ρ2-ρ1
Où ρ1 et ρ2 sont les réflectances maximale et minimale
(sans exposition/ exposé à saturation à la lumière).
En pratique, on exprime cette dynamique en Densité optique :
D = log( ρ 2 ) − log( ρ1 )
b) Nombre d’intervalles,
Le nombre doit dépendre de la sensibilité du système visuel (pas de différence entre
l’image originale et l’image quantifiée). On s’appuy sur l’expérience de Weber–Fechner
qui conclut à :
D log ρ 2 − log ρ1
Nq = =
log(1 + Cw ) log(1 + Cw )
4
2
17/12/2016
Exemple,
Film photographique, D=2, et observateur « moyen », Cw=0.015.
2
Nq = = 309.3
log(1.015)
en nombre entier, 309 ou 310.
Codage en mots binaires : on recherche la puissance de deux la plus proche de Nq par
valeurs supérieures : Bq=log2512=9 bits (si Cw=0.02, 8 bits suffiront).
c) Quantification et compression,
Opération irréversible
Introduit une distorsion.
Il faut minimiser la distorsion, lors de la conception d’un quantificateur.
Le taux de compression augmente lorsque le nombre d’intervalles de quantification
diminue.
Opération non linéaire est utilisée dans la compression pour extraire l’information
pertinente.
3
17/12/2016
f) Variante de quantification,
On transforme les données, lors d’un prétraitement, de telle sorte que
leur répartition soit plus uniforme, à l’aide d’une fonction de
répartition f (de type look up table). Une quantification uniforme est
appliquée sur ces données modifiées, et, finalement, on applique la
fonction de répartition inverse g=f-1 après quantification.
q7 q6 q5 q4 q3 q2 q1
Distribution de Gauss
8
4
17/12/2016
g) Quantification psycho-visuelle,
Un quantificateur conçu en utilisant la limitation en terme de différence relative de
luminance perçue par l’œil (échelon liminaire de luminance Cw=∆ℓ/ℓ ). r = 0
0
La loi de quantification se fait selon les relations suivantes : ti = ri −1 + ∆l(ti −1 )
Exemple: La codification IGS (Improved Gray Scale) , r = t + ∆l(t )
i i i
Principe: Le codage à 256 niveaux de gris s'effectue sur 8 bits séparables en poids forts
(4 bits) et poids faibles (4 bits); pour des pixels successifs, le codage IGS à 16
niveaux (4 bits) s'obtient en tenant compte du codage sur 8 bits des pixels
précédents et en ne retenant que les bits de poids forts.
Algorithme: Codage IGS d’un pixel de rang i:
Si poids forts de niveau(i)=1111 alors somme(i)=niveau(i)+0000
sinon somme(i)=poids faibles de somme(i-1)+niveau(i)
Codage IGS=poids forts de somme(i)
Exemple: (initialisation: somme(0)=0)
Pixel 1 de niveau 10000111 codage IGS=1000
Pixel 2 de niveau 11110100 codage IGS=1111
9
Pixel 3 de niveau 01101100 codage IGS=0111
10
5
17/12/2016
b) Algorithme,
La quantification vectorielle consiste à:
Engendrer un ensemble de vecteurs de référence (code book) en
utilisant un algorithme d’apprentissage appliqué à un ensemble
d’images.
Décomposer l’image en vecteurs de taille identique à ceux du
dictionnaire,
Rechercher pour chaque vecteur Xi de l’image le plus proche
dans le dictionnaire,
Le remplacer par l’indice dans le dictionnaire du vecteur associé
(codage),
Le décodeur reçoit l’indice et génère le vecteur X̂ i correspondant
du dictionnaire qui constitue une approximation du vecteur
initial
Remarque: la quantification vectorielle donne souvent de meilleurs
résultats que la quantification scalaire.
11
c) Exemple,
Le débit de codage Bit-rate Br est donné par Br=log2(NC)/k
bit/pixel, où k est la dimension des vecteurs à coder et NC la taille du
dictionnaire. En général, NC=2L, et L est la longueur du mot
correspondant à l’indice transmis.
Taille du Débit Longueur Taille
bloc k Br indice L dictionnaire NC
6
17/12/2016
e) Mesure de distorsion,
Mesure idéale: évaluer la qualité subjective de l’image
reconstruite.
Mesure pratique: la plus utilisée est l’Erreur quadratique
moyenne,
f) Génération du dictionnaire,
On cherche à construire un dictionnaire optimal de NC vecteurs au
sens où il minimise une distorsion moyenne donnée par :
NC
1
D( X , Q ( X )) =
NC
∑ d ( X , Xˆ )
i =1
i i
7
17/12/2016
15
règle de
parcours
16
8
17/12/2016
☺ Dynamique faible,
Moins de niveaux de quantification
Ii ei
Image Image
décompressée + Décodage compressée
Prédicteur Ĩi
9
17/12/2016
Image Ki εi
+ Image
décompressée Décodage compressée
Prédicteur Ĩi
20
10
17/12/2016
21
11
17/12/2016
σ IJ
Le coefficient dei =1Corrélation est donnéi =1 par: CorIJ =
Propriétés du coefficient de Corrélation, σ Iσ J
−1 ≤ CorIJ ≤ 1 (inégalité de Cauchy-Schwarz)
Si |CorIJ|=1 I et J sont linéairement liées (aIi + bJi = c)
Si CorIJ=0 variables décorrélées (sans dire indépendantes!)
Valeurs propres et vecteurs propres,
Un vecteur V≠0 de taille n est un vecteur propre d’une matrice I
de taille n×n ∃ λ∈₵ telle que: I×V=λ×V (λ: valeur propre de I
associée à V). 5 1 −1 0 1 1
Exemple: La matrice 2 4 − 2 a pour vecteurs propres V1 = 1 V2 =0 V3 =1
1 −1 3 1 1 0
On vérifie facilement que les valeurs propres
24 associées sont: λ1=2, λ2=4, λ3=6.
12
17/12/2016
∑∑ I ( x, y) = ∑∑ C (u , v)
2 2
x =0 y =0 u =0 v =0
N −1 N −1
1
La transformation inverse : I ( x, y ) =
N
∑∑ C (u, v)e
u =0 v =0
2 jπux / N
e 2 jπvy / N
25 avec x et y∈{0,1,…,N-1}
Généralisation, 1
Si on remplace e − 2 jπux / N par T(u,x) dans la formule C
N uv
La transformation linéaire généralisée est:
Cuv=Tu × Ixy × Tvt
Si T est une matrice orthonormale (ce qui est le cas de la TFD
lorsque M=N), alors T-1=T*t et on peut généraliser la
transformée inverse : Ixy=Tx*t × Cuv × Ty*
L’objectif de ces transformations est de:
1. Décorréler les données, c’est-à-dire d’obtenir des coefficients
transformés moins corrélés que les pixels de l’image;
2. Concentrer l’énergie sur un nombre réduit de coefficient, les
coefficients ayant une valeur plus importante aux basses
fréquences qu’aux hautes fréquences.
La compression effective est obtenue en codant finement les
coefficients des basses fréquences et grossièrement (voire
26 supprimer) les coefficients hautes fréquences.
13
17/12/2016
Remarques:
1. L’efficacité d’une transformation peut être mesurée par la prise en
compte de trois facteurs :
L’efficacité de décorrélation (plus les coefficients sont
décorrélés, plus le procédé est efficace ;
La concentration de l’énergie, pour coder de manière
privilégiée un nombre réduit de coefficients ;
L’existence d’algorithmes rapides pour calculer les
transformations.
2. Etant donné que la matrice T est orthonormale; elle peut être
considérée comme le résultats des vecteurs
Tu = (t(u,0), t(u,1),…, t(u, N - 1) ) avec u∈{0,1,…,N-1}
t
x1
On veut passer de 2 On cherche la direction qui différencie
variables à 1 seule. le plus les points entre eux.
Les informations statistiques contenues sur les autres axes de la transformée
de Karhunen-Loeve constituent de nouvelles informations statistiques.
28
14
17/12/2016
Méthode:
σ 12 σ 12 K σ 1n
Soient un bloc I de n valeurs (vecteur).
On modélise la corrélation entre les σ 21
CovI =
valeurs par la matrice de Covariance:
M O
CovI=E[(I-I̅ ) ×(I-I̅ )t] σ σ 2
n1 n
L’élément (i,j) de la matrice est la
covariance des valeurs Ii et Ij (note σij ) 1 r12 K r1n
Si on suppose que la covariance σij ne r21 1
dépend que de la distance entre variables
CorIJ =
M O
I et J normalisée; la Matrice de r 1
Corrélation se met sous la forme: n1
λ1 0
Les vecteurs propres de la matrice Cov forment une
λ2
base de fonctions de décomposition. Cov J =
O
On cherche les vecteurs propres de cette matrice, et
0 λn
on note T la matrice de transformation J=I×T
La matrice de covariance de J est: CovJ=CovI×T
29
Matrice diagonale
15
17/12/2016
16
17/12/2016
Question 5: Est-ce que l’énergie est semblable dans chacune des images?
Les niveaux d’énergie sont très différents, puisque l’on distingue très peu de
variations dans les plans R’ et G’ et une très grande plage de valeur en B’
Données vérifiant l’hypothèse : Variance R’ = 56.795 (0.9 %),
Variance G’ = 565.04 (8.88 %),
Variance B’ = 5739.9 (90.22 %),
Variance Totale = 6361.7 (100 %)
Question 6: Comparaison avant et après la transformation de l’énergie dans les
canaux
On constate à partir de la table que l’énergie totale est conservée mais que les
proportion de chacun des canaux a changé.
Variance
17
17/12/2016
18
17/12/2016
Remarques,
Il est très difficile de déterminer les vecteurs propres de la
matrice de covariance.
Il n'existe pas d’algorithmes rapides pour le calcul de la
transformée de Karhunen-Loève.
En pratique on utilise des transformées sous-optimales qui
convergent asymptotiquement vers la transformée de Karhunen-
Loève mais peuvent être calculées à l'aide des algorithmes
rapides
On peut mentionner parmi ces transformées:
La transformée de Walsh-Hadamard,
La transformée en cosinus discrète, DCT,
La transformée en ondelettes discrète.
37
19
17/12/2016
a) Calcul de la DCT,
Le calcul est effectué sur chaque matrice (8x8), et elle donne une
matrice 8x8 de coefficients,
L'élément (0,0) représente la valeur moyenne du bloc (DC), les
autres (AC) la puissance spectrale pour chaque fréquence spatiale
Les axes x et y représentent les dimensions horizontales et
verticales de l'image, les axes u et v représentent les fréquences
du signal : Coefficient DC
Amplitude Transformation DCT Coefficients AC
y v
x u
Bloc-image de 8x8 pixels Coefficients DCT
On effectue un codage particulier pour le coefficient le plus
important (coefficient DC), puis un autre codage pour les
40
autres coefficients (coefficients AC)
20
17/12/2016
Image I DCT(I)
La DCT Illustre l’irrégularité spatiale de la répartition de
l’information dans le domaine fréquentiel.
La compression exploite cette différence en supprimant les
fréquences les plus élevées de la DCT
41
42
21
17/12/2016
Schéma général
Remarques:
☺ JPEG très performant à taux faibles (#10)
43
Effets de blocs à taux élevés
Il faut de nouveaux outils qui observent les fréquences dans une zone
restreinte du signal. Par exemples:
La DFT fenêtrée,
Bancs de filtres,
La transformée en ondelettes : JPEG2000, MPEG4.
44
etc.
22
17/12/2016
t t t t
Représentation Transformée Transformée de Fourier Transformée en ondelettes
de Shannon de Fourier à fenêtre glissante (si continue scalogramme)
45
b) Analyse multirésolution,
Les études menées par S. Mallat ont prouvé une équivalence entre la théorie
mathématique des ondelettes et l’approche multirésolution par bancs de filtres.
Bancs de filtres à reconstruction parfaite: L’idée est de représenter l’image
selon différentes bandes correspondant à des domaines fréquentiels donnés.
c1
c̃ 0
c0 Synthèse
Analyse
d1
↓2 signifie une décimation par 2 (on ne garde qu’un pixel sur 2),
↑2 un sur-échantillonnage (par entrelacement de zéros).
La figure illustre un banc de filtres à deux sous-bandes et à reconstruction
parfaite où H désigne un filtre passe-bas et G un passe-haut.
46
23
17/12/2016
Analyse multirésolution
Décomposition récursive en 2 moitiés
égales d’un signal: filtres passe-bas h et
passe-haut g.
Phase Analyse
Phase Synthèse
47
différence
V1 φ
1(t)
moyenne ψ1(t)
différence
φ (t)
V0 ψ (t)
moyenne
[9.875 –5.625 –2 .25 –2.5 –1 –1.5 –2 –2]
Décomposition en ondelettes par projection sur les dilatées, translatées de
48
l’ondelette mère ψ et de la fonction d’échelle φ de Haar (la base la plus simple)
24
17/12/2016
Exemple 2
La transformée en ondelettes de Haar :
Ses filtres numériques passe-bas et passe-haut :
49
50
25
17/12/2016
51
26
17/12/2016
Codage par seuil : On prend en compte, non plus la localisation dans le plan
transformé des coefficients, mais leur modules, pour ne retenir que les plus
importants (>seuil). Le taux de compression est de l’ordre de 12 au 13.
3. Quantification des coefficients repose sur la statistique de ces coefficients. On leur
assigne des mots binaires proportionnellement au logarithme de leur variance.
Remarques:
La compression par transformation peut être rendue adaptative (le codeur varie
selon les propriétés statistiques locale de l’image). Le taux de compression
augmente de 20 à 30 %.
La méthode, codage par transformation, résiste au bruit de transmission (Une
erreur, qui affecte la valeur d’un coefficient, sera lissée au décodage lors du calcul
de la transformation inverse).
53
54
27