2 JPEG200042300210-te5320

Réf.
: TE5320 V1
JPEG 2000, format de

Date de publication :
10 février 2016
compression d'image
numérique par ondelettes -
Principes
Cet article est issu de : Technologies de l'information | Le traitement du signal et ses
applications
par Jean-Noël GOUYET, Christophe NELSON,

Marc LEGER
Mots-clés Résumé Cet article décrit le format de compression d’images numériques, JPEG2000.
ondelettes | transformée en Après une courte histoire de son développement et un résumé des objectifs visés, il
ondelettes | codage entropique
| compression des images | rappelle les principes de la transformée en ondelettes et de son application au codage
codage | formats-conteneurs d’une image. Les principales fonctionnalités du format sont ensuite détaillées, ainsi que
les fonctions et les techniques mises en œuvre dans la chaîne de codage.
Keywords Abstract This article describes the JPEG2000 picture compression format. After a short
wavelets | Discrete Wavelet background and a summary of the objectives of JPEG2000, a basic reminder on the
Transform DWT | entropy
coding | picture compression | principles of the wavelet transform and its application to picture coding is given. The main
coding | container-formats functionalities of the format are then detailed along with the functions and techniques
implemented in the coding chain.
Pour toute question :

Service Relation clientèle
Techniques de l’Ingénieur
Immeuble Pleyad 1 Document téléchargé le : 06/10/2019
39, boulevard Ornano
93288 Saint-Denis Cedex Pour le compte : 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Par mail :
infos.clients@teching.com
Par téléphone :
00 33 (0)1 53 35 20 20 © Techniques de l'Ingénieur | tous droits réservés
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
JPEG 2000, format de compression

d’image numérique par ondelettes
Principes
par Jean-Noël GOUYET

Ingénieur-formateur et consultant en techniques et gestion des médias numériques.
Ancien chargé d’études à la Direction de la recherche de l’INA (Institut national de l’audio-
visuel)
Christophe NELSON
Parution : février 2016 - Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Formateur en techniques numériques vidéo

Ina EXPERT
et Marc LEGER
Diplômé de l’École nationale supérieure Louis-Lumière
Opérateur de prise de vues
Ingénieur vision
Responsable de filière formation aux techniques vidéo
Ina EXPERT
1. Développement et objectifs visés.................................................... TE 5 320 - 2

2. Concepts de base.................................................................................. — 3
3. Principales fonctionnalités de JPEG 2000 .................................... — 12
4. Chaîne de codage ................................................................................. — 14
5. Conclusion .............................................................................................. — 30
6. Abréviations et acronymes ................................................................ — 30
Pour en savoir plus ........................................................................................ Doc. TE 5 320
orsqu’on aborde le sujet de la compression d’images, la première norme

L qui vient à l’esprit est JPEG. Créée en 1991, cette norme est toujours en
effet l’une des plus utilisées dans le domaine de la compression d’images pho-
tographiques. Elle s’avère d’ailleurs encore aujourd’hui très efficace lorsqu’elle
est utilisée à des taux de compression faibles ou moyens, mais la piètre qualité
des images obtenues à des taux de compression plus élevés ainsi que son
manque de flexibilité et de fonctionnalités témoignent de son incapacité à
satisfaire toutes les exigences des applications, en particulier professionnelles,
d’aujourd’hui. C’est à partir de ce constat qu’a été élaboré en 2000, le format
de compression d’images JPEG 2000.
Ce dossier comprend deux articles indissociés.
Ce premier article [TE 5 320] présente :
– un court historique ;
– les objectifs visés par son développement ;
– les concepts de base de la transformée en ondelettes DWT (Discrete
Wavelet Transform) ;
– les principales fonctionnalités ;
– les fonctions et les techniques utilisées dans la chaîne de codage
JPEG 2000.
Copyright © – Techniques de l’Ingénieur – Tous droits réservés TE 5 320 – 1
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
JPEG 2000, FORMAT DE COMPRESSION D’IMAGE NUMÉRIQUE PAR ONDELETTES ________________________________________________________________
Et dans le deuxième article [TE 5 322] :

– la famille de normes JPEG 2000 ;
– les formats-conteneurs utilisés pour encapsuler, stocker ou transporter des
images codées en JPEG 2000 ;
– les performances vis-à-vis de JPEG et d’autres codecs pour images fixes
ou animées ;
– les applications dans les domaines de l’imagerie numérique, du cinéma
numérique et de la vidéo, en particulier dans les domaines de l’archivage et de
la distribution.
La section consacrée aux ondelettes adopte une approche « physico-
pratique » et non mathématique, pour permettre de comprendre d’une part la
richesse des fonctionnalités induites, avec en particulier une scalabilité intrin-
sèque en qualité et/ou en résolution d’image, et d’autre part les performances
atteintes en comparaison avec les autres codecs d’images utilisant la trans-
formée DCT (Discrete Cosine Transform).
De nombreux termes et le texte de certaines figures ont été conservés en
anglais (en italique dans le texte), de manière à faciliter la lecture et l’utilisation
de documents techniques. De nombreuses références, des listes de normes,

standards et recommandations ainsi que d’organismes, sont fournies dans le
document « Pour en savoir plus ».
Une liste des abréviations et acronymes est disponible en fin d’article (§ 6).
■ En premier, une plus grande efficacité de compression, en parti-

1. Développement culier à bas débit, pour des applications telles que la transmission
et objectifs visés d’image sur réseau et la télédétection (remote sensing). Par exem-
ple, moins de 0,25 bpp (bit per pixel) pour des images à niveaux
de gris avec beaucoup de détails.
Historique ■ La compression d’images à ton continu (continuous-tone) et à

deux tons (bi-level), avec des gammes de profondeur de codage
En 1986, sous l’auspice conjoint de l’ISO (International (nombre de bits par pixel pour chaque composante couleur), de 1
Organization for Standardization) et de l’ITU-T (International à 16 bits.
Telecommunication Union), un groupe de travail commun fut
formé, le Joint Photographic Experts Group JPEG, chargé de
Les applications concernées sont, par exemple : documents
la compression et du codage numériques des images fixes. La
composés d’images et de texte, images médicales avec annotations
norme JPEG fut publiée en septembre 1992 (ITU-T Rec. T.81)
superposées (text overlay), images infographiques avec des zones à
puis (ISO/IEC10918-1:1994). Le format de compression qu’elle
deux niveaux, images avec couche de découpage (alpha plane) et de
spécifiait a depuis été très largement utilisé, en particulier en
transparence, fax.
photographie numérique grand public. Ce succès est dû à ses
performances techniques, à l’absence de paiement de royal-
ties, et à la disponibilité d’un logiciel (codec) de l’Independent
JPEG Group, gratuit et efficace. ■ Une compression mathématiquement sans perte (lossless) et
avec pertes (lossy). Une compression mathématiquement sans
Toutefois, des limitations de JPEG (en niveau de qualité
perte, avec un faible taux de compression, permet de reconstituer
mathématiquement sans perte, en scalabilité...) apparurent
au décodage toutes les valeurs numériques originelles des
avec le besoin de compresser des images dans des domaines
matrices de nombres de l’image-source. Avec un taux de
tels que l’imagerie médicale, l’archivage iconographique, le
compression plus important, cette restitution parfaite ne sera plus
multimédia, l’Internet et les terminaux mobiles. Le comité
possible, et donc mathématiquement avec pertes. Les applications
JPEG commença donc en 1996 à envisager le développement
pouvant utiliser la compression mathématiquement sans perte
d’une nouvelle norme, avec un appel à propositions en mars
incluent les images médicales où aucune perte n’est tolérée, les
1997 et l’évaluation de plus de 20 algorithmes dès novembre
archives iconographiques où la plus haute qualité est requise pour
1997. Ce processus aboutit à la version internationale de la
la conservation mais pas pour l’affichage, les applications sur
première partie de la norme ISO/IEC 15444-1 en décembre
réseaux fournissant des équipements avec des capacités et des
2000, suivie par la publication de plus d’une dizaine d’autres
ressources diverses, et les images de prépresse.
parties (voir [TE 5 322] – § 1.1).
■ La transmission progressive, soit en fonction de la précision de
Les caractéristiques souhaitées pour le format JPEG 2000 ont été codage du pixel, soit de la résolution spatiale (densité surfacique
détaillées dans le document (ISO/IEC JTC 1/SC 29/WG1 N1803) de de pixels) de l’image. Cela permet une reconstruction différenciée
juillet 2000. Les fonctionnalités développées pour les atteindre et de l’image selon les équipements de réception et d’affichage, par
les techniques mises en œuvre pour les réaliser seront exposées exemple dans le domaine du Web, des applications d’archivage
dans la suite de cet article (§ 3 et § 4). iconographique, des imprimantes, etc.
TE 5 320 − 2 Copyright © – Techniques de l’Ingénieur – Tous droits réservés
________________________________________________________________ JPEG 2000, FORMAT DE COMPRESSION D’IMAGE NUMÉRIQUE PAR ONDELETTES
■ Un débit fixe (fixed-rate, ou fixed local rate) signifie que le – la transformée DCT (Discrete Cosine Transform), basée sur
nombre de bits pour un nombre de pixels consécutifs est égal (ou l’analyse de Fourier, analyse et traite l’image par blocs de pixels ;
inférieur) à une certaine valeur. Cela permet ainsi au décodeur de elle est utilisée par la presque totalité des formats de compression
traiter en temps réel les données transitant via des canaux de d’images (de type JPEG, MPEG...) ;
capacité limitée, par exemple pour la télédétection, le codage de – la transformée DWT (Discrete Wavelet Transform) qui analyse
mouvements, etc. Une taille fixe (fixed-size, ou fixed global rate) et traite simultanément l’ensemble des pixels de l’image ; elle est
signifie que la taille totale du train de données codées, le codes- utilisée par JPEG 2000 et quelques autres codecs tels que Dirac
tream (généré à la sortie du codeur), est égale à une certaine (SMPTE VC-2), CineForm (SMPTE VC-5)...
valeur, pour une image complète. Cela permet à un équipement
Pour faciliter l’analyse de l’image, JPEG 2000 procède d’abord à
avec un espace mémoire limité de contenir un train de données
une structuration de l’image-source, selon le modèle décrit
complet quelle que soit l’image.
ci-après.
■ L’accès et le traitement direct du train de données, pour permet-
tre que des zones de l’image plus importantes que d’autres, appe-
lées ROI (Region-Of-Interest), soient directement accessibles et 2.1 Structure et paramètres
décompressées avec moins de distortion que le reste de l’image. de l’image-source
Le traitement avec accès direct dans le codestream, pourrait per-
mettre d’effectuer des opérations telles que rotation, translation,
filtrage, extraction de caractéristiques, mise à l’échelle (scaling), 2.1.1 Modèle de l’image
etc.
Du point de vue du codec (codeur/décodeur ou compresseur/
■ Le codage temps réel ou capacité à compresser et décompresser décompresseur), une image est composée d’une ou plusieurs
les images en une seule passe séquentielle. La norme devrait aussi composantes, jusqu’à une limite de 214 (figure 1a et [16]). Par
permettre de traiter une composante d’image dans un ordre entre- exemple, une image couleur RVB a 3 composantes. Une image en
lacé ou non. Durant la compression, le format devrait utiliser un niveaux de gris n’a qu’une seule composante. Chaque composante
contexte de pixels limité à un nombre raisonnable de lignes. (figure 1b) consiste en une matrice rectangulaire d’échantillons.
Les valeurs des échantillons pour chaque composante sont des
■ La robustesse vis-à-vis des erreurs binaires (error resilience), nombres entiers, signés (±) ou non, avec une précision de 1 à
importante en particulier pour la transmission via les réseaux sans 38 bits par échantillon, cela étant spécifié pour chaque compo-
fil. Le train de données comprenant des parties plus importantes sante.
que d’autres dans la détermination de la qualité de l’image déco- Les diverses composantes d’une image n’ont pas besoin d’être
dée, sa conception doit permettre une détection-correction des échantillonnées avec la même définition et peuvent avoir en
erreurs au décodage. conséquence des tailles différentes. C’est le cas d’images couleur
■ La protection des images, avec des méthodes telles que : le représentées dans l’espace de luminance-chrominance, avec
watermarking ou marquage invisible inséré dans le contenu de l’information de luminance souvent plus finement échantillonnée
l’image, l’étiquetage (labeling) par ajout de données spécifiques que celle de chrominance.
dans le train de données ou le fichier, l’empreinte numérique
(fingerprinting) par calcul d’un code ou signature unique mais 2.1.2 Grille de référence
externe à l’image, le chiffrement (encryption) ou l’embrouillage
(scrambling) de tout ou partie de l’image, et enfin le logo Une image étant donnée, le codec décrit sa géométrie selon une
(stamping) sur l’image affichée – voir pour une présentation grille rectangulaire appelée la grille de référence (figure 2 et [15]).
détaillée de ces techniques [TE 5 890]. La grille de taille Xsiz par Ysiz ne peut excéder 232-1 unités. La
zone image correspond aux données d’image. Toutes les
■ La rétro-compatibilité, ou un transcodage facile, avec JPEG, la composantes sont alignées (mapped) sur la zone image de la grille
compatibilité avec les recommandations de l’ITU-T pour l’échange de référence. Mais comme les composantes n’ont pas besoin
d’images (celles concernant, par exemple, le fax), et l’interfaçage d’être échantillonnées à la pleine résolution de la grille de réfé-
avec MPEG-4, en particulier avec la conservation des informations rence, des informations additionnelles sont nécessaires, sous la
concernant la propriété intellectuelle lors de l’insertion ou de forme de deux paramètres XRsiz et YRsiz. Ceux-ci spécifient la
l’extraction d’images fixes vers des ou à partir d’images animées. séparation horizontale/verticale d’un échantillon de la composante
D’autres caractéristiques requises concernaient : i par rapport à la grille de référence de l’image, appelée aussi
« sous-échantillonnage » horizontal et vertical, exprimé en unités
– la description basée sur le contenu, pour retrouver une image
de la grille de référence (voir des exemples de contraintes impo-
dans de grandes banques de données ;
sées à ces valeurs [TE 5 322] – tableaux 2, 11 et 15). À noter que la
– de meilleures performances lors de multiples cycles de grille de référence impose un alignement particulier des échan-
compression-décompression ; tillons des diverses composantes relativement entre elles.
– un format de fichier plus flexible.
Ce système de repérage permet d’effectuer efficacement un cer-
tain nombre d’opérations de base telles que découpe (cropping),
retournement horizontal/vertical (flipping) ou rotation d’un multi-
ple de 90˚.
2. Concepts de base
2.1.3 Tuilage (tiling)
Le principe de la compression d’une image numérique repose
sur le passage d’une matrice de valeurs de luminosité des pixels à Dans certaines situations (très grandes images), une image peut
une matrice de coefficients traduisant des fréquences visuelles, être très large par rapport à la taille de la mémoire disponible dans
c’est-à-dire des variations de pixels à pixels, permettant de coder le codec. Il n’est alors pas possible de coder/décoder l’image
des zones « plates » plus homogènes ou des zones de détails. comme une seule entité. On peut alors partager l’image en une ou
C’est l’analyse de cette dernière matrice qui permettra d’éliminer la plusieurs régions rectangulaires disjointes ne se recouvrant pas
redondance et donc de réduire le volume de données. Cette opéra- (figure 3a), appelées carreaux ou tuiles (tiles), chacune d’elles
tion portant sur des nombres et leurs relations, deux outils mathé- codée indépendamment. On superpose à la grille de référence une
matiques sont utilisés : grille de tuilage (figure 3b et [15]) avec des espacements horizon-
Composante n° N-1
...
Composante n° 2
Composante n° 1
Composante n° 0
a image à N composantes
a image 863 × 631 pixels, très fortement compressée avec JPEG 2000,
partagée en « tuiles » 128 × 128, dont les contours ont été dessinés
Composante n° i
en pointillés et superposés pour les visualiser
Xsiz
(0,0) Numéro d’index de la tuile

YTOsiz
...
(XTOsiz, YTOsiz)
(XOsiz, YOsiz) YTsiz

T0 T1 T2
Ysiz
...
T3 T4 T5 YTsiz
T6 T7 T8
b composante individuelle YTsiz
Figure 1 – Modèle d’image source ([15], figure 1)

XTOsiz XTsiz XTsiz XTsiz
b tuiles superposées à la grille de référence
Xsiz
(0,0)
(0,0)
(Xsiz – 1, 0)
(tcx0 , 1, tcy0)
YOsiz
(XOsiz, YOsiz)
Ysiz Données de la tuile-composante
Zone image
Ysiz – YOsiz
(tcx1 – 1, tcy1 – 1)
(0, Ysiz – 1)
(Xsiz – 1, Ysiz – 1)
c système de coordonnées d’une « tuile-composante », portion
XOsiz Xsiz – XOsiz de composante correspondant à une seule tuile
Figure 2 – Grille de référence (([15] figure 2) et ISO/IEC 15444-1 Figure 3 – Image partagée en « tuiles » (Ina et al., [15] et
figure B-1) ISO/IEC 15444-1 figure B-4)
TE 5 320 – 4 Copyright © – Techniques de l’Ingénieur – Tous droits réservés
taux XTsiz et verticaux YTsiz. En appliquant la position de chaque

tuile de la grille de référence aux systèmes de coordonnées des
composantes individuelles, on obtient un partitionnement des
composantes elles-mêmes (figure 3c et [15]). La portion d’une
composante qui correspond à une seule tuile est désignée par
tuile-composante (tile-component).
En pratique, le tuilage n’est pas utilisé en cinéma numérique et
en vidéo.
Nota : l’origine des tuiles (XTOSiz, YTOSiz) est décalée par rapport au (0,0) de la grille
de référence pour la même raison que l’origine de l’image (X0Siz, YOSiz) l’est : afin d’être
le plus générique possible. Plusieurs choix techniques dans JPEG 2000 ont été faits non
pas pour répondre à un cas utilisateur bien précis, mais pour être ouvert aux nouveaux
cas pouvant apparaître. Ce décalage permet notamment de positionner les frontières des
tuiles arbitrairement sur l’image, afin de permettre une découpe (cropping) plus aisée de
l’image (pour passer d’un format 16/9 à 4/63, par exemple). La grille de référence, la
taille, le sous-échantillonnage et le décalage (offset) sont alors parfaitement définis dans
l’en-tête principal (main header) du codestream généré à la sortie du codeur (figure 29). a 2 sinusoïdes de fréquences différentes
Une partie de tuile sera encodée exactement de la même manière qu’une tuile entière.
Toutefois, en pratique, X0Siz, YOSiz et XTOSiz, YTOSiz sont très rarement différents
de zéro.
2.2 Transformée en ondelettes

Si les premières études datent du début et de la moitié du

XXe siècle (1909, Alfred Haar, et 1946, Dennis Gabor), l’analyse par
ondelettes a été d’abord utilisée au début des années 1980 pour
les besoins des études sismiques en prospection pétrolière. Il
s’agissait à l’époque de donner une représentation des signaux
b 2 « Gaborettes »
permettant de faire apparaître simultanément des informations
temporelles (localisation dans le temps, durée) et fréquentielles, Fonctions élémentaires dont l’on fait varier la localisation (translation)
facilitant par là l’identification des caractéristiques physiques de la ainsi que la fréquence (modulation), tout en gardant leur taille (amplitude
structure géologique à l’origine du signal. Les ondelettes n’ont et durée) constante. Leur forme (enveloppe) varie
depuis lors cessé de se développer et de trouver de nouveaux
champs d’application, dont la compression d’images utilisée par
JPEG 2000.
Nota : la présentation qui suit du principe des ondelettes et de leur utilisation en
compression d’image, est en grande partie reprise d’une conférence au Club Visu de
Yann Guyonvarc’h, alors PDG de l’ex-société VisioWave. La section correspondante de la
bibliographie (dans la partie « Pour en savoir plus ») fournit des références
complémentaires. Pour une approche mathématique des ondelettes, on se reportera à
l’article [TE 5 215] des Techniques de l’Ingénieur.
c 2 « ondelettes »
2.2.1 Principe de la transformée en ondelettes Fonctions élémentaires dont l’on fait varier la localisation (translation)
DWT ainsi que la taille (dilatation ou contraction), tout en gardant leur forme
constante.
L’analyse de Fourier nous enseigne qu’un signal quelconque
La dilatation s’accompagne d’une variation de la vitesse des oscillations,
peut s’écrire comme une somme de sinusoïdes, de fréquences et
donc de la fréquence
d’amplitudes variables. Un signal est ainsi entièrement caractérisé
par l’ensemble des amplitudes des sinusoïdes qui forme ce qu’on
appelle sa transformée de Fourier (figure 5b et [13]). La transfor- Figure 4 – Exemples d’ondes élémentaires [10]
mée de Fourier est porteuse de précieuses informations sur le
signal analysé. On sait que, si elle n’a que de faibles valeurs pour
des valeurs élevées de la variable de fréquence, cela signifie que le signifie qu’elle est nulle en dehors d’une certaine zone, qui
signal varie lentement. Inversement, si elle prend des valeurs constitue son support. L’ensemble de ces transformées de Fourier
importantes pour les hautes fréquences, cela signifie que le signal ainsi localisées forme la transformée de Gabor du signal, elle four-
contient une quantité non négligeable de hautes fréquences, et nit donc une analyse fréquentielle locale. Par conséquent, le signal
donc varie rapidement, au moins dans certaines zones. peut être reconstruit à partir de sa transformée de Gabor. Cette
L’analyse spectrale repose donc sur des sinusoïdes. Une sinu- reconstruction est très simple : le signal peut être synthétisé
soïde est associée à une fréquence « infiniment pure », mais à comme somme de gaborettes (figure 4b et [10]), qui ne sont
laquelle on ne saurait affecter de notion temporelle précise (instant autres que des sinusoïdes localisées par des fenêtres du même
de départ, durée) : une sinusoïde n’a ni début ni fin (figure 4a et type que celles qui sont utilisées pour la transformation de Gabor.
[10]). Et c’est précisément ici que se situe l’une des limitations À chacune de ces gaborettes sont attachés une fréquence et un
importantes de l’analyse de Fourier usuelle. La transformée de temps bien déterminés. Le poids d’une gaborette dans un signal
Fourier du signal (figure 5b et [13]) est incapable de localiser les n’est autre que la valeur de sa transformée de Gabor pour la fré-
portions du signal dans lesquelles les variations sont rapides par quence et le temps correspondants. Ce sera aussi le cas des onde-
opposition à celles qui sont lentes. Au milieu des années 1940, le lettes (figure 5c et [13]).
physicien Dennis Gabor, qui en 1971 reçut le prix Nobel de L’analyse et la transformée en ondelettes discrète DWT (Discrete
physique pour ses travaux sur l’holographie, proposa un prototype Wavelet Transform), plus récente et proposée initialement par J.
d’analyse par ondelettes. Gabor suggérait de rendre locale l’ana- Morlet, se fondent sur un concept quelque peu différent de celui
lyse de Fourier en s’aidant de « fenêtres ». Une fenêtre est une de fréquence : le concept d’échelle. Au lieu de considérer des fonc-
fonction régulière, lentement variable et bien localisée, ce qui tions oscillantes placées à l’intérieur d’une fenêtre, que l’on fait
s’écrit sous la forme d’une superposition de telles ondelettes déca-

0,1 lées et dilatées. Les poids de ces ondelettes dans la décomposition
(appelés « coefficients d’ondelettes ») forment la transformée en
0 ondelettes, qui est donc une fonction de deux variables : le temps
et l’échelle (dilatation). La fonction de base est soit déplacée et
– 0,1
modulée (gaborettes), soit translatée et dilatée (ondelettes).
Temps (ms)
La différence fondamentale entre les deux tient précisément à
a onde sonore d’extrait musical cette opération de dilatation : les ondelettes s’adaptent
d’elles-mêmes à la taille des caractéristiques qu’elles recherchent.
Elles sont très étendues pour étudier les basses fréquences (les
110
grandes échelles) et très fines pour étudier des phénomènes plus
transitoires (hautes fréquences, ou petites échelles). Cette procé-
100 dure développée par Stéphane Mallat et systématisée par Ingrid
90 Daubechies, porte le nom de multirésolution.
80
Pour illustrer cette approche, on peut prendre un exemple de fonc-
Amplitude
70 tion particulière de deux variables, en l’occurrence, ce qui nous inté-

60 resse dans cet article : l’image. Une image (en noir et blanc pour
simplifier) consiste en une série de points (pixels) plus ou moins
50
sombres (on parle de « niveaux de gris ») que l’on peut idéaliser
40 comme une fonction dans un espace à deux dimensions (le plan de

l’image). Cette fonction associe à chaque point un nombre représen-
30
tant son niveau de gris (l’intensité lumineuse en ce point). Lisser une
20 image consiste mathématiquement à prendre le produit de
10 convolution de sa version numérique avec une fonction très régulière,
et revient à la rendre floue par suppression des fréquences visuelles
hautes. Si nous considérons maintenant deux versions floues de
200 400 600 800 1 000 1 200 1 400 1 600 1 800 2 000 l’image, nous pouvons nous intéresser aux détails qui sont toujours
Fréquence (Hz)
présents dans l’image la moins floue, mais qui ont disparu dans
b transformée de Fourier l’image la plus floue. Mathématiquement, cela revient à calculer une
différence entre les deux fonctions lissées, et l’on peut montrer que
Les raies de la transformée de Fourier indiquent quelles sont les notes cette opération est identique au calcul d’une transformée d’onde-
qui sont présentes dans l’extrait musical, en renseignant précisément lettes (bidimensionnelle) de notre image. À ce moment-là, la
sur leurs fréquences ; on ne sait cependant pas l’ordre dans lequel les
reconstruction de l’image à sa finesse de détails la plus grande, à par-
notes sont jouées
tir de ses coefficients en ondelettes, consiste à effectuer la somme
d’une version floue et des détails (figure 6 et [10]). Ces détails
peuvent être calculés à des échelles différentes, c’est-à-dire à des
0,45 résolutions différentes.
Fréquence (kHz)
0,4
Amplitude
0,35
0,3
0,25 L Image de moyenne
0,2
0,15
0,1
500 1 000 1 500 2 000 2 500 3 000 3 500 4 000 4 500

Temps (ms)
c transformée en ondelettes
Les raies verticales de la transformée de Fourier se retrouvent dans le

scalogramme, sous la forme de bandes horizontales. En outre, ces
fréquences sont localisées en temps (ce qui est un « plus »). Mais le = +
prix à payer est la perte de localisation fréquentielle. Ce qu’on gagne
d’un côté est perdu de l’autre.
Le scalogramme qui résulte de la transformée en ondelettes tend vers
la représentation idéale qu’est la partition musicale. D’une certaine
manière, les ondelettes peuvent être assimilées aux « notes-
mathématiques » d’un morceau de musique.
Image initiale
Figure 5 – Transformée de Fourier (b) et transformée en ondelettes

(c) d’un signal musical (a) [13]
ensuite coulisser le long d’un signal à analyser (les gaborettes), les H Image de différence
ondelettes sont davantage des copies les unes des autres ; copies
presque conformes, puisqu’elles sont de forme constante et ne dif-
fèrent que par leur taille (figure 4c et [13]). La décomposition en Figure 6 – Concept de base de la décomposition d’une image
par ondelettes : (L) partie basse du spectre + (H) partie haute
ondelettes est similaire à la décomposition de Gabor : un signal du spectre [10]
2.2.2 Codage « didactique » d’une image l’image originale. Il faut leur ajouter les 8 coefficients de détails du
niveau précédent si on veut retrouver les valeurs des 16 pixels ini-
La section suivante propose d’oublier les ondelettes pour un tiaux. Si on itère le codage jusqu’au niveau 4, on se retrouve avec
moment et de donner une perception « physico-pratique » de ce qui une valeur moyenne (ici : 5,5) et 15 coefficients de détails : (1 de
se passe dans la compression/décompression d’une image par niveau 4) + (2 de niveau 3) + (4 de niveau 2) + (8 de niveau 1) = 15.
ondelettes. Mais où est donc la compression ?
La première ligne de nombres du tableau 1 traduit la succession La compression peut être introduite du fait que les coefficients de
de niveaux de gris de pixels situés au-dessus, comme on peut en détails sont petits et que beaucoup d’entre eux, en dessous d’un
trouver le long d’une ligne d’écran de télévision. C’est le « niveau seuil donné, peuvent être mis à zéro. Si on décide dans le tableau 1
0 », avant tout codage. que tout coefficient de détail inférieur ou égal à 1 est quantité négli-
Le premier codage de « niveau 1 » consiste à calculer la geable et qu’on le remplace par « 0 », noté (0) en gras dans le
moyenne (2e ligne de nombres en partant du haut du tableau) des tableau 2, on y reconstruit (2e ligne de nombres en haut du tableau)
niveaux de gris des pixels, pris deux par deux. Cette moyenne est l’image de bas en haut du tableau, en additionnant à la moyenne de
en fait une opération de filtrage passe-bas, car on ne retient que la niveau 4 les coefficients de détails successifs.
fréquence moitié du spectre contenu dans la série initiale de Dans cet exemple très simplifié et « brutal », avec la mise à zéro
valeurs (figure 7). Pour ne pas perdre la partie haute fréquence de de 8 coefficients de détail notés en gras (0), on voit que l’image se
ce spectre (se rappeler les transformées de Fourier ou par ondelet- trouve décrite de façon simplifiée par 1 nombre (valeur moyenne)
tes...), on a porté, sur la 3e ligne de nombres, les différences ou + 7 coefficients de détails, au lieu des 1 + 15 initialement. C’est là
« delta » (nombres entre parenthèses) qui permettent de reconsti- que la compression commence à opérer (et ce n’est pas le seul
tuer le signal initial. Par exemple, les deux premières valeurs, 9 et moyen, d’autres viennent en complément, comme on le verra aux
7, ont donné une moyenne de 8, et une différence de 1, car la pre- paragraphes 4.3 et 4.4). Bien sûr, dans cet exemple, le résultat
mière valeur « 9 » vaut bien 8 + 1, et la seconde « 7 » vaut 8 – 1. n’est pas très précis, quand on compare la séquence initiale et la
Ces différences sont appelées coefficients de détails. Ils sont natu- séquence restituée (1re et 2e lignes de nombres en haut du
rellement toujours plus petits que les valeurs moyennes de la ligne tableau). Mais pour avoir une vue réaliste de la reconstitution, il ne
du dessus (voir nota ci-après). Cela prépare à la compression, qui faut pas aller regarder uniquement « au niveau du pixel » (niveau
n’en est pas encore une et qui sera effectuée ultérieurement. En 0) mais aussi au niveau des paires de pixels (niveau 1), ou des
effet, les 16 valeurs de la première ligne ont été remplacées par les quartets (niveau 2), ou des octets (niveau 3), etc. C’est ce
8 moyennes (2e ligne de nombres) et les 8 coefficients de détails qu’illustre le tableau 3 comparatif. On peut en retenir que si c’est
(3e ligne), sans plus. « passable » au niveau des pixels (niveau 0), cela devient meilleur
Nota : cela est correct pour des valeurs non-signées mais ça ne l’est plus pour des
à mesure qu’on prend du recul vers les groupes de pixels de plus
valeurs signées, comme c’est le cas dans JPEG 2000. Dans une image de bruit, on peut en plus gros (du niveau 1 au niveau 4).
se retrouver facilement avec des coefficients basse fréquence proches de 0 et des coeffi-
cients haute fréquence beaucoup plus élevés. Cette assertion est toutefois vraie pour la Nota : la transformée en ondelettes n’est donc pas à proprement parler une compres-
plupart des images naturelles (photos). sion d’information. La transformée ne fait que réorganiser l’information en séparant les
basses et hautes fréquences, afin de faciliter une compression ultérieure. Cette compression
Ce processus peut être réitéré, si on procède à un second niveau peut ensuite se faire par quantification des coefficients d’ondelettes (§ 4.3) et/ou via un
encodage entropique (§ 4.4). JPEG 2000 fait les deux, sauf dans le cas d’une compression
de codage (4e et 5e lignes), où on voit apparaître 4 valeurs mathématiquement sans perte où il n’y a pas de quantification des coefficients.
moyennes et 4 coefficients de détails. Mais il ne faut pas croire que
ces 8 valeurs suffiraient à reconstituer les valeurs des pixels de Mais où sont les ondelettes dans tout cela ?
Tableau 1 – Codage de 16 pixels par moyennes et différences (« coefficients de détails »)

(source VisioWave)
Niveau 0 de niveaux de gris
Rangée de 16 pixels d’image
Valeurs initiales des niveaux de gris 9 7 1 7 2 4 9 5 8 6 5 7 9 5 3 1
Codage niveau 1 :
8 4 3 7 7 6 7 2
Moyenne 16 → 8 pixels
Différence entre niveau 0 et niveau 1
(1) (– 3) (– 1) (2) (1) (– 1) (2) (1)
(coefficient de détails)
Codage niveau 2 :
6 5 6,5 4,5
(2) (– 2) (0,5) (2,5)
Codage niveau 3 :
5,5 5,5

(0,5) (1)
Codage niveau 4
5,5
Moyenne 2 → 1 pixel

(0)
Tableau 2 – Compression par mise à zéro de certains coefficients de détails et reconstitution

des 16 pixels (source VisioWave)
Valeurs initiales 9 7 1 7 2 4 9 5 8 6 5 7 9 5 3 1
Valeurs reconstituées 7,5 7,5 0,5 6,5 3,5 3,5 9,5 5,5 5,5 5,5 5,5 5,5 10 6 3 3
Codage niveau 1 :
7,5 3,5 3,5 7,5 5,5 5,5 8 3

(0) (– 3) (0) (2) (0) (0) (2) (0)
Codage niveau 2 :
5,5 5,5 5,5 5,5

(2) (– 2) (0) (2,5)
Codage niveau 3 :
5,5 5,5

(0) (0)
Codage niveau 4
5,5
Moyenne 2 → 1 pixel

(0)
Tableau 3 – Comparaison des valeurs de gris et de leur reconstitution à tous les niveaux de codage
(source VisioWave)
Niveaux 0 de gris initiaux 9 7 1 7 2 4 9 5 8 6 5 7 9 5 3 1
Niveaux 0 reconstitués 7,5 7,5 0,5 6,5 3,5 3,5 9,5 5,5 5,5 5,5 5,5 5,5 10 6 3 3
Niveaux 1 de gris initiaux 8 4 3 7 7 6 7 2
Niveaux 1 reconstitués 7,5 3,5 3,5 7,5 5,5 5,5 8 3
Niveaux 2 de gris initiaux 6 5 6,5 4,5
Niveaux 2 reconstitués 5,5 5,5 5,5 5,5
Niveaux 3 de gris initiaux 5,5 5,5
Niveaux 3 reconstitués 5,5 5,5
Niveaux 4 de gris initiaux 5,5
Niveaux 4 reconstitués 5,5
2.2.3 Application des ondelettes à l’image Une méthode assimilable à la transformée de Gabor est en œuvre,
par exemple, dans la compression MPEG en général, et tout particu-
Quand, précédemment, on a pris la moyenne des valeurs de lièrement MPEG-2. On décompose l’image en blocs de 8 × 8 pixels,
deux pixels adjacents, on a extrait la fréquence basse (L = Low), et on applique à cette « fenêtre d’image » la transformation DCT (Dis-
spatiale ou temporelle du spectre de l’image locale que forment crete Cosine Transform ). Notons qu’au départ, on perd déjà un degré
ces pixels. Les différences de détails, elles, représentaient la partie de liberté : ce sera un bloc de 8 × 8 pixels, et pas autre chose. Mais
haute (H = High) du spectre. les ondelettes permettent de faire plus, avec davantage de rationalité
Ce traitement peut être effectué par l’analyse de Fourier fenêtrée et de souplesse, bien que longtemps, le succès rencontré par la
(transformée de Gabor) ou, bien plus efficacement, par l’analyse transformée DCT ait occulté les travaux menés parallèlement sur
par ondelettes (§ 2.2.1). d’autres types de transformation dont celle en ondelettes.
La transformée en ondelettes va donc être appliquée à l’ensem- – LL1 (Lowpass horizontal + Lowpass vertical) obtenue par appli-
ble des pixels de l’image sur ses 2 dimensions, en générant une cation successive de deux opérateurs :
image de moyenne et des images de différence. La figure 6 pré- • L sur les N rangées de LL0 (donne N/2 colonnes),
sente le concept de base de cette décomposition, avec à gauche
l’image initiale à une bonne résolution, à droite en haut une ver- • L sur les N/2 colonnes ci-dessus (donne N2/4 coefficients pour
sion lissée à une résolution plus faible et à droite en bas la diffé- LL1) ;
rence entre les deux images précédentes, contenant les détails – LH1 (Lowpass horizontal + Highpass vertical) obtenue par
présents dans la première image et absents de la seconde. En pra- application successive de deux opérateurs :
tique, plusieurs images de différence seront générées.
• L sur les N rangées de LL0 (donne N/2 colonnes),
Concrètement, une ondelette est une sinusoïde modulée en fré- • H sur les N/2 colonnes ci-dessus (donne N2/4 coefficients
quence et amplitude selon une forme adaptée, généralement en pour LH1) ;
« chapeau de gendarme » (figure 4c). En analyse spectrale, elle va
chercher avec le signal à traiter une corrélation avec son spectre – HL1 (Highpass horizontal + Lowpass vertical) obtenue par
de fréquences, sur le temps (ou l’espace) « couvert » par le cha- application successive de deux opérateurs :
peau. Un modèle de forme de l’ondelette ayant été établi pour res- • H sur les N rangées de LL0 (donne N/2 colonnes),
pecter notamment les propriétés ci-dessus, on dispose alors d’un
• L sur les N/2 colonnes ci-dessus (donne N2/4 coefficients pour
outil d’analyse modulable :
HL1) ;
– on peut le dilater horizontalement, ce qui revient à élargir sa
– HH1 (Highpass horizontal + Highpass vertical) : obtenue par
fenêtre de sensibilité, et à diminuer dans la même proportion la
application successive de deux opérateurs :
fréquence d’analyse (il y a un nombre constant d’alternances sous
le « chapeau ») ; • H sur les N rangées de LL0 (donne N/2 colonnes),

– on peut le translater dans le temps ou dans l’espace, pour aller • H sur les N/2 colonnes ci-dessus (donne N2/4 coefficients
se positionner sur la fenêtre de signal qu’on veut explorer. pour HH1).
En somme, on dispose d’une sorte de microscope, dont on peut Le terme de « sous-bandes » se réfère au domaine des fréquen-
régler le point de visée (translation) et, une fois sur ce point, on ces avec les effets du filtrage passe-bas ou passe-haut associé à un
peut faire varier le « grossissement » (correspondant à la fré- sous-échantillonnage de facteur 2 (figure 7).
quence d’analyse). Quand l’un ou l’autre augmente, on distingue À la fin de cette première passe, on dispose de 4
des détails plus petits (petits paquets de pixels) dans un champ de matrices × N2/4 = N2 coefficients, sans compression donc à ce
vision qui se restreint. C’était bien ce qu’on réalisait, dans l’exem- stade. Pas plus qu’il n’y aura compression au second passage
ple didactique qui précédait, en prenant des moyennes (diminution (niveau 2), qui prendra comme point de départ les N2/4 coefficients
du grossissement) et en recommençant au niveau suivant (grossis- de LL1. Pour la commodité de la présentation, on dispose de la
sement encore réduit), tout en gardant les différences (coefficients façon suivante les 4 fois N2/4 séries de coefficients de l’algorithme
de détails) en réserve pour conserver la partie haute du spectre. appliqué à un niveau donné.
Traduit en termes d’ondelettes dans le cas à une dimension, cela Lorsque les N2/4 coefficients LL1 sont à leur tour traités pour
signifie qu’une première double-passe doit être faite avec un filtre obtenir les 4 × (N2/16) = N2/4 coefficients du niveau 2, on les dis-
(ondelette) passe-bas (L = Low) et un filtre passe-haut (H = High) : pose sous forme de 4 matrices LL2, LH2, HL2, HH2 qui se substi-
cela donnera l’équivalent de ce que donnaient respectivement la tuent à la matrice LL1. Et ainsi de suite, jusqu’au niveau 3
moyenne (L) et les différences ou « coefficients de détails » (H) (figure 9).
dans l’exemple didactique de l’introduction. Puis, sur les résultats
donnés par le filtre passe-bas (voir nota ci-après), il faut répéter La figure 10 illustre bien ces itérations successives [17], avec :
l’opération de double filtrage (on monte d’un niveau en réduisant – l’image initiale de « Lena » (figure 10a) ;
d’un cran la résolution et en élargissant d’autant la largeur de – au niveau 1 de décomposition (figure 10b), quatre
champ) et ainsi de suite jusqu’au niveau maximum où l’on ne peut sous-images (sous-bandes) conventionnelles (LL1, LH1, HL1 et
plus diviser par 2 la taille du résultat itératif du filtre passe-bas. En HH1) représentant les coefficients obtenus dans chaque matrice
pratique, on se limite souvent à 5 itérations. (avec la valeur des coefficients traduite faute de mieux par un
niveau de gris, avec noir = maximale négative et blanc = valeur
Nota : c’est ce qu’on appelle une décomposition dyadique. Ce type de décomposition maximale positive – il faudrait en fait une sorte de carte 3D avec
est particulièrement adapté aux images naturelles, pour lesquelles la plus grande quan-
tité d’information se trouve généralement concentrée dans les basses fréquences de des cotes de profondeur) ;
l’image. Il est néanmoins possible de montrer que certaines images « pathologiques » – puis au niveau 2 de décomposition (figure 10c), quatre autres
bénéficieraient bien plus de décompositions successives des hautes fréquences. sous-images issues de la décomposition itérative de LL1.
Évidemment, ce qui s’applique à un signal linéaire est extrapola- La figure 11 illustre la multirésolution ainsi générée par la
ble à un signal « surfacique », c’est-à-dire à une image à deux décomposition en ondelettes, qui permet, dans le processus
dimensions. Mais là, il faut procéder avec des ondelettes dites inverse de décodage, de reconstituer l’image originale.
bi-orthogonales en balayant par rangées et colonnes. Plus précisé- D’une manière qualitative (figure 12), les images LH repré-
ment, l’analyse se déroule par balayage alternatif de rangées et de sentent les détails horizontaux, les images HL les détails verticaux
colonnes selon l’algorithme suivant. (le filtre H s’applique aux rangées) et les images HH les détails dia-
gonaux. Les images LL donnent en quelque sorte les « à-plats »,
■ Niveau 0 c’est-à-dire les plages assez uniformes (à l’échelle observée).
Le point de départ est une image échantillonnée sur N × N
pixels, soit N2 pixels dans les 2 dimensions, horizontale et verti-
cale, de cette image échantillonnée, dite « LL0 » : premier L (Low) 2.3 Principe de la compression
pour « basse fréquence » des rangées horizontales de nombres du
niveau 0, second L pour « basse fréquence » des colonnes Ayant de la sorte codé sans perte d’information, mais non
verticales de nombres du niveau 0. encore compressé, l’image à traiter, il va falloir appliquer une stra-
tégie de réduction des données qui pourra avoir au moins deux
■ Niveau 1 types d’objectifs :
On calcule, lors d’une 1re passe, 4 sous-images distinctes filtrées – soit respecter une qualité minimale de restitution, quel que soit
et sous-échantillonnées, ou « sous-bandes » (figure 7 et figure 8) : le volume (ou débit) d’information résiduelle à transmettre ;
fréquence
0 sur N échantillons (dans la dimension x ou y)
Filtre L Filtre H
passe-bas passe-haut
sur N/2 échantillons Sur n/2 échantillons
Filtre L Filtre H Filtre L Filtre H

passe-bas passe-haut passe-bas passe-haut
sur N/4 échantillons sur N/4 échantillons sur N/4 échantillons sur N/4 échantillons
Sous-bande LL Sous-bande LH Sous-bande HL Sous-bande HH
Figure 7 – Décomposition en sous-bandes dans le domaine des fréquences
L est L’image L
l’image originale filtrée passe-bas est filtrée passe-bas L/passe-haut H
et sous-échantillonnée par un facteur de 2 et sous-échantillonnée par un facteur de 2
dans la dimension x (rangées de pixels) dans la dimension y (colonnes de pixels)
LL
(La 2e passe L 1 sous-image (sous-bande)
effectuera le de moyenne (d’approximation)
même traitement (fréquences visuelles basses
sur l’image LL) les plus importantes)
Convolution sur y Sous-
par filtrage échantillonnage/2
passe-bas Ly sur axe y LH
Convolution Sous-
sur axe x échantillonnage/2
par filtrage sur axe x Convolution sur y Sous-
passe-bas par filtrage échantillonnage/2
Lx passe-haut Hy sur axe y HL
3 sous-images
H (sous-bandes)
de détails
horizontaux (LH)
Convolution sur y Sous- verticaux (HL)
par filtrage échantillonnage/2 diagonaux (HH)
passe-bas Ly sur axe y HH (si erreurs ou
forte compression,
infos les moins gênantes)
Convolution Sous-
sur axe x échantillonnage/2
par filtrage sur axe x Sous-
Convolution sur y
passe-haut échantillonnage/2
par filtrage
Hx sur axe y
passe-haut Hy
H est L’image H
l’image originale filtrée passe-haut est filtrée passe-bas L / passe-haut H
et sous-échantillonnée par un facteur de 2 et sous-échantillonnée par un facteur de 2
dans la dimension x (rangées de pixels) dans la dimension y (colonnes de pixels)
Figure 8 – 1re passe (puis 2e passe) du processus de décomposition en « sous-images » (sous-bandes) par ondeletettes à 2 dimensions (source
Wavelet Transform : https://software.intel.com/en-us/node/504431)
Image initiale 1re décomposition 2e décomposition (niveau 2) 3e décomposition (niveau 3)

(niveau 0) (niveau 1)
LLO LL1 HL1 LL2 HL2 HL1 LL3 HL3 HL2 HL1
LH3 HH3
LH2 HH2 LH2 HH2
LH1 HH1 LH1 HH1 LH1 HH1
Figure 9 – Matrices de coefficients en sous-bandes de transformation itérative DWT sur 3 niveaux ([17]-24)
a image initial « Lena » b sous-images (des sous-bandes) c sous-images (des sous-bandes)

au niveau 1 de décomposition au niveau 2 de décomposition
Figure 10 – Une image et sa décomposition itérative en sous-images issues des matrices de coefficients des sous-bandes (source IntoPiX [17])
Figure 11 – Ondelettes et multirésolution (source IntoPIX [17])
Approximation Détails
verticaux
Détails Détails
horizontaux diagonaux
Figure 12 – Résultats du filtrage en ondelettes – Approximation et détails horizontaux, verticaux et diagonaux (source Cisco)
– soit se fixer un volume (ou débit) maximum d’information à est aussi plus douce, avec un flou léger sur les zones à hautes fré-
transmettre, quitte à sacrifier la qualité d’image. quences visuelles (bords, traits, transitions, diagonales...), les coef-
Divers procédés sont pour cela utilisés : ficients correspondants étant alors supprimés pour atteindre un
fort taux de compression.
– une élimination plus ou moins poussée des coefficients des
matrices obtenues (§ 4.3), comme déjà illustrée dans le tableau 2 ;
– un codage entropique (§ 4.4) qui consiste à repérer les valeurs
les plus probables et à leur donner le code le plus court. 3.3 Codage avec ou sans pertes
Ainsi est accompli le parcours qui permet de passer d’une image Pour obtenir une qualité d’image maximale, JPEG 2000
numérique à son expression compressée. comprend un mode de compression « mathématiquement sans
Cette première approche des principes et des techniques de la perte » (mathematically lossless). Ce mode, avec un taux de
compression des images par ondelettes va nous permettre de pré- compression de l’ordre de 2:1, permet de reconstituer exactement
senter et d’illustrer les principales fonctionnalités de JPEG 2000. toutes les valeurs numériques des pixels de l’image originale
(figure 14b+c et figure 25 Bit-plane 11 et 10). Ce mode est ainsi
extrêmement important dans des domaines tels que l’archivage
numérique, l’acquisition en cinéma numérique et l’imagerie médi-
3. Principales fonctionnalités cale ([TE 5 322] § 4).
Avec un taux de compression plus important, cette reconstitu-
de JPEG 2000 tion parfaite des valeurs numériques initiales ne sera plus possi-
ble. On parle alors de compression « mathématiquement avec
JPEG 2000 présente de nombreux atouts, pour des images fixes pertes » (mathematically lossy) entraînant une perte de qualité
ou pour des images animées, correspondant aux objectifs fixés irrémédiable de l’image.
lors de la conception du format (§ 1). Toutefois, à des taux de compression modérés, de 5:1 à 10:1
environ, on peut d’abord effectuer une compression « visuelle-
ment sans perte » (visually lossless) de l’image, que même l’œil
3.1 « License-free » exercé d’un expert ne pourra pas distinguer de l’original
(figure 15b et figure 25 Bit-plane 9 et 8). Par contre, avec un effet
Suite à des accords entre plus de 20 organisations ou entre- de zoom et si le taux de compression est trop élevé, les premiers
prises possédant des brevets dans ce domaine, la partie 1 de la artefacts deviendront perceptibles.
norme JPEG 2000 ([TE 5 322], § 1.1.1), concernant le cœur du À un niveau de qualité encore inférieur, pour des taux de
codage, n’est pas sujet au paiement de royalties ou de licences. compression jusqu’à 50:1 environ, et au-delà, les artefacts de
compression deviennent visibles (figure 15c et figures 24 et 25
Bit-plane 7 et 6) et on parle alors de compression « visuellement
3.2 Efficacité et perception améliorées avec pertes » (visually lossy). Les images peuvent cependant res-
de la compression ter utilisables dans le cadre, par exemple, d’une recherche sur le
Web.
L’efficacité sera largement démontrée dans le paragraphe du
deuxième article ([TE 5 322], § 3) concernant les performances de
JPEG 2000 comparées à celles d’autres formats de compression 3.4 Scalabilité
d’images fixes ou d’images animées. La figure 13 compare deux
images compressées JPEG et JPEG 2000 à un très fort niveau de Un format de compression est dit intrinsèquement scalable
compression (137:1). Sur l’image compressée JPEG apparaissent quand l’utilisateur peut extraire de multiples versions d’un seul
des effets de blocs, dus au processus d’analyse et de transforma- train de données (codestream) ou d’un seul fichier, en fonction des
tion DCT (Discrete Cosine Transform) s’appliquant sur des blocs ressources de l’équipement utilisateur ou des besoins en niveau
de pixels. La dégradation sur l’image JPEG 2000 est plus homo- de qualité. Un codestream JPEG 2000 est la juxtaposition, en fin de
gène, l’analyse et la transformée en ondelettes DWT (Discrete codeur (§ 4), d’en-têtes contenant les paramètres de codage et de
Wavelet Transform) s’appliquant sur l’ensemble de l’image. Elle bit streams, formes compressées des données de l’image (§ 4.5.2).

a JPEG (transformée DCT) Taux de compression 137:1 b JPEG 2000 (transformée DWT) Taux de compression 137:1
Figure 13 – Compression comparée JPEG//JPEG 2000 (source intoPIX)
a original b compression 2:1 mathématiquement c décompression mathématiquement

sans perte sans perte
Figure 14 – Compression mathématiquement sans perte (lossless) (source IntoPIX [17] p. 5)
a original b compression 5:1 visuellement sans perte c compression 50:1 visuellement avec pertes
Figure 15 – Compression visuellement sans/avec pertes (lossless/lossy) (source intoPIX [17] p. 5)
Cette scalabilité est permise par la structure « atomisée » : 3.7 Autres fonctionnalités
– de l’image, en composantes, en tuiles (§ 2.1) et en secteurs
(precincts – § 4.5.1) ; Parmi les autres fonctionnalités offertes par JPEG 2000, on peut
– de la décomposition itérative multirésolution par ondelettes en citer :
sous-bandes (§ 2.2.3) ;
– des matrices de données en blocs de codage et en plans de – l’accès aléatoire aux différentes zones de l’image. Il est
bits (§ 4.4), en couches, en secteurs, puis en paquets (§ 4.5.1) ; possible de ne décoder qu’une certaine zone d’une image, c’est là
– du codestream (§ 4.5.2) et des fichiers ([TE 5 322], § 2.1) encap- un atout des tuiles (quand l’image est très grande), et des secteurs
sulant ces données. (precincts) ;
On peut alors : – les métadonnées très variées que JPEG 2000 permet d’enregis-
trer ([TE 5 322], § 2.3.1) ;
– générer facilement une version de consultation (proxy ou
browsing copy) ; – le traitement d’une grande variété de types d’images. La
– visualiser et traiter des régions d’intérêt ROI (Region of norme JPEG 2000 s’applique aux images photographiques en cou-
Interest) – § 4.8 ; leurs mais aussi aux images en niveaux de gris et aux images
– optimiser la capacité disponible et variable sur un réseau, par composées de zones différentes ;
exemple en donnant la priorité à des paquets de données fonda- – la compatibilité avec les profils ICC. JPEG 2000 emporte des
mentales, pour en permettre une adaptation automatique au débit informations précises sur les couleurs ; en particulier, il est
disponible, ou encore en augmentant la redondance de ces compatible avec les profils ICC (International Colour Consortium)
paquets pour garantir une qualité minimum d’image en cas qui sont devenus incontournables dans la pré-presse ;
d’affaiblissement du signal ; – les images 32 bits. JPEG 2000, contrairement à JPEG, permet
– effectuer une réception adaptative, tenant compte du débit de de traiter des images 32 bits ;
transmission et de la définition d’affichage disponibles
– la transparence. Contrairement à JPEG, JPEG 2000 permet
(figure 36b), permettant ainsi en cinéma numérique soit un affi-
d’enregistrer une image comportant de la transparence.
chage 2K, soit 4K ([TE 5 322], figure 26). Ou encore en diffusion
vidéo numérique (application pas utilisée), cela permet soit à une
tablette avec une connexion bas débit de recevoir une version de
résolution ou de qualité réduite, par exemple pour regarder des
actualités, soit à un téléviseur HD ou UHD-1 (« 4K ») de recevoir le 4. Chaîne de codage
même signal en pleine résolution (voir aussi figure 36) ;
– bénéficier d’un décodage progressif en résolution ou en qua-
lité (§ 4.5.3), sur un même équipement. Seul l’algorithme de décodage est décrit dans la Partie 1 de la
norme JPEG 2000. Cependant, pour faciliter l’introduction de la ter-
minologie et celle des techniques mises en oeuvre, nous présen-
3.5 Régions d’intérêt tons ici un algorithme de codage typique compatible avec la
norme. La figure 16 présente le schéma fonctionnel d’un codeur
Une région d’intérêt (ROI) est une région de l’image qui est JPEG 2000. Il se divise essentiellement en 5 modules :
codée avec une plus grande précision parce qu’elle présente un pré-traitement, transformée en ondelettes discrète, quantification,
intérêt particulier. Cette plus grande précision se fait au détriment codage entropique et allocation de débit.
des autres zones de l’image qui sont alors compressées à un taux
supérieur et donc dégradées (§ 4.8).
4.1 Pré-traitement
3.6 Résistance aux erreurs
■ Tuilage
Le problème vient du codeur arithmétique (§ 4.4.2) car un seul
bit erroné entraîne le décodage d’une mauvaise séquence. Afin de C’est à cette étape que, en option, en particulier pour
limiter les effets de ces erreurs (figure 39 et [TE 5 322] – figure 28), compresser des images de grande taille, l’image est découpée en
la norme propose plusieurs outils, dont la philosophie est essen- tuiles (tiles) ou pavés, blocs rectangulaires qui ne se recouvrent
tiellement de compartimenter les mots de codes ou de réduire leur pas (§ 2.1.3). Chaque tuile est traitée indépendamment et peut se
longueur afin d’éviter ou de limiter la propagation des erreurs voir ultérieurement attribuer ses propres paramètres de
(§ 4.9). Pour une transmission sans fil, des méthodes spécifiques compression. Les tuiles permettent alors de réduire la taille
ont été développées dans la Partie 11 du standard, JPEG 2000 mémoire dans le codeur comme dans le décodeur, en travaillant
Wireless (ISO/IEC 15444-11/ITU-TT.8), pour détecter et corriger les sur des sous-images indépendantes. Ces tuiles sont réunies, en fin
erreurs ([TE 5 322], § 1.1.11). de chaîne de codage, dans un seul et même codestream.
Allocation
de débit
Données Mise en
Pré- Transformée Modélisation Codage Codestream
de l’image Quantification ordre
traitement en ondelettes contexte arithmétique JPEG 2000
originale des données
Région
d’intérêt
Figure 16 – Fonctions de la chaîne de codage JPEG 2000
Les tuiles peuvent avoir un impact visuel : on peut percevoir par-

fois leurs bornes (lignes horizontales et verticales sur l’image) – Original
voir figure 3a.
Par défaut, par exemple en cinéma numérique et en vidéo,
l’image entière est considérée comme une seule « tuile ».
■ Décalage de la valeur continu (DC level shift)
Il permet de passer d’une représentation des valeurs [0 à 255] à
[– 128 à + 127], afin d’avoir un signal centré autour de zéro.
■ Transformation colorimétrique
Le bloc fonctionnel effectue, en option, la transformation colori- Rouge Vert Bleu
métrique inter-composantes. Elle consiste à passer de l’espace des
couleurs RVB (3 composantes primaires Rouge-Vert-Bleu) à
l’espace YCbCr (1 composante de luminance et 2 composantes de
chrominance) (figure 17 et [4]). Cette transformation agit sur tou-
tes les composantes RVB ensemble et sert à décorréler les don-
nées des composantes entre elles. Cela contribue à une meilleure
efficacité de codage (voir Nota ci-après). Après cette transforma-
tion, chaque nouvelle composante calculée est traitée séparément
(bien qu’une quantification différente soit possible pour chacune, Transformation colorimétrique
mais aussi une allocation de débit commune à toutes).

Nota : dans un espace RVB, l’information est disséminée de manière égale dans les
Luminance Chrominance
3 composantes tandis que dans un espace YCbCr, l’information est concentrée dans la
composante de luminance (correspondant à la version en niveaux de gris de l’image). Y Cb Cr
Les composantes de chrominance contiennent en effet moins d’information pour l’œil et
c’est d’ailleurs la raison pour laquelle elles sont souvent sous-échantillonnées en vidéo.
L’espace YCbCr étant par conséquent plus propice à la compression que l’espace RVB,
une transformation de RVB vers YCbCr est donc opérée en cas d’entrée d’une image
RVB. On parle ainsi de décorrélation inter-composantes qui poursuit le même objectif
que la transformée en ondelettes qui est une décorrélation intra-composante : concentrer
le plus possible l’information (dans la composante de luminance et dans les basses fré-
quences) pour pouvoir compresser plus efficacement les autres zones de l’image
(composantes de chrominance et hautes fréquences). Concrètement, cette décorrélation
inter-composantes est un simple produit matriciel. Par ailleurs, c’est également cette
transformation qui permet d’extraire facilement une version en niveaux de gris d’une
image couleur puisque chaque composante est encodée indépendamment.
Figure 17 – Transformation colorimétrique inter-composantes RVB à
YCbCr ([5] p. 30-31)
Deux transformées sont spécifiées :
– ICT (Irreversible Component Transform), irréversible, à coeffi-
cients réels à virgule flottante, pour le codage avec pertes, avec : Les résultats de la décomposition sont enregistrés sous forme
• Y = [1/4 (R + 2V + B)], Cb = B – V et Cr = R – V pour la transfor- de matrices de coefficients d’ondelettes : LL, LH, HL et HH. On réi-
mée directe, tère ensuite l’opération avec la nouvelle image de sous-bande LL
obtenue précédemment, et ainsi de suite tant qu’il reste des pixels
• V = Y – [1/4 (Cb + Cr)], R = Cr + V, B = Cb + V pour la transfor-
(figure 10). La norme prévoit un nombre maximal de niveaux de
mée inverse ;
décomposition de 32 ; 5 décompositions sont effectuées par
– RCT (Reversible Component Transform), réversible, à coeffi- défaut.
cients entiers, utilisée en combinaison avec la transformée en
ondelette réversible 5/3 (§ 4.2) pour la compression sans perte, Au contraire de l’espace limité de la mémoire de travail requise
avec : par la transformée DCT d’un bloc de 8 × 8 pixels, une décomposi-
tion bidimensionnelle en ondelettes nécessite la mise en mémoire
• Y = 0,299(R – V) + V + 0,114 (B – V), d’une image entière. Pour simplifier (figure 18a [4] et [20]), on uti-
• Cb = 0,564(B – Y) et Cr = 0,713 (R – Y). lise le processus suivant (lifting scheme) :
Tout autre espace des couleurs (que ceux cités précédemment) – on calcule d’abord une transformée en ondelettes simple (lazy
peut être utilisé. Dans ce cas, il s’agira de désactiver la transfor- wavelet transform), et on sépare le signal original en deux
mée inter-composantes décrite ci-dessus qui n’est valable que sous-séquences indexées, impaire et paire ;
pour une conversion de RVB vers YCbCr. À noter que la Partie 2 de
la norme JPEG 2000 permet, quant à elle, de spécifier dans les – puis on modifie ces valeurs en effectuant alternativement des
en-têtes du codestream et dans le format de fichier JP2 ([TE 5 322], étapes de prédiction (prediction step) et de mise à jour (updating
§ 1.1.2) les coefficients d’une transformée inter-composantes alter- step) ; ces étapes sont généralement répétées N fois, avec des
native à celle définie dans la Partie 1. poids différents à chaque itération.
Dans le schéma général du processus (figure 18a) :
– s0i et d1i représentent respectivement les séquences paires et
4.2 Transformée en ondelettes impaires, résultant de l’application de la transformée en ondelettes
La transformée en ondelettes (§ 2.2.3) effectue, sur chaque tuile simple sur la séquence d’entrée des pixels d’images ;
de chaque composante, une décomposition en sous-bandes de fré- – P et U sont respectivement les poids de prédiction (prediction
quences (figure 9). Chaque itération des filtres d’analyse passe-bas weight) et de mise à jour (update weight) à chaque itération (1 à
et passe-haut est suivie d’une décimation par 2 (figure 7). Cela N) ;
permet : – la sortie de l’étape finale de prédiction générera les coefficients
– une décorrélation intra-composante, qui concentre l’informa- passe-haut avec un facteur d’échelle (scaling factor) K1 , tandis que
tion de l’image dans une zone petite et très localisée ; la sortie de l’étape finale de mise à jour générera les coefficients
– la représentation multirésolution de l’image. passe-bas avec un facteur d’échelle (scaling factor) K0.
Séquence paire Sortie

si0 + siN -1 siN passe-bas
+ K0
Séquence + +
Transformée
d’entrée
xi en ondelettes
simple P1(z) U1(z) PN(z) UN(z)
(lazy
transform) Sortie
+ +
di0 diN -1 diN passe-haut
K1
+ +
Séquence impaire
P : poids de prédiction (prediction weight) K : facteur de mise

U : poids de mise à jour (update weight) à l’échelle
(scaling factor)
a schéma général du processus

Séquences paire et impaire

s00 d 00 s10 d 10 s20 d 20 s30
Séquence
1 1 1 1 1 1 d’entrée
− 1 − − 1 − − 1 −
2 2 2 2 2 2
1 d 01 1 d 11 1 d 21 1 Sortie
passe-haut
1
di1 = di0 − (s00 + si0+1)
2
1 1 1 1 1 1 Étapes de prédiction
4 4 4 4 4 4 (prediction step)
Sortie
passe-bas
s01 s11 s21 s31
1 0
si1 = si0 + (di -1 + di1)
4
Étapes de mise à jour
(update step)
Les équations générales indiquent que les étapes de prédiction

et de mise à jour (update) sont généralement répétées N fois,
avec une pondération différente à chaque itération.
din = din −1 + ∑ Pn (k )s kn −1, n ∈[1, 2,..., N ]

k
Pn(k): poids de prédiction à la nième itération
sin = sin −1 + ∑ Un (k )d kn , n ∈[1, 2,..., N ]

k
Un(k) : poids de mise à jour (update) à la nième itération
b filtre 5/3
Figure 18 – Processus et exemple de filtre de décomposition en ondelettes ([5] et figure 6 et 7 et [20] p. 77 et 79)
Pour réaliser ce processus de transformée en ondelettes, il est Dans la figure 18b :

possible d’utiliser deux types de filtres dans JPEG 2000. – d1i représente l’erreur de prédiction entre la valeur d’un échan-
Le filtre 5/3, de Le Gall (figure 18b), a des coefficients qui sont tillon impair et la moyenne de 2 pixels voisins pairs ;
entiers. Il y a 5 coefficients pour le filtre passe-bas et 3 pour le filtre – s1i représente la séquence de mise à jour ;
passe-haut. La paire (5,3) étant réversible, elle seule permet une – Pn(k) et Un(k) sont respectivement les poids de prédiction
reconstruction parfaite et peut être utilisée pour une compression (prediction weight) et de mise à jour (update weight) à la nième
mathématiquement sans perte. itération.
Le filtre 9/7, de Daubechies, est à coefficients réels, avec 9 coef- 4.4 Codage entropique
ficients pour le passe-bas et 7 pour le passe-haut. Cette paire per-
met de meilleures performances que la 5/3 à des taux de L’entropie d’une source est la quantité moyenne d’information
compression plus élevés, mais est aussi plus complexe. La trans- contenue dans le message issu de cette source (par exemple, en
formée (9,7) n’étant pas réversible, elle peut seulement être utili- bit/pixel). Un codage entropique va utiliser des statistiques sur la
sée pour la compression mathématiquement avec pertes. source pour construire un mot de code dont la longueur dépend
de ces propriétés. Ce mécanisme est une version préliminaire de
Nota : ces deux filtres ont été choisis, car il fallait des filtres biorthogonaux, seuls ces l’outil CABAC (Context-Adaptive Binary Arithmetic Coding) utilisé
filtres garantissant la propriété de perfect reconstruction (PR), c’est-à-dire la possibilité de
reconstruire parfaitement le signal décomposé en l’absence de toute erreur de quantifica- pour MPEG-4 AVC/H.264 [TE 5 367], puis également pour
tion. Le filtre 5/3 a été choisi car c’est un des filtres biorthogonaux les plus simples et HEVC/H.265 [TE 5 372].
qu’il dispose de coefficients entiers (permettant dès lors une compression mathémati-
quement sans perte). Le filtre 9/7 est un filtre biorthogonal très connu, introduit par Il s’agit d’effectuer un codage sans perte des coefficients d’onde-
Antonini en 1992 [8]. Il a été choisi car il permet une bonne discrimination fréquentielle lettes quantifiés de chaque sous-bande, dans l’unité de codage
(séparant basses et hautes fréquences). entropique ECU (Entropy Coding Unit) qui est composée de
(figure 20 et [4]) :
– un modeleur de contexte (context modeling) qui choisit quelle
4.3 Quantification donnée à coder en premier en fournissant des informations
contextuelles la concernant, le contexte de conditionnement per-
mettant de saisir la redondance dans l’image (figure 21 et [5]) ;
La transformée en ondelettes en elle-même ne compresse pas – un codeur arithmétique basé sur le contexte, qui utilise alors
les données de l’image ; elle les structure, de sorte qu’une réduc- ces caractéristiques spatiales locales ou temporelles pour estimer
tion soit plus facile (il en est de même de la transformée la probabilité d’un symbole à être codée et attribuer des mots de
inter-composantes couleur RVB → YCbCr). La quantification en est code plus ou moins courts.
la première étape. La norme JPEG 2000 utilise un quantificateur
scalaire uniforme à zone morte ou dead zone (figure 19 et [22]). Pour analyser l’image, une structure, groupant les coefficients
Les coefficients des ondelettes non-nuls mais proches de zéro quantifiés, est adoptée sur la base (figure 22 et [4]) :
n’apportent que très peu d’information pertinente, et leur codage – de la partition de chaque sous-bande (sub-band) de chaque
entropique (§ 4.4) impliquerait un important surcoût au vu de la tuile-composante (tile-component) en blocs de codage
qualité gagnée. La zone morte permet de se débarrasser de ces (code-block), typiquement de taille 64 × 64 ou 32 × 32, codés
coefficients en les quantifiant à zéro. Elle concerne donc le codage indépendamment ;
mathématiquement avec pertes.
Dans le cas d’un codage sans perte, le pas de quantification est
égal à 1. Bit Données
Coefficients Modélisation Codage d’image
quantifiés du contexte arithmétique compressées
des Contexte
ondelettes
Q(w)
Figure 20 – Codage entropique ([4] p. 20)

Index 5
de quantification
obtenu
4
Sans contexte : Entropie = 1,0 bit/pixel
Avec contexte de 7 pixels voisins : Entropie = 0,14 bit/pixel
3
2
Coefficient
1 d’ondelettes
à quantifier
– 5∆ – 4∆ – 3∆ – 2∆ – ∆
W
∆ 2∆ 3∆ 4∆ 5∆
1
∆ : Pas de quantification
2 de la sous-bande
Zone
morte
(dead zone)
Figure 21 – Entropie d’une image (au niveau du plan de bit de poids

Figure 19 – Fonction de quantification de JPEG 2000 avec zone le plus fort MSB) sans et avec contexte de conditionnement
morte ([22], figure 3) ([5] p. 114)
Plan de bit i
(Bit-plane i)
LSB
DWT MSB
Tuile-composante
(tile-component)
Sous-bande
(sub-band) Bloc de codage
(code-block)
Figure 22 – Structure de codage ([4] p. 1-2/18)
Chaque plan de bits est encodé en 3 passes, afin de :

MSB Most Significant Bit – prendre en compte les cases du tableau susceptibles d’appor-
(bit de poids le plus fort) ter de l’information ;
– d’ajouter 2 points de troncation supplémentaires possibles
Poid dans le bit-stream. En plus de pouvoir couper entre chaque plan
du bit de bit, on peut aussi couper à la fin de la première ou de la
0
2N–1 deuxième passe.
1 À chaque case visitée, on émet à la fois la valeur du bit, et son
2N–2 contexte (signifiance des voisins). EBCOT se base donc sur le
niveau d’importance (significance) de chaque bit, qui est repré-
1 senté par une variable binaire appelée « significant state » asso-
2N–3
ciée à chaque coefficient d’un bloc de codage. L’état change de
« insignificant » à « significant » au plan de bit où l’on trouve le
23 = 8
premier bit de poids le plus fort égal à 1.
22 = 4
21 = 2 Les 3 passes de codage sont :
20 = 1 0
– d’abord la passe de propagation de la signifiance (significance
propagation), durant laquelle on code les cases associées à des
LSB Least Significant Bit
colonnes voisines de colonnes signifiantes ; une colonne est dite
(bit de poids le plus faible)
signifiante si des bits non nuls ont été rencontrés dans cette
colonne dans les plans précédents ;
Figure 23 – Plans de bits des coefficients ([5] p. 104)
– puis une passe d’affinage de l’amplitude (magnitude
refinement), durant laquelle on code les cases associées aux
– du codage de chaque bloc de codage, au niveau de chaque colonnes signifiantes ;
plan de bits (bit-plane), et non pas coefficient par coefficient – enfin une passe de nettoyage (clean-up), durant laquelle les
comme cela est le cas dans JPEG. Les éléments du code-bloc (qui cases du plan qui n’ont pas été visitées durant les passes précé-
n’est rien d’autre qu’un tableau de nombres à deux dimensions) dentes le sont.
sont vus du point de vue de leur écriture binaire, en « profondeur »
Le résultat de cette étape de codage entropique progressif (per-
(figure 23 et [5]). Chaque plan correspond donc à un bit de l’écri-
mettant donc un décodage progressif) est illustré par la « fresque »
ture binaire des nombres représentant les coefficients composant
des figures 24 et 25 ([5] [2]). Pour chaque plan de bits, la couleur
le code bloc.
des pixels indique :
– en vert, les coefficients des ondelettes devenant significatifs
4.4.1 Modélisation du contexte durant la passe de significance propagation ;
Le but de cette fonction est de coder d’abord, parmi tous les bits – en noir, les coefficients traités pendant la passe de magnitude
appartenant au bloc de codage, ceux qui fournissent la plus refinement ;
grande réduction de distorsion dans la compression. Cela permet – en rouge, les coefficients devenant significatifs durant la passe
d’obtenir un flux de bits optimal, quel que soit le point de coupure de clean-up ;
(truncation point) dans ce flux.
– en blanc, les coefficients qui restent non significatifs après les
L’outil utilisé est l’algorithme EBCOT (Embedded Block Coding 3 passes de codage.
with Optimal Truncation) [23] qui code par plan de bits, du plan de
bit de poids le plus fort MSB (Most Significant Bit) au plan de bit Le flux de données (bit stream) obtenu peut être tronqué à la fin
de poids le plus faible LSB (Least Significant Bit), car un MSB de chacune des passes de codage (coding pass), qui correspon-
contribue beaucoup plus à la réduction de distortion qu’un LSB. dent alors à des qualités progressives de chaque bloc de codage.
4.4.2 Codage arithmétique – le nombre de plans de bits utilisés pour représenter les coeffi-
cients de chaque bloc de codage nouvellement inclus ;
La deuxième étape est réalisée par un codeur arithmétique dit – le nombre de passes de codage inclus dans ce paquet, et ce
codeur MQ (qui est une modification de l’ancien Q-Coder déve- pour chaque bloc de codage ;
loppé par IBM). Son but est de réduire la taille de la séquence – la longueur des données codées, c’est-à-dire le nombre
binaire. Il reçoit pour cela une succession de couples d’informa- d’octets pour chaque bloc de codage.
tions (bit, contexte) de l’étage précédent de modélisation
(figure 20), lui permettant d’estimer la probabilité des bits. Il peut
alors représenter toute une séquence binaire par un nombre entre 4.5.2 Organisation du codestream
0 et 1, dépendant de cette probabilité.
Le flux de données codées (codestream) comprend toutes les
Le résultat des deux étapes du codage entropique est illustré par données de l’image compressée dans les paquets avec toutes les
les figures 26 et 27 [5]. Elle permet de visualiser les différentes informations (markers) nécessaires à sa décompression. Il repré-
structures (sous-bandes, blocs de codage, plans de bits, passes de sente le format d’échange minimum des données de JPEG 2000,
modélisation) qui aboutissent à une très grande variété de para- mais il est habituellement encapsulé dans un format de fichier
mètres dans le décodage et, donc, dans l’utilisation de ces don- ([TE 5 322] § 2).
nées. On aboutit alors à la notion de couche (layer) explicitée
ci-après. Il est composé (figure 30 et [2], [15] et ISO 15444-1) : d’un
en-tête principal, d’en-têtes de tuiles qui spécifient les paramètres
La figure 26 illustre la gestion de la résolution en fonction du de codage, et des données codées pour chaque tuile.
nombre de sous-bandes prises en compte, avec une qualité maxi-
mum, tous les plans de bits étant conservés ainsi que toutes les Une partie de tuile (tile-part) est une portion du codestream
contenant des données d’image pour une partie ou pour le tout
passes par bloc de codage. La figure 27 illustre la gestion de la

qualité en fonction des plans de bits (les MSB en priorité), des d’une tuile. La partie de tuile inclut au moins un, et jusqu’à tous,
passes par bloc de codage et des sous-bandes pris en compte. des paquets qui constituent la tuile codée.
Chaque paquet est ajouté au codestream à la suite d’un en-tête
(regroupant tous les paramètres de codage) et suivant un ordre
4.5 Mise en ordre des données (data prédéfini, dépendant du mode de progression désiré :
ordering) et formats-conteneurs – LRCP (Layer – Resolution Level – Component – Position), pour
la progressivité en qualité et en débit ;
Le but est de formater un flux de données codées (codestream) – RLCP ou RPCL pour la progressivité en résolution ;
en sortie du codeur. Ce flux de sortie est le résultat de la chaîne de – PCRL pour la progressivité spatiale ;
codage avec ses différentes structures de données. – CPRL pour la progressivité de composante.
Il est possible de modifier la progression pendant la transmis-
4.5.1 Couche, secteur, paquet sion, à partir d’un même codestream stocké côté serveur. Ainsi,
suivant l’ordre dans lequel le décodeur reçoit les paquets, il est
Une couche (layer) est une collection de passes de codage de capable de reconstruire une image progressivement par résolution
plans de bits consécutifs, provenant de tous les blocs de codage ou par couche.
dans toutes les sous-bandes de toutes les composantes (figure 28 L’ordre des paquets détermine donc la progressivité de décodage
et [5]). Chaque bloc de codage peut contribuer à une couche avec et d’affichage de l’image (progressivité spatiale, par couche de qua-
un nombre arbitraire de passes de codage des plans de bits. lité, ou même par composante). L’ordre des paquets sera différent
Chaque couche augmente la qualité de l’image, avec le rapport pour permettre un décodage progressif selon le mode choisi.
signal-sur-bruit ou la qualité visuelle associée. Les couches sont
signalées de façon explicite et peuvent être déterminées arbitraire-
ment par le codeur. Le nombre de couches peut varier de 1 à 4.5.3 Exemples d’ordre de progression
65 535, avec un nombre typique de 20. En très grand nombre, elles
servent à des sessions interactives au cours desquelles chaque Les quatre figures ci-après ([4] [5] et [17]) illustrent les différents
couche est générée en fonction de la rétroaction de l’utilisateur. En ordres de progression possibles :
cinéma numérique ou en Broadcast, les couches ne sont jamais – par qualité, suivant les plans de bits (figure 31) ;
utilisées. – par définition (nombre de pixels) ou résolution (densité de
Pour obtenir des taux de compression élevés, les dernières pixels), suivant les sous-bandes (figure 32) ;
passes de codage d’un bloc de codage peuvent être sautées – spatialement, suivant des secteurs (precincts) correspondants
(figure 28). dans chaque sous-bande (figure 33) ;
– par composante, luminance puis chrominance, par exemple
Un secteur (precinct) résulte de la partition d’un niveau de réso-
(figure 34).
lution d’une composante en rectangles de taille de 2PPx × 2PPy
échantillons (figure 29). Cette taille est sélectionnable au niveau
du codeur pour chaque niveau de résolution. Par défaut
PPx = PPy = 15. Le secteur permet de limiter la taille du paquet 4.6 Allocation de débit
et/ou du bloc de codage, diminuant ainsi la taille de la
mémoire-tampon. Il permet pratiquement, par exemple, la pro- Son but est soit d’obtenir une taille (ou débit) cible de fichier (ou
gression spatiale (figure 33). de flux) avec la plus grande qualité possible, soit d’obtenir une
qualité cible avec la plus petite taille de fichier possible. Le critère
Un secteur (precinct) peut se réduire à un bloc de codage, la de qualité optimale peut être basé sur l’erreur quadratique MSE
seule contrainte étant que ses dimensions soient une puissance de (Mean Squared Error) ou RMSE (root-mean-square-error) entre
2. l’original et l’image reconstruite, la distorsion visuelle ou tout autre
Un paquet est constitué des données codées de l’image corres- paramètre de mesure.
pondant à une tuile (tile), une couche (layer), une composante Plusieurs tailles/débits ou distorsions cibles peuvent être définis
(component), un niveau de résolution (resolution level) et un sec- lors du codage d’une image et sont associés à une couche de qua-
teur (precinct) spécifiques. Son en-tête indique : lité (quality layer). Ainsi la figure 35 illustre qu’à chaque couche de
– la longueur nulle ou non du paquet ; qualité ajoutée correspond un débit (en bits par pixel) et un niveau
– si un bloc de codage est inclus ou non dans le paquet ; de qualité, jusqu’à atteindre le débit fixé.

Figure 24 – Image reconstruite après encodage 3 passes et décodage des plans de bits 1 à 11 (de gauche à droite et de haut en bas) ([5] 122-134
et [2] figure 1.30 p. 62)

vert : coefficients des ondelettes devenant significatifs durant la

passe de significance propagation
noir : coefficients qui sont traités pendant la passe de magnitude
refinement
rouge : coefficients devenant significatifs durant la passe de clean-up
blanc : coefficients qui restent non significatifs après les 3 passes de
codage
Figure 25 – Suite de la figure 24 – Image reconstruite après encodage 3 passes et décodage des plans de bits 1 à 11 (de gauche à droite et de
haut en bas) ([5] 122-134 et [2] figure 1.30 p. 62)
Plans
a) Résolution la plus basse (une seule sous-bande) Image (256 x 256)
de bits
Qualité la plus grande (tous les plans de bits)
LL2
BP1 HL2
b) Résolution moyenne (plusieurs sous-bandes)
MSB Qualité la plus grande (tous le plans de bits) HL1
LH2 HH2
c) Résolution la plus grande (toutes les sous-bandes)
Qualité la plus grande (tous les plans de bits)
BP2
Blocs de codage (64 x 64)
LH1 HH1
BP3
Passes
Significance
Refinement
Clean-up
BP4
BP5
BP6
LL2 HL2 LH2 HH2 HL1 LH1 HH1
LL1
Sous-bandes
Figure 26 – Exemple de données codées par passes en plans de bits et gestion de la résolution ([5] p. 137-141)
L’allocation de débit consiste à choisir quelles sont les passes nombre de bits/réduction de distorsion d’abord) jusqu’à atteindre l’objectif. Le ratio
nombre de bits/réduction de distorsion correspond en fait à la pente de la courbe de la
que l’on va mettre dans chaque couche de qualité et quelles sont figure 34 : on ne garde que les passes qui ont une pente supérieure à une valeur donnée,
celles que l’on va laisser tomber (discarded ). et on rejette (discarded) toutes celles au-delà de 2 bpp, puisqu’on vise un taux de
compression de 4:1. Cette élimination résulte de facto en une quantification supplémen-
Il faut savoir que l’allocation de débit ne fait pas partie du stan- taire de certains coefficients (puisque ce sont les bits LSB qui sont écartés).
dard JPEG 2000, chacun étant libre d’opérer cette allocation
comme il veut, pour autant que le codestream final soit conforme
au standard.
Les types de contrôle de débit (en bpp, bits per pixel) possibles 4.7 Paramètres usuels de codage
sont :
– limité (comme en JPEG), le taux de compression étant déter- En synthèse de la description de la chaîne de codage, la
miné uniquement par la taille du pas de quantification et le figure 36 illustre les différentes structures des données dans le for-
contenu de l’image ; mat JPEG 2000 et la flexibilité d’utilisation du codestream :
– itératif, la taille des pas de quantification est ajustée selon le – les composantes (components) et les tuiles (tiles), au niveau
taux de compression obtenu, et l’opération est répétée ; de l’image d’origine ;
– en post-compression, l’allocation du débit est effectuée, au
niveau de chaque bloc de codage, après que l’ensemble de l’image – les sous-bandes (sub-bands) multirésolution, après transfor-
ait été codé (voir nota ci-après). mation en ondelettes ;
Nota : il s’agit de la voie la plus souvent adoptée pour l’allocation de débit. Elle – les couches (layers) de qualité selon les sous-bandes, les blocs
consiste à encoder dans un premier temps l’ensemble de l’image avec des pas de quan- de codage (code-blocks), les plans de bits (bit-planes) et les passes
tification par défaut (égaux à 1 en cas de compression sans perte par transformation 5/3). de codage (coding passes) ;
Ensuite, une fois que toute l’image est encodée, on sait exactement quel est le ratio entre
le nombre de bits dans une passe de codage et la contribution de cette passe à la réduc- – les secteurs (precincts) regroupant des blocs de codage ;
tion de distorsion de l’image. Suivant que l’on cible une taille fixe ou une qualité fixe, les
passes vont être incorporées dans le codestream (les passes avec le plus bas ratio – les paquets (packets) au niveau du codestream.
Plans
a) Résolution la plus grande (toutes les sous-bandes) Image (256 x 256)
de bits
Qualité-cible du rapport signal-sur-bruit LL2
BP1 (fonction du nombre de plans de bits et de passes) HL2
MSB b) Résolution grande (fonction du nombre de sous-bandes) HL1
Qualité-cible visuelle
(fonction du nombre de plans de bits et de passes) LH2 HH2
BP2
Blocs de codage (64 x 64)
LH1 HH1
BP3
Passes
Significance
Refinement
Clean-up
BP4
BP5
BP6
LL1
Sous-bandes
Figure 27 – Exemple de données codées par passes en plans de bits et gestion de la qualité ([5] p. 137-141)
Les paramètres de codage suivants en découlent : Nota : de plus grands blocs de codage diminuent la marge (overhead) nécessaire aux
en-têtes de paquet (car il y a globalement moins de blocs de codage) et donc, à débit
– taille des tuiles. Par exemple, de 128 × 128 à 1 024 × 1 024 ; le donné, laissent plus de place aux données compressées. Par ailleurs, le codeur entro-
PSNR (Peak Signal-to-Noise Ratio) augmente avec la taille ; en pique est aussi potentiellement plus efficace sur de plus grands blocs de codage car son
cinéma numérique et en vidéo une seule tuile par image en modèle de probabilité adaptatif est moins souvent réinitialisé.
pratique ;
– transformée colorimétrique des composantes multiples, réver-
sible ou non. L’ICT, irréversible, est meilleure, mais seule la RCT, 4.8 Codage d’une région d’intérêt (ROI)
réversible, permet la compression mathématiquement sans pertes
(§ 4.1) ; Le codage d’une région d’intérêt ROI (Region Of Interest) permet
– nombre de décompositions DWT. Il est habituellement de 5. Le une distribution non-uniforme de la qualité de compression. La
rapport signal crête/bruit PSNR augmente avec leur nombre ROI est codée avec une plus grande qualité que le fond
(§ 4.2) ; (figure 37a).
– banc de filtres (5,3) ou (9,7). Le (9,7) est meilleur, mais seul le – les ROI statiques sont définies et paramétrées au codage et
(5,3) permet la compression mathématiquement sans pertes conviennent pour le stockage, les transmissions fixes, la télé-
(§ 4.2) ; détection, etc. ;
– taille des blocs de codage (§ 4.4), habituellement 64 × 64. Le – les ROI dynamiques sont définies de façon interactive par un
PSNR augmente avec la taille (voir nota ci-après) ; utilisateur en relation client-serveur durant une transmission pro-
– taille des secteurs, precincts (§ 4.5.1) ; gressive et conviennent pour la télémédecine, les communications
– nombre de couches (layers) de qualité (§ 4.5.1) et leur cible mobiles, les tablettes, etc.
correspondante, en débit ou en distorsion ; Le masque ROI (figure 37b) définit quels coefficients
– ordre de progression LRCP, RLCP, RPCL, PCRL, CPRL. Habituel- contribuent à reconstruire la ROI. C’est un masque binaire qui
lement LRCP, Layer – Resolution Level – Component – Position dépend de la forme de la ROI dans le domaine image et qui est
(§ 4.5.2). généré dans le domaine des ondelettes.
Plans
Couches
de bits
BP1 Layer 1
MSB
Layer 2
Layer 3
BP2
Layer 4
Blocs de codage
BP3
Passes
Significance
Refinement
Clean-up
BP4
BP5
BP6
LL1
Sous-bandes
Figure 28 – Exemple d’organisation en couches (layer) de qualité, fonction du nombre de sous-bandes, de plans de bits, de blocs de codage et
de passes pris en compte ([5] p. 145)
Dans le processus d’accroissement de l’échelle ou general sca- transmise dans un marqueur, et dans le décodeur cette simple
ling (figure 38b), les coefficients quantifiés des ondelettes de la valeur de seuil permet de distinguer la ROI du fond.
ROI sont décalés d’une valeur s vers le haut de l’échelle des plans Ses avantages sont :
de bits, tandis que ceux du fond restent inchangés. En
conséquence, les coefficients ROI sont codés avant. La valeur de s – des formes arbitraires même disjointes sont possibles ;
est transmise dans l’en-tête du codestream (§ 4.5.2) pour chaque – le codeur peut optimiser le masque ROI pour améliorer la qua-
lité visuelle (par exemple, toute la sous-bande LL peut être
ROI.
considérée comme une ROI pour fournir un fond en basse
Ses avantages sont : résolution) ;
– l’ajustement par l’utilisateur au niveau du codeur du différen- – il n’y a pas besoin d’inclure la forme de la ROI dans le code-
tiel de qualité entre la ROI et le fond ; stream et aucun masque ROI n’est requis dans le décodeur.
– la possibilité de multiples ROI avec des différentiels de qualité Ses inconvénients sont :
différents à l’intérieur d’une même tuile-composante. – aucun contrôle du différentiel de qualité entre la ROI et le
Ses inconvénients sont : fond ;
– possible seulement avec la Partie 2 de la norme ([TE 5 322], – une seule ROI par tuile-composante est permise.
§ 1.1.2) ;
– le codeur doit générer un masque ROI standard sans optimisa-
tion possible ; 4.9 Résistance aux erreurs
– le décodeur doit également régénérer le masque ROI ;
Quand des images compressées sont livrées via un canal de
– les formes de ROI sont limitées (rectangle et ellipse). transmission, toute erreur peut gravement affecter la qualité de
Dans le processus de décalage maximum ou maxshift l’image décodée. Ces erreurs peuvent être aléatoires, par paquets,
(figure 38c), au décalage s des coefficients ROI correspond 2s la ou dues à des octets manquants (en cas de perte de paquets dans
valeur la plus grande des coefficients du fond. La valeur s est le réseau).
Secteurs (precincts)
Limites des sous-bandes Limites des blocs de codage
Figure 29 – Exemple de secteurs et de blocs de codage ([5] p. 147)
En-tête Corps de En-tête Corps de En-tête Corps de

En-tête principal Tuile 0, partie 0 partie de tuile Tuile 1, partie 0 partie de tuile Tuile 1, partie 1 partie de tuile
(Main Header) (Tile-part Header) (Tile-part body) (Tile-part Header) (Tile-part body) (Tile-part Header) (Tile-part body)
COD, COC
QCD, QCC
COD, COC
QCD, QCC
COD, COC
QCD, QCC
COD, COC
QCD, QCC
RGN, etc.
RGN, etc.
RGN, etc.
RGN, etc.
SOD
SOD
SOD
SOC
SOT
SOT
SOT
EOC
Paquets Paquets Paquets
SIZ
de données de données de données
SOC : Start Of Codestream

SIZ : Image and Tile Size
SOT : Start Of Tile-part
SOD : Start Of Data
EOC : End Of Codestream
En-tête Bloc de codage i Bloc de codage n
SOP EPH
paquet Données Données
SOP : Start Of Packet

EPH : End of Packet Header
Figure 30 – Structure du codestream et marqueurs ([2] figure 1.26 p. 44 et [15] p. 13 et ISO 15444-1 figure A2)
Du fait que chaque bloc de codage est traité indépendamment, peuvent être alors faussement affectées à d’autres blocs et les
une erreur dans le codestream correspondant sera contenue dans paquets suivants ne peuvent pas être correctement localisés, d’où
ce bloc de codage. Le codestream étant constitué de paquets, leurs une perte totale de synchronisation ;
en-têtes sont aussi interdépendants et donc fragiles : – si l’erreur a lieu dans le corps du paquet, corrompant les don-
nées d’un bloc de codage, des symboles incorrects sont décodés
– si l’erreur a lieu dans l’en-tête, une longueur erronée du corps et des contextes incorrects sont attribués pour les plans de bits
du paquet peut être décodée, les données du bloc de codage suivants, d’où une grave distorsion ;
LSB
MSB LL3 HL3
LL3 HL3
HL2
LH3 HH3
LH3 HH3 HL2
HL1
HL1
LH2 HH2 LH2 HH2
LSB
MSB
LH1 HH1
LH1 HH1
LSB
MSB LL3 HL3
LL3 HL3 HL2
LH3 HH3
HL2
LH3 HH3 HL1
HL1
LH2 HH2
LH2 HH2
LSB
MSB
LH1 HH1
LH1 HH1
LSB LL3 HL3

MSB
LL3 HL3 HL2
LH3 HH3
HL2
HL3 HH3 HL1
LSB HL1
MSB
LH2 HH2
LH2 HH2
LH1 HH1 LH1 HH1
Figure 31 – Progression de qualité (exprimée en rapport signal/bruit LL3 HL3

SNR), de haut en bas, en ajoutant les données (en rouge) suivant
HL2
les plans de bits : du bit de poids le plus fort MSB au bit de poids LH3 HH3
le plus faible LSB, dans toutes les sous-bandes à la fois
([5] p. 154-156) HL1
LH2 HH2
– si des octets sont manquants (perte de paquets), cela peut
générer des effets combinés d’erreurs dans l’en-tête et le corps du
paquet ; les effets de la perte d’un paquet dépendent de la résolu-
tion d’image contenue et de la couche de qualité correspondante.
LH1 HH1
Deux types de mesures de protection, très efficaces (figure 39),
sont mis en œuvre :
– au niveau des données du bloc de codage :
• des marqueurs de segmentation sont ajoutés dans une
séquence spéciale avec un contexte fixe à la fin de chaque Figure 32 – Progression de résolution, de haut en bas,
en ajoutant les données (en rouge) : de la sous-bande LL3 à toutes
plan de bits pour y détecter une erreur au décodage, les sous-bandes ([5] p. 157-160)
• des données de fin de passe de codage sont ajoutées, pour
détecter une erreur au décodage ;
ders, Tile-part header marker) dans l’en-tête de partie de
– au niveau des en-têtes de paquet : tuile ; ces marqueurs consistent à rassembler tous les
• un marqueur de resynchronisation SOP (Start Of Packet), en-têtes de paquets dans l’en-tête principal ou dans l’en-tête
avec un index de séquence, peut précéder chaque en-tête de de partie de tuile,
paquet et détecter des données corrompues,
• les secteurs (precincts) peuvent limiter la couverture spatiale
• des marqueurs PPM (Packed Packet headers, Main header d’un paquet et ainsi restreindre les effets des erreurs de
marker) dans l’en-tête principal et PPT (Packed Packet hea- l’en-tête à une petite zone de l’image.
LL3 HL3 Y
HL2
LH3 HH3
Secteurs
HL1 (precints)
LH2 HH2
LH1 HH1
LL3 HL3
LH3 HH3 HL2

HL1
LH2 HH2
YCbCr
HH1
LH1 HH1
LL3 HL3
LH3 HH3 HL2
HL1
LH2 HH2
Figure 34 – Progression par composante, de haut en bas :

de la luminance Y, en niveaux de gris, aux trois composantes
LH1 HH1 YCbCr, luminance + chrominance ([17] p. 7)
Image originale : 8 bits/pixel – Cible : taux de compression de 4:1

LL3 HL3
HL2 4 couches (layers) à intervalle logarithmique
LH3 HH3 9
RMSE (Root-Mean-Square Error)
8
LH2 HH2 HL1 7
Erreur quadratique
6
5
4
LH2 HH1 3
2
1
Figure 33 – Progression spatiale, de haut en bas, en ajoutant
les données (en rouge) des secteurs (precincts) correspondants dans 0
chaque sous-bande ([4] 1-1 12) 0 0,5 1 1,5 2 2,5 3
Couche 1 bpp (bits/pixel)
Une stratégie de protection différenciée (Unequal Error Protec- Couche 2
tion, UEP) selon l’importance des paquets peut aussi être appli- Couche 3
quée (figure 40). Sa mise en œuvre est spécifiée par la Partie 11 de Couche 4
la norme pour les transmissions sans fil ([TE 5 322], § 1.1.11), avec Éliminé (discarded)
le code Reed-Solomon, et augmente encore l’efficacité de la pro-
Figure 35 – Exemple d’allocation de débit par ajout de couches de
tection des données, qui décroît toutefois avec le taux de qualité successives, avec diminution de l’erreur quadratique entre
compression. l’image originale et l’image reconstruite ([5] p. 164)
Tuile originale (Tile) T0 Secteur (Precinct) Pr0 de HL1

LL2
HL2 HL1
Sous-bandes
de la transformée LH2 HH2 cb0
en ondefettes cb1
LH1
HH1
Blocs
cb2 cb4
de codage
cb3 cb5
cbi
Secteur Pr0 de LH1 Secteur Pr0 de HH1

Les données des coefficients des ondetettes sont rangées dans le codestream JPEG 2000
Tuile (Tile) T0
Résolution R0 R
R1
Couche qualité
(Layer) L0 L1 L0 L
Composante Y Cb Cr Y Cb Cr Y Cb C
Secteur P
Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 Pr0 Pr1 Pr2
(Precinct)
Paquet 0 Paquet1 Paquet 2 Paquet 3 Paquet 4
Données bloc Données bloc Données bloc Données bloc Données bloc Données bloc
En-tête
de codage cb0 de codage cb1 de codage cb2 de codage cb3 de codage cb4 de codage cb5
Paquet 0
S/s-bande HL1 S/s-bande HL1 S/s-bande LH1 S/s-bande LH1 S/s-bande HH1 S/s-bande HH1
a codage du codestream–décomposition de l’image en matrices de données et paquets
Tuile (Tile) T0
Résolution R0 R1 R
Couche qualité
L0 L1 L0 L
(Layer)
Composante Y Cb Cr Y Cb Cr Y Cb C
Secteur
Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 P
(Precinct)
Décodeur 1 : Décodeur 2 : Décodeur 3 :

Archivage sur disque magnétique Imprimante haute qualité Moniteur vidéo noir/blanc
Requiert : Requiert: Requiert:
Pleine résolution [R0] Pleine résolution [R0] Résolution réduite [R1]
Mathématiquement sans perte [L0] Mathématiquement sans perte [L1] Mathématiquement avec pertes [L0]
Toutes les composantes secteur 0 [Pr0] Toutes les composantes Composante Y seule (luminance)
Paquet 0 de tous les secteurs
b décodage–un codestream JPEG 2000 est utilisé de façon spécifique par plusieurs décodeurs
Figure 36 – Exemple de codage (a) et de décodage (b) d’un codestream JPEG 2000 et de sa flexibilité d’utilisation (source : Bako-Analog Devices)

a image avec des régions d'intérêt ROI b masque de codage ROI
Figure 37 – Régions d’intérêt et masque (source IntoPIX)
Region Of Interest
(coefficients ROI)
fond fond
MSB
Plans de bits
S
plans de bits
S
LSB plans de bits
a original b general scaling (accroissement de l'échelle) c maxshift (décalage maximum)
Figure 38 – Codage des ROI ([5] p. 176-177)
a JPEG b JPEG 2000
Figure 39 – Exemple de résistance aux erreurs dues à 16 octets mis à zéro au milieu du fichier : la moitié de l’image codée JPEG
est corrompue (a), mais non l’image codée JPEG 2000 (b) (source IntoPIX)
Paquet 1 FEC … Paquet k FEC Paquet n FEC
Basse FEC Moyenne FEC Haute FEC

résolution grand résolution moyen résolution petit
Couche Couche Couche
basse basse haute
FEC (Forward Error Correction) : outils ajoutés dans le codestream

pour la détection-correction des erreurs en amont, au décodage
Figure 40 – Exemple de protection différentiée des données, UEP (Unequal Error Protection) (source IntoPIX)
5. Conclusion Abréviations et acronymes (suite)

4K Format d’image de cinéma numérique avec 4 096
Ce premier article sur le format de compression d’image numé- pixels de définition horizontale à 24 image/s
rique JPEG 2000 a d’abord présenté les objectifs visés au départ
de son développement. Les principes de la compression par onde- Amd Amendement

lettes ont éclairé les fonctionnalités offertes, ainsi que son inté- AVC Advanced Video Coding (MPEG-4 Part 10)
gration dans la chaîne de codage. Les principaux avantages de
JPEG 2000 sont sa scalabilité, la possibilité d’une compression BD Blu-ray Disc
sans perte, ses performances en multigénération et sa robustesse
envers les erreurs. BER Bit Error Rate
Le deuxième article [TE 5 322] expose la famille de documents BP Bit Plane
composant la norme JPEG 2000, ainsi que les formats-conteneurs
permettant de l’encapsuler. Il détaille les performances de bpp bits per pixel
JPEG 2000 en codage d’images fixes et animées et illustre ses
COC Coding style Component marker
différents domaines d’application.
COD Coding style Default marker
Cet article n’aurait pas pu être écrit sans l’apport des nom- COM Comment Marker
breux travaux et publications des chercheurs et ingénieurs,
contributeurs à la norme JPEG 2000, ainsi que d’institutions et C-P-R-L Component-Position-Resolution-Layer
de sociétés telles que l’EPFL, intoPIX... Qu’ils en soient ici tous CRG Component Registration marker
remerciés.
Nos remerciements particuliers à Antonin DESCAMPE de la DCDM Digital Cinema Distribution Master
société intoPIX pour la relecture attentive de ce document DCI Digital Cinema Initiative
avec ses corrections et l’ajout de notes, et à Jacques
JOUHANEAU pour ses corrections et ses propositions d’amé- DCP Digital Cinema Package
lioration de la lisibilité.
DCT Discrete Cosine Transform
DVB Digital Video Broadcasting
6. Abréviations et acronymes DVD Digital Versatile Disc

DWT Discrete Wavelet Transform
Abréviations et acronymes EBCOT Embedded Block Coding with Optimal Truncation
2K Format d’image de cinéma numérique avec 2 048 EBU European Broadcasting Union
pixels de définition horizontale à 24 ou 48 image/s
EOC End of Codestream marker
3D Tri-dimensionnel
3G Standard SMPTE* de vidéo numérique HD pour des EPFL École Polytechnique Fédérale de Lausanne
images 1 080 pixels en vertical, scan progressif, à EPH End of Packet Header marker
50 image/s ; débit de liaison de 3 Gbit/s
ES Elementary Stream
4:2:2 Rapport des fréquences d’échantillonnage pour
numériser la Luminance (Y) et la Chrominance (Cb, FEC Forward Error Correction
CR) d’un signal vidéo, avec sous-échantillonnage de
la chrominance H Highpass filter (filtre passe-haut)
4:4:4 Rapport des fréquences d’échantillonnage pour H.264 Dénomination ITU* de la norme MPEG-4 AVC*
numériser la Luminance (Y) et la Chrominance (Cb, (Part 10)
CR) d’un signal vidéo, sans sous-échantillonnage de
la chrominance H.265 Dénomination ITU* de la norme HEVC*
(*) renvoie à une autre définition. (*) renvoie à une autre définition.
Abréviations et acronymes (suite) Abréviations et acronymes (suite)

HD High Definition (1 280 × 720 pixels/1 920 LSB Least Significant Bit (chiffre binaire de poids le plus
× 1 080 pixels) faible)
HEVC High Efficiency Video Coding = H.265* Mb Maximum number of Bit-planes coded in a given
code-block
HH Highpass horizontal + Highpass vertical filtered
JPEG 2000 picture DWT* sub-band MJ2 Motion JPEG 2000 Format
HL Highpass horizontal + Lowpass vertical filtered MPEG Moving Picture Experts Group
JPEG 2000 picture DWT* sub-band
MSB Most Significant Bit (chiffre binaire de poids le plus
HTTP HyperText Transfer Protocol fort)
I Intra-picture coding MSE Mean Squared Error (erreur quadratique moyenne)
i Interlaced scan (entrelacé) MXF Material Exchange Format
ICC International Colour Consortium n/a Not applicable
ICT Irreversible Colour Transformation NATO North Atlantic Treaty Organization
IEC International Electrotechnical Commission
NL Number of decomposition Levels as defined in COD*

IMF Interoperable Master Format and COC*
IMX Interoperable Material eXchange – format Sony de OP Operational Pattern (MXF*)

compression vidéo (MPEG-2 422Profile@MainLevel) p Progressive scan
et d’enregistrement sur bande magnétique
P Precinct (secteur)
IP Internet Protocol
P-C-R-L Position-Component-Resolution-Layer
IPTV Television over IP*
PDF Portable Document Format (Adobe)
ISO International Organization for Standardization
PES Packetized Elementary Stream
ITU International Telecommunication Union
PLM Packet Length, Main header marker
J2K JPEG 2000
PLT Packet Length, Tile-part header marker
JP2 JPEG 2000 file format
PNG Portable Network Graphics format
JP3D JPEG 2000 3-dimensional extensions (Part 10)
JPC JPEG 2000 codestream POC Progression Order Change marker
JPEG Joint Photographic Experts Group PPM Packed Packet headers, Main header marker
JPEG-LS JPEG* Lossless PPT Packed Packet headers, Tile-part header marker
JPIP JPEG 2000 Interactive Protocol (Part 9) PSNR Peak Signal-to-Noise Ratio (rapport signal crête sur
bruit)
JPM JPEG 2000 coumpound image file format (Part 6)
QCC Quantization Component marker
JPSEC JPEG 2000 Secured (Part 8)
QCD Quantization Default marker
JPWL JPEG 2000 Wireless (Part 11)
Rb Dynamic Range of a component sample as defined
JPX JPEG 2000 eXtended file format (Part 2) in SIZ*
JPXML JPEG 2000 XML structural representation RCT Reversible Colour Transformation
(Part 14)
RGB Red-Green-Blue
KLV Key Length Value
RGN Region of interest marker
L Lowpass filter
R-L-C-P Resolution-Layer-Component-Position
L- Lossless (sans perte)
RMSE Root-Mean-Square-Error (racine carrée de l’erreur
LH Lowpass horizontal + Highpass vertical filtered quadratique moyenne)
JPEG 2000 picture DWT* sub-band
ROI Region Of Interest
LL Lowpass horizontal + Lowpass vertical filtered
JPEG 2000 picture DWT* sub-band R-P-C-L Resolution-Position-Component-Layer
L-R-C-P Layer-Resolution-Component-Position RTP Real-Time Protocol

LS Lossless (sans perte) RVB Rouge-Vert-Bleu
Abréviations et acronymes (suite) Abréviations et acronymes (suite)

SD Standard Definition (720 × 576 pixels) TLM Tile-part Lengths Marker
SIZ Image and tile SIZe marker TS Transport Stream
SMPTE Society of Motion Picture and Television Engineers UDP User Datagram Protocol
SNR Signal-to-Noise Ratio UEP Unequal Error Protection

UHD Ultra High Definition video picture
SOC Start Of Codestream marker
UUID Universal Unique IDentifier
SOD Start Of Data marker
VP8 Codec vidéo (créé par On2 Technologies, racheté par
SOP Start Of Packet marker Google)
SOT Start Of Tile-part marker VTC Visual Texture Coding (version du format de
compression MPEG-4 à base d’ondelettes)
SSIM Structural SIMilarity index
XML eXtensible Markup Language
T Tile (tuile)
X, Y, Z Axes de coordonnées et/ou de dimension
TCP Transmission Control Protocol
YCbCr Y, luminance ; Cb chrominance (bleu), et Cr chromi-

TIFF Tag Image File Format nance (rouge)
P
O
U
JPEG 2000, format de compression R
d’image numérique par ondelettes
E
Principes N
par Jean-Noël GOUYET
Ingénieur-formateur et consultant en techniques et gestion des médias numériques.
Ancien chargé d’études à la Direction de la recherche de l’INA (Institut national
S
de l’audiovisuel)
Christophe NELSON
A
Formateur en techniques numériques vidéo
Ina EXPERT V
Marc LEGER
et
Diplômé de l’École nationale supérieure Louis-Lumière
O
Opérateur de prise de vues
Ingénieur vision
Responsable de filière formation aux techniques vidéo
I
Ina EXPERT
R
P
Sources bibliographiques
L
Ouvrages Développement – Historique – Objectifs https://www.ceremade.dauphine.fr/
[1] ELSEVIER. – Special issue on JPEG 2000. [6] ISO/IEC Requirements ad hoc group. – JPEG
~peyre/java/image/
http://www.cmap.polytechnique.fr/~peyre/
U
Requirements and profiles version 6.3. java/image/
Signal Processing : Image Communication,
vol. 17, issue 1, janv. 2002. ISO/IEC N1803, juil. 2000
http://www.jpeg.org/public/wg1n1803.pdf Principes du JPEG 2000. Chaîne de codage
S
[2] SCHELKENS (P.), SKODRAS (A.) et EBRA- [7] CLARK (R.). – An Introduction to JPEG 2000
HIMI (T.). – The JPEG 2000 suite. Wiley, and Watermarking [15] ADAMS (M.). – The JPEG 2000 still image
ISBN-13:978-0470721476, sept. 2009 http://www.jpeg.org/public/jpgintro.pdf compression standard. ISO/IEC N2412,
http://eu.wiley.com/WileyCDA/WileyTitle/ 1er sept. 2001/21 juil. 2013
productCd-0470721472.html Ondelettes http://www.ece.uvic.ca/~frodo/publications/
http://www.amazon.com/gp/product/ jpeg2000.pdf
0470721472?ie=UTF8&tag=jpeg-20&link- [8] ANTONINI (M.), BARLAUD (M.), MATHIEU
Code=as2&camp=1789&creative= [16] BROWER (B.). – The next generation of
(P.) et DAUBECHIES (I.). – Image coding
9325&creativeASIN=0470721472 compression JPEG 2000. NSES-Kodak,
using wavelet transform. IEEE Transactions
Image Compression Symposium, 21 mai
on Image Processing, vol. 1, n˚ 2, p. 205-220,
[3] TAUBMAN (D.) et MARCELLIN (M.). – 2002
avr. 1992
JPEG 2000 : image compression fundamen- http://www.gwg.nga.mil/ntb/2002SICS/
http://www.i3s.unice.fr/~barlaud/publi/
tals, standards and practice. Kluwer, Interna- 05NextGen.PDF
IP92.pdf
tional Series in Engineering and Computer [17] intoPIX. – Everything you always wanted to
Science, ISBN-13:978-0792375197, nov. 2001 [9] BURKE HUBBARD (B.). – Ondes et ondelet-
tes. La Saga d’un outil mathématique. Édi- know about JPEG 2000, août 2012
http://www.springer.com/computer/ http://www.intopix.com/uploaded/
image+processing/book/978-0-7923-7519-7 teur Pour la Science/Belin, 1995/juil. 2000.
Download%20Tutorials/intoPIX%20-%
http://www.amazon.com/JPEG2000- [10] GROSSMANN (A.) et TORRÉSANI (B.). – Les 20Pocket%20book%20about%
Compression-Fundamentals-International- ondelettes, août 2001 20JPEG%202000.pdf
Engineering/dp/079237519X/ http://www.cmi.univ-mrs.fr/~torresan/
ref=pd_cp_b_0/191-3597340-7040716 universalis/ondel.html [18] MARCELLIN (M.W.), GORMISH (M.J.), BIL-
GIN (A.) et BOLIEK (M. P.). – An overview of
[11] GUYONVARC’H (Y.). – La compression JPEG 2000 (2000)
Tutoriel d’images par ondelettes. VisioWave/Club http://ce.sharif.ac.ir/courses/84-85/2/
Visu (1996). ce342/resources/root/Lecture%20Notes/
[4] DESCAMPE (A.) et MACE (F.). – The JPEG [12] LEMIRE (D.). – FAQ sur les ondelettes dcc2000_jpeg2000_note.pdf
2000 standard. intoPIX/INA Training, mars ftp://ftp-sop.inria.fr/ariana/Downloads/
2013. [19] MARCELLIN (M.W.) et BILGIN (A.). –
faqondelette.pdf
JPEG2000 for digital cinema. University of
[5] RABBANI (M.) et SANTA CRUZ (D.). – The [13] MORIZET (N.). – Initiation aux ondelettes. Arizona, VidTrans and SMPTE Advanced Mo-
JPEG 2000 still-image compression stan- REE n˚ 9, oct. 2006. tion Imaging (2005)
dard. Kodak, EPFL (2003) [14] PEYRE (G.), CASTILLO (I.), DOSSAL (C.) et DI http://citeseerx.ist.psu.edu/viewdoc/
http://dsanta.users.ch/teaching/ (A.). – La compression d’images par ondelet- download?doi=10.1.1.87.594&rep=
ICIP2001_JPEG2K.pdf tes. Introduction interactive avec Java rep1&type=pdf
Copyright © – Techniques de l’Ingénieur – Tous droits réservés Doc. TE 5 320 – 1
P JPEG 2000, FORMAT DE COMPRESSION D’IMAGE NUMÉRIQUE PAR ONDELETTES ________________________________________________________________
O
U [20] RABBANI (M.) et JOSHI (R.). – An overview
of the JPEG 2000 still image compression
standard. ISO/IEC N2233, 19 juil. 2001
http://flashinformatique.epfl.ch/IMG/
pdf/fi-3-1.pdf
https://www.itscj.ipsj.or.jp/sc29/29w42901.
htm#JPEG%202000
[25] JPEG.org. – Overview of JPEG 2000/Our new
R http://www.cis.rit.edu/~cnspci/references/
dip/compression/rabbani2000.pdf
[23] TAUBMAN (D.). – High performance scalable
image compression with EBCOT. IEEE Tran-
saction on Image Processing, vol.9, n˚ 7,
standard
http://www.jpeg.org/jpeg2000/index.html
[21] SANTA-CRUZ (D.) et EBRAHIMI (T.). – An http://old.jpeg.org/jpeg2000/index.html
p. 1158-1170, juil. 2000
analytical study of JPEG 2000 functionalities, [26] Library of Congress. – JPEG 2000
http://www.cs.nthu.edu.tw/~cchen/CS6531/
nov 2000 encodings + file formats
2012/Taubman2000.pdf
http://dsanta.users.ch/re- http://www.digitalpreservation.gov/
E [22]
search/jpeg2k-func-icip2000.pdf
SANTA-CRUZ (D.), GROSBOIS (R.) et EBRA- Norme – Profils – Fonctionnalités
formats/fdd/fdd000138.shtml
http://www.digitalpreservation.gov/
HIMI (T.). – JPEG 2000. La nouvelle norme formats/fdd/fdd000143.shtml
N pour le codage d’images. EPFL flash informa-
tique, 27 mars 2001
[24] ISO/IEC JTC 1/ SC 29/WG 1 Programme of
Work
À lire également dans nos bases

S PESQUET-POPESCU (B.) et PESQUET (J-C). – GOUYET (J.N.), NELSON (C.) et LEGER (M.). – JPEG
A Ondelettes et applications. [TE 5 215] (2001). 2000, format de compression d’image numéri-
que par ondelettes – Normes. Performances.
Applications. [TE 5 322] (2015).
V
Normes et standards
O
I CST-RT021-part1:2013 2013 Fichiers d’exploitation et d’échange des
œuvres cinéma
ISO/IEC 15444-2/
ITU-T T.801 2004 JPEG 2000 image coding system : exten-
sions
CST-RT021-part2:2013 2013 Specification Format Mezzanine
R DCI 2005-2012 2012 Digital Cinema System Specification Ver-
sion 1.2 10 october 2012
ISO/IEC 15444-3/
ITU-T.802 2007 JPEG 2000 image coding system : motion
JPEG 2000
http://www.dcimo-
vies.com/DCIDigitalCinemaSystemSpecv1 ISO/IEC 15444-4/
_2.pdf ITU-T T.803 2004 JPEG 2000 image coding system :
conformance testing
ETSI TS 101 154 V2.1.1
P (2015-03) 2015 Digital Video Broadcasting (DVB); Specifi-
cation for the use of Video and Audio
ISO/IEC 15444-5/
ITU-T T.804 2015 JPEG 2000 image coding system : refe-
Coding in Broadcasting Applications rence software
L based on the MPEG-2 Transport Stream
http://www.etsi.org/deli-
ver/etsi_ts/101100_101199/101154/02.01.0
ISO/IEC 15444-6/
ITU-T T.805 2011 JPEG 2000 image coding system :
compound image file format
U ISO/IEC 10918:1994 1994
1_60/ts_101154v020101p.pdf
Information
compression
technology
and
–
coding
Digital
of
ISO/IEC 15444-8/
ITU-T T.807 2007 JPEG 2000 image coding system : secure
JPEG 2000
S continuous-tone still images – Require-
ments and guidelines ISO/IEC 15444-9/
ITU-T T.808 2005 JPEG 2000 image coding system : inte-
ISO/IEC 13818-1:2013 2013 Information technology – Generic coding
of moving pictures and associated audio ractivity tools, APIs and protocols
information – Part 1 : Systems ISO/IEC 15444-10/
ISO/IEC ITU-T T.809 2011 JPEG 2000 image coding system : exten-
13818-1:2007/Amd.5:2011 2011 Transport of JPEG 2000 Part 1 (ITU-T Rec sions for three-dimensional data
T.800|ISO/IEC 15444-1) video over ITU-T ISO/IEC 15444-11/
Rec H.222.0|ISO/IEC 13818-1 (Revised by ITU-T T.810 2007 JPEG 2000 image coding system : wire-
ISO/IEC 13818-1:2013) less
ISO/IEC ISO/IEC 15444-12 2012 JPEG 2000 image coding system : ISO
13818-1:2007/Amd 5 2007 Information technology – Generic coding Base Media File Format
of moving pictures and associated audio
information : Systems Transport of JPEG ISO/IEC 15444-13/
2000 part 1 video over MPEG-2 TS ITU-T T.812 2008 JPEG 2000 image coding system : an
entry level JPEG 2000 encoder
ISO/IEC 15444-1/
ITU-T T.800 2002 JPEG 2000 image coding system : core ISO/IEC 15444-14/
coding system ITU-T T.813 2013 JPEG 2000 image coding system: XML
structural representation and reference
ISO/IEC 15444-1:2004/
Amd 1:2006 2006 Profiles for digital cinema applications ISO/IEC BIIF
ISO/IEC 15444-1:2004/ Profile BPJ2K01.10 2009 BIIF Profile for JPEG 2000. 15 april 2009
Amd 2:2009 2009 Extended profiles for cinema and video ITU-T H.222.0
production and archival applications Amd 5 (05-2011) 2011 Information technology – Generic coding
ISO/IEC 15444-1:2004/ of moving pictures and associated audio
Amd 3:2010 2010 Profiles for broadcast applications information : systems. Amendment 5 :
Transport of JPEG 2000 Part 1 (ITU-T
ISO/IEC 15444-1:2004/ T.800 | ISO/IEC 15444-1) video over (ITU-T
Amd 5:2013 2013 Enhancements for digital cinema and H.222.0| ISO/IEC 13818-1) Transport
archive profiles (additional frame rates) Stream
ISO/IEC 15444-1:2004/ ITU Rec. T81 1992 1992 Information technology – Digital
Amd 6:2013 2013 Updated ICC profile support, bit depth compression and coding continuous-tone
and resolution clarifications still images – Requirements and
guidelines
ISO/IEC 15444-1:2004/
Amd 8:2015 2015 Profiles for an interoperable master for- RFC 5371 (2008-10) 2010 RTP Payload Format for JPEG 2000 Video
mat IMF Streams
Doc. TE 5 320 – 2 Copyright © – Techniques de l’Ingénieur – Tous droits réservés
________________________________________________________________ JPEG 2000, FORMAT DE COMPRESSION D’IMAGE NUMÉRIQUE PAR ONDELETTES P

O
RFC 5372 (2008-10) 2008 Payload Format for JPEG 2000 Video :
Extensions for Scalability and Main Hea-
der Recovery
SMPTE ST 2022-3:2010 2010 Unidirectional Transport of Variable Bit
Rate MPEG-2 Transport Streams on IP
Networks
U
RFC 6597 (2012-04) 2012 RTP Payload Format for Society of
Motion Picture and Television Engineers
(SMPTE) ST 336 Encoded Data (KLV)
SMPTE 2022-5:2013 2013 Forward Error Correction for Transport of
High Bit Rate Media Signals over IP
R
Networks (HBRMT)
SMPTE ST 336:2007 2007 Data Encoding Protocol Using
Key-Length-Value
SMPTE 2022-6:2012 2012 Transport of High Bit Rate Media Signals
SMPTE ST 422:2014 2014 Material Exchange Format – Mapping over IP Networks (HBRMT)
JPEG 2000 Codestreams into the MXF
Generic Container SMPTE ST 2067-1à 2012 Interoperable Master Format
E
SMPTE ST 429-4:2006
SMPTE ST 2022-1:2007
2006
2007
D-Cinema Packaging – MXF JPEG 2000
Application
Forward Error Correction for Real-Time
VSF TR-01 2013 Technical Recommendation TR-01. Trans-
port of JPEG 2000 Broadcast Profile video
N
Video/Audio Transport Over IP Networks in MPEG-2 TS over IP. Video Services
Forum April 15, 2013
SMPTE ST 2022-2:2007 2007 Unidirectional Transport of Constant Bit http://www.videoservicesfo-
Rate MPEG-2 Transport Streams on IP rum.org/activity_groups/VSF_TR-01_2013-
Networks 04-15.pdf
S
Annuaire A
Constructeurs – Intégrateurs de circuits JPEG 2000
(liste non exhaustive)
Rohde & Schwarz – DVS
http://www.rohde-schwarz.com/en/products/broadcast-media/ V
dvs_video_solutions_/dvs-video-solutions_94581.html
Alma-Technologies
https://www.alma-technologies.com/ip-core.JPEG-2000
Barco-Silex
Telestream
http://www.telestream.net/vantage/overview.htm O
Organismes – Fédérations – Associations (liste non exhaustive)
http://www.barco-silex.com/ip-cores/jpeg2000
CAST DCI (Digital Cinema Initiatives)
http://www.dcimovies.com/
I
http://www.cast-inc.com/index.html
intoPIX
http://www.intopix.com
DICOM (Digital Imaging and Communications in Medecine)
http://dicom.nema.org/ R
ISO (International Organization for Standardization)
Dalet-Amberfin http://www.iso.ch/iso/fr/ISOOnline.frontpage
http://www.dalet.com/products/amberfin-ingest http://www.iso.ch/iso/en/prods-services/popstds/mpeg.html
Evertz JPEG (Joint Photographic Experts Group)
http://www.evertz.com/products/compression
EVS OpenCube
http://www.jpeg.org/index.html
JPEG2000 Alliance
P
www.evs.com/ http://www.jpeg2000alliance.com/
Harmonic
http://www.harmonicinc.com/product/promedia-carbon
IRT (Insttitut für Rundfunktechnik)
http://mxf.irt.de/
L
Net Insight
http://www.netinsight.net/Products/Nim-
bra-600-Series/JPEG2000-Video-Access/Overview/
ITU-T (International Telecommunication Union – Telecommunication Stan-
dardisation Sector)
http://www.itu.int/ITU-T/
U
Nevion/T-VIPS
http://nevion.com/products/media-gateways
NTT AT
SMPTE (Society of Motion Picture and Television Engineers)
http://www.smpte.org
VSF (Video Services Forum)
S
http://www.ntt-at.com/product/jpeg2000/ http://www.videoservicesforum.org
Copyright © – Techniques de l’Ingénieur – Tous droits réservés Doc. TE 5 320 – 3
GAGNEZ DU TEMPS ET SÉCURISEZ VOS PROJETS
EN UTILISANT UNE SOURCE ACTUALISÉE ET FIABLE
Techniques de l’Ingénieur propose la plus importante

collection documentaire technique et scientifique
en français !
Grâce à vos droits d’accès, retrouvez l’ensemble
des articles et fiches pratiques de votre offre,
leurs compléments et mises à jour,
et bénéficiez des services inclus.
   
RÉDIGÉE ET VALIDÉE MISE À JOUR 100 % COMPATIBLE SERVICES INCLUS
PAR DES EXPERTS PERMANENTE SUR TOUS SUPPORTS DANS CHAQUE OFFRE
NUMÉRIQUES
 + de 350 000 utilisateurs

 + de 10 000 articles de référence
 + de 80 offres
 15 domaines d’expertise
Automatique - Robotique Innovation
Biomédical - Pharma Matériaux
Construction et travaux publics Mécanique
Électronique - Photonique Mesures - Analyses
Énergies Procédés chimie - Bio - Agro
Environnement - Sécurité Sciences fondamentales
Génie industriel Technologies de l’information
Ingénierie des transports
Pour des offres toujours plus adaptées à votre métier,

découvrez les offres dédiées à votre secteur d’activité
Depuis plus de 70 ans, Techniques de l’Ingénieur est la source

d’informations de référence des bureaux d’études,
de la R&D et de l’innovation.
www.techniques-ingenieur.fr
CONTACT : Tél. : + 33 (0)1 53 35 20 20 - Fax : +33 (0)1 53 26 79 18 - E-mail : infos.clients@teching.com
LES AVANTAGES ET SERVICES
compris dans les offres Techniques de l’Ingénieur
  
ACCÈS
Accès illimité Téléchargement des articles Consultation sur tous

aux articles en HTML au format PDF les supports numériques
Enrichis et mis à jour pendant Pour un usage en toute liberté Des contenus optimisés
toute la durée de la souscription pour ordinateurs, tablettes et mobiles
 
SERVICES ET OUTILS PRATIQUES
Questions aux experts* Articles Découverte Dictionnaire technique multilingue

Les meilleurs experts techniques La possibilité de consulter des articles 45 000 termes en français, anglais,
et scientifiques vous répondent en dehors de votre offre espagnol et allemand
 
Archives Impression à la demande Alertes actualisations
Technologies anciennes et versions Commandez les éditions papier Recevez par email toutes les nouveautés
antérieures des articles de vos ressources documentaires de vos ressources documentaires
*Questions aux experts est un service réservé aux entreprises, non proposé dans les offres écoles, universités ou pour tout autre organisme de formation.
ILS NOUS FONT CONFIANCE
www.techniques-ingenieur.fr
CONTACT : Tél. : + 33 (0)1 53 35 20 20 - Fax : +33 (0)1 53 26 79 18 - E-mail : infos.clients@teching.com

2 JPEG200042300210-te5320

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

2 JPEG200042300210-te5320

Transféré par

Droits d'auteur :

Formats disponibles

Réf.

JPEG 2000, format de

par Jean-Noël GOUYET, Christophe NELSON,

Pour toute question :

JPEG 2000, format de compression

par Jean-Noël GOUYET

Formateur en techniques numériques vidéo

1. Développement et objectifs visés.................................................... TE 5 320 - 2

orsqu’on aborde le sujet de la compression d’images, la première norme

Copyright © – Techniques de l’Ingénieur – Tous droits réservés TE 5 320 – 1

JPEG 2000, FORMAT DE COMPRESSION D’IMAGE NUMÉRIQUE PAR ONDELETTES ________________________________________________________________

Et dans le deuxième article [TE 5 322] :

de documents techniques. De nombreuses références, des listes de normes,

■ En premier, une plus grande efficacité de compression, en parti-

Historique ■ La compression d’images à ton continu (continuous-tone) et à

TE 5 320 − 2 Copyright © – Techniques de l’Ingénieur – Tous droits réservés

________________________________________________________________ JPEG 2000, FORMAT DE COMPRESSION D’IMAGE NUMÉRIQUE PAR ONDELETTES

Copyright © – Techniques de l’Ingénieur – Tous droits réservés TE 5 320 – 3

JPEG 2000, FORMAT DE COMPRESSION D’IMAGE NUMÉRIQUE PAR ONDELETTES ________________________________________________________________

(0,0) Numéro d’index de la tuile

(XOsiz, YOsiz) YTsiz

b composante individuelle YTsiz

Figure 1 – Modèle d’image source ([15], figure 1)

b tuiles superposées à la grille de référence

Ysiz Données de la tuile-composante

TE 5 320 – 4 Copyright © – Techniques de l’Ingénieur – Tous droits réservés

________________________________________________________________ JPEG 2000, FORMAT DE COMPRESSION D’IMAGE NUMÉRIQUE PAR ONDELETTES

taux XTsiz et verticaux YTsiz. En appliquant la position de chaque

2.2 Transformée en ondelettes

Si les premières études datent du début et de la moitié du

Copyright © – Techniques de l’Ingénieur – Tous droits réservés TE 5 320 – 5

JPEG 2000, FORMAT DE COMPRESSION D’IMAGE NUMÉRIQUE PAR ONDELETTES ________________________________________________________________

s’écrit sous la forme d’une superposition de telles ondelettes déca-

70 tion particulière de deux variables, en l’occurrence, ce qui nous inté-

40 comme une fonction dans un espace à deux dimensions (le plan de

500 1 000 1 500 2 000 2 500 3 000 3 500 4 000 4 500

Les raies verticales de la transformée de Fourier se retrouvent dans le

Figure 5 – Transformée de Fourier (b) et transformée en ondelettes

TE 5 320 – 6 Copyright © – Techniques de l’Ingénieur – Tous droits réservés

________________________________________________________________ JPEG 2000, FORMAT DE COMPRESSION D’IMAGE NUMÉRIQUE PAR ONDELETTES

Tableau 1 – Codage de 16 pixels par moyennes et différences (« coefficients de détails »)

Différence entre niveau 2 et niveau 3

Différence entre niveau 3 et niveau 4

Copyright © – Techniques de l’Ingénieur – Tous droits réservés TE 5 320 – 7

JPEG 2000, FORMAT DE COMPRESSION D’IMAGE NUMÉRIQUE PAR ONDELETTES ________________________________________________________________

Tableau 2 – Compression par mise à zéro de certains coefficients de détails et reconstitution

Différence entre niveau 0 et niveau 1

Différence entre niveau 1 et niveau 2

Différence entre niveau 2 et niveau 3

Différence entre niveau 3 et niveau 4

TE 5 320 – 8 Copyright © – Techniques de l’Ingénieur – Tous droits réservés

________________________________________________________________ JPEG 2000, FORMAT DE COMPRESSION D’IMAGE NUMÉRIQUE PAR ONDELETTES

le « chapeau ») ; • H sur les N rangées de LL0 (donne N/2 colonnes),

Copyright © – Techniques de l’Ingénieur – Tous droits réservés TE 5 320 – 9

JPEG 2000, FORMAT DE COMPRESSION D’IMAGE NUMÉRIQUE PAR ONDELETTES ________________________________________________________________

sur N/2 échantillons Sur n/2 échantillons

Filtre L Filtre H Filtre L Filtre H

Figure 7 – Décomposition en sous-bandes dans le domaine des fréquences

TE 5 320 – 10 Copyright © – Techniques de l’Ingénieur – Tous droits réservés

________________________________________________________________ JPEG 2000, FORMAT DE COMPRESSION D’IMAGE NUMÉRIQUE PAR ONDELETTES

Image initiale 1re décomposition 2e décomposition (niveau 2) 3e décomposition (niveau 3)

LH2 HH2 LH2 HH2

LH1 HH1 LH1 HH1 LH1 HH1