Académique Documents
Professionnel Documents
Culture Documents
: TE5320 V1
Mots-clés Résumé Cet article décrit le format de compression d’images numériques, JPEG2000.
ondelettes | transformée en Après une courte histoire de son développement et un résumé des objectifs visés, il
ondelettes | codage entropique
| compression des images | rappelle les principes de la transformée en ondelettes et de son application au codage
codage | formats-conteneurs d’une image. Les principales fonctionnalités du format sont ensuite détaillées, ainsi que
les fonctions et les techniques mises en œuvre dans la chaîne de codage.
Keywords Abstract This article describes the JPEG2000 picture compression format. After a short
wavelets | Discrete Wavelet background and a summary of the objectives of JPEG2000, a basic reminder on the
Transform DWT | entropy
coding | picture compression | principles of the wavelet transform and its application to picture coding is given. The main
coding | container-formats functionalities of the format are then detailed along with the functions and techniques
implemented in the coding chain.
Par mail :
infos.clients@teching.com
Par téléphone :
00 33 (0)1 53 35 20 20 © Techniques de l'Ingénieur | tous droits réservés
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
■ Un débit fixe (fixed-rate, ou fixed local rate) signifie que le – la transformée DCT (Discrete Cosine Transform), basée sur
nombre de bits pour un nombre de pixels consécutifs est égal (ou l’analyse de Fourier, analyse et traite l’image par blocs de pixels ;
inférieur) à une certaine valeur. Cela permet ainsi au décodeur de elle est utilisée par la presque totalité des formats de compression
traiter en temps réel les données transitant via des canaux de d’images (de type JPEG, MPEG...) ;
capacité limitée, par exemple pour la télédétection, le codage de – la transformée DWT (Discrete Wavelet Transform) qui analyse
mouvements, etc. Une taille fixe (fixed-size, ou fixed global rate) et traite simultanément l’ensemble des pixels de l’image ; elle est
signifie que la taille totale du train de données codées, le codes- utilisée par JPEG 2000 et quelques autres codecs tels que Dirac
tream (généré à la sortie du codeur), est égale à une certaine (SMPTE VC-2), CineForm (SMPTE VC-5)...
valeur, pour une image complète. Cela permet à un équipement
Pour faciliter l’analyse de l’image, JPEG 2000 procède d’abord à
avec un espace mémoire limité de contenir un train de données
une structuration de l’image-source, selon le modèle décrit
complet quelle que soit l’image.
ci-après.
■ L’accès et le traitement direct du train de données, pour permet-
tre que des zones de l’image plus importantes que d’autres, appe-
lées ROI (Region-Of-Interest), soient directement accessibles et 2.1 Structure et paramètres
décompressées avec moins de distortion que le reste de l’image. de l’image-source
Le traitement avec accès direct dans le codestream, pourrait per-
mettre d’effectuer des opérations telles que rotation, translation,
filtrage, extraction de caractéristiques, mise à l’échelle (scaling), 2.1.1 Modèle de l’image
etc.
Du point de vue du codec (codeur/décodeur ou compresseur/
■ Le codage temps réel ou capacité à compresser et décompresser décompresseur), une image est composée d’une ou plusieurs
Parution : février 2016 - Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
les images en une seule passe séquentielle. La norme devrait aussi composantes, jusqu’à une limite de 214 (figure 1a et [16]). Par
permettre de traiter une composante d’image dans un ordre entre- exemple, une image couleur RVB a 3 composantes. Une image en
lacé ou non. Durant la compression, le format devrait utiliser un niveaux de gris n’a qu’une seule composante. Chaque composante
contexte de pixels limité à un nombre raisonnable de lignes. (figure 1b) consiste en une matrice rectangulaire d’échantillons.
Les valeurs des échantillons pour chaque composante sont des
■ La robustesse vis-à-vis des erreurs binaires (error resilience), nombres entiers, signés (±) ou non, avec une précision de 1 à
importante en particulier pour la transmission via les réseaux sans 38 bits par échantillon, cela étant spécifié pour chaque compo-
fil. Le train de données comprenant des parties plus importantes sante.
que d’autres dans la détermination de la qualité de l’image déco- Les diverses composantes d’une image n’ont pas besoin d’être
dée, sa conception doit permettre une détection-correction des échantillonnées avec la même définition et peuvent avoir en
erreurs au décodage. conséquence des tailles différentes. C’est le cas d’images couleur
■ La protection des images, avec des méthodes telles que : le représentées dans l’espace de luminance-chrominance, avec
watermarking ou marquage invisible inséré dans le contenu de l’information de luminance souvent plus finement échantillonnée
l’image, l’étiquetage (labeling) par ajout de données spécifiques que celle de chrominance.
dans le train de données ou le fichier, l’empreinte numérique
(fingerprinting) par calcul d’un code ou signature unique mais 2.1.2 Grille de référence
externe à l’image, le chiffrement (encryption) ou l’embrouillage
(scrambling) de tout ou partie de l’image, et enfin le logo Une image étant donnée, le codec décrit sa géométrie selon une
(stamping) sur l’image affichée – voir pour une présentation grille rectangulaire appelée la grille de référence (figure 2 et [15]).
détaillée de ces techniques [TE 5 890]. La grille de taille Xsiz par Ysiz ne peut excéder 232-1 unités. La
zone image correspond aux données d’image. Toutes les
■ La rétro-compatibilité, ou un transcodage facile, avec JPEG, la composantes sont alignées (mapped) sur la zone image de la grille
compatibilité avec les recommandations de l’ITU-T pour l’échange de référence. Mais comme les composantes n’ont pas besoin
d’images (celles concernant, par exemple, le fax), et l’interfaçage d’être échantillonnées à la pleine résolution de la grille de réfé-
avec MPEG-4, en particulier avec la conservation des informations rence, des informations additionnelles sont nécessaires, sous la
concernant la propriété intellectuelle lors de l’insertion ou de forme de deux paramètres XRsiz et YRsiz. Ceux-ci spécifient la
l’extraction d’images fixes vers des ou à partir d’images animées. séparation horizontale/verticale d’un échantillon de la composante
D’autres caractéristiques requises concernaient : i par rapport à la grille de référence de l’image, appelée aussi
« sous-échantillonnage » horizontal et vertical, exprimé en unités
– la description basée sur le contenu, pour retrouver une image
de la grille de référence (voir des exemples de contraintes impo-
dans de grandes banques de données ;
sées à ces valeurs [TE 5 322] – tableaux 2, 11 et 15). À noter que la
– de meilleures performances lors de multiples cycles de grille de référence impose un alignement particulier des échan-
compression-décompression ; tillons des diverses composantes relativement entre elles.
– un format de fichier plus flexible.
Ce système de repérage permet d’effectuer efficacement un cer-
tain nombre d’opérations de base telles que découpe (cropping),
retournement horizontal/vertical (flipping) ou rotation d’un multi-
ple de 90˚.
2. Concepts de base
2.1.3 Tuilage (tiling)
Le principe de la compression d’une image numérique repose
sur le passage d’une matrice de valeurs de luminosité des pixels à Dans certaines situations (très grandes images), une image peut
une matrice de coefficients traduisant des fréquences visuelles, être très large par rapport à la taille de la mémoire disponible dans
c’est-à-dire des variations de pixels à pixels, permettant de coder le codec. Il n’est alors pas possible de coder/décoder l’image
des zones « plates » plus homogènes ou des zones de détails. comme une seule entité. On peut alors partager l’image en une ou
C’est l’analyse de cette dernière matrice qui permettra d’éliminer la plusieurs régions rectangulaires disjointes ne se recouvrant pas
redondance et donc de réduire le volume de données. Cette opéra- (figure 3a), appelées carreaux ou tuiles (tiles), chacune d’elles
tion portant sur des nombres et leurs relations, deux outils mathé- codée indépendamment. On superpose à la grille de référence une
matiques sont utilisés : grille de tuilage (figure 3b et [15]) avec des espacements horizon-
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Composante n° N-1
...
Composante n° 2
Composante n° 1
Composante n° 0
a image à N composantes
a image 863 × 631 pixels, très fortement compressée avec JPEG 2000,
partagée en « tuiles » 128 × 128, dont les contours ont été dessinés
Parution : février 2016 - Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Composante n° i
en pointillés et superposés pour les visualiser
Xsiz
T3 T4 T5 YTsiz
T6 T7 T8
Xsiz
(0,0)
(0,0)
(Xsiz – 1, 0)
(tcx0 , 1, tcy0)
YOsiz
(XOsiz, YOsiz)
Zone image
Ysiz – YOsiz
(tcx1 – 1, tcy1 – 1)
(0, Ysiz – 1)
(Xsiz – 1, Ysiz – 1)
c système de coordonnées d’une « tuile-composante », portion
XOsiz Xsiz – XOsiz de composante correspondant à une seule tuile
Figure 2 – Grille de référence (([15] figure 2) et ISO/IEC 15444-1 Figure 3 – Image partagée en « tuiles » (Ina et al., [15] et
figure B-1) ISO/IEC 15444-1 figure B-4)
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
c 2 « ondelettes »
2.2.1 Principe de la transformée en ondelettes Fonctions élémentaires dont l’on fait varier la localisation (translation)
DWT ainsi que la taille (dilatation ou contraction), tout en gardant leur forme
constante.
L’analyse de Fourier nous enseigne qu’un signal quelconque
La dilatation s’accompagne d’une variation de la vitesse des oscillations,
peut s’écrire comme une somme de sinusoïdes, de fréquences et
donc de la fréquence
d’amplitudes variables. Un signal est ainsi entièrement caractérisé
par l’ensemble des amplitudes des sinusoïdes qui forme ce qu’on
appelle sa transformée de Fourier (figure 5b et [13]). La transfor- Figure 4 – Exemples d’ondes élémentaires [10]
mée de Fourier est porteuse de précieuses informations sur le
signal analysé. On sait que, si elle n’a que de faibles valeurs pour
des valeurs élevées de la variable de fréquence, cela signifie que le signifie qu’elle est nulle en dehors d’une certaine zone, qui
signal varie lentement. Inversement, si elle prend des valeurs constitue son support. L’ensemble de ces transformées de Fourier
importantes pour les hautes fréquences, cela signifie que le signal ainsi localisées forme la transformée de Gabor du signal, elle four-
contient une quantité non négligeable de hautes fréquences, et nit donc une analyse fréquentielle locale. Par conséquent, le signal
donc varie rapidement, au moins dans certaines zones. peut être reconstruit à partir de sa transformée de Gabor. Cette
L’analyse spectrale repose donc sur des sinusoïdes. Une sinu- reconstruction est très simple : le signal peut être synthétisé
soïde est associée à une fréquence « infiniment pure », mais à comme somme de gaborettes (figure 4b et [10]), qui ne sont
laquelle on ne saurait affecter de notion temporelle précise (instant autres que des sinusoïdes localisées par des fenêtres du même
de départ, durée) : une sinusoïde n’a ni début ni fin (figure 4a et type que celles qui sont utilisées pour la transformation de Gabor.
[10]). Et c’est précisément ici que se situe l’une des limitations À chacune de ces gaborettes sont attachés une fréquence et un
importantes de l’analyse de Fourier usuelle. La transformée de temps bien déterminés. Le poids d’une gaborette dans un signal
Fourier du signal (figure 5b et [13]) est incapable de localiser les n’est autre que la valeur de sa transformée de Gabor pour la fré-
portions du signal dans lesquelles les variations sont rapides par quence et le temps correspondants. Ce sera aussi le cas des onde-
opposition à celles qui sont lentes. Au milieu des années 1940, le lettes (figure 5c et [13]).
physicien Dennis Gabor, qui en 1971 reçut le prix Nobel de L’analyse et la transformée en ondelettes discrète DWT (Discrete
physique pour ses travaux sur l’holographie, proposa un prototype Wavelet Transform), plus récente et proposée initialement par J.
d’analyse par ondelettes. Gabor suggérait de rendre locale l’ana- Morlet, se fondent sur un concept quelque peu différent de celui
lyse de Fourier en s’aidant de « fenêtres ». Une fenêtre est une de fréquence : le concept d’échelle. Au lieu de considérer des fonc-
fonction régulière, lentement variable et bien localisée, ce qui tions oscillantes placées à l’intérieur d’une fenêtre, que l’on fait
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
0,4
Amplitude
0,35
0,3
0,25 L Image de moyenne
0,2
0,15
0,1
c transformée en ondelettes
ensuite coulisser le long d’un signal à analyser (les gaborettes), les H Image de différence
ondelettes sont davantage des copies les unes des autres ; copies
presque conformes, puisqu’elles sont de forme constante et ne dif-
fèrent que par leur taille (figure 4c et [13]). La décomposition en Figure 6 – Concept de base de la décomposition d’une image
par ondelettes : (L) partie basse du spectre + (H) partie haute
ondelettes est similaire à la décomposition de Gabor : un signal du spectre [10]
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
2.2.2 Codage « didactique » d’une image l’image originale. Il faut leur ajouter les 8 coefficients de détails du
niveau précédent si on veut retrouver les valeurs des 16 pixels ini-
La section suivante propose d’oublier les ondelettes pour un tiaux. Si on itère le codage jusqu’au niveau 4, on se retrouve avec
moment et de donner une perception « physico-pratique » de ce qui une valeur moyenne (ici : 5,5) et 15 coefficients de détails : (1 de
se passe dans la compression/décompression d’une image par niveau 4) + (2 de niveau 3) + (4 de niveau 2) + (8 de niveau 1) = 15.
ondelettes. Mais où est donc la compression ?
La première ligne de nombres du tableau 1 traduit la succession La compression peut être introduite du fait que les coefficients de
de niveaux de gris de pixels situés au-dessus, comme on peut en détails sont petits et que beaucoup d’entre eux, en dessous d’un
trouver le long d’une ligne d’écran de télévision. C’est le « niveau seuil donné, peuvent être mis à zéro. Si on décide dans le tableau 1
0 », avant tout codage. que tout coefficient de détail inférieur ou égal à 1 est quantité négli-
Le premier codage de « niveau 1 » consiste à calculer la geable et qu’on le remplace par « 0 », noté (0) en gras dans le
moyenne (2e ligne de nombres en partant du haut du tableau) des tableau 2, on y reconstruit (2e ligne de nombres en haut du tableau)
niveaux de gris des pixels, pris deux par deux. Cette moyenne est l’image de bas en haut du tableau, en additionnant à la moyenne de
en fait une opération de filtrage passe-bas, car on ne retient que la niveau 4 les coefficients de détails successifs.
fréquence moitié du spectre contenu dans la série initiale de Dans cet exemple très simplifié et « brutal », avec la mise à zéro
valeurs (figure 7). Pour ne pas perdre la partie haute fréquence de de 8 coefficients de détail notés en gras (0), on voit que l’image se
ce spectre (se rappeler les transformées de Fourier ou par ondelet- trouve décrite de façon simplifiée par 1 nombre (valeur moyenne)
tes...), on a porté, sur la 3e ligne de nombres, les différences ou + 7 coefficients de détails, au lieu des 1 + 15 initialement. C’est là
« delta » (nombres entre parenthèses) qui permettent de reconsti- que la compression commence à opérer (et ce n’est pas le seul
tuer le signal initial. Par exemple, les deux premières valeurs, 9 et moyen, d’autres viennent en complément, comme on le verra aux
Parution : février 2016 - Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
7, ont donné une moyenne de 8, et une différence de 1, car la pre- paragraphes 4.3 et 4.4). Bien sûr, dans cet exemple, le résultat
mière valeur « 9 » vaut bien 8 + 1, et la seconde « 7 » vaut 8 – 1. n’est pas très précis, quand on compare la séquence initiale et la
Ces différences sont appelées coefficients de détails. Ils sont natu- séquence restituée (1re et 2e lignes de nombres en haut du
rellement toujours plus petits que les valeurs moyennes de la ligne tableau). Mais pour avoir une vue réaliste de la reconstitution, il ne
du dessus (voir nota ci-après). Cela prépare à la compression, qui faut pas aller regarder uniquement « au niveau du pixel » (niveau
n’en est pas encore une et qui sera effectuée ultérieurement. En 0) mais aussi au niveau des paires de pixels (niveau 1), ou des
effet, les 16 valeurs de la première ligne ont été remplacées par les quartets (niveau 2), ou des octets (niveau 3), etc. C’est ce
8 moyennes (2e ligne de nombres) et les 8 coefficients de détails qu’illustre le tableau 3 comparatif. On peut en retenir que si c’est
(3e ligne), sans plus. « passable » au niveau des pixels (niveau 0), cela devient meilleur
Nota : cela est correct pour des valeurs non-signées mais ça ne l’est plus pour des
à mesure qu’on prend du recul vers les groupes de pixels de plus
valeurs signées, comme c’est le cas dans JPEG 2000. Dans une image de bruit, on peut en plus gros (du niveau 1 au niveau 4).
se retrouver facilement avec des coefficients basse fréquence proches de 0 et des coeffi-
cients haute fréquence beaucoup plus élevés. Cette assertion est toutefois vraie pour la Nota : la transformée en ondelettes n’est donc pas à proprement parler une compres-
plupart des images naturelles (photos). sion d’information. La transformée ne fait que réorganiser l’information en séparant les
basses et hautes fréquences, afin de faciliter une compression ultérieure. Cette compression
Ce processus peut être réitéré, si on procède à un second niveau peut ensuite se faire par quantification des coefficients d’ondelettes (§ 4.3) et/ou via un
encodage entropique (§ 4.4). JPEG 2000 fait les deux, sauf dans le cas d’une compression
de codage (4e et 5e lignes), où on voit apparaître 4 valeurs mathématiquement sans perte où il n’y a pas de quantification des coefficients.
moyennes et 4 coefficients de détails. Mais il ne faut pas croire que
ces 8 valeurs suffiraient à reconstituer les valeurs des pixels de Mais où sont les ondelettes dans tout cela ?
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Codage niveau 3 :
5,5 5,5
Moyenne 4 → 2 pixels
Tableau 3 – Comparaison des valeurs de gris et de leur reconstitution à tous les niveaux de codage
(source VisioWave)
Niveau 0 de niveaux de gris
Rangée de 16 pixels d’image
Niveaux 0 de gris initiaux 9 7 1 7 2 4 9 5 8 6 5 7 9 5 3 1
Niveaux 0 reconstitués 7,5 7,5 0,5 6,5 3,5 3,5 9,5 5,5 5,5 5,5 5,5 5,5 10 6 3 3
Niveaux 1 de gris initiaux 8 4 3 7 7 6 7 2
Niveaux 1 reconstitués 7,5 3,5 3,5 7,5 5,5 5,5 8 3
Niveaux 2 de gris initiaux 6 5 6,5 4,5
Niveaux 2 reconstitués 5,5 5,5 5,5 5,5
Niveaux 3 de gris initiaux 5,5 5,5
Niveaux 3 reconstitués 5,5 5,5
Niveaux 4 de gris initiaux 5,5
Niveaux 4 reconstitués 5,5
2.2.3 Application des ondelettes à l’image Une méthode assimilable à la transformée de Gabor est en œuvre,
par exemple, dans la compression MPEG en général, et tout particu-
Quand, précédemment, on a pris la moyenne des valeurs de lièrement MPEG-2. On décompose l’image en blocs de 8 × 8 pixels,
deux pixels adjacents, on a extrait la fréquence basse (L = Low), et on applique à cette « fenêtre d’image » la transformation DCT (Dis-
spatiale ou temporelle du spectre de l’image locale que forment crete Cosine Transform ). Notons qu’au départ, on perd déjà un degré
ces pixels. Les différences de détails, elles, représentaient la partie de liberté : ce sera un bloc de 8 × 8 pixels, et pas autre chose. Mais
haute (H = High) du spectre. les ondelettes permettent de faire plus, avec davantage de rationalité
Ce traitement peut être effectué par l’analyse de Fourier fenêtrée et de souplesse, bien que longtemps, le succès rencontré par la
(transformée de Gabor) ou, bien plus efficacement, par l’analyse transformée DCT ait occulté les travaux menés parallèlement sur
par ondelettes (§ 2.2.1). d’autres types de transformation dont celle en ondelettes.
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
La transformée en ondelettes va donc être appliquée à l’ensem- – LL1 (Lowpass horizontal + Lowpass vertical) obtenue par appli-
ble des pixels de l’image sur ses 2 dimensions, en générant une cation successive de deux opérateurs :
image de moyenne et des images de différence. La figure 6 pré- • L sur les N rangées de LL0 (donne N/2 colonnes),
sente le concept de base de cette décomposition, avec à gauche
l’image initiale à une bonne résolution, à droite en haut une ver- • L sur les N/2 colonnes ci-dessus (donne N2/4 coefficients pour
sion lissée à une résolution plus faible et à droite en bas la diffé- LL1) ;
rence entre les deux images précédentes, contenant les détails – LH1 (Lowpass horizontal + Highpass vertical) obtenue par
présents dans la première image et absents de la seconde. En pra- application successive de deux opérateurs :
tique, plusieurs images de différence seront générées.
• L sur les N rangées de LL0 (donne N/2 colonnes),
Concrètement, une ondelette est une sinusoïde modulée en fré- • H sur les N/2 colonnes ci-dessus (donne N2/4 coefficients
quence et amplitude selon une forme adaptée, généralement en pour LH1) ;
« chapeau de gendarme » (figure 4c). En analyse spectrale, elle va
chercher avec le signal à traiter une corrélation avec son spectre – HL1 (Highpass horizontal + Lowpass vertical) obtenue par
de fréquences, sur le temps (ou l’espace) « couvert » par le cha- application successive de deux opérateurs :
peau. Un modèle de forme de l’ondelette ayant été établi pour res- • H sur les N rangées de LL0 (donne N/2 colonnes),
pecter notamment les propriétés ci-dessus, on dispose alors d’un
• L sur les N/2 colonnes ci-dessus (donne N2/4 coefficients pour
outil d’analyse modulable :
HL1) ;
– on peut le dilater horizontalement, ce qui revient à élargir sa
– HH1 (Highpass horizontal + Highpass vertical) : obtenue par
fenêtre de sensibilité, et à diminuer dans la même proportion la
application successive de deux opérateurs :
fréquence d’analyse (il y a un nombre constant d’alternances sous
Parution : février 2016 - Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
fréquence
0 sur N échantillons (dans la dimension x ou y)
Filtre L Filtre H
passe-bas passe-haut
sur N/4 échantillons sur N/4 échantillons sur N/4 échantillons sur N/4 échantillons
Sous-bande LL Sous-bande LH Sous-bande HL Sous-bande HH
L est L’image L
l’image originale filtrée passe-bas est filtrée passe-bas L/passe-haut H
et sous-échantillonnée par un facteur de 2 et sous-échantillonnée par un facteur de 2
dans la dimension x (rangées de pixels) dans la dimension y (colonnes de pixels)
LL
(La 2e passe L 1 sous-image (sous-bande)
effectuera le de moyenne (d’approximation)
même traitement (fréquences visuelles basses
sur l’image LL) les plus importantes)
Convolution sur y Sous-
par filtrage échantillonnage/2
passe-bas Ly sur axe y LH
Convolution Sous-
sur axe x échantillonnage/2
par filtrage sur axe x Convolution sur y Sous-
passe-bas par filtrage échantillonnage/2
Lx passe-haut Hy sur axe y HL
3 sous-images
H (sous-bandes)
de détails
horizontaux (LH)
Convolution sur y Sous- verticaux (HL)
par filtrage échantillonnage/2 diagonaux (HH)
passe-bas Ly sur axe y HH (si erreurs ou
forte compression,
infos les moins gênantes)
Convolution Sous-
sur axe x échantillonnage/2
par filtrage sur axe x Sous-
Convolution sur y
passe-haut échantillonnage/2
par filtrage
Hx sur axe y
passe-haut Hy
H est L’image H
l’image originale filtrée passe-haut est filtrée passe-bas L / passe-haut H
et sous-échantillonnée par un facteur de 2 et sous-échantillonnée par un facteur de 2
dans la dimension x (rangées de pixels) dans la dimension y (colonnes de pixels)
Figure 8 – 1re passe (puis 2e passe) du processus de décomposition en « sous-images » (sous-bandes) par ondeletettes à 2 dimensions (source
Wavelet Transform : https://software.intel.com/en-us/node/504431)
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
LH3 HH3
Figure 9 – Matrices de coefficients en sous-bandes de transformation itérative DWT sur 3 niveaux ([17]-24)
Parution : février 2016 - Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Figure 10 – Une image et sa décomposition itérative en sous-images issues des matrices de coefficients des sous-bandes (source IntoPiX [17])
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Approximation Détails
verticaux
Détails Détails
horizontaux diagonaux
Figure 12 – Résultats du filtrage en ondelettes – Approximation et détails horizontaux, verticaux et diagonaux (source Cisco)
Parution : février 2016 - Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
– soit se fixer un volume (ou débit) maximum d’information à est aussi plus douce, avec un flou léger sur les zones à hautes fré-
transmettre, quitte à sacrifier la qualité d’image. quences visuelles (bords, traits, transitions, diagonales...), les coef-
Divers procédés sont pour cela utilisés : ficients correspondants étant alors supprimés pour atteindre un
fort taux de compression.
– une élimination plus ou moins poussée des coefficients des
matrices obtenues (§ 4.3), comme déjà illustrée dans le tableau 2 ;
– un codage entropique (§ 4.4) qui consiste à repérer les valeurs
les plus probables et à leur donner le code le plus court. 3.3 Codage avec ou sans pertes
Ainsi est accompli le parcours qui permet de passer d’une image Pour obtenir une qualité d’image maximale, JPEG 2000
numérique à son expression compressée. comprend un mode de compression « mathématiquement sans
Cette première approche des principes et des techniques de la perte » (mathematically lossless). Ce mode, avec un taux de
compression des images par ondelettes va nous permettre de pré- compression de l’ordre de 2:1, permet de reconstituer exactement
senter et d’illustrer les principales fonctionnalités de JPEG 2000. toutes les valeurs numériques des pixels de l’image originale
(figure 14b+c et figure 25 Bit-plane 11 et 10). Ce mode est ainsi
extrêmement important dans des domaines tels que l’archivage
numérique, l’acquisition en cinéma numérique et l’imagerie médi-
3. Principales fonctionnalités cale ([TE 5 322] § 4).
Avec un taux de compression plus important, cette reconstitu-
de JPEG 2000 tion parfaite des valeurs numériques initiales ne sera plus possi-
ble. On parle alors de compression « mathématiquement avec
JPEG 2000 présente de nombreux atouts, pour des images fixes pertes » (mathematically lossy) entraînant une perte de qualité
ou pour des images animées, correspondant aux objectifs fixés irrémédiable de l’image.
lors de la conception du format (§ 1). Toutefois, à des taux de compression modérés, de 5:1 à 10:1
environ, on peut d’abord effectuer une compression « visuelle-
ment sans perte » (visually lossless) de l’image, que même l’œil
3.1 « License-free » exercé d’un expert ne pourra pas distinguer de l’original
(figure 15b et figure 25 Bit-plane 9 et 8). Par contre, avec un effet
Suite à des accords entre plus de 20 organisations ou entre- de zoom et si le taux de compression est trop élevé, les premiers
prises possédant des brevets dans ce domaine, la partie 1 de la artefacts deviendront perceptibles.
norme JPEG 2000 ([TE 5 322], § 1.1.1), concernant le cœur du À un niveau de qualité encore inférieur, pour des taux de
codage, n’est pas sujet au paiement de royalties ou de licences. compression jusqu’à 50:1 environ, et au-delà, les artefacts de
compression deviennent visibles (figure 15c et figures 24 et 25
Bit-plane 7 et 6) et on parle alors de compression « visuellement
3.2 Efficacité et perception améliorées avec pertes » (visually lossy). Les images peuvent cependant res-
de la compression ter utilisables dans le cadre, par exemple, d’une recherche sur le
Web.
L’efficacité sera largement démontrée dans le paragraphe du
deuxième article ([TE 5 322], § 3) concernant les performances de
JPEG 2000 comparées à celles d’autres formats de compression 3.4 Scalabilité
d’images fixes ou d’images animées. La figure 13 compare deux
images compressées JPEG et JPEG 2000 à un très fort niveau de Un format de compression est dit intrinsèquement scalable
compression (137:1). Sur l’image compressée JPEG apparaissent quand l’utilisateur peut extraire de multiples versions d’un seul
des effets de blocs, dus au processus d’analyse et de transforma- train de données (codestream) ou d’un seul fichier, en fonction des
tion DCT (Discrete Cosine Transform) s’appliquant sur des blocs ressources de l’équipement utilisateur ou des besoins en niveau
de pixels. La dégradation sur l’image JPEG 2000 est plus homo- de qualité. Un codestream JPEG 2000 est la juxtaposition, en fin de
gène, l’analyse et la transformée en ondelettes DWT (Discrete codeur (§ 4), d’en-têtes contenant les paramètres de codage et de
Wavelet Transform) s’appliquant sur l’ensemble de l’image. Elle bit streams, formes compressées des données de l’image (§ 4.5.2).
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
a JPEG (transformée DCT) Taux de compression 137:1 b JPEG 2000 (transformée DWT) Taux de compression 137:1
a original b compression 5:1 visuellement sans perte c compression 50:1 visuellement avec pertes
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Cette scalabilité est permise par la structure « atomisée » : 3.7 Autres fonctionnalités
– de l’image, en composantes, en tuiles (§ 2.1) et en secteurs
(precincts – § 4.5.1) ; Parmi les autres fonctionnalités offertes par JPEG 2000, on peut
– de la décomposition itérative multirésolution par ondelettes en citer :
sous-bandes (§ 2.2.3) ;
– des matrices de données en blocs de codage et en plans de – l’accès aléatoire aux différentes zones de l’image. Il est
bits (§ 4.4), en couches, en secteurs, puis en paquets (§ 4.5.1) ; possible de ne décoder qu’une certaine zone d’une image, c’est là
– du codestream (§ 4.5.2) et des fichiers ([TE 5 322], § 2.1) encap- un atout des tuiles (quand l’image est très grande), et des secteurs
sulant ces données. (precincts) ;
On peut alors : – les métadonnées très variées que JPEG 2000 permet d’enregis-
trer ([TE 5 322], § 2.3.1) ;
– générer facilement une version de consultation (proxy ou
browsing copy) ; – le traitement d’une grande variété de types d’images. La
– visualiser et traiter des régions d’intérêt ROI (Region of norme JPEG 2000 s’applique aux images photographiques en cou-
Interest) – § 4.8 ; leurs mais aussi aux images en niveaux de gris et aux images
– optimiser la capacité disponible et variable sur un réseau, par composées de zones différentes ;
exemple en donnant la priorité à des paquets de données fonda- – la compatibilité avec les profils ICC. JPEG 2000 emporte des
mentales, pour en permettre une adaptation automatique au débit informations précises sur les couleurs ; en particulier, il est
disponible, ou encore en augmentant la redondance de ces compatible avec les profils ICC (International Colour Consortium)
paquets pour garantir une qualité minimum d’image en cas qui sont devenus incontournables dans la pré-presse ;
d’affaiblissement du signal ; – les images 32 bits. JPEG 2000, contrairement à JPEG, permet
Parution : février 2016 - Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
– effectuer une réception adaptative, tenant compte du débit de de traiter des images 32 bits ;
transmission et de la définition d’affichage disponibles
– la transparence. Contrairement à JPEG, JPEG 2000 permet
(figure 36b), permettant ainsi en cinéma numérique soit un affi-
d’enregistrer une image comportant de la transparence.
chage 2K, soit 4K ([TE 5 322], figure 26). Ou encore en diffusion
vidéo numérique (application pas utilisée), cela permet soit à une
tablette avec une connexion bas débit de recevoir une version de
résolution ou de qualité réduite, par exemple pour regarder des
actualités, soit à un téléviseur HD ou UHD-1 (« 4K ») de recevoir le 4. Chaîne de codage
même signal en pleine résolution (voir aussi figure 36) ;
– bénéficier d’un décodage progressif en résolution ou en qua-
lité (§ 4.5.3), sur un même équipement. Seul l’algorithme de décodage est décrit dans la Partie 1 de la
norme JPEG 2000. Cependant, pour faciliter l’introduction de la ter-
minologie et celle des techniques mises en oeuvre, nous présen-
3.5 Régions d’intérêt tons ici un algorithme de codage typique compatible avec la
norme. La figure 16 présente le schéma fonctionnel d’un codeur
Une région d’intérêt (ROI) est une région de l’image qui est JPEG 2000. Il se divise essentiellement en 5 modules :
codée avec une plus grande précision parce qu’elle présente un pré-traitement, transformée en ondelettes discrète, quantification,
intérêt particulier. Cette plus grande précision se fait au détriment codage entropique et allocation de débit.
des autres zones de l’image qui sont alors compressées à un taux
supérieur et donc dégradées (§ 4.8).
4.1 Pré-traitement
3.6 Résistance aux erreurs
■ Tuilage
Le problème vient du codeur arithmétique (§ 4.4.2) car un seul
bit erroné entraîne le décodage d’une mauvaise séquence. Afin de C’est à cette étape que, en option, en particulier pour
limiter les effets de ces erreurs (figure 39 et [TE 5 322] – figure 28), compresser des images de grande taille, l’image est découpée en
la norme propose plusieurs outils, dont la philosophie est essen- tuiles (tiles) ou pavés, blocs rectangulaires qui ne se recouvrent
tiellement de compartimenter les mots de codes ou de réduire leur pas (§ 2.1.3). Chaque tuile est traitée indépendamment et peut se
longueur afin d’éviter ou de limiter la propagation des erreurs voir ultérieurement attribuer ses propres paramètres de
(§ 4.9). Pour une transmission sans fil, des méthodes spécifiques compression. Les tuiles permettent alors de réduire la taille
ont été développées dans la Partie 11 du standard, JPEG 2000 mémoire dans le codeur comme dans le décodeur, en travaillant
Wireless (ISO/IEC 15444-11/ITU-TT.8), pour détecter et corriger les sur des sous-images indépendantes. Ces tuiles sont réunies, en fin
erreurs ([TE 5 322], § 1.1.11). de chaîne de codage, dans un seul et même codestream.
Allocation
de débit
Données Mise en
Pré- Transformée Modélisation Codage Codestream
de l’image Quantification ordre
traitement en ondelettes contexte arithmétique JPEG 2000
originale des données
Région
d’intérêt
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
1 d 01 1 d 11 1 d 21 1 Sortie
passe-haut
1
di1 = di0 − (s00 + si0+1)
2
1 1 1 1 1 1 Étapes de prédiction
4 4 4 4 4 4 (prediction step)
Sortie
passe-bas
s01 s11 s21 s31
1 0
si1 = si0 + (di -1 + di1)
4
Étapes de mise à jour
(update step)
b filtre 5/3
Figure 18 – Processus et exemple de filtre de décomposition en ondelettes ([5] et figure 6 et 7 et [20] p. 77 et 79)
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Le filtre 9/7, de Daubechies, est à coefficients réels, avec 9 coef- 4.4 Codage entropique
ficients pour le passe-bas et 7 pour le passe-haut. Cette paire per-
met de meilleures performances que la 5/3 à des taux de L’entropie d’une source est la quantité moyenne d’information
compression plus élevés, mais est aussi plus complexe. La trans- contenue dans le message issu de cette source (par exemple, en
formée (9,7) n’étant pas réversible, elle peut seulement être utili- bit/pixel). Un codage entropique va utiliser des statistiques sur la
sée pour la compression mathématiquement avec pertes. source pour construire un mot de code dont la longueur dépend
de ces propriétés. Ce mécanisme est une version préliminaire de
Nota : ces deux filtres ont été choisis, car il fallait des filtres biorthogonaux, seuls ces l’outil CABAC (Context-Adaptive Binary Arithmetic Coding) utilisé
filtres garantissant la propriété de perfect reconstruction (PR), c’est-à-dire la possibilité de
reconstruire parfaitement le signal décomposé en l’absence de toute erreur de quantifica- pour MPEG-4 AVC/H.264 [TE 5 367], puis également pour
tion. Le filtre 5/3 a été choisi car c’est un des filtres biorthogonaux les plus simples et HEVC/H.265 [TE 5 372].
qu’il dispose de coefficients entiers (permettant dès lors une compression mathémati-
quement sans perte). Le filtre 9/7 est un filtre biorthogonal très connu, introduit par Il s’agit d’effectuer un codage sans perte des coefficients d’onde-
Antonini en 1992 [8]. Il a été choisi car il permet une bonne discrimination fréquentielle lettes quantifiés de chaque sous-bande, dans l’unité de codage
(séparant basses et hautes fréquences). entropique ECU (Entropy Coding Unit) qui est composée de
(figure 20 et [4]) :
– un modeleur de contexte (context modeling) qui choisit quelle
4.3 Quantification donnée à coder en premier en fournissant des informations
contextuelles la concernant, le contexte de conditionnement per-
mettant de saisir la redondance dans l’image (figure 21 et [5]) ;
La transformée en ondelettes en elle-même ne compresse pas – un codeur arithmétique basé sur le contexte, qui utilise alors
les données de l’image ; elle les structure, de sorte qu’une réduc- ces caractéristiques spatiales locales ou temporelles pour estimer
Parution : février 2016 - Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
tion soit plus facile (il en est de même de la transformée la probabilité d’un symbole à être codée et attribuer des mots de
inter-composantes couleur RVB → YCbCr). La quantification en est code plus ou moins courts.
la première étape. La norme JPEG 2000 utilise un quantificateur
scalaire uniforme à zone morte ou dead zone (figure 19 et [22]). Pour analyser l’image, une structure, groupant les coefficients
Les coefficients des ondelettes non-nuls mais proches de zéro quantifiés, est adoptée sur la base (figure 22 et [4]) :
n’apportent que très peu d’information pertinente, et leur codage – de la partition de chaque sous-bande (sub-band) de chaque
entropique (§ 4.4) impliquerait un important surcoût au vu de la tuile-composante (tile-component) en blocs de codage
qualité gagnée. La zone morte permet de se débarrasser de ces (code-block), typiquement de taille 64 × 64 ou 32 × 32, codés
coefficients en les quantifiant à zéro. Elle concerne donc le codage indépendamment ;
mathématiquement avec pertes.
Dans le cas d’un codage sans perte, le pas de quantification est
égal à 1. Bit Données
Coefficients Modélisation Codage d’image
quantifiés du contexte arithmétique compressées
des Contexte
ondelettes
Q(w)
2
Coefficient
1 d’ondelettes
à quantifier
– 5∆ – 4∆ – 3∆ – 2∆ – ∆
W
∆ 2∆ 3∆ 4∆ 5∆
1
∆ : Pas de quantification
2 de la sous-bande
Zone
morte
(dead zone)
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Plan de bit i
(Bit-plane i)
LSB
DWT MSB
Tuile-composante
(tile-component)
Sous-bande
(sub-band) Bloc de codage
(code-block)
Parution : février 2016 - Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
4.4.2 Codage arithmétique – le nombre de plans de bits utilisés pour représenter les coeffi-
cients de chaque bloc de codage nouvellement inclus ;
La deuxième étape est réalisée par un codeur arithmétique dit – le nombre de passes de codage inclus dans ce paquet, et ce
codeur MQ (qui est une modification de l’ancien Q-Coder déve- pour chaque bloc de codage ;
loppé par IBM). Son but est de réduire la taille de la séquence – la longueur des données codées, c’est-à-dire le nombre
binaire. Il reçoit pour cela une succession de couples d’informa- d’octets pour chaque bloc de codage.
tions (bit, contexte) de l’étage précédent de modélisation
(figure 20), lui permettant d’estimer la probabilité des bits. Il peut
alors représenter toute une séquence binaire par un nombre entre 4.5.2 Organisation du codestream
0 et 1, dépendant de cette probabilité.
Le flux de données codées (codestream) comprend toutes les
Le résultat des deux étapes du codage entropique est illustré par données de l’image compressée dans les paquets avec toutes les
les figures 26 et 27 [5]. Elle permet de visualiser les différentes informations (markers) nécessaires à sa décompression. Il repré-
structures (sous-bandes, blocs de codage, plans de bits, passes de sente le format d’échange minimum des données de JPEG 2000,
modélisation) qui aboutissent à une très grande variété de para- mais il est habituellement encapsulé dans un format de fichier
mètres dans le décodage et, donc, dans l’utilisation de ces don- ([TE 5 322] § 2).
nées. On aboutit alors à la notion de couche (layer) explicitée
ci-après. Il est composé (figure 30 et [2], [15] et ISO 15444-1) : d’un
en-tête principal, d’en-têtes de tuiles qui spécifient les paramètres
La figure 26 illustre la gestion de la résolution en fonction du de codage, et des données codées pour chaque tuile.
nombre de sous-bandes prises en compte, avec une qualité maxi-
mum, tous les plans de bits étant conservés ainsi que toutes les Une partie de tuile (tile-part) est une portion du codestream
contenant des données d’image pour une partie ou pour le tout
Parution : février 2016 - Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Figure 24 – Image reconstruite après encodage 3 passes et décodage des plans de bits 1 à 11 (de gauche à droite et de haut en bas) ([5] 122-134
et [2] figure 1.30 p. 62)
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Figure 25 – Suite de la figure 24 – Image reconstruite après encodage 3 passes et décodage des plans de bits 1 à 11 (de gauche à droite et de
haut en bas) ([5] 122-134 et [2] figure 1.30 p. 62)
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Plans
a) Résolution la plus basse (une seule sous-bande) Image (256 x 256)
de bits
Qualité la plus grande (tous les plans de bits)
LL2
BP1 HL2
b) Résolution moyenne (plusieurs sous-bandes)
MSB Qualité la plus grande (tous le plans de bits) HL1
LH2 HH2
c) Résolution la plus grande (toutes les sous-bandes)
Qualité la plus grande (tous les plans de bits)
BP2
Blocs de codage (64 x 64)
LH1 HH1
BP3
Passes
Significance
Refinement
Parution : février 2016 - Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Clean-up
BP4
BP5
BP6
LL1
Sous-bandes
Figure 26 – Exemple de données codées par passes en plans de bits et gestion de la résolution ([5] p. 137-141)
L’allocation de débit consiste à choisir quelles sont les passes nombre de bits/réduction de distorsion d’abord) jusqu’à atteindre l’objectif. Le ratio
nombre de bits/réduction de distorsion correspond en fait à la pente de la courbe de la
que l’on va mettre dans chaque couche de qualité et quelles sont figure 34 : on ne garde que les passes qui ont une pente supérieure à une valeur donnée,
celles que l’on va laisser tomber (discarded ). et on rejette (discarded) toutes celles au-delà de 2 bpp, puisqu’on vise un taux de
compression de 4:1. Cette élimination résulte de facto en une quantification supplémen-
Il faut savoir que l’allocation de débit ne fait pas partie du stan- taire de certains coefficients (puisque ce sont les bits LSB qui sont écartés).
dard JPEG 2000, chacun étant libre d’opérer cette allocation
comme il veut, pour autant que le codestream final soit conforme
au standard.
Les types de contrôle de débit (en bpp, bits per pixel) possibles 4.7 Paramètres usuels de codage
sont :
– limité (comme en JPEG), le taux de compression étant déter- En synthèse de la description de la chaîne de codage, la
miné uniquement par la taille du pas de quantification et le figure 36 illustre les différentes structures des données dans le for-
contenu de l’image ; mat JPEG 2000 et la flexibilité d’utilisation du codestream :
– itératif, la taille des pas de quantification est ajustée selon le – les composantes (components) et les tuiles (tiles), au niveau
taux de compression obtenu, et l’opération est répétée ; de l’image d’origine ;
– en post-compression, l’allocation du débit est effectuée, au
niveau de chaque bloc de codage, après que l’ensemble de l’image – les sous-bandes (sub-bands) multirésolution, après transfor-
ait été codé (voir nota ci-après). mation en ondelettes ;
Nota : il s’agit de la voie la plus souvent adoptée pour l’allocation de débit. Elle – les couches (layers) de qualité selon les sous-bandes, les blocs
consiste à encoder dans un premier temps l’ensemble de l’image avec des pas de quan- de codage (code-blocks), les plans de bits (bit-planes) et les passes
tification par défaut (égaux à 1 en cas de compression sans perte par transformation 5/3). de codage (coding passes) ;
Ensuite, une fois que toute l’image est encodée, on sait exactement quel est le ratio entre
le nombre de bits dans une passe de codage et la contribution de cette passe à la réduc- – les secteurs (precincts) regroupant des blocs de codage ;
tion de distorsion de l’image. Suivant que l’on cible une taille fixe ou une qualité fixe, les
passes vont être incorporées dans le codestream (les passes avec le plus bas ratio – les paquets (packets) au niveau du codestream.
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Plans
a) Résolution la plus grande (toutes les sous-bandes) Image (256 x 256)
de bits
Qualité-cible du rapport signal-sur-bruit LL2
BP1 (fonction du nombre de plans de bits et de passes) HL2
MSB b) Résolution grande (fonction du nombre de sous-bandes) HL1
Qualité-cible visuelle
(fonction du nombre de plans de bits et de passes) LH2 HH2
BP2
Blocs de codage (64 x 64)
LH1 HH1
BP3
Passes
Significance
Refinement
Parution : février 2016 - Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Clean-up
BP4
BP5
BP6
LL1
Sous-bandes
Figure 27 – Exemple de données codées par passes en plans de bits et gestion de la qualité ([5] p. 137-141)
Les paramètres de codage suivants en découlent : Nota : de plus grands blocs de codage diminuent la marge (overhead) nécessaire aux
en-têtes de paquet (car il y a globalement moins de blocs de codage) et donc, à débit
– taille des tuiles. Par exemple, de 128 × 128 à 1 024 × 1 024 ; le donné, laissent plus de place aux données compressées. Par ailleurs, le codeur entro-
PSNR (Peak Signal-to-Noise Ratio) augmente avec la taille ; en pique est aussi potentiellement plus efficace sur de plus grands blocs de codage car son
cinéma numérique et en vidéo une seule tuile par image en modèle de probabilité adaptatif est moins souvent réinitialisé.
pratique ;
– transformée colorimétrique des composantes multiples, réver-
sible ou non. L’ICT, irréversible, est meilleure, mais seule la RCT, 4.8 Codage d’une région d’intérêt (ROI)
réversible, permet la compression mathématiquement sans pertes
(§ 4.1) ; Le codage d’une région d’intérêt ROI (Region Of Interest) permet
– nombre de décompositions DWT. Il est habituellement de 5. Le une distribution non-uniforme de la qualité de compression. La
rapport signal crête/bruit PSNR augmente avec leur nombre ROI est codée avec une plus grande qualité que le fond
(§ 4.2) ; (figure 37a).
– banc de filtres (5,3) ou (9,7). Le (9,7) est meilleur, mais seul le – les ROI statiques sont définies et paramétrées au codage et
(5,3) permet la compression mathématiquement sans pertes conviennent pour le stockage, les transmissions fixes, la télé-
(§ 4.2) ; détection, etc. ;
– taille des blocs de codage (§ 4.4), habituellement 64 × 64. Le – les ROI dynamiques sont définies de façon interactive par un
PSNR augmente avec la taille (voir nota ci-après) ; utilisateur en relation client-serveur durant une transmission pro-
– taille des secteurs, precincts (§ 4.5.1) ; gressive et conviennent pour la télémédecine, les communications
– nombre de couches (layers) de qualité (§ 4.5.1) et leur cible mobiles, les tablettes, etc.
correspondante, en débit ou en distorsion ; Le masque ROI (figure 37b) définit quels coefficients
– ordre de progression LRCP, RLCP, RPCL, PCRL, CPRL. Habituel- contribuent à reconstruire la ROI. C’est un masque binaire qui
lement LRCP, Layer – Resolution Level – Component – Position dépend de la forme de la ROI dans le domaine image et qui est
(§ 4.5.2). généré dans le domaine des ondelettes.
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Plans
Couches
de bits
BP1 Layer 1
MSB
Layer 2
Layer 3
BP2
Layer 4
Blocs de codage
BP3
Passes
Significance
Refinement
Parution : février 2016 - Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Clean-up
BP4
BP5
BP6
LL1
Sous-bandes
Figure 28 – Exemple d’organisation en couches (layer) de qualité, fonction du nombre de sous-bandes, de plans de bits, de blocs de codage et
de passes pris en compte ([5] p. 145)
Dans le processus d’accroissement de l’échelle ou general sca- transmise dans un marqueur, et dans le décodeur cette simple
ling (figure 38b), les coefficients quantifiés des ondelettes de la valeur de seuil permet de distinguer la ROI du fond.
ROI sont décalés d’une valeur s vers le haut de l’échelle des plans Ses avantages sont :
de bits, tandis que ceux du fond restent inchangés. En
conséquence, les coefficients ROI sont codés avant. La valeur de s – des formes arbitraires même disjointes sont possibles ;
est transmise dans l’en-tête du codestream (§ 4.5.2) pour chaque – le codeur peut optimiser le masque ROI pour améliorer la qua-
lité visuelle (par exemple, toute la sous-bande LL peut être
ROI.
considérée comme une ROI pour fournir un fond en basse
Ses avantages sont : résolution) ;
– l’ajustement par l’utilisateur au niveau du codeur du différen- – il n’y a pas besoin d’inclure la forme de la ROI dans le code-
tiel de qualité entre la ROI et le fond ; stream et aucun masque ROI n’est requis dans le décodeur.
– la possibilité de multiples ROI avec des différentiels de qualité Ses inconvénients sont :
différents à l’intérieur d’une même tuile-composante. – aucun contrôle du différentiel de qualité entre la ROI et le
Ses inconvénients sont : fond ;
– possible seulement avec la Partie 2 de la norme ([TE 5 322], – une seule ROI par tuile-composante est permise.
§ 1.1.2) ;
– le codeur doit générer un masque ROI standard sans optimisa-
tion possible ; 4.9 Résistance aux erreurs
– le décodeur doit également régénérer le masque ROI ;
Quand des images compressées sont livrées via un canal de
– les formes de ROI sont limitées (rectangle et ellipse). transmission, toute erreur peut gravement affecter la qualité de
Dans le processus de décalage maximum ou maxshift l’image décodée. Ces erreurs peuvent être aléatoires, par paquets,
(figure 38c), au décalage s des coefficients ROI correspond 2s la ou dues à des octets manquants (en cas de perte de paquets dans
valeur la plus grande des coefficients du fond. La valeur s est le réseau).
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Secteurs (precincts)
Parution : février 2016 - Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
COD, COC
QCD, QCC
COD, COC
QCD, QCC
COD, COC
QCD, QCC
RGN, etc.
RGN, etc.
RGN, etc.
RGN, etc.
SOD
SOD
SOD
SOC
SOT
SOT
SOT
EOC
Paquets Paquets Paquets
SIZ
Figure 30 – Structure du codestream et marqueurs ([2] figure 1.26 p. 44 et [15] p. 13 et ISO 15444-1 figure A2)
Du fait que chaque bloc de codage est traité indépendamment, peuvent être alors faussement affectées à d’autres blocs et les
une erreur dans le codestream correspondant sera contenue dans paquets suivants ne peuvent pas être correctement localisés, d’où
ce bloc de codage. Le codestream étant constitué de paquets, leurs une perte totale de synchronisation ;
en-têtes sont aussi interdépendants et donc fragiles : – si l’erreur a lieu dans le corps du paquet, corrompant les don-
nées d’un bloc de codage, des symboles incorrects sont décodés
– si l’erreur a lieu dans l’en-tête, une longueur erronée du corps et des contextes incorrects sont attribués pour les plans de bits
du paquet peut être décodée, les données du bloc de codage suivants, d’où une grave distorsion ;
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
LSB
MSB LL3 HL3
LL3 HL3
HL2
LH3 HH3
LH3 HH3 HL2
HL1
HL1
LSB
MSB
LH1 HH1
LH1 HH1
LSB
MSB LL3 HL3
LL3 HL3 HL2
LH3 HH3
HL2
LH3 HH3 HL1
HL1
LH2 HH2
Parution : février 2016 - Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
LH2 HH2
LSB
MSB
LH1 HH1
LH1 HH1
LH2 HH2
– si des octets sont manquants (perte de paquets), cela peut
générer des effets combinés d’erreurs dans l’en-tête et le corps du
paquet ; les effets de la perte d’un paquet dépendent de la résolu-
tion d’image contenue et de la couche de qualité correspondante.
LH1 HH1
Deux types de mesures de protection, très efficaces (figure 39),
sont mis en œuvre :
– au niveau des données du bloc de codage :
• des marqueurs de segmentation sont ajoutés dans une
séquence spéciale avec un contexte fixe à la fin de chaque Figure 32 – Progression de résolution, de haut en bas,
en ajoutant les données (en rouge) : de la sous-bande LL3 à toutes
plan de bits pour y détecter une erreur au décodage, les sous-bandes ([5] p. 157-160)
• des données de fin de passe de codage sont ajoutées, pour
détecter une erreur au décodage ;
ders, Tile-part header marker) dans l’en-tête de partie de
– au niveau des en-têtes de paquet : tuile ; ces marqueurs consistent à rassembler tous les
• un marqueur de resynchronisation SOP (Start Of Packet), en-têtes de paquets dans l’en-tête principal ou dans l’en-tête
avec un index de séquence, peut précéder chaque en-tête de de partie de tuile,
paquet et détecter des données corrompues,
• les secteurs (precincts) peuvent limiter la couverture spatiale
• des marqueurs PPM (Packed Packet headers, Main header d’un paquet et ainsi restreindre les effets des erreurs de
marker) dans l’en-tête principal et PPT (Packed Packet hea- l’en-tête à une petite zone de l’image.
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
LL3 HL3 Y
HL2
LH3 HH3
Secteurs
HL1 (precints)
LH2 HH2
LH1 HH1
LL3 HL3
HL1
LH2 HH2
YCbCr
HH1
LH1 HH1
LL3 HL3
HL1
LH2 HH2
8
LH2 HH2 HL1 7
Erreur quadratique
6
5
4
LH2 HH1 3
2
1
Figure 33 – Progression spatiale, de haut en bas, en ajoutant
les données (en rouge) des secteurs (precincts) correspondants dans 0
chaque sous-bande ([4] 1-1 12) 0 0,5 1 1,5 2 2,5 3
Couche 1 bpp (bits/pixel)
Une stratégie de protection différenciée (Unequal Error Protec- Couche 2
tion, UEP) selon l’importance des paquets peut aussi être appli- Couche 3
quée (figure 40). Sa mise en œuvre est spécifiée par la Partie 11 de Couche 4
la norme pour les transmissions sans fil ([TE 5 322], § 1.1.11), avec Éliminé (discarded)
le code Reed-Solomon, et augmente encore l’efficacité de la pro-
Figure 35 – Exemple d’allocation de débit par ajout de couches de
tection des données, qui décroît toutefois avec le taux de qualité successives, avec diminution de l’erreur quadratique entre
compression. l’image originale et l’image reconstruite ([5] p. 164)
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Sous-bandes
de la transformée LH2 HH2 cb0
en ondefettes cb1
LH1
HH1
Blocs
cb2 cb4
de codage
cb3 cb5
cbi
Les données des coefficients des ondetettes sont rangées dans le codestream JPEG 2000
Tuile (Tile) T0
Résolution R0 R
R1
Couche qualité
(Layer) L0 L1 L0 L
Composante Y Cb Cr Y Cb Cr Y Cb C
Secteur P
Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 Pr0 Pr1 Pr2
(Precinct)
Paquet 0 Paquet1 Paquet 2 Paquet 3 Paquet 4
Données bloc Données bloc Données bloc Données bloc Données bloc Données bloc
En-tête
de codage cb0 de codage cb1 de codage cb2 de codage cb3 de codage cb4 de codage cb5
Paquet 0
S/s-bande HL1 S/s-bande HL1 S/s-bande LH1 S/s-bande LH1 S/s-bande HH1 S/s-bande HH1
Tuile (Tile) T0
Résolution R0 R1 R
Couche qualité
L0 L1 L0 L
(Layer)
Composante Y Cb Cr Y Cb Cr Y Cb C
Secteur
Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 Pr0 Pr1 Pr2 P
(Precinct)
Figure 36 – Exemple de codage (a) et de décodage (b) d’un codestream JPEG 2000 et de sa flexibilité d’utilisation (source : Bako-Analog Devices)
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Region Of Interest
(coefficients ROI)
fond fond
MSB
Plans de bits
S
plans de bits
S
LSB plans de bits
Figure 39 – Exemple de résistance aux erreurs dues à 16 octets mis à zéro au milieu du fichier : la moitié de l’image codée JPEG
est corrompue (a), mais non l’image codée JPEG 2000 (b) (source IntoPIX)
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Figure 40 – Exemple de protection différentiée des données, UEP (Unequal Error Protection) (source IntoPIX)
Cet article n’aurait pas pu être écrit sans l’apport des nom- COM Comment Marker
breux travaux et publications des chercheurs et ingénieurs,
contributeurs à la norme JPEG 2000, ainsi que d’institutions et C-P-R-L Component-Position-Resolution-Layer
de sociétés telles que l’EPFL, intoPIX... Qu’ils en soient ici tous CRG Component Registration marker
remerciés.
Nos remerciements particuliers à Antonin DESCAMPE de la DCDM Digital Cinema Distribution Master
société intoPIX pour la relecture attentive de ce document DCI Digital Cinema Initiative
avec ses corrections et l’ajout de notes, et à Jacques
JOUHANEAU pour ses corrections et ses propositions d’amé- DCP Digital Cinema Package
lioration de la lisibilité.
DCT Discrete Cosine Transform
DVB Digital Video Broadcasting
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
JPEG Joint Photographic Experts Group PPM Packed Packet headers, Main header marker
JPEG-LS JPEG* Lossless PPT Packed Packet headers, Tile-part header marker
JPIP JPEG 2000 Interactive Protocol (Part 9) PSNR Peak Signal-to-Noise Ratio (rapport signal crête sur
bruit)
JPM JPEG 2000 coumpound image file format (Part 6)
QCC Quantization Component marker
JPSEC JPEG 2000 Secured (Part 8)
QCD Quantization Default marker
JPWL JPEG 2000 Wireless (Part 11)
Rb Dynamic Range of a component sample as defined
JPX JPEG 2000 eXtended file format (Part 2) in SIZ*
JPXML JPEG 2000 XML structural representation RCT Reversible Colour Transformation
(Part 14)
RGB Red-Green-Blue
KLV Key Length Value
RGN Region of interest marker
L Lowpass filter
R-L-C-P Resolution-Layer-Component-Position
L- Lossless (sans perte)
RMSE Root-Mean-Square-Error (racine carrée de l’erreur
LH Lowpass horizontal + Highpass vertical filtered quadratique moyenne)
JPEG 2000 picture DWT* sub-band
ROI Region Of Interest
LL Lowpass horizontal + Lowpass vertical filtered
JPEG 2000 picture DWT* sub-band R-P-C-L Resolution-Position-Component-Layer
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
SMPTE Society of Motion Picture and Television Engineers UDP User Datagram Protocol
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
P
O
U
JPEG 2000, format de compression R
d’image numérique par ondelettes
E
Principes N
par Jean-Noël GOUYET
Ingénieur-formateur et consultant en techniques et gestion des médias numériques.
Ancien chargé d’études à la Direction de la recherche de l’INA (Institut national
S
de l’audiovisuel)
Christophe NELSON
A
Formateur en techniques numériques vidéo
Ina EXPERT V
Parution : février 2016 - Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Marc LEGER
et
Diplômé de l’École nationale supérieure Louis-Lumière
O
Opérateur de prise de vues
Ingénieur vision
Responsable de filière formation aux techniques vidéo
I
Ina EXPERT
R
P
Sources bibliographiques
L
Ouvrages Développement – Historique – Objectifs https://www.ceremade.dauphine.fr/
[1] ELSEVIER. – Special issue on JPEG 2000. [6] ISO/IEC Requirements ad hoc group. – JPEG
~peyre/java/image/
http://www.cmap.polytechnique.fr/~peyre/
U
Requirements and profiles version 6.3. java/image/
Signal Processing : Image Communication,
vol. 17, issue 1, janv. 2002. ISO/IEC N1803, juil. 2000
http://www.jpeg.org/public/wg1n1803.pdf Principes du JPEG 2000. Chaîne de codage
S
[2] SCHELKENS (P.), SKODRAS (A.) et EBRA- [7] CLARK (R.). – An Introduction to JPEG 2000
HIMI (T.). – The JPEG 2000 suite. Wiley, and Watermarking [15] ADAMS (M.). – The JPEG 2000 still image
ISBN-13:978-0470721476, sept. 2009 http://www.jpeg.org/public/jpgintro.pdf compression standard. ISO/IEC N2412,
http://eu.wiley.com/WileyCDA/WileyTitle/ 1er sept. 2001/21 juil. 2013
productCd-0470721472.html Ondelettes http://www.ece.uvic.ca/~frodo/publications/
http://www.amazon.com/gp/product/ jpeg2000.pdf
0470721472?ie=UTF8&tag=jpeg-20&link- [8] ANTONINI (M.), BARLAUD (M.), MATHIEU
Code=as2&camp=1789&creative= [16] BROWER (B.). – The next generation of
(P.) et DAUBECHIES (I.). – Image coding
9325&creativeASIN=0470721472 compression JPEG 2000. NSES-Kodak,
using wavelet transform. IEEE Transactions
Image Compression Symposium, 21 mai
on Image Processing, vol. 1, n˚ 2, p. 205-220,
[3] TAUBMAN (D.) et MARCELLIN (M.). – 2002
avr. 1992
JPEG 2000 : image compression fundamen- http://www.gwg.nga.mil/ntb/2002SICS/
http://www.i3s.unice.fr/~barlaud/publi/
tals, standards and practice. Kluwer, Interna- 05NextGen.PDF
IP92.pdf
tional Series in Engineering and Computer [17] intoPIX. – Everything you always wanted to
Science, ISBN-13:978-0792375197, nov. 2001 [9] BURKE HUBBARD (B.). – Ondes et ondelet-
tes. La Saga d’un outil mathématique. Édi- know about JPEG 2000, août 2012
http://www.springer.com/computer/ http://www.intopix.com/uploaded/
image+processing/book/978-0-7923-7519-7 teur Pour la Science/Belin, 1995/juil. 2000.
Download%20Tutorials/intoPIX%20-%
http://www.amazon.com/JPEG2000- [10] GROSSMANN (A.) et TORRÉSANI (B.). – Les 20Pocket%20book%20about%
Compression-Fundamentals-International- ondelettes, août 2001 20JPEG%202000.pdf
Engineering/dp/079237519X/ http://www.cmi.univ-mrs.fr/~torresan/
ref=pd_cp_b_0/191-3597340-7040716 universalis/ondel.html [18] MARCELLIN (M.W.), GORMISH (M.J.), BIL-
GIN (A.) et BOLIEK (M. P.). – An overview of
[11] GUYONVARC’H (Y.). – La compression JPEG 2000 (2000)
Tutoriel d’images par ondelettes. VisioWave/Club http://ce.sharif.ac.ir/courses/84-85/2/
Visu (1996). ce342/resources/root/Lecture%20Notes/
[4] DESCAMPE (A.) et MACE (F.). – The JPEG [12] LEMIRE (D.). – FAQ sur les ondelettes dcc2000_jpeg2000_note.pdf
2000 standard. intoPIX/INA Training, mars ftp://ftp-sop.inria.fr/ariana/Downloads/
2013. [19] MARCELLIN (M.W.) et BILGIN (A.). –
faqondelette.pdf
JPEG2000 for digital cinema. University of
[5] RABBANI (M.) et SANTA CRUZ (D.). – The [13] MORIZET (N.). – Initiation aux ondelettes. Arizona, VidTrans and SMPTE Advanced Mo-
JPEG 2000 still-image compression stan- REE n˚ 9, oct. 2006. tion Imaging (2005)
dard. Kodak, EPFL (2003) [14] PEYRE (G.), CASTILLO (I.), DOSSAL (C.) et DI http://citeseerx.ist.psu.edu/viewdoc/
http://dsanta.users.ch/teaching/ (A.). – La compression d’images par ondelet- download?doi=10.1.1.87.594&rep=
ICIP2001_JPEG2K.pdf tes. Introduction interactive avec Java rep1&type=pdf
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
O
U [20] RABBANI (M.) et JOSHI (R.). – An overview
of the JPEG 2000 still image compression
standard. ISO/IEC N2233, 19 juil. 2001
http://flashinformatique.epfl.ch/IMG/
pdf/fi-3-1.pdf
https://www.itscj.ipsj.or.jp/sc29/29w42901.
htm#JPEG%202000
[25] JPEG.org. – Overview of JPEG 2000/Our new
R http://www.cis.rit.edu/~cnspci/references/
dip/compression/rabbani2000.pdf
[23] TAUBMAN (D.). – High performance scalable
image compression with EBCOT. IEEE Tran-
saction on Image Processing, vol.9, n˚ 7,
standard
http://www.jpeg.org/jpeg2000/index.html
[21] SANTA-CRUZ (D.) et EBRAHIMI (T.). – An http://old.jpeg.org/jpeg2000/index.html
p. 1158-1170, juil. 2000
analytical study of JPEG 2000 functionalities, [26] Library of Congress. – JPEG 2000
http://www.cs.nthu.edu.tw/~cchen/CS6531/
nov 2000 encodings + file formats
2012/Taubman2000.pdf
http://dsanta.users.ch/re- http://www.digitalpreservation.gov/
E [22]
search/jpeg2k-func-icip2000.pdf
SANTA-CRUZ (D.), GROSBOIS (R.) et EBRA- Norme – Profils – Fonctionnalités
formats/fdd/fdd000138.shtml
http://www.digitalpreservation.gov/
HIMI (T.). – JPEG 2000. La nouvelle norme formats/fdd/fdd000143.shtml
N pour le codage d’images. EPFL flash informa-
tique, 27 mars 2001
[24] ISO/IEC JTC 1/ SC 29/WG 1 Programme of
Work
A Ondelettes et applications. [TE 5 215] (2001). 2000, format de compression d’image numéri-
que par ondelettes – Normes. Performances.
Applications. [TE 5 322] (2015).
V
Parution : février 2016 - Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Normes et standards
O
I CST-RT021-part1:2013 2013 Fichiers d’exploitation et d’échange des
œuvres cinéma
ISO/IEC 15444-2/
ITU-T T.801 2004 JPEG 2000 image coding system : exten-
sions
CST-RT021-part2:2013 2013 Specification Format Mezzanine
R DCI 2005-2012 2012 Digital Cinema System Specification Ver-
sion 1.2 10 october 2012
ISO/IEC 15444-3/
ITU-T.802 2007 JPEG 2000 image coding system : motion
JPEG 2000
http://www.dcimo-
vies.com/DCIDigitalCinemaSystemSpecv1 ISO/IEC 15444-4/
_2.pdf ITU-T T.803 2004 JPEG 2000 image coding system :
conformance testing
ETSI TS 101 154 V2.1.1
P (2015-03) 2015 Digital Video Broadcasting (DVB); Specifi-
cation for the use of Video and Audio
ISO/IEC 15444-5/
ITU-T T.804 2015 JPEG 2000 image coding system : refe-
Coding in Broadcasting Applications rence software
L based on the MPEG-2 Transport Stream
http://www.etsi.org/deli-
ver/etsi_ts/101100_101199/101154/02.01.0
ISO/IEC 15444-6/
ITU-T T.805 2011 JPEG 2000 image coding system :
compound image file format
U ISO/IEC 10918:1994 1994
1_60/ts_101154v020101p.pdf
Information
compression
technology
and
–
coding
Digital
of
ISO/IEC 15444-8/
ITU-T T.807 2007 JPEG 2000 image coding system : secure
JPEG 2000
S continuous-tone still images – Require-
ments and guidelines ISO/IEC 15444-9/
ITU-T T.808 2005 JPEG 2000 image coding system : inte-
ISO/IEC 13818-1:2013 2013 Information technology – Generic coding
of moving pictures and associated audio ractivity tools, APIs and protocols
information – Part 1 : Systems ISO/IEC 15444-10/
ISO/IEC ITU-T T.809 2011 JPEG 2000 image coding system : exten-
13818-1:2007/Amd.5:2011 2011 Transport of JPEG 2000 Part 1 (ITU-T Rec sions for three-dimensional data
T.800|ISO/IEC 15444-1) video over ITU-T ISO/IEC 15444-11/
Rec H.222.0|ISO/IEC 13818-1 (Revised by ITU-T T.810 2007 JPEG 2000 image coding system : wire-
ISO/IEC 13818-1:2013) less
ISO/IEC ISO/IEC 15444-12 2012 JPEG 2000 image coding system : ISO
13818-1:2007/Amd 5 2007 Information technology – Generic coding Base Media File Format
of moving pictures and associated audio
information : Systems Transport of JPEG ISO/IEC 15444-13/
2000 part 1 video over MPEG-2 TS ITU-T T.812 2008 JPEG 2000 image coding system : an
entry level JPEG 2000 encoder
ISO/IEC 15444-1/
ITU-T T.800 2002 JPEG 2000 image coding system : core ISO/IEC 15444-14/
coding system ITU-T T.813 2013 JPEG 2000 image coding system: XML
structural representation and reference
ISO/IEC 15444-1:2004/
Amd 1:2006 2006 Profiles for digital cinema applications ISO/IEC BIIF
ISO/IEC 15444-1:2004/ Profile BPJ2K01.10 2009 BIIF Profile for JPEG 2000. 15 april 2009
Amd 2:2009 2009 Extended profiles for cinema and video ITU-T H.222.0
production and archival applications Amd 5 (05-2011) 2011 Information technology – Generic coding
ISO/IEC 15444-1:2004/ of moving pictures and associated audio
Amd 3:2010 2010 Profiles for broadcast applications information : systems. Amendment 5 :
Transport of JPEG 2000 Part 1 (ITU-T
ISO/IEC 15444-1:2004/ T.800 | ISO/IEC 15444-1) video over (ITU-T
Amd 5:2013 2013 Enhancements for digital cinema and H.222.0| ISO/IEC 13818-1) Transport
archive profiles (additional frame rates) Stream
ISO/IEC 15444-1:2004/ ITU Rec. T81 1992 1992 Information technology – Digital
Amd 6:2013 2013 Updated ICC profile support, bit depth compression and coding continuous-tone
and resolution clarifications still images – Requirements and
guidelines
ISO/IEC 15444-1:2004/
Amd 8:2015 2015 Profiles for an interoperable master for- RFC 5371 (2008-10) 2010 RTP Payload Format for JPEG 2000 Video
mat IMF Streams
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
SMPTE ST 2022-1:2007
2006
2007
D-Cinema Packaging – MXF JPEG 2000
Application
Forward Error Correction for Real-Time
VSF TR-01 2013 Technical Recommendation TR-01. Trans-
port of JPEG 2000 Broadcast Profile video
N
Video/Audio Transport Over IP Networks in MPEG-2 TS over IP. Video Services
Forum April 15, 2013
SMPTE ST 2022-2:2007 2007 Unidirectional Transport of Constant Bit http://www.videoservicesfo-
Rate MPEG-2 Transport Streams on IP rum.org/activity_groups/VSF_TR-01_2013-
Networks 04-15.pdf
S
Annuaire A
Constructeurs – Intégrateurs de circuits JPEG 2000
(liste non exhaustive)
Rohde & Schwarz – DVS
http://www.rohde-schwarz.com/en/products/broadcast-media/ V
Parution : février 2016 - Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
dvs_video_solutions_/dvs-video-solutions_94581.html
Alma-Technologies
https://www.alma-technologies.com/ip-core.JPEG-2000
Barco-Silex
Telestream
http://www.telestream.net/vantage/overview.htm O
Organismes – Fédérations – Associations (liste non exhaustive)
http://www.barco-silex.com/ip-cores/jpeg2000
CAST DCI (Digital Cinema Initiatives)
http://www.dcimovies.com/
I
http://www.cast-inc.com/index.html
intoPIX
http://www.intopix.com
DICOM (Digital Imaging and Communications in Medecine)
http://dicom.nema.org/ R
ISO (International Organization for Standardization)
Dalet-Amberfin http://www.iso.ch/iso/fr/ISOOnline.frontpage
http://www.dalet.com/products/amberfin-ingest http://www.iso.ch/iso/en/prods-services/popstds/mpeg.html
Evertz JPEG (Joint Photographic Experts Group)
http://www.evertz.com/products/compression
EVS OpenCube
http://www.jpeg.org/index.html
JPEG2000 Alliance
P
www.evs.com/ http://www.jpeg2000alliance.com/
Harmonic
http://www.harmonicinc.com/product/promedia-carbon
IRT (Insttitut für Rundfunktechnik)
http://mxf.irt.de/
L
Net Insight
http://www.netinsight.net/Products/Nim-
bra-600-Series/JPEG2000-Video-Access/Overview/
ITU-T (International Telecommunication Union – Telecommunication Stan-
dardisation Sector)
http://www.itu.int/ITU-T/
U
Nevion/T-VIPS
http://nevion.com/products/media-gateways
NTT AT
SMPTE (Society of Motion Picture and Television Engineers)
http://www.smpte.org
VSF (Video Services Forum)
S
http://www.ntt-at.com/product/jpeg2000/ http://www.videoservicesforum.org
tiwekacontentpdf_te5320 v1 Ce document a ete delivre pour le compte de 7200039513 - ecole centrale de marseille // thierry GAIDON // 78.201.118.183
GAGNEZ DU TEMPS ET SÉCURISEZ VOS PROJETS
EN UTILISANT UNE SOURCE ACTUALISÉE ET FIABLE
RÉDIGÉE ET VALIDÉE MISE À JOUR 100 % COMPATIBLE SERVICES INCLUS
PAR DES EXPERTS PERMANENTE SUR TOUS SUPPORTS DANS CHAQUE OFFRE
NUMÉRIQUES
www.techniques-ingenieur.fr
CONTACT : Tél. : + 33 (0)1 53 35 20 20 - Fax : +33 (0)1 53 26 79 18 - E-mail : infos.clients@teching.com
LES AVANTAGES ET SERVICES
compris dans les offres Techniques de l’Ingénieur
ACCÈS
SERVICES ET OUTILS PRATIQUES
Archives Impression à la demande Alertes actualisations
Technologies anciennes et versions Commandez les éditions papier Recevez par email toutes les nouveautés
antérieures des articles de vos ressources documentaires de vos ressources documentaires
*Questions aux experts est un service réservé aux entreprises, non proposé dans les offres écoles, universités ou pour tout autre organisme de formation.
www.techniques-ingenieur.fr
CONTACT : Tél. : + 33 (0)1 53 35 20 20 - Fax : +33 (0)1 53 26 79 18 - E-mail : infos.clients@teching.com