Chapitre 4suite

Master 1 :
Télécommunication
Chapitre 4 : Compression de données. 1
I. Introduction :
 La compression a pour but de réduire la longueur d’une chaîne sans affecter son contenu informatif.
Cela permet à la fois de réduire les exigences en mémoire et d’augmenter la capacité d’un canal de
transmission (théorie de Shannon). L’information d’un message peut se définir comme la "surprise"
causée par la connaissance de ce message.
 Pourquoi la compression de données ?
 Les supports de stockage de données se remplissent en même temps que leur taille croit.
 Formats de fichiers intégrant la compression : images (gif ou jpeg) texte (pdf).
 Réseaux : augmenter la bande passante en diminuant le nombre de bits émis (pb des chiffres)
 Télécommunications : utilisation courante dans le fonctionnement des modems (protocole V42
par exemple) et pour les transmissions par télécopie.
 Types d’algorithmes de compression :
 Les algorithmes statistiques, p.e. codes de Huffman, construisent un dictionnaire en effectuant

une analyse statistique du document en entier :
 Les algorithmes dynamiques, p.e. Lempel et Ziv, construisent dynamiquement un dictionnaire et
remplacent les données répétées par des liens vers une entrée du dictionnaire.
 Les méthodes heuristiques essayent de !deviner" les éléments du bloc de données. Ce sont les
plus récentes.
 Compression et décompression
R n’est pas forcement identique à B. Lorsque :
 B = R on parle de compression sans perte.

 B ≠ R on parle de compression avec pertes (plus efficace)
Site E‐Learning :http://elearning.univ‐bejaia.dz/enrol/index.php?id=1139 clé : tec480 Chargé de cours : A.MEKHMOUKH

Master 1 :
Télécommunication
Les différents algorithmes de compression sont choisis en fonction de :
 Leur taux de compression (rapport de la taille du fichier compressé sur la taille du fichier initial)
 La qualité de compression (sans/avec perte et alors pourcentage de pertes)
 La vitesse de compression et de décompression
II. Classification des méthodes de compression :
La compression peut être avec perte ou sans perte. On utilise la première pour les schémas, les photos,
les dessins techniques, les icônes, les bandes dessinées, les fichiers exécutables ou texte, le fax car les
images compressées présentent des défauts de compression, et la deuxième pour les images médicales, les
archives car il faut préserver une grande précision.
1) Sans perte (compactage) : La suite de bits obtenue après la compression est strictement identique
à l'originale. Il n'y a aucune perte dans l'information d'origine, l’information est seulement réécrite
d'une manière plus concise. Les algorithmes utilisés ne garantissent pas que tous les ensembles de
données en entrée sont réduits : en d’autres termes, il y a des données en entrée qui restent
inchangées
 Ce type de compression est utilisé en :
 Audio : RealPlayer (Windows, Mac OS X, Linux, Unix, Palm OS, Windows Mobile),
WMA (Windows Media Audio)
 Images : GIF (Graphics Interchange Format), PNG (Portable_Network_Graphics), JPEG et
JPEG 2000 (Joint Photographic Experts Group), TIFF (Tagged Image File Format)
 Video : H.264 ou MPEG-4 AVC (Advanced Video Coding), format propriétaire du Moving
Picture Experts Group
2) Avec pertes (irréversible ou non conservative) : La suite de bits obtenue après la compression est
différente de l'originale, mais l'information reste sensiblement la même. Elle est réservée aux
données «perceptibles», en général sonores ou visuelles, qui peuvent subir une modification, parfois
importante, sans que cela ne soit perceptible par un humain. La perte d'information est irréversible,
il est impossible de retrouver les données d'origine après une telle compression. La compression
avec perte est pour cela parfois appelée compression.
 Les formats tels que Zip, RAR (Roshal ARchive inventé par Eugene Roshal).
 MP3 (Mpeg 1 audio layer 3)
 JPEG (Joint Photographic Experts Group) utilisent des algorithmes de compression.

Master 1 :
Télécommunication
3) Compression d’image :
 Une image numérique est codée par un ensemble de bits

 L’objectif de la compression est de coder l’image (donc la même information) avec moins de bits.
 Standards de compression fournis par l’ITU (International Telecommunication Union) et l’ISO
(International Organization for Standardization)
Combien de bits pour coder une seconde de vidéo Full HD ?
 Caractéristiques d’une vidéo HD :

 1920 * 1080 pixels
 50 Hz
 Trois canaux (RVB) codés sur 8 bits = 1 octet chacun
1920 * 1080 * 50 * 3 *1 = 311 040 000 octets = 311 Mo

 Un DVD (4,7 Go) ne peut donc stocker que 15 s
a) Codage par plage (Run-Length Encoding)
L’encodage RLE remplace les suites de pixels de la même couleur par le nombre de pixels de cette
séquence.
 Création d’une nouvelle séquence dans laquelle le deuxième élément correspond au niveau de gris
et le premier élément correspond au nombre de pixels consécutif possédant ce niveau de gris
 On code séparément le niveau de gris et l’occurrence de chaque pixel.

Master 1 :
Télécommunication
b) Compression JPEG
JPEG est l’acronyme de Joint Photographic Experts Group. Il s'agit d'un comité d’experts qui édite des
normes de compression pour l’image fixe. La norme communément appelée JPEG, de son vrai nom
ISO/CEI 10918-1 UIT-T Recommendation T.81, est le résultat de l’évolution de travaux qui ont débuté
dans les années 1978 à 1980 avec les premiers essais en laboratoire de compression d'images.
Le groupe JPEG qui a réuni une trentaine d’experts internationaux, a spécifié la norme en 1991. La norme
officielle et définitive a été adoptée en 1992. Dans la pratique, seule la partie concernant le codage
arithmétique est brevetée, et par conséquent protégée par IBM, son concepteur.
Une photo de fleur compressée en JPEG, avec des compressions de plus en plus fortes,
de gauche à droite.
 Étapes pour effectuer la compression JPEG :

1

Master 1 :
Télécommunication
1. 1 Changement de l’espace couleur

2. 2 Sous-échantillonnages
3. 3 Découpages en sous-images 8* 8
4. 4 Application d’une transformée (DCT)
5. 5 Quantification des coefficients de la transformée
6. 6 Compressions sans perte des coefficients quantifiés
A. Changement de l’espace couleur

Master 1 :
Télécommunication
 Espace couleur YCbCr :

 Y : luminosité
 Cb : chrominance bleue
 Cr : chrominance rouge
 L’oeil étant plus sensible à la luminosité qu’à la couleur (95 % de bâtonnets pour la lumière
; 5 % de cônes pour la couleur), les humains sont plus sensibles à la luminosité d’une image
(composante Y) qu’à la couleur (composantes Cb et Cr).
 Utilisation de l’espace YCbCr pour permettre une compression plus importante sans altérer
la qualité de l’image.
 Sous-échantillonnage des chrominances.
B. Sous-échantillonnage :
Le schéma de sous-échantillonnage est noté J:a:b où :
 J : taille horizontale du bloc (généralement 4)
 a : nombre de chrominances dans la 1ʳᵉ ligne
 b : nombre de chrominances additionnels dans la 2ᵉ ligne

Master 1 :
Télécommunication
C. Découpage en sous-images 8 X 8 :
Chaque canal (Y, Cb, Cr) est découpé en blocs de 8X8 pixels.
L’énergie d’une image naturelle est principalement concentrée dans les basses fréquences, donc sur
quelques coefficients de la transformée de Fourier discrète seulement.
En pratique, la DCT (transformée en cosinus discrète : discrete cosine transform) est utilisée à la place
de la transformée de Fourier discrète pour des raisons des facilité d’implémentation.
Le format JPEG2000 utilise la transformée en ondelettes.
 Transformée en cosinus discrète de l’image I de taille N X N :
 Exemple :

Master 1 :
Télécommunication
D. Quantification de la transformée :
Plutôt que d’annuler purement et simplement les coefficients les plus faibles, on applique une
quantification différente en chaque fréquence. Ainsi, les coefficients supprimés sont ceux qui
n’affectent pas significativement l’image décompressée.
Où :
■ D : coefficients de la DCT
■ Q : matrice de quantification
■ D′ : coefficients quantifiés

Master 1 :
Télécommunication
E. Compression de la quantification :
Un parcours en zig-zag des blocs produit une séquence où les fréquences similaires sont regroupées.
Après quantification il y a beaucoup de valeurs identiques et proches de zéro. Le choix de la matrice de

quantification avec des valeurs proche de 1, ou loin de 1 permet l’augmentation ou la diminution du niveau
de détails de l'image.
Enfin, l’image est codée comme une suite de nombres avec un run-length encoding ou RLE qui est un
algorithme de compression des données sans perte. Une valeur quantifié de la DCT est suivit du nombre de
pixels consécutifs selon un balayage en zigzag.
 Exemple complet
Cette image est en noir et blanc (nuances de gris) , c'est à dire qu’on ne va travailler qu’avec une seule
matrice au lieu de trois (mode RVB), on a dans ce cas R=V=B.

Master 1 :
Télécommunication
La matrice de pixels du bloc :
Dans ce cas (nuances de gris), on pas besoin de passer au mode YCbCr puisque Y=G, et donc les
matrices Cb et Cr prendront de l’espace inutilement. Puisqu’on n’est pas passé au mode YCbCr, on ne va
pas effectuer le sous échantillonnage qui s’applique sur les composantes Cb et Cr. (Chrominance). Avant
d’appliquer la DCT on va retrancher 128 : G_128 = G – 128 (avec G en mode « double (pour les nombres
négatifs) »):
 Application de la DCT sur G_128 :
 Quantification :
Puisque la composante Y est équivalente à la matrice de pixels, dans ce cas, on va utiliser une table de
quantification basée sur la table de quantification de luminance : (Si l’image est en couleurs RVB, dans ce
cas on va utiliser une table de quantification de luminance pour Y et une table de chrominance pour CB et

Master 1 :
Télécommunication
CR. Ces tables changent bien sûr en fonction de la qualité). La table de luminance par défaut (pour
qualité=50) :
Pour cet exemple, on va prendre qualité=15, ce qui donne la table suivante :
 Calcul de la matrice quantifiée :

Master 1 :
Télécommunication
 Parcours en zigzag :
 Encodage RLE :
 Codage de HUFFMAN :

Master 1 :
Télécommunication

Chapitre 4suite

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Chapitre 4suite

Transféré par

Droits d'auteur :

Formats disponibles

Master 1 :

 Pourquoi la compression de données ?

 Types d’algorithmes de compression :

 Les algorithmes statistiques, p.e. codes de Huffman, construisent un dictionnaire en effectuant

R n’est pas forcement identique à B. Lorsque :

 B = R on parle de compression sans perte.

Site E‐Learning :http://elearning.univ‐bejaia.dz/enrol/index.php?id=1139 clé : tec480 Chargé de cours : A.MEKHMOUKH

Les différents algorithmes de compression sont choisis en fonction de :

II. Classification des méthodes de compression :

Site E‐Learning :http://elearning.univ‐bejaia.dz/enrol/index.php?id=1139 clé : tec480 Chargé de cours : A.MEKHMOUKH

 Une image numérique est codée par un ensemble de bits

Combien de bits pour coder une seconde de vidéo Full HD ?

 Caractéristiques d’une vidéo HD :

1920 * 1080 * 50 * 3 *1 = 311 040 000 octets = 311 Mo

a) Codage par plage (Run-Length Encoding)

Site E‐Learning :http://elearning.univ‐bejaia.dz/enrol/index.php?id=1139 clé : tec480 Chargé de cours : A.MEKHMOUKH

 Étapes pour effectuer la compression JPEG :

Site E‐Learning :http://elearning.univ‐bejaia.dz/enrol/index.php?id=1139 clé : tec480 Chargé de cours : A.MEKHMOUKH

1. 1 Changement de l’espace couleur

A. Changement de l’espace couleur

Site E‐Learning :http://elearning.univ‐bejaia.dz/enrol/index.php?id=1139 clé : tec480 Chargé de cours : A.MEKHMOUKH

 Espace couleur YCbCr :

 Sous-échantillonnage des chrominances.

Site E‐Learning :http://elearning.univ‐bejaia.dz/enrol/index.php?id=1139 clé : tec480 Chargé de cours : A.MEKHMOUKH

Le format JPEG2000 utilise la transformée en ondelettes.

 Transformée en cosinus discrète de l’image I de taille N X N :

Site E‐Learning :http://elearning.univ‐bejaia.dz/enrol/index.php?id=1139 clé : tec480 Chargé de cours : A.MEKHMOUKH

Site E‐Learning :http://elearning.univ‐bejaia.dz/enrol/index.php?id=1139 clé : tec480 Chargé de cours : A.MEKHMOUKH

Après quantification il y a beaucoup de valeurs identiques et proches de zéro. Le choix de la matrice de

Site E‐Learning :http://elearning.univ‐bejaia.dz/enrol/index.php?id=1139 clé : tec480 Chargé de cours : A.MEKHMOUKH

La matrice de pixels du bloc :

 Application de la DCT sur G_128 :

Site E‐Learning :http://elearning.univ‐bejaia.dz/enrol/index.php?id=1139 clé : tec480 Chargé de cours : A.MEKHMOUKH

Pour cet exemple, on va prendre qualité=15, ce qui donne la table suivante :

 Calcul de la matrice quantifiée :

Site E‐Learning :http://elearning.univ‐bejaia.dz/enrol/index.php?id=1139 clé : tec480 Chargé de cours : A.MEKHMOUKH

Site E‐Learning :http://elearning.univ‐bejaia.dz/enrol/index.php?id=1139 clé : tec480 Chargé de cours : A.MEKHMOUKH

Site E‐Learning :http://elearning.univ‐bejaia.dz/enrol/index.php?id=1139 clé : tec480 Chargé de cours : A.MEKHMOUKH

Vous aimerez peut-être aussi