Vous êtes sur la page 1sur 67

GÉNÉRALITÉS

REPRÉSENTATION DE L'INFORMATION
LA COMPRESSION DE DONNÉES
Joint Photographic Experts Group (JPEG)

Les Signaux Multimédia


Codage, Compression et Transmission

Master II : Systèmes des Télécommunications

Département d'Automatique, Télécommunication et Électronique


Université de Béjaia

Module : Technologie et protocoles pour le multimédia,


2019-2020

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION
LA COMPRESSION DE DONNÉES
Joint Photographic Experts Group (JPEG)

Sommaire
1 GÉNÉRALITÉS
Les ux d'information
Caractéristiques des réseaux de transmission
2 REPRÉSENTATION DE L'INFORMATION
Les diérents types d'information
Codage des informations
Dénition
Les codes de longueur xe
Les codes de longueur variable
Numérisation des informations
3 LA COMPRESSION DE DONNÉES
Généralités
Techniques de Compression
4 Joint Photographic Experts Group (JPEG)
Introduction
Procédure de calcul de la DCT
Chapitre 1 Mr. BELLAHSENE H.
GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Concepts de base
LA COMPRESSION DE DONNÉES Caractéristiques des réseaux de transmission
Joint Photographic Experts Group (JPEG)
1 GÉNÉRALITÉS
Les ux d'information
Caractéristiques des réseaux de transmission
2 REPRÉSENTATION DE L'INFORMATION
Les diérents types d'information
Codage des informations
Dénition
Les codes de longueur xe
Les codes de longueur variable
Numérisation des informations
3 LA COMPRESSION DE DONNÉES
Généralités
Techniques de Compression
4 Joint Photographic Experts Group (JPEG)
Introduction
Procédure de calcul de la DCT
Vers l'image Animée : MPEG, H.261,H263, H264
Chapitre 1 Mr. BELLAHSENE H.
GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Concepts de base
LA COMPRESSION DE DONNÉES Caractéristiques des réseaux de transmission
Joint Photographic Experts Group (JPEG)

Le réseau et les diérents ux d'information

Dénition
Média : texte, image xe, son, vidéo
 Multimédia : Présence de plus d'un média qui sont joués sur un même intervalle de
temps : texte et image, vidéo et son ...

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Concepts de base
LA COMPRESSION DE DONNÉES Caractéristiques des réseaux de transmission
Joint Photographic Experts Group (JPEG)
1 GÉNÉRALITÉS
Les ux d'information
Caractéristiques des réseaux de transmission
2 REPRÉSENTATION DE L'INFORMATION
Les diérents types d'information
Codage des informations
Dénition
Les codes de longueur xe
Les codes de longueur variable
Numérisation des informations
3 LA COMPRESSION DE DONNÉES
Généralités
Techniques de Compression
4 Joint Photographic Experts Group (JPEG)
Introduction
Procédure de calcul de la DCT
Vers l'image Animée : MPEG, H.261,H263, H264
Chapitre 1 Mr. BELLAHSENE H.
GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Concepts de base
LA COMPRESSION DE DONNÉES Caractéristiques des réseaux de transmission
Joint Photographic Experts Group (JPEG)

Le débit binaire

On appelle débit binaire D en bits par seconde (bit/s), le nombre


d'éléments binaires, ou nombre de bits, émis sur le support de
transmission pendant une unité de temps. C'est l'une des caractéristiques
essentielles d'un système de transmission. Il est donné par :

V
D=
t
V le volume à transmettre exprimé en bit et t la durée de
transmission en seconde.

Chapitre 1 Mr. BELLAHSENE H.


utilisée en premier pour qualifier un système de transmission ; il s’exprime par la relation :
GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Concepts de base
LA COMPRESSION DE DONNÉESD = VCaractéristiques des réseaux de transmission
Joint Photographic Experts Group (JPEG) t
avec D (débit) en bits2 par seconde (bit/s),
Rapport signal sur bruit V volume à transmettre exprimé en bits,
t durée de la transmission en seconde.

Le débit binaire mesure le nombre d’éléments binaires transitant sur le canal de transmission
pendant l’unité de temps (figure 1.2).
Les signaux transmis sur un canal peuvent être perturbés par des phénomènes
électriques ou électromagnétiques désignés sous le terme
Canal de transmission générique de bruit. Le bruit
Destination
est un phénomène qui dénature le signal et introduit (Puits)
Source
des erreurs.
Le rapport entre la puissance du signal transmis et celle du bruit qualie le canal
vis-à-vis du bruit. Ce rapport, appelé rapport signal sur bruit (S/N ou SNR avec N
Figure 1.2 La schématisation d’un système de transmission.

pour Noise), s'exprime en dB (décibel) :


Notion de rapport signal sur bruit
Durant la transmission, les signaux électriques peuvent Sêtre perturbés par des phénomènes élec-
 
(SNR)
triques ou électromagnétiques dB =externe
d’origine 10
10 N sous le terme générique de bruit. Le
logdésignés
bruit est un phénomène qui dénature le signal et qui est susceptible d’introduire des erreurs d’inter-
puissance
prétation du signal reçu (figure 1.3).

+V S N

t t

Signal sans bruit Signal avec bruit

Figure 1.3 Le signal pollué par le bruit.

ChapitreL’abréviation
2. L’unité officielle de débit est le bit/s (invariable). 1 Mr.bpsBELLAHSENE H. avec byte par seconde ne
pouvant être confondue
GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Concepts de base
LA COMPRESSION DE DONNÉES Caractéristiques des réseaux de transmission
Joint Photographic Experts Group (JPEG)

Taux d'erreur

On appelle taux d'erreur binaire (TEB ou BER, Bit Error Rate) le


rapport du nombre de bits reçus en erreur au nombre de bits total
transmis. Les phénomènes parasites (bruit) perturbent le canal de
transmission et peuvent aecter les informations en modiant un
ou plusieurs bits du message transmis, introduisant ainsi des erreurs
dans le message.
Nombre de bits erronés
BER =
Nombre de bits Transmis

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Concepts de base
LA COMPRESSION DE DONNÉES Caractéristiques des réseaux de transmission
Joint Photographic Experts Group (JPEG)

Notion de temps de transfert (Dénit au Chap1)

Le temps de transfert ou temps de transit ou bien temps de


latence, mesure le temps entre l'émission d'un bit, à l'entrée du
réseau et sa réception en sortie du réseau. Ce temps prend en
compte le temps de propagation sur le ou les supports et le temps
de traitement par les éléments actifs du réseau (n÷uds). Le temps
de transfert est un paramètre important à prendre en compte
lorsque la source et la destination ont des échanges interactifs. Pour
un réseau donné, le temps de transfert n'est généralement pas une
constante, il varie en fonction de la charge du réseau. Cette
variation est appelée gigue ou jitter.

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Concepts de base
LA COMPRESSION DE DONNÉES Caractéristiques des réseaux de transmission
Joint Photographic Experts Group (JPEG)

Spectre du signal

Tout signal périodique de forme quelconque peut être décomposé


en une somme de signaux sinusoïdaux élémentaires (fondamental et
harmoniques) autour d'une valeur moyenne (composante continue)
qui peut être nulle. L'ensemble de ces composantes forme le spectre
du signal ou bande de fréquence occupée par le signal (largeur de
bande).

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Codage des informations
LA COMPRESSION DE DONNÉES Numérisation des informations
Joint Photographic Experts Group (JPEG)
1 GÉNÉRALITÉS
Les ux d'information
Caractéristiques des réseaux de transmission
2 REPRÉSENTATION DE L'INFORMATION
Les diérents types d'information
Codage des informations
Dénition
Les codes de longueur xe
Les codes de longueur variable
Numérisation des informations
3 LA COMPRESSION DE DONNÉES
Généralités
Techniques de Compression
4 Joint Photographic Experts Group (JPEG)
Introduction
Procédure de calcul de la DCT
Vers l'image Animée : MPEG, H.261,H263, H264
Chapitre 1 Mr. BELLAHSENE H.
GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Codage des informations
LA COMPRESSION DE DONNÉES Numérisation des informations
Joint Photographic Experts Group (JPEG)

Les données discrètes

L'information correspond à l'assemblage d'une suite d'éléments


indépendants les uns des autres (suite discontinue de valeurs) et
dénombrables (ensemble ni). Par exemple, un texte est une
association de mots eux-mêmes composés de lettres (symboles
élémentaires).

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Codage des informations
LA COMPRESSION DE DONNÉES Numérisation des informations
Joint Photographic Experts Group (JPEG)

Les données discrètes

L'information correspond à l'assemblage d'une suite d'éléments


indépendants les uns des autres (suite discontinue de valeurs) et
dénombrables (ensemble ni). Par exemple, un texte est une
association de mots eux-mêmes composés de lettres (symboles
élémentaires).

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Codage des informations
LA COMPRESSION DE DONNÉES Numérisation des informations
Joint Photographic Experts Group (JPEG)

Les données Continues ou analogiques

Résultent de la variation continue d'un phénomène physique :


température, voix, image... Un capteur fournit une tension
électrique proportionnelle à l'amplitude du phénomène physique
analysé : signal analogique (signal qui varie de manière analogue au
phénomène physique). Un signal analogique peut prendre une
innité de valeurs dans un intervalle déterminé (bornes). Pour
traiter ces informations par des équipements informatiques il est
nécessaire de substituer à chaque élément d'information une valeur
binaire représentative de l'amplitude de celui-ci. Cette opération
porte le nom de codage de l'information (codage à la source) pour
les informations discrètes et numérisation de l'information pour les
informations analogiques.

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Codage des informations
LA COMPRESSION DE DONNÉES Numérisation des informations
Joint Photographic Experts Group (JPEG)
1 GÉNÉRALITÉS
Les ux d'information
Caractéristiques des réseaux de transmission
2 REPRÉSENTATION DE L'INFORMATION
Les diérents types d'information
Codage des informations
Dénition
Les codes de longueur xe
Les codes de longueur variable
Numérisation des informations
3 LA COMPRESSION DE DONNÉES
Généralités
Techniques de Compression
4 Joint Photographic Experts Group (JPEG)
Introduction
Procédure de calcul de la DCT
Vers l'image Animée : MPEG, H.261,H263, H264
Chapitre 1 Mr. BELLAHSENE H.
10
GÉNÉRALITÉS
2 L’information et sa représentation dans les systèmes de transmission

REPRÉSENTATION DE L'INFORMATION Codage des informations


LA COMPRESSION DE DONNÉES Numérisation des informations
Joint Photographic Experts Group (JPEG)
Capteur Transducteur
Ligne analogique

Dénition du codage Figure 2.3 Le signal analogique.

2.2.2 Codage des informations


Définition
Coder l'information consiste à faire correspondre (bijection) à chaque
Coder l’information consiste à faire correspondre (bijection) à chaque symbole d’un alphabet
symbole d'un alphabet
(élément (élémentbinaire
à coder) une représentation à coder)
(mot code). une représentation
L’ensemble binaire (mot
des mots codes constitue
le code (figure 2.4). Ces informations peuvent aussi bien être un ensemble de commandes
code). L'ensemble des mots codes constitue le code.
d’une machine outil que des caractères alphanumériques... C’est à ces derniersExemple
codes que nouscaractères
nous intéresserons. Un code alphanumérique peut contenir :
alphanumériques
– Des chiffres de la numérotation usuelle [0..9] ;
 Des chires– Des
de lettres
la numérotation
de l’alphabet usuelle [0..9]
[a..z, A..Z]; ; Des lettres de l'alphabet [a..z,
A..Z] ;  les accents [é, è,...]
– Des symboles ;  Des symboles
nationaux [é, è,...]de; ponctuation [, ; : . ? ! ...] ;  Des
symboles semi-graphiques [ , [ ] ;  Des commandes
– Des symboles de ponctuation [, ; : . ? ! ...] ; nécessaires au système [Saut de
ligne, Saut de– Des
page, etc.].
symboles semi-graphiques [ ];
– Des commandes nécessaires au système [Saut de ligne, Saut de page, etc.].

Codage

B
A Symbole
à coder mot code
1000001
1000010
1000011
C

Alphabet Code
Figure 2.4 Principe du codage des données.

Les différents types de code


Le codage des différents étatsChapitre 1 peut s’envisager
d’un système Mr. BELLAHSENE H.
selon deux approches. La pre-
GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Codage des informations
LA COMPRESSION DE DONNÉES Numérisation des informations
Joint Photographic Experts Group (JPEG)

Les diérents types de code

L'information peut être codée selon deux approches :


La première, considère que chacun des états du système est
équiprobable. Donnant ainsi l'approche dite par codes à
longueur xe.
La seconde prend en compte la fréquence d'apparition d'un
état (sa probabilité d'occurrence). Cette approche conduit à
dénir les codes à longueur variable.

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Codage des informations
LA COMPRESSION DE DONNÉES Numérisation des informations
Joint Photographic Experts Group (JPEG)

Approche par code à longueur xe

Chaque état du système est codé par un certain nombre de bits,


appelé longueur du code, longueur du mot code ou encore code à n
moments ou code à n bits. Avec n bits on code 2n états
Le nombre d'état pouvant être codés par un code de n bits
s'appelle puissance lexicographique du code notée : P = 2n . En
général on a 2n−1 < P ≤ 2n .
La longueur moyenne coïncide avec le rapport entre le nombre de
symboles binaires du message codé, et le nombre de symboles de source.
Lmoy = ∑Si=1 pi li

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Codage des informations
LA COMPRESSION DE DONNÉES Numérisation des informations
Joint Photographic Experts Group (JPEG)

Approche par code à longueur xe


Le nombre de bits pour coder P symboles est n = log2 P . Ce nombre de bits n
représente la quantité d'information, appelée entropie H apportée par la
connaissance d'un état du système.
Lorsque tous les états sont équiprobables, la quantité d'information apportée
par la connaissance d'un état est la même quel que soit l'état connu. Si
l'information est représentée par deux valeurs équiprobables (0 ou 1, pile ou
face...), la quantité d'information est Q = log2 2=1 bit (proba = 1/2).
Dans le cas contraire, la quantité d'information est d'autant plus grande que la
probabilité de réalisation de l'état est faible. Si p est la probabilité de
réalisation de l'état P , la quantité d'information apportée par la connaissance
de P est : Q = log2 (1/p)
Exemple
Combien de bits sont nécessaires pour coder toutes les lettres de
l'alphabet et quelle est la quantité d'information transmise par une lettre
(en supposant équiprobable l'apparition de chaque lettre) ?

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Codage des informations
LA COMPRESSION DE DONNÉES Numérisation des informations
Joint Photographic Experts Group (JPEG)

Corrigé de l'exemple
Le nombre de bits nécessaires, pour coder P valeurs, est donné par
la relation

2n−1 < P ≤ 2n ⇔ 2n−1 < 26 ≤ 2n ⇒ n = 5


Il faut 5bits pour coder 26 éléments. La quantité d'information est
dont
1
Q = log2 ( ) = 3.31log10 26 = 4.70 bits
1/26
On trouve parmi les codes à longueur xe les plus connus à sept éléments le
code ASCII (American Standard Code for Information Interchange ) appelé
aussi CCITT nž5 ou encore IA5. C'est le code générique des
télécommunications. ainsi que le code EBCDIC (Extended Binary Coded
Decimal Interchange Code ) code à huit moments, d'origine IBM, est utilisé
dans les ordinateurs du constructeur. Le code EBCDIC a, aussi, été adopté par
d'autres constructeurs (notamment Bull) pour leurs calculateurs.
Chapitre 1 Mr. BELLAHSENE H.
GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Codage des informations
LA COMPRESSION DE DONNÉES Numérisation des informations
Joint Photographic Experts Group (JPEG)

Approche par code à longueur variable

Lorsque les états du système ne sont pas équiprobables, la quantité


d'information apportée par la connaissance d'un état est d'autant plus grande
que cet état a une faible probabilité de se réaliser. La quantité moyenne
d'information apportée par la connaissance d'un état, appelée entropie, est
donnée par la relation :
i =n
H = − ∑ pi log2 pi
i =1

où pi représente la probabilité d'apparition du symbole de rang i .


L'entropie représente la longueur optimale du codage des symboles du
système.

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Codage des informations
LA COMPRESSION DE DONNÉES Numérisation des informations
Joint Photographic Experts Group (JPEG)

Ecacité et redondance

Dénition
L'ecacité est donnée par : η = Lmoy
H

De même on a
Dénition
La redondance est : τ = 1 − η

Exemple
Quelle est la longueur optimale du code pour le système décrit par le tableau qui suit ?

État E A S T U Y
Probabilité 0.48 0.21 0.12 0.08 0.06 0.05

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Codage des informations
LA COMPRESSION DE DONNÉES Numérisation des informations
Joint Photographic Experts Group (JPEG)

Corrigé de l'exemple

La longueur optimale du mot code est

H = −(0.48log2 0.48 + 0.21log2 0.21 + 0.12log2 0.12


= +0.08log2 0.08 + 0.06log2 0.06 + 0.05log2 0.05) = 2.09 bits

Le codage optimal devrait conduire à construire un code dont la longueur


moyenne serait de 2,09 bits

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Codage des informations
LA COMPRESSION DE DONNÉES Numérisation des informations
Joint Photographic Experts Group (JPEG)

Codage d'Human
Human a introduit une technique de codage (codage d'entropie) qui prend en compte
la fréquence d'occurrence des états et qui se rapproche de cette limite théorique
100
0 1

52 1
0
48
E
0 31
21 1
A
19
0 1
12
S
8
T 11 1
0

5 6
Y U

Occurrence E A S T U Y
Code 0 10 110 1110 11111 11110

Longueur moyenne (proche de 2.09bits ) du code est


Lmoy = 0, 48.1 + 0, 21.2 + 0, 08.3 + 0, 06.5 + 0, 05.5 = 2.13bits

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Codage des informations
LA COMPRESSION DE DONNÉES Numérisation des informations
Joint Photographic Experts Group (JPEG)
1 GÉNÉRALITÉS
Les ux d'information
Caractéristiques des réseaux de transmission
2 REPRÉSENTATION DE L'INFORMATION
Les diérents types d'information
Codage des informations
Dénition
Les codes de longueur xe
Les codes de longueur variable
Numérisation des informations
3 LA COMPRESSION DE DONNÉES
Généralités
Techniques de Compression
4 Joint Photographic Experts Group (JPEG)
Introduction
Procédure de calcul de la DCT
Vers l'image Animée : MPEG, H.261,H263, H264
Chapitre 1 Mr. BELLAHSENE H.
GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Codage des informations
LA COMPRESSION DE DONNÉES Numérisation des informations
Joint Photographic Experts Group (JPEG)

Présentation générale

Décompression et Présentation
Rouge
CAN

Numérisation et Compression
Vert

Transmission
Matrice
CAN
Bleu
Caméra
CAN

CAN
Microphone

Comment se présente l'information Audio et vidéo ? Après la conversion


numérique et compression s'ensuit la transmission. Le chemin inverse est réalisé
en réception.

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Codage des informations
LA COMPRESSION DE DONNÉES Numérisation des informations
Joint Photographic Experts Group (JPEG)

Exemple de la Numérisation Audio

A des instants signicatifs, des échantillons sont prélevés du signal


continu (grandeur analogique) correspondant à son amplitude an
de le numériser. La valeur de l'amplitude est exprimée par rapport à
une échelle nie permettant sa quantication.
Le récepteur reconstitue le signal d'origine à partir des valeurs
transmises. Une restitution dèle du signal nécessite :
Un intervalle d'échantillonnage qui doit être une constante du système
(fréquence d'échantillonnage)
Une amplitude de l'échelle de quantication, celle-ci doit être susante
pour reproduire la dynamique du signal (diérence d'amplitude entre la
valeur la plus faible et la valeur la plus forte)
Des mécanismes pour garantir que le système de transmission respecte les
intervalles temporels entre chaque échantillon.

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Codage des informations
LA COMPRESSION DE DONNÉES Numérisation des informations
Joint Photographic Experts Group (JPEG)

Échantillonnage et Quantication
Les diérentes étapes de la numérisation du signal audio sont données par la gure. À
intervalles réguliers (période d'échantillonnage), on prélève une fraction du signal
16 2 • L’information et sa représentation dans les systèmes de transmission

(échantillon) en utilisant une PAM. Puis, on fait correspondre à l'amplitude de chaque


échantillon une valeur (quantication), cette valeur est ensuite transformée en valeur
La figure 2.7 représente les différentes étapes de la numérisation du signal. À intervalle

binaire (codication).
régulier (période d’échantillonnage), on prélève une fraction du signal (échantillon). Puis,
on fait correspondre à l’amplitude de chaque échantillon une valeur (quantification), cette
valeur est ensuite transformée en valeur binaire (codification).

Signal à numériser

Instants d’échantillonnage
t

12
11
Echantillons 9
8 8
6 Echelle de
Quantification 4 quantification

Codage et transmission 8 9 6 4 8 12 11

Figure 2.7 Numérisation d’un signal analogique.

Une approximation est nécessaire quel que soit le nombre de niveaux utilisés, celle-ci
La quantification définit des valeurs en escalier (par bond) alors que le phénomène à quanti-

introduit une erreur dite decelle-ci


quantication
introduit une erreurou
ditebruit de quantication qui est la
fier varie de façon continue. Aussi, quel que soit le nombre de niveaux utilisés, une approxima-
tion est nécessaire, de quantification ou bruit de quantification
diérence entrequiPour
laest valeur réelle de l'échantillon et la valeur quantiée.
la différence entre la valeur réelle de l’échantillon et la valeur quantifiée.
reproduire correctement le signal à l’arrivée, le récepteur doit disposer d’un minimum
d’échantillons. Il existe donc une relation étroite entre la fréquence maximale des variations
Chapitre
du signal à discrétiser et le nombre 1
d’échantillons àMr. BELLAHSENE H.
prélever.
est la différence entre la valeur GÉNÉRALITÉS
réelle de l’échantillon et la valeur quantifiée.
REPRÉSENTATION DE L'INFORMATION Codage des informations
LA COMPRESSION DE DONNÉES Numérisation des informations
our reproduire Jointcorrectement le Group
Photographic Experts signal à l’arrivée,
(JPEG) le récepteur doit disposer d’un min
hantillons. Il existe donc une relation étroite entre la fréquence maximale des vari
ignalA àladiscrétiser
réceptionet le nombre d’échantillons à prélever.
Pour restituer
oit un signal dont lecorrectement
spectre estlelimité
signal,etle dont
théorème de Shannon
la borne vaut Fmax , Shan
doit être
supérieure
tré querespecté
si Fe estd'où
la :fréquence d’échantillonnage, le spectre du signal échantillonné
ble de Fmax et est centré autour de Fe , 2Fe ... nFe . Par conséquent, pour éviter tout reco
t de spectre, le signal à échantillonner Fe ≥ doit2.Fêtre
max
borné (filtre) à une fréquence supé
que Fmax soit inférieure à la moitié de l’intervalle d’écartement des spectres (F
e 2.8 illustre cette relation appelée relation de Shannon.
Spectre du signal échantillonné
Spectre du Fe 2Fe
signal origine

Fréquences
+Fmax -Fmax +Fmax -Fmax +Fmax
Figure 2.8 Spectre d’échantillonnage.
Par conséquent, pour éviter tout recouvrement de spectre, le signal à
échantillonner
n en déduit que la doit être borné
fréquence (ltre de d’échantillonnage
minimale garde) à une fréquence supérieure de
(fréquence telleNyquist)
que F soit inférieure à la moitié de l'intervalle d'écartement
al doit être le double de la fréquence maximale du signal à échantillonner :
max des spectres
(Fe ).
Féchantillon  2 · Fmax du signal
Chapitre 1 Mr. BELLAHSENE H.
GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Codage des informations
LA COMPRESSION DE DONNÉES Numérisation des informations
Joint Photographic Experts Group (JPEG)

Transmission de la voix en téléphonie


Un canal téléphonique utilise une plage de fréquence ou Bande Passante
[300Hz à 3400Hz ]. Si Fmax = 4000Hz , la fréquence d'échantillonnage
minimale est de :

Fe ≥ 2.Fmax = 8000Hz
Pour une restitution correcte (dynamique et rapport signal à bruit), la voix
devrait être quantiée sur 12 bits (4 096 niveaux). Les contraintes de
transmission en rapport avec le débit conduisent à réduire cette bande.
L'utilisation d'une loi quantication logarithmique permet de ramener la
représentation numérique de la voix à 8 bits (7 bits pour l'amplitude et un bit
de signe), tout en conservant une qualité de reproduction similaire à celle
obtenue avec une quantication linéaire sur 12 bits. Cette opération dite de
compression est diérente en Europe (loi A) et en Amérique du Nord (loi µ ).
En codant chaque échantillon sur 8 bits, il est nécessaire d'écouler :
8000.8 = 64000 bits/s sur le lien. Ce choix correspond à celui du RNIS ou ISDN
(Integrated Service Digital Network ) qui utilise des voies à 64 kbit/s.
Chapitre 1 Mr. BELLAHSENE H.
GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Codage des informations
LA COMPRESSION DE DONNÉES Numérisation des informations
Joint Photographic Experts Group (JPEG)

Le seuil de l'audition
8 1 • Propriétés et acquisition des signaux sonores

20 k k

Figure 1.2 Courbes d’audition isosonique.

Figure  Tracée à partir du niveau de pression acoustique (SPL) IEEE 2000


c) Courbes de pondération sonométriques
Les courbes de la figure 1.2 ne sont pas parallèles. Elles montrent que la sensation de
volume sonore est d’autant plus dépendante de la fréquence que le niveau du son est
faible.
Pour rendre compte de cet effet et mesurer l’impact physiologique d’un bruit, les
sonomètres sont dotés d’unChapitre
module de 1pondération
Mr.spectrale
BELLAHSENE
qui corrige lesH.
mesures de
bits required to GÉNÉRALITÉS
quantize the audio samples in different frequency bands, since the (masking)
REPRÉSENTATION DEthresholds
hearing L'INFORMATION Codage des informations
are greatly raised and the human tolerance of quantization noise is thus
LA COMPRESSION DE DONNÉES
greatly increased.
Numérisation des informations
Joint Photographic Experts
3.1.3 Temporal Group (JPEG)
masking

Masquage Temporel et fréquentiel


Similarly, a weak sound emitted soon after the end of a louder sound is masked by
the louder sound. Even a weak sound just before a louder sound can be masked by

90

60
Masker
Masking
dB Threshold

40
Masked Sound

Threshold
20 in quiet

Inaudible
Signal
0

–0.2 –0.5 –1 –2 –5 1 2 5 10 20

Figure 3.7 The louder sound (the masker) will distort the absolute threshold of hearing and make the

Le son le plus fortquieter


(lesound
masqueur) déforme le seuil absolu de l'audition et rend
(the masked sound), which is originally audible, inaudible [7].

l'appareil auditif silencieux (le son masqué). Le son qui est à l'origine audible
devient inaudible (ici deux notes une à 250Hz à 65dB xe.la seconde à 180 Hz
qui augmente) masquage fréquentiel.
De même, un son faible émis peu après la n d'un son plus fort est masqué par
le son plus fort. Même un son faible juste avant qu'un son plus fort puisse être
masqué par le son plus fort ! Ces deux eets sont appelés respectivement
masquage post-temporel et pré-temporel (exemple de l'avion qui passe)
Chapitre 1 Mr. BELLAHSENE H.
GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Codage des informations
LA COMPRESSION DE DONNÉES Numérisation des informations
Joint Photographic Experts Group (JPEG)

Bande Passante requise pour le signal Audio

Qualité Nbre de Fréquence Résolution Bande


audio Canaux d'échantillonnage (bits) passante
Voix(NC) 1 8 kHz 7 56 kbps
Voix(NC) 1 8 kHz 8 64 kbps
Voix(C) 1 8 kHz 8 4-32 kbps
CD(NC) 2 44.1 kHz 16 1.411 Mbps
CD(C) 2 44.1 kHZ 16 64-192 kbps
NC : Non Compressée
C : Compressée

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS
REPRÉSENTATION
Application DE L'INFORMATION
à l’image vidéo Codage des informations
LA COMPRESSION DE DONNÉES Numérisation
Joint
La voix estPhotographic
un phénomèneExperts Groupl’oreille
vibratoire, (JPEG) perçoit et interprètedes
lesinformations
variations de pression succes-
sives. L’image est analysée globalement par l’œil alors qu’elle ne peut être transmise et reproduite
Image Vidéo que séquentiellement. La discrétisation de l’image nécessite deux étapes : d’abord une transforma-
tion espace/temps qui se concrétise par une analyse de celle-ci, ligne par ligne, puis une décom-
position de chaque ligne en points (pixel), enfin, la quantification de la valeur lumineuse du point,
valeur qui est transmise.
Image monochrome
La➤ discrétisation de l'image nécessite deux étapes : d'abord une transformation
L’image monochrome
espace/temps
La reproductionqui se concrétise
d’une par une
image nécessite analyse
l’analyse et ladequantification
celle-ci, ligne
de par ligne, lumineuse,
l’intensité par la suiteou
une décomposition
luminance, de chacunde
deschaque ligne en points
points constituant l’image(pixel), enn,Lalafigure
(échantillon). quantication de lal’ana-
1.13 schématise
valeur
lyse delumineuse
l’image et du pointleetsignal
présente qui sera transmise.
électrique analogique résultant dit « signal de luminance » et
noté Y(t).

Signal de luminance

Synchro Synchro
ligne trame
© Dunod – La photocopie non autorisée est un délit

Trame N Trame N + 1

Figure 1.13 Le principe de l’analyse d’image.


La reproduction d'une image nécessite l'analyse et la quantication de
l'intensité
L’image lumineuse, ougauche
est analysée de luminance,
à droitede chacun
ligne des(balayage
par ligne points constituant
horizontal) et l'image
de haut en
bas (balayage vertical).
(échantillon). La gurePour garantir le synchronisme
schématise l'analyse de entre le système
l'image et d’analyselede
présente l’émetteur
signal
et le système de reproduction du récepteur, une impulsion de synchronisation (synchronisation
électrique analogique résultant signal de luminance et noté Y (t)
Chapitre
6. La dynamique exprime le rapport entre les 1 maximale
puissances Mr. et
BELLAHSENE H.
minimale du signal.
GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Codage des informations
LA COMPRESSION DE DONNÉES Numérisation des informations
Joint Photographic Experts Group (JPEG)

Image Vidéo
Image Colorée
Une image colorée peut être analysée selon trois couleurs primaires de longueur d'onde
(λ). La synthèse additive permet de reconstituer l'image d'origine en superposant les
trois images. La gure représente le principe de la synthèse additive. Le dosage de
chacune des sources lumineuses permet de reproduire toutes les couleurs
18 2 • L’information et sa représentation dans les systèmes de transmission

Rouge

Magenta Jaune

Blanc

Bleu Vert
Cyan

b = 0,436m v = 0,546m
r = 0,700m
B V
R

Figure 2.10 La synthèse additive.

Chaque point de l'image est représenté par deux grandeurs, la luminance et la


Chaque point de l’image est représenté par deux grandeurs, la luminance et la chromi-
nance. La chrominance, ou information de couleur, est le résultat de la superposition de
trois couleurs dites primaires (figure 2.10). Ces deux grandeurs sont reliées entre elles par la

chrominance. Ces grandeurs sont reliées entre elles par la relation :


relation :
Y = 0,3 R + 0,59 V + 0,11 B

Y = 0.3R + 0.59V + 0.11B avec Y la luminance ; R , V et B intensité de la


où : Y est la luminance (échelle des gris),
R l’intensité de la composante de lumière rouge,
V celle de lumière verte,

lumière des couleurs respectivement rouge, verte et bleu (Norme ITU-R


B celle de lumière bleue.
L’image est dite RVB ou RGB (Red, Green, Blue), du nom des trois couleurs primaires

recommandation BT601 et BT656).


Rouge, Vert, Bleu. En télévision, pour assurer la compatibilité avec les téléviseurs mono-
chromes, il nous faut transmettre, en plus des informations de chrominance, les informations
de luminance (échelle des gris).
Les différentes caractéristiques d’une image vidéo constituent un standard. Les paramètres
Chapitre 1
de ces standards sont :
Mr. BELLAHSENE H.
– le format de l’image, à l’origine le même format que le cinéma (4/3), aujourd’hui on évolue
GÉNÉRALITÉS 1.2 La représentation de l’information 19
REPRÉSENTATION DE L'INFORMATION Codage des informations
LA COMPRESSION– le DE
– le nombre deDONNÉES
points par ligne défini à 720 ;
Numérisation des informations
9

Joint Photographic Experts Group (JPEG)


nombre d’images par seconde déterminé à 25 images
Ainsi, on transmet :
(25 Hz).

Codage de l'information couleur


– 720 points par ligne pour le signal Y ;
– 360 points pour chacune des couleurs B et R.
Au total 1 440 échantillons élémentaires par ligne sont analysés. En se satisfaisant d’une quan-
tification sur 255 niveaux (8 bits, soit 16 millions de couleurs, plus que l’œil n’est capable d’en
discerner), le nombre de bits nécessaires à la reconstitution d’une image (576 lignes) est donc de :

N(bits) = 1 440 · 8 · 576 = 6 635 520 bits

À raison de 25 images par seconde (50 demi-images), il faut, pour transmettre une image animée,
un débit minimal de :
Dmin = 6 635 520 · 25 = 166 Mbit/s.

Ce débit, relativement important, a conduit à rechercher des méthodes de codage particulières.

Une image colorée peut être analysée selon trois couleurs primaires de longueur d'onde
Un groupe de travail commun à l’ISO et à la CEI (Commission électrotechnique internationale), le
Motion Picture Expert Group (MPEG), est chargé de définir les algorithmes normalisés de com-
pression d’images vidéo et du son associé.

(λ). La synthèse additive permet de reconstituer l'image d'origine en superposant les ➤ Le codage de l’information de couleur

trois images. La gure représente le principe de la synthèse additive. Le dosage de


Les différents procédés de télévision couleur diffèrent essentiellement par le codage adopté pour
transmettre les informations de couleur. Le premier système public de télévision a été mis au point
aux États-Unis par le National Television Comitee d’où son nom de NTSC (National Television

chacune des sources lumineuses permet de reproduire toutes les couleurs System Comitee)
Dans le système NTSC, les informations de couleur modulent en amplitude deux sous-porteuses
en quadrature. Le signal réellement émis est donc un vecteur dit vecteur de chrominance (Uc)
(figure 1.17).

R-Y
Uc
© Dunod – La photocopie non autorisée est un délit

2 2
Uc = R −Y + B −Y
R−Y
tg α =
B−Y

α B-Y

Figure 1.17 Le codage de l’information de chrominance dans le système NTSC.

Chaque point de l'image est représenté par deux grandeurs, la luminance et la 9. À titre de comparaison : le magnétoscope VHS (Video Home System) 250 points/ligne ; le magnétoscope SVHS 400
points/ligne.

chrominance. Ces grandeurs sont reliées entre elles par la relation :


Y = 0.3R + 0.59V + 0.11B avec Y la luminance ; R , V et B intensité de la
lumière des couleurs respectivement rouge, verte et bleu. La
représentationYUV est donnée par U = (B − Y ).0.493 et V = (R − Y ).0.877.

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Codage des informations
LA COMPRESSION DE DONNÉES Numérisation des informations
Joint Photographic Experts Group (JPEG)

La numérisation vidéo

Chaque image est divisée en petits blocs appelés pixels. Une image
en niveaux de gris est représentées par 8 bits. En présence de la
couleurs, chaque pixel est représenté par 24 bits, 8 bits pour chaque
couleurs primaire. si on suppose qu'une trame image est composée
de 640x480 pixels, la bande passante requise est de
2.25.640.480 = 368.64Mbits/s . Ceci est trop grand pour eectuer
une transmission dans le réseau internet. D'où la nécessité de la
compression et spécialement pour la compression vidéo.

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Généralités
LA COMPRESSION DE DONNÉES Techniques de Compression
Joint Photographic Experts Group (JPEG)
1 GÉNÉRALITÉS
Les ux d'information
Caractéristiques des réseaux de transmission
2 REPRÉSENTATION DE L'INFORMATION
Les diérents types d'information
Codage des informations
Dénition
Les codes de longueur xe
Les codes de longueur variable
Numérisation des informations
3 LA COMPRESSION DE DONNÉES
Généralités
Techniques de Compression
4 Joint Photographic Experts Group (JPEG)
Introduction
Procédure de calcul de la DCT
Vers l'image Animée : MPEG, H.261,H263, H264
Chapitre 1 Mr. BELLAHSENE H.
GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Généralités
LA COMPRESSION DE DONNÉES Techniques de Compression
Joint Photographic Experts Group (JPEG)

Motivation de la compression

Utilisation massive des données numériques → problème de


stockage/transmission
Mise en place de nouveaux réseaux d'accès : Communication avec
les mobiles, Internet Nouveaux services et applications : TVoDSL,
streaming, VoIP, photo numérique
Image xe : format CIF (352x288 pixels, 24 bits/pixel) → 43
secondes pour une transmission à 56 kbit/s
Réduire la quantité de données à stocker ou à transmettre.

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Généralités
LA COMPRESSION DE DONNÉES Techniques de Compression
Joint Photographic Experts Group (JPEG)

Exemples de Bande passante requise en vidéo

Qualité RH RV RC RT bande passante bande passante


Vidéo non compressée compressée
HDTV 1920 1080 24 60 2986 Mbits/s MPEG2 :25-34 Mbits/s
TV 720 576 24 25 249 Mbits/s MPEG2 : 3-6 Mbits/s
CIF 352 288 8 15 12.165 Mbits/s H261 : 112kbits/s
QCIF 176 144 8 10 2.0 Mbits/s MPEG4 : <64 kbits/s

RH et RV sont les Résolutions Horizontale et Verticale. RC Résolution de


la Couleur. RT Résolution Trames CIF :Common Image Format. En
comparant les deux dernière colonnes, nous comprenons que la
compression devient impérative.

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Généralités
LA COMPRESSION DE DONNÉES Techniques de Compression
Joint Photographic Experts Group (JPEG)

Enjeux de la Compression

Les besoins en terme de bande passante pour le train binaire à


transmettre (Bits/s)
Qualité de l'image
Vitesse de compression et de décompression entre autre la latence,
le coût et la symétrie.
La robustesse : tolérance des erreurs et des pertes.
L'exigence des applications soit une vidéo en live ou une vidéo
enregistrée ou bien en streaming.

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Généralités
LA COMPRESSION DE DONNÉES Techniques de Compression
Joint Photographic Experts Group (JPEG)

Distorsion et limite de la compression

}
Représentation de la source

Les Méthodes de Codage Réversibles CR<3

Entropie

}
Les Méthodes de Codage non Réversibles
Débit

Distorsion

Figure  Courbe de distorsion et limite de Shannon

Peut-on compresser l'information ? Réponse de shannon a été


armative d'un point de vue théorie de l'information
Théorème de codage source sans
Chapitre 1 bruit.
Mr. BELLAHSENE H.
GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Généralités
LA COMPRESSION DE DONNÉES Techniques de Compression
Joint Photographic Experts Group (JPEG)

Quand peut-on compresser


Lorsqu'une redondance existe dans une séquence vidéo par exemple
ou sur une image xe ou bien lorsque la présence ou l'absence d'un
bit n'est pas détecté par notre SVH, il est possible de supprimer ce
bit.
Dans le premier cas :
L'élimination de la redondance dans l'espace (car les pixels voisins
ont de forte chance de se ressembler)
L'élimination de la redondance temporelle (car une vidéo est la
succession d'images à travers le temps. Les pixels d'une image à
une position donnée (même macro-bloc) ressemblent à l'image
suivante ou précédente.
Dans le second cas :
Les détails imperceptibles sont éliminés par :
Codage
Transformée de domaine
Chapitre 1 Mr. BELLAHSENE H.
GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Généralités
LA COMPRESSION DE DONNÉES Techniques de Compression
Joint Photographic Experts Group (JPEG)
1 GÉNÉRALITÉS
Les ux d'information
Caractéristiques des réseaux de transmission
2 REPRÉSENTATION DE L'INFORMATION
Les diérents types d'information
Codage des informations
Dénition
Les codes de longueur xe
Les codes de longueur variable
Numérisation des informations
3 LA COMPRESSION DE DONNÉES
Généralités
Techniques de Compression
4 Joint Photographic Experts Group (JPEG)
Introduction
Procédure de calcul de la DCT
Vers l'image Animée : MPEG, H.261,H263, H264
Chapitre 1 Mr. BELLAHSENE H.
GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Généralités
LA COMPRESSION DE DONNÉES Techniques de Compression
Joint Photographic Experts Group (JPEG)

Les techniques les plus utilisées dans la compression vidéo

Simple Interpolation Predictive Transformée Statistique

Color LookUp Huffman


Sous- DPCM
Table CLUT
échantillonnage Par compensation DCT & Codage
tranquée Arithmetique
de mouvement

Fixes Adaptatives

Entrée Composantes Affectation


couleurs Algorithmes de Compression Vidéo
Vidéo de bits Train binaire
Signal PCM Compressé

DPCM Dierential Pulse Code Modulation ; DCT Discret Cosine


Transform ; PCM Pulse code Modulation

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS
REPRÉSENTATION DE L'INFORMATION Généralités
LA COMPRESSION DE DONNÉES Techniques de Compression
Joint Photographic Experts Group (JPEG)

Critères de choix en Compression

La dégradation de la qualité de l'image d'origine est généralement dénie sur la base


du rapport pic signal/bruit PSNR (Peak Signal-to-Noise Ratio), qui est le rapport
entre la puissance maximale possible d'un signal et la puissance des erreurs de
reconstruction, en décibels. Le PSNR est le plus souvent utilisé comme mesure de la
qualité de la reconstitution en compression d'image. Plus précisément, étant donné
l'image originale f (x, y ) de taille M × N et sa version reconstituée (codage suivi du
décodage) fˆ(x, y ) après compression, le PSNR est déni comme suit :
MaxI2
 
PSNR = 10 log10
MSE
M−1 N−1
1 2
MSE = ∑ ∑ f (x, y ) − fˆ(x, y )
MN x =0 y =0

Le CR (Compression Rate) est donné par :


Nombre de bits utilis és par le signal original
CR = Nombre de bits utilis és par le signal compress é

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS Introduction
REPRÉSENTATION DE L'INFORMATION Procédure de calcul de la DCT
LA COMPRESSION DE DONNÉES Vers l'image Animée : MPEG, H.261,H263, H264
Joint Photographic Experts Group (JPEG)
1 GÉNÉRALITÉS
Les ux d'information
Caractéristiques des réseaux de transmission
2 REPRÉSENTATION DE L'INFORMATION
Les diérents types d'information
Codage des informations
Dénition
Les codes de longueur xe
Les codes de longueur variable
Numérisation des informations
3 LA COMPRESSION DE DONNÉES
Généralités
Techniques de Compression
4 Joint Photographic Experts Group (JPEG)
Introduction
Procédure de calcul de la DCT
Vers l'image Animée : MPEG, H.261,H263, H264
Chapitre 1 Mr. BELLAHSENE H.
GÉNÉRALITÉS Introduction
REPRÉSENTATION DE L'INFORMATION Procédure de calcul de la DCT
LA COMPRESSION DE DONNÉES Vers l'image Animée : MPEG, H.261,H263, H264
Joint Photographic Experts Group (JPEG)

L'une des normes de codage d'images les plus populaires et les plus
complètes est la norme JPEG. Le nom JPEG signie Joint Photographic
Experts Group (groupe mixte d'experts en photographie), c'est le comité
international qui a créé la norme ISO/CEI 10918-1/2/3 (aujourd'hui
Recommandations 81, 83 et 84 de l'UIT-T) en 1994 pour les images xes
continues en niveaux de gris et couleurs. Les images compressées, avec
l'extension *.jpg qui utilise la compression JPEG, sont communément
appelées aussi images JPEG. En raison de son adoption par le World Wide
Web (www) et l'appareil photo numérique DSC (Digital Still Camera),
JPEG est plus ou moins considéré comme le seul format dominant pour
le stockage et la transmission des photographies numériques.

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS Introduction
REPRÉSENTATION DE L'INFORMATION Procédure de calcul de la DCT
LA COMPRESSION DE DONNÉES Vers l'image Animée : MPEG, H.261,H263, H264
Joint Photographic Experts Group (JPEG)

Algorithme JPEG Baseline


YUV
s(i,j) S(u,v) Sq (u,v)
DCT Quantificateur

8x8

ZIG ZAG

Table de
Entêtes quantification
Table de
Tables Codage

Données DPCM
DC
Codage
Entropique
RLC AC

La modulation DPCM (Dierential PCM) code les diérences entre les


valeurs successives en PCM. Ces valeurs sont en général faibles et
conduisent donc à un nombre de bits de codage petit.
RLC : Run Length Coding.
Chapitre 1 Mr. BELLAHSENE H.
GÉNÉRALITÉS Introduction
REPRÉSENTATION DE L'INFORMATION Procédure de calcul de la DCT
LA COMPRESSION DE DONNÉES Vers l'image Animée : MPEG, H.261,H263, H264
Joint Photographic Experts Group (JPEG)
1 GÉNÉRALITÉS
Les ux d'information
Caractéristiques des réseaux de transmission
2 REPRÉSENTATION DE L'INFORMATION
Les diérents types d'information
Codage des informations
Dénition
Les codes de longueur xe
Les codes de longueur variable
Numérisation des informations
3 LA COMPRESSION DE DONNÉES
Généralités
Techniques de Compression
4 Joint Photographic Experts Group (JPEG)
Introduction
Procédure de calcul de la DCT
Vers l'image Animée : MPEG, H.261,H263, H264
Chapitre 1 Mr. BELLAHSENE H.
GÉNÉRALITÉS Introduction
REPRÉSENTATION DE L'INFORMATION Procédure de calcul de la DCT
LA COMPRESSION DE DONNÉES Vers l'image Animée : MPEG, H.261,H263, H264
Joint Photographic Experts Group (JPEG)

Analyse spectrale et la DCT


La première étape a consisté à mettre au point une méthode permettant de
décrire l'image suivant un catalogue ou un dictionnaire de formes ou de motifs
prédénis dont on peut repérer la présence dans l'image grâce à des
algorithmes mathématiques relativement simples et qui permettent de
regrouper et classer les informations selon les fréquences spatiales horizontale
(plus ou moins de barreaux dans une grille) et verticale (plus ou moins de
marches dans un escalier). La DCT utilise une opération mathématique appelée
Discrete Cosine Transform.
Le traitement de l'ensemble d'une image exigerait la manipulation d'énormes
quantités de données. On a donc été amené à découper en morceaux ces
opérations. On analyse successivement des petits morceaux d'image ou blocs de
8 Ö 8 pixels, c'est-à-dire qu'on fait subir au signal à transformer un fenêtrage
préalable (STFT, Short Time Fourier Transform, Transformation de Fourier à
Court Terme ou transformation de Gabor). L'analyse en fréquences spatiales
s'eectue successivement suivant l'axe vertical puis suivant l'axe horizontal.Il
faut bien entendu eectuer ces opérations pour les diérentes composantes
dénissant l'image, généralement en couleur : soit les trois composantes R,V,B,
soit les composantes Y,U,V.
Chapitre 1 Mr. BELLAHSENE H.
GÉNÉRALITÉS Introduction
REPRÉSENTATION DE L'INFORMATION Procédure de calcul de la DCT
LA COMPRESSION DE DONNÉES Vers l'image Animée : MPEG, H.261,H263, H264
Joint Photographic Experts Group (JPEG)

Calcul de la Discrète Cosine Transform (DCT)

Dans le cas d'une image deux dimensions de taille NxN pixels on a pour le DCT
directe : :
N−1 N−1
2 1 1
     
πk πl
X [k, l] = Cu Cv ∑ ∑ x(n, m) cos n+ cos m+
N n =0 m =0 N 2 N 2
Pour La IDCT ou DCT inverse :
N−1 N−1
2 1 1
     
πu πv
x(n, m) = ∑ ∑ Cu Cv X (k, l) cos N n+ cos m+
N u =0 v =0 2 N 2

2
2 lorsque α = 0
(
Avec Cα =
1 sinon

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS Introduction
REPRÉSENTATION DE L'INFORMATION Procédure de calcul de la DCT
LA COMPRESSION DE DONNÉES Vers l'image Animée : MPEG, H.261,H263, H264
Joint Photographic Experts Group (JPEG)

Vecteur de base de la DCT(N=8)


Le bloc donnant les diérentes fréquences correspondant des motifs (verticaux
Dunod_Luxereau_50991_BAT Page 71 Vendredi, 8. août 2008 1:42 13

ou horizontaux) constitue le catalogue des 64 motifs géométriques simples


obtenu partir des 64 pixels d'un bloc 8 × 8. TECHNIQUES DE CODAGE 2 CHAPITRE

Figure 2.11.
Catalogue
de tartans écossais.

peut réaliser avec les 64 pixels d’un bloc 8 × 8. Il me fit


La DCT permet de savoir sipenser
chacun de cesde tartans
à un catalogue motifs peutd’oùêtre
écossais, le nomdétecté dans le bloc
analysé. On substitue au tableau constitué par
que je me plais à lui attribuer.
les 64 nombres aectés aux points du
bloc (domaine spatial) un autre tableau comportant les coecients
La DCT permet de savoir si chacun de ces motifs peut
être décelé dans le bloc analysé. On substitue alors au d'amplitude des
composantes fréquentiellestableau
permettant
constitué parde caractériser
les 64 nombres affectés la
auxcontribution
points dans l'image de
chacun des motifs dont la présence
les coefficientsété détectée (domaine
du bloc (domaine spatial) un autre tableau comportant
d’amplitude des composantes fréquentiel).
fréquen-
tielles permettant de caractériser la contribution dans
l’image de chacun des motifs dont la présence a été
détectée Chapitre 1 Mr. BELLAHSENE
(domaine fréquentiel). H.
GÉNÉRALITÉS Introduction
REPRÉSENTATION DE L'INFORMATION Procédure de calcul de la DCT
LA COMPRESSION DE DONNÉES Vers l'image Animée : MPEG, H.261,H263, H264
Joint Photographic Experts Group (JPEG)

Exemple simplié de calcul de Quantication des coecients DCT

Quantication uniforme par division par une constante N et arrondi (N=4 ou 8


dans l'exemple
D.C.T.
80 7
-9 1

10 2
arrondi(DCT/Ceof)=
8 3 -1 0
9 4
Tableau des Coefficients

Figure  Exemple de quantication des coecients de la DCT

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS Introduction
REPRÉSENTATION DE L'INFORMATION Procédure de calcul de la DCT
LA COMPRESSION DE DONNÉES Vers l'image Animée : MPEG, H.261,H263, H264
Joint Photographic Experts Group (JPEG)

Quantication des coecients DCT


Dans JPEG, chaque coecient DCT X (u, v ) est divisé par une constante
Q(u, v ).
Table des Q(u,v) = table de quantication.
Exemple de matrice de quantication pour la luminance. ×il très sensible aux
basses fréquences (en rouge), peu sensible aux hautes fréquences (en vert).

16 11 10 16 24 40 51 61
 
 12 12 14 19 26 58 60 55 
14 13 16 24 40 57 69 56
 
 
14 17 22 29 51 87 80 62
 
 
Q =
18 22 37 56 68 109 103 77

 
24 35 55 64 81 104 113 92
 
 
49 64 78 87 103 121 120 101
 
 
72 92 95 98 112 100 103 99
Après quantication, annulation de nombreux coecients DCT
Chapitre 1 Mr. BELLAHSENE H.
GÉNÉRALITÉS Introduction
REPRÉSENTATION DE L'INFORMATION Procédure de calcul de la DCT
LA COMPRESSION DE DONNÉES Vers l'image Animée : MPEG, H.261,H263, H264
Joint Photographic Experts Group (JPEG)

Lecture (Balayage) en zig-zag


Bloc 8x8 après quantication =vecteur de longueur 64 contenant de nombreux
zéros → grouper les coecients non nuls au début du vecteur et les zéros la n
de celui-ci.

Figure  Lecture en zigzag des éléments macro blocs de la norme JPEG

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS Introduction
REPRÉSENTATION DE L'INFORMATION Procédure de calcul de la DCT
LA COMPRESSION DE DONNÉES Vers l'image Animée : MPEG, H.261,H263, H264
Joint Photographic Experts Group (JPEG)

Codage entropique du coecient DC


Signal de diérence : DCn − DCn−1
Détermination de la catégorie correspondante :
Valeur Catégorie DC
0 0
1 -1,1
2 -3,-2,2,3
3 -7,· · · , −4, 4, · · · , 7
4 -15,· · · , −8, 8, · · · , 15
5 -31,· · · , −16, 16, · · · , 31
6 -63,· · · , −32, 32, · · · , 63
7 -127,· · · , −64, 64, · · · , 127
8 -255,· · · , −128, 128, · · · , 255
9 -511,· · · , −256, 256, · · · , 511
10 -1023,· · · , −512, 512, · · · , 1023
Le code de Human associé à la catégorie+un nombre xe de bits égal à la valeur de la catégorie
envoyés. Chapitre 1 Mr. BELLAHSENE H.
GÉNÉRALITÉS Introduction
REPRÉSENTATION DE L'INFORMATION Procédure de calcul de la DCT
LA COMPRESSION DE DONNÉES Vers l'image Animée : MPEG, H.261,H263, H264
Joint Photographic Experts Group (JPEG)

Codage entropique du coecient DC


Détermination de la longueur du code et sa valeur partir de la table de la diérence de la luminance de
DC (K.3) :
Catégorie Longueur du code Valeur du code
0 2 00
1 3 010
2 3 011
3 3 100
4 3 101
5 3 110
6 4 1110
7 5 11110
8 6 111110
9 7 1111110
10 8 11111110
11 9 111111110
Chapitre 1 Mr. BELLAHSENE H.
GÉNÉRALITÉS Introduction
REPRÉSENTATION DE L'INFORMATION Procédure de calcul de la DCT
LA COMPRESSION DE DONNÉES Vers l'image Animée : MPEG, H.261,H263, H264
Joint Photographic Experts Group (JPEG)

Codage entropique des coecients AC

Codage par plage appliqué sur le reste des coecients


(coecients AC).
Codage par paires (Zero Run, Category).
Catégorie = nombre de bits nécessaires pour coder la valeur
absolue du coecient non nul qui suit.
Deux codes particuliers : suite de 16 zéros consécutifs + (0,0)
= n de bloc (EOB)

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS Introduction
REPRÉSENTATION DE L'INFORMATION Procédure de calcul de la DCT
LA COMPRESSION DE DONNÉES Vers l'image Animée : MPEG, H.261,H263, H264
Joint Photographic Experts Group (JPEG)
1 GÉNÉRALITÉS
Les ux d'information
Caractéristiques des réseaux de transmission
2 REPRÉSENTATION DE L'INFORMATION
Les diérents types d'information
Codage des informations
Dénition
Les codes de longueur xe
Les codes de longueur variable
Numérisation des informations
3 LA COMPRESSION DE DONNÉES
Généralités
Techniques de Compression
4 Joint Photographic Experts Group (JPEG)
Introduction
Procédure de calcul de la DCT
Vers l'image Animée : MPEG, H.261,H263, H264
Chapitre 1 Mr. BELLAHSENE H.
GÉNÉRALITÉS Introduction
REPRÉSENTATION DE L'INFORMATION Procédure de calcul de la DCT
LA COMPRESSION DE DONNÉES Vers l'image Animée : MPEG, H.261,H263, H264
Joint Photographic Experts Group (JPEG)

Redondance spatiale et redondance temporelle


Les algorithmes MPEG utilisent les algorithmes JPEG qui exploitent les redondances
existant à l'intérieur de l'image. La redondance spatiale permet aux algorithmes JPEG
d'atteindre un taux de réduction de débit de l'ordre de 10 :1 en pratique. Mais des
taux bien plus élevés sont nécessaires pour faire passer dans les réseaux les 216 Mb/s
(8 bits) ou 270 Mb/s (10 bits) de l'image TV standard (ou bien 1,5 Gb/s de la
HDTV). Sachant que les diérentes images d'une séquence animée présentent
toujours (sauf s'il y a eu un point de montage) une grande parenté : plan xe traversé
par une automobile ou un ballon, déplacement régulier des éléments de l'image dans
un panoramique. . . C'est l'exploitation de cette redondance temporelle qui permet aux
algorithmes MPEG d'obtenir les taux élevés de réduction de débit qu'exigent les
images animées. La réduction de débit JPEG est dite  intra  pour intraimage, la
réduction de débit MPEG est dite  inter  pour inter-images. On notera qu'il
convient de distinguer en fait des possibilités de codages inter-trames et inter-images,
tous deux retenus par MPEG-2 pour les systèmes à balayage entrelacé. Le mode
inter-trame donne de meilleurs résultats lorsqu'il se produit un déplacement important
des images, en particulier un panoramique vertical. Il faut noter que tout événement
brutal survenant au cours d'une séquence (le ash d'un appareil photographique au
cours d'une conférence de presse par exemple) aecte la redondance temporelle, réduit
donc l'ecacité de la réduction de débit et peut devenir source de graves
perturbations dans l'encodage.
Chapitre 1 Mr. BELLAHSENE H.
GÉNÉRALITÉS Introduction
REPRÉSENTATION DE L'INFORMATION Procédure de calcul de la DCT
LA COMPRESSION DE DONNÉES Vers l'image Animée : MPEG, H.261,H263, H264
Joint Photographic Experts Group (JPEG)

Vecteur de mouvement

Chaque image est découpée en blocs de 8 × 8 pixels comme en JPEG. Ces blocs sont
ensuite groupés par 4 pour former un macrobloc. Les macroblocs forment des tranches
(slices). L'algorithme de compression cherche à repérer des déplacements éventuels des
diérents macroblocs en comparant deux images successives.
Image n Image n+1

Une fois ces macroblocs identiés, on leur associe des  vecteurs de déplacement
(motion vectors) qui, décrivent en direction, sens et amplitude le déplacement de ces
éléments d'image. Les mouvements de rotation ne sont pas traités par cette technique.

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS Introduction
REPRÉSENTATION DE L'INFORMATION Procédure de calcul de la DCT
LA COMPRESSION DE DONNÉES Vers l'image Animée : MPEG, H.261,H263, H264
Joint Photographic Experts Group (JPEG)

GOPs (Group Of Pictures) avec trois types d'images


Les séquences sont segmentées en groupes d'images, en abrégé GOPs, plus ou moins
longs à l'intérieur desquels on va rechercher les parentés entre images (redondance
temporelle). Dans un GOP : trois types d'images peuvent être mis en oeuvre : Images
I : Intra, P : Prédites, B : interpolées Bidirectionnelles. Chaque GOP commence par
une image I qui va servir à dénir les autres images du GOP. Les images I subissent
uniquement une réduction de débit de type Intra comme en JPEG. Le codeur possède
une boucle de contrôle du dispositif de quantication qui réduit la profondeur de celle-ci
lorsque le débit maximal autorisé est atteint ; il y a dans ce cas une perte de qualité.
Perte d'autant plus importante que l'image I sert de base au calcul de toutes les autres
images du GOP.

1 2 3 4 5 6 7 8 9 11 12
10 13

I B B P P P B I
B B B B B

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS Introduction
REPRÉSENTATION DE L'INFORMATION Procédure de calcul de la DCT
LA COMPRESSION DE DONNÉES Vers l'image Animée : MPEG, H.261,H263, H264
Joint Photographic Experts Group (JPEG)

GOPs avec trois types d'images


Chaque image P d'un GOP est prédite soit à partir à partir de l'image I qui la précède,
soit à partir de l'image P qui la précède. On peut dire de manière schématique qu'elle
est dénie ainsi :  c'est la même image à quelques diérences près  ; il sut de
transmettre ces diérences pour savoir reconstituer la nouvelle image ; il est inutile de
retransmettre ce qui est identique. Les vecteurs déplacement jouent évidemment un
rôle fondamental dans l'expression de ces diérences. Les images B sont élaborées en
référence avec le passé et le futur. L'encodeur réalise une interpolation bidirectionnelle,
utilisant des vecteurs déplacement avant et arrière, entre les images I ou P qui
encadrent l'image B, an de dénir des macroblocs intermédiaires. Les valeurs de ces
macroblocs interpolés sont soustraites de celles des macroblocs réels et seules les
diérences, généralement faibles, sont transmises. C'est un élément essentiel quant à
l'ecacité du codage MPEG dans la réduction de débit.

1 2 3 4 5 6 7 8 9 11 12
10 13

I B B P P P B I
B B B B B

Chapitre 1 Mr. BELLAHSENE H.


GÉNÉRALITÉS Introduction
REPRÉSENTATION DE L'INFORMATION Procédure de calcul de la DCT
LA COMPRESSION DE DONNÉES Vers l'image Animée : MPEG, H.261,H263, H264
Joint Photographic Experts Group (JPEG)

Exemple Des GOPs

Etant donné un GOP de 12 images I B B P B B P B B P B B I B B P. . . Ce type de


GOP long est très utilisé en diusion. Ceci n'empêche pas l'utilisation de GOP de 16
images, voire plus. Le GOP le plus court est de 1 image I I I I. . . On parle alors de
codage I only. Il est évidemment moins ecace quant à la réduction de débit mais
présente d'autres avantages pour la production. Il faut noter que les images du GOP
ne sont pas transmises dans l'ordre de lecture et d'achage mais dans celui qui
permet la reconstruction la plus rapide : I(1) P(4) B(2) B(3) P(7) B(5) B(6), etc.

1 2 3 4 5 6 7 8 9 11 12
10 13

I B B P P P B I
B B B B B

Chapitre 1 Mr. BELLAHSENE H.


Dunod_Luxereau_50991_BAT Page 88 Vendredi, 8. août 2008Appendix
1:42 13

Synoptique du codeur MPEG


COMPRESSION DU SIGNAL AUDIOVISUEL

Figure 3.3.
Synoptique
du codage MPEG.

3.2.4 Des puzzles bien entremêlés


Le codage des séquences s’effectue selon une syntaxe
Chapitre 1 Mr. BELLAHSENE H.
Appendix Lectures complémentaires

Lectures complémentaires I

S. Collin,. Le multimédia sur PC, Dunod, Paris, 1994.


Marc Van Droogenbroeck. Technologies du multimédia, des
télécommunications et de l'Internet, Université de Liège, 2004
E. Holsinger, How multimedia works, Zi-David Press,
Emeryville, California, 1994.
C. Servin, Réseaux et télécoms, Dunod, Paris, 2003.
S. Déon, La téléphonie sur IP, Eyrolles, 2010.
G. Pujolle, Les réseaux, Eyrolles, 2000.
O. Hersent, La voix sur IP : Déploiement des architectures,
Eyrolles, 2006.

Chapitre 1 Mr. BELLAHSENE H.

Vous aimerez peut-être aussi