Vous êtes sur la page 1sur 49

Normes de Compression

audio-vido
Ahmed Mehaoua
Matre de Confrences
Universit de Versailles
Laboratoire CNRS - PRiSM

Plan

Normes Video de 1re gnration


JPEG et Motion JPEG
H.261
MPEG-1

Normes Video de 2me Gnration


H.263
MPEG-2

Normes Video de 3me Gnration


H.263+
MPEG-4
MPEG-7

Normes Audio

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 2

Bibliographie

Http://www.mpeg.org

Understanding Networked Multimedia, F. Fluckiger,


Prentice Hall, 1995

Multimedia : computing, communications and


Applications, R. Steinmetz, Prentice Hall, 1995

Networked Multimedia Systems, Concepts,


Architecture, and Design, S.V. Raghavan, Prentice
Hall, 1998

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 3

JPEG et Motion-JPEG
Dfinition :
JPEG : norme de compression dimages fixes propose en 1988
par OSI.
Motion-JPEG : algorithme de synchronisation image-son
propritaire
dbits variables entre 15-25 Mbps (format TV)
accepte diffrents formats de couleurs pour le signal en entre.

Applications :
Temps de latence rduit
Transmission vido qualit TV en temps rel (hardware)
DV
Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 4

JPEG et Motion-JPEG
R

G
RGB YUV

sous-chantillonnage
des Couleurs
(optionel)

pour chaque Matrice

Quantification

Balayage
en Zig-Zag

DCT

pour chaque
Bloc de 8x8

DPCM
DC
Codage
Entropique

RLE

. . . 10110010111
Huffman

AC

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 5

JPEG et Motion-JPEG
Compression Diffrentielle (DPCM) du cofficient DC :

DCi-1

DCi

Blocki-1

Blocki

DIFF = DCi - DCi-1

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 6

JPEG et Motion-JPEG
Lecture en Zig-Zag des coefficients AC pour amliorer la Quantification :
chantillon de l'image (Bloc)

Coefficients de la transforme
Composante
DC

DCT

Balayage en zigzag

Balayage alternatif

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 7

DV
Digital Video
Format de stockage de la vido numrique pour camra
vido grand public
Compression Video :
- Similaire Motion-JPEG (image/image)
- Format PAL/SECAM : 4:1:1 YCbCr /525
- Format NTSC : 4:2:0 YCbCr /625
- Table de quantification par MacroBlock
- Dbit : 25 Mbps (3.6 Mop/s)
Audio non Compress :
- 2 canaux PCM 16 bit, 44.1 Khz
- 2 canaux PCM 16 bits, 48 Khz
- 4 canaux PCM 12 bits, 32 Khz

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 8

ITU H.261
Dfinition:
norme pour la compression de limages animes et du son propose
en 1990 par UIT.
Principe : codage JPEG (Image codes Intra) + codage temporel
(Images codes Prdictives)
Succession dimages JPEG (images I) et dimages H.261 (Images P)
Formats vido accepts en entre limits :
CIF 352x288 jusqu 30 fps
QCIF 176x144
Application :
ddi la vidoconfrence sur le RNIS bande troite
dbits constants nx64 Kbps (n compris entre 1 et 30)

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 9

ITU H.261
Structure des Images
176 pixels

GOB 1

GOB 2

GOB 3

.....

MB1 MB2

.....

MB MB
10 11

.....

MB
12

.....

MB
22

MB
23

.....

MB
33

.....

48 pixels

288 pixels

352 pixels

Group of Blocks (GOB)


GOB 12
Picture

Y1 Y2
Y3 Y4

8 pixels

57

8
.....

.....

.....

8 pixels

.....

16 pixels

GOB 11

C1

C2

16 pixels

Macroblocks (MB)

64

Block
Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 10

ITU H.261
La compression Spatiale (Image I)
Cb

Cr

Pour chaque

Macrobloc

Macrobloc
Luminance

Quantification

Zig-Zag
Scan

Blocs
Chrominance

Pour
chaque
Bloc

DCT

DC
RLE

Codage
Entropique

. . . 10110010111

Huffman
AC

Diffrence avec JPEG


Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 11

ITU H.261
La compression Temporelle (Image P)
Image courante

Difference
Image Rfrence

Macrobloc
Luminance

meilleure
concordance

48

4
5
Blocs
Chrominance

Vecteur de
mouvement

Vecteur de
mouvement

64

Pour
chaque
Quantification

Zig-Zag
Scan

DCT

Bloc

DC
RLE

Codage
Entropique

. . . 10110010111

Huffman
AC

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 12

ITU H.261
Contrle de Flux
Contrle
Video IN

Video Out
Tampon de
transmission

Huffman

Quant

Vecteurs de mouvement

DCT

Q-1

-1

DCT

seuil

Compensation de
mouvement et Mmoire

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 13

ITU H.261
Flux Binaire compress
Niveau Image

Picture Temporal Picture


Type

GOB

Start Code Reference

Niveau Group
of Block

GOB

start code

Group
Number

Niveau Macro @ADDR TYPE


Block

Niveau Block

DC

Universit de Versailles
Laboratoire CNRS - PRiSM

Quantization Value

QUANT Vector

Val.

Val.

.......

GOB

MB

.......

CBP Bloc #0

.......

Val.

GOB

MB

....... Bloc #5

EOB

Ahmed Mehaoua - 14

ITU H.261
Flux Binaire compress (2)
Niveau image
PSC

TR

PTYPR

PEI

PSPARE

GOB DATA

Niveau groupe de blocs


GBSC

GN

GQUANT

GEI

GSPARE

MB DATA

Niveau macrobloc
MBA MTYPE MQUANT MVD

CBP

BLOCK DATA

Niveau bloc
TCOEF

EOB

PSC : Picture Start Code (20 bits)


TR : Temporal Reference (5 bits)
PTYPR : Type Information (6 bits)
PEI : Extra Insertion Information (1 bit)
PSPARE : Spare Information (16 bits)
GBSC : Group of Bloc Start Code (16 bits)
GN : Group Number (4 bits)

GQUANT : Quantizer Information (5 bits)


GEI : Extra Insertion Information (1 bit)
GSPARE : Spare Information (18 bits)
MBA : Macro-Block Address (variable)
MTYPE : Block Type Information (variable)
MQUANT : Quantizer Type (5 bits)
MVD : Motion Vector Data (variable)
CBP : Coded Block Patterns (variable)
TCOEF : Transform Coefficients (variable)
EOB : End Of Block (2 bits)

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 15

OSI MPEG-1
Dfinition:
norme de compression dimages animes et du son propose en 1991 par OSI.
Suppose un systme de communication fiable (bus PC)
naccepte que la vido progressive (non compatible avec format TV)

Regroupe 3 normes :
IS-11172-1 (Systme)
IS-11172-2 (Vido)
IS-11172-3 (Audio)

Application :
Ddi au stockage sur CD-Rom, Vido-CD, CD Interactif (Philips)
Qualit VHS avec dbit constant jusqu 1.8 Mbps (nx150 Kbp/s)

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 16

OSI MPEG-1
La compression dfinit 3 type dimages :

Image Intra (I)


Image Predictive (P)
Image Bidirectionnelle (B)

(codage JPEG)
(codage H.261)
(codage temporel amlior)

Ces images sont entrelaces pour former un groupe dimages

Formats vido accepts en entre :


SIF 352x288 jusqu 30 fps

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 17

OSI MPEG-1
Groupe dImages
Groupe d'images (GOP) (N = 12, M = 3)

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 18

OSI MPEG-1
Structure des images
Video Sequence
Group of Picture

....

....
8 pixels
8 pixels

Slice

Picture

Block

Macroblock

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 19

OSI MPEG-1
Structure du flux binaire
Squence

GOP 1

Groupe d'images
(GOP)

Image

Tranche

Macrobloc
(16 x 16) pixels

Bloc
(8 x 8) pixels

Universit de Versailles
Laboratoire CNRS - PRiSM

...

GOP 2

Image 1

...

Image 2

Tranche 1 Tranche 2

MacroBloc 1

GOP n

Image m

...

MacroBloc 2

Bloc 1

Tranche i

MacroBloc j

...

Bloc 2

Bloc 3

Bloc 46

Header

Ahmed Mehaoua - 20

10

OSI MPEG-1
BLOC : unit de traitement de la DCT
MACROBLOCK : unit de traitement de la compensation de
mouvements (en-tte contient le type de codage, les vecteurs de
mvts, echelle de quantification).
TRANCHE : unit autonome de codage et de resynchronisation du
codeur (en-tte contient position de la tranche dans limage)
IMAGE : unit daccs et daffichage (en-tte contient le numro de
squence)
GOP: unit de codage (en-tte contient info. dhorloge)
SEQUENCE: unit dinitialisation (en-tete contient valeur du dbit
binaire, ratio daspect, frequence dimages et matrices de
quantification).

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 21

OSI MPEG-1
Codage Bidirectionnel (Image B)
Image Rfrence Passe

Image courante B

Image Rfrence Future

VM1

VM2

Quantification

Zig-Zag
Scan

DCT

pour chaque
Bloc de 8x8

=
0

Macrobloc
Luminance

Blocs
Chrominance

Vecteurs de mouvement
VM1 et VM2

DPCM
DC
Codage
Entropique

RLE

. . . 10110010111
Huffman

AC

Universit de Versailles
Laboratoire CNRS - PRiSM

VM1 et VM2

Ahmed Mehaoua - 22

11

OSI MPEG-1
VCD
Dfinition : Video Compact Disk
Dvelopp en 1983 pour le support de la vido de qualit TV.
- VCD v1.0 (Codage MPEG-1 et lecture linaire)
- VCD v2.0 (Codage MPEG-1 avec accs interactif similaire CD-I)
- VCD 3.0 (MPEG-2)
Capacit :
680 Mo
70 Minutes de vido

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 23

OSI MPEG-1
CD-I
Dfinition : Compact Disk Interactive
Dvelopp en 1983 par Philips pour le support de la vido qualit
VHS.
Abondonn en 1999 pour le DVD
Codage MPEG-1 32 fps avec accs interactif
Cible : Lecture sur TV et non PC (plus simple, dbit unique et peu
coteux)
Capacit :
680 Mo
70 Minutes de vido

Lecteur CD-I peut lire VCD, CD Audio, et Photo-CD de kodak

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 24

12

OSI MPEG-2
Dfinition:
norme de compression dimages animes et du son propose en
1994 par OSI et UIT (H.262).
Regroupe 4 normes :

IS-13818-1 (Systme)
IS-13818-2 (Vido)
IS-13818-3 (Audio)
IS-13818-7 (DSM-CC) Digital Storage Media-Command and Control

Norme universelle pour le stockage et les communications vido


Qualit TVHD avec dbits variables ou constants jusqu 100Mbps
Accepte la vido entrelace (TV) et progressive (Informatique)
Compatible avec MPEG1 et B-ISDN/ATM
Robuste aux erreurs de communications

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 25

OSI MPEG-2
- Multiplexage Audio/Vido PES
Vido

Codeur
vido

Paqutiseur

Multiplexeur
Program
Stream

Program
Stream
(paquets de
longueur
variable, base
de temps
commune)

Paqutiseur

Multiplexeur
Transport
Stream

Transport
Stream
(paquets de
longueur fixe,
pas de base de
temps
commune)

Horloge

Audio

Codeur
vido

PES

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 26

13

MPEG-2 - Processus de Compression

ES : Elementary stream
PES : Packetized Elementary
Stream
TS : Transport stream
PS : Program Stream
AAL PDU

Cellule ATM

Bit

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 27

OSI MPEG-2
- Synchronisation -

Synchronisation des Flux audio et vido


Synchronisation des horloges du Codeur et du
Dcodeur

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 28

14

OSI MPEG-2
- Synchronisation Audio/Vido Au moyen de TimeStamps situs dans les en-ttes des
paquets Program Elementary stream (PES) :
le presentation video-conferencing time stamp (PTS) :
indique au dcodeur quel moment prsenter
linformation lutilisateur final.
le decoder time stamp (DTS) : indique au dcodeur
quand dcoder linformation situe dans ses buffers
audio et vido.

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 29

OSI MPEG-2
- Synchronisation des Horloges Les horloges du codeur et du dcodeur ont des compteurs cods
42 bits et incrments la frquence de 27 MHz :
Utilisation dune boucle verrouillage de phase (PLL)
Codes Program Clock Reference (PCR) : insrs
intervalles rguliers dans les en-ttes des paquets
Transport Stream.

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 30

15

OSI MPEG-2
- Compression 3 type dimages (I, P, B) avec compression images B amliore
+ 6 canaux audio (multilingues)
Formats vido accepts en entre :
CIF et SIF 352x288 jusqu 30 fps
CCIR 601 720x575 avec 30 fps
TVHD 1920 x 1152 avec 60 fps

Dfinition de profils (outils) et de niveaux (qualit)


Codage Hierarchique

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 31

OSI MPEG-2
- Profiles et Niveaux -

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 32

16

OSI MPEG-2
- Niveaux

Les niveaux (Levels) sont associs avec le format de la source et


dfinissent un niveau de qualit :
Low Level : un quart du format ITU-R Recommendation BT. 601.
Main Level : Plein format ITU-R Recommendation BT. 601.
High-1440 Level : Format Haute Definition avec 1440 chant/ligne.
High Level : Format Haute Dfinition avec 1920 chant/ligne.

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 33

OSI MPEG-2
- Codage Hierarchique A quoi a sert ?

Objectif :
Economiser les ressources de communication et
de stockage
Permettre des terminaux de
puissances/capacits diffrentes de
recevoir/visualiser les mmes squences vido en
ne traitant que les informations utilisables

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 34

17

OSI MPEG-2
- Codage Hierarchique (2)

Comment a marche ? :
Qualit 1

Flux vido de base

(2 Mb/s)

+
Flux v ido d'amlioration 1
Qualit 2
(1 Mb/s)

Flux v ido d'amlioration 2

Qualit 3
(500 Kb/s)

Total : 3.5 Mb/s au lieu de 7.5 Mb/s (3 Mb/s + 2.5 Mb/s + 2 Mb/s)
Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 35

OSI MPEG-2
- 4 modes de codage hierarchique

Codage hirarchique Temporel :


variation de la frquence dimages

Codage hirarchique Spatial :


variation de la taille dimages

Codage hirarchique SNR :


variation de la qualit de limage (taux de
compression)

Partitionnement des Donnes (Data Partitioning) :


variation de la qualit de limage (quantit
dinformation)

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 36

18

OSI MPEG-2
- Data Partitioning Flux de base

132 136 138 140 144 145 147 155

172

-18

15

-8

23

-9

-14

136 140 140 147 140 148 155 156

21

-34

24

-8

-10

11

14

19
7

140 143 144 148 150 152 154 155

-9

-8

-4

-5

-1
1

-10

-5

-4

150 152 155 156 150 145 144 140

-8

-2

-3

-3

144 145 146 148 143 158 150 140

-2

-4

-4

-1

150 156 157 156 140 146 156 145

-3

-4

148 145 146 148 156 160 140 145

-8

-4

144 144 146 145 149 150 153 160

DCT

Flux
complmentaires

Low Frequencies (well perceived by the HVS)


Block of 8x8 pixels

Medium Frequencies
High Frequencies (not perceived by the HVS)

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 37

MPEG-1 vs MPEG-2
MPEG1

MPEG2

Formats vido en entre

SIF
Progressif

Progressif / Entrelac

Dbit binaire

constant
( 1.856 Mbps)

Constant ou variable ( 100 Mbps)

Latence maximale

150 ms

150 ms

Codage hirarchique

non

SNR, spatiale,
partitioning

DCT

non entrelace

Trame
(progressive),
(entrelace)

Mode de balayage

zigzag

Zigzag et alternatif

Estimation de mouvement

macrobloc 16x16

CCIR-601, SIF 4:2:0, 4:2:2, 4:4:4

temporelle,

data
Image

non entrelace

Macrobloc 16x16, 16x8


Entrelace et non entrelace

Access image

Alatoire

Alatoire / Channel hopping

Vecteurs de mouvement

pour P, B seulement

Pour P, B et I
Vecteurs de mouvement I pour Error
Concealment (dissimulation)

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 38

19

OSI MPEG-2
- Applications Applications :
norme universelle pour le stockage et les communications vido
Haute qualit avec dbits variables ou constants jusqu 150Mbps
accepte la vido entrelace (TV) et progressive (Informatique)

DVD (Digital Video Disk) : stockage vido numrique


DVB (Digital Video Broadcast) : vido numrique par cble/satellite
VOD (Video On Demand) sur B-ISDN / ATM
TVHD (ATV USA)
D-VHS (JVC)

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 39

OSI MPEG-2
- DVD Digital Video Disk (Codage MPEG-2 Video).
Dvelopp en septembre 1995 par 10 companies (Hitachi, JVC,
Matsushita, Mitsubishi, Philips, Pioneer, Sony, Thomson, Time Warner,
et Toshiba) pour le support de la vido qualit cinma.
Renomm Digital Versatil Disk (vido, donnes, audio, jeux, )
Il y avait l'origine deux standards concurrents pour le DVD :
le format MMCD de Sony et Philips,
et le format SD de Toshiba et Time Warner

Un consortium men par IBM a insist pour quil ya ai un standard


unique, le DVD.

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 40

20

DVD
- Capacit et fonctions Capacit et fonctionnalits :

4.7 Go (une couche) - 2h13


8.5 Go (double couche) - 4h30 heures
17Go (double couche et double face) - 8 heures
6 canaux stro (PCM CD-Audio, Dolby Surround, DTS, .)
8 pistes audio (multilingues)
32 pistes de sous-titres
9 angles de vues
Zoom numrique X2 ou X4 dune zone

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 41

DVD
- Licences et copyright Toutes les socits fabricant des DVD doivent acqurir la licence
appartenant au consortium.
Les royalties sont de :
5% pour un lecteur de DVD-Vido,
6$ pour un lecteur de DVD-ROM et dcodeur
et 10 cents pour un disque.

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 42

21

DVD
- Formats Il faut distinguer le :
DVD-Audio : support de la musique uniquement
DVD-Vido : support audio-video avec lecture sur un TV
DVD-Rom : Audio/Video et lecture sur un PC (plus donnes info.)
DVD-R
DVD-RAM

: enregistrable une fois


: reiniscriptible

Un lecteur DVD peut lire les formats CD, VCD, CDI


Supporte MPEG2 video et MPEG1 video
Dbit : 3.5 Mbps
Dbit : 6 Mbps

qualit TV
qualit studio

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 43

DVD
- Systmes de Protection 6 rgions ont t dfinis par le DVD-Consortium pour rendre
incompatibles entres eux les lecteurs et les disques DVD :
1: Canada, tats-Unis et territoires rattachs
2: Japon, Europe, Afrique du Sud, Moyen Orient (incluant l'gypte)
3: Asie du sud-est, Est de l'Asie (incluant Hong Kong)
4: Australie, NZ, Ile du Pacifique, Amrique Centrale, Mexico, Amrique
du Sud, Carabes
5: CEI, Inde, Afrique, Core du Nord, Mongolie
6: Chine

Code 0 : Lecteurs compatibles toutes zones


Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 44

22

DVD
Systmes de Protection (2)
4 systmes de protection contre les enregistrements illgaux :

Analog Protection System (APS)


Empche la copie dun DVD sur VHS en analogique

Systme CGMS
C'est un systme de gestion de niveau de gnration de
copie (CGMS) conu pour empcher les copies numrique ou les
copies de copies.

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 45

DVD
Systmes de Protection (3)

Content Scrambling System (CSS)


mthode d'encryptage de donnes destine interdire la
lecture des fichiers directement sur le systme de fichier du
DVD via un PC.

Digital Transmission Content Protection (DTCP)


Pour les lectures la demande et distance sans possibilit
de raliser une copie localement

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 46

23

DVD Audio

Le format DVD-Audio require 2 modes de codage audio :


Le Linear PCM
Le Meridian Lossless Packing

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 47

DVD Audio
Linear PCM
Codage non compress/sans pertes (identique aux CD-Audio)
offrant jusqu' 6 canaux et un chantillonnage de 48, 96 ou 192
kHz (ainsi que 44,1/88,2/176,4 kHz) et une profondeur de codage
de 16/20/24 bits.
Le dbit maximum est de 6.144 Mbps.
La dynamique est de 96 dB avec 16 bits, ou 120 dB avec 20 bits.
La frequency response peut aller jusqu' 22 000 Hz partir
d'un chantillonnage de 48 kHz.
Toutefois, davantage de profondeur dans le codage et une
frquence d'chantillonnage plus grande sont utiles pour le travail
en studio ainsi que pour des traitements numriques pousss ou
pour une reproduction spatiale du son.
Les lecteurs de DVD doivent tre compatibles avec toutes les
variations du LPCM
Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 48

24

DVD Audio
Meridian Lossless Packing
Adopt en Aot 1998, il permet un codage sans pertes mais
compress. Les dures d'coutes de deux canaux 192
kHz/24 bit seront d'environ 120 140 minutes.

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 49

DVD Vido - Partie Audio

un DVD-Vido peut avoir 8 pistes audio. Chaque piste audio peut tre
de lun de ces trois formats :
Dolby Digital (anciennement appel AC-3): 1 5.1 canaux
MPEG Audio: 1 5.1 ou 7.1 canaux
PCM: 1 8 canaux.

Trois autres formats optionnels sont possibles mais tous deux


ncessitent des dcodeurs externes et ne sont pas compatibles avec
tous les lecteurs :
DTS
THX
et SDDS
Remarque : Le .1 fait rfrence au canal basses frquences (Low
Frequency Effects LFE) qui se branche un caisson de basses.
Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 50

25

DVD Vido - Partie Audio


Dolby Digital
Dolby Digital est le format utilis sur la majorit des DVD (en Zone 1).
Cest un format sonore numrique et mutli-canal, comprim, avec la
technologie de codage AC-3 de la socit Dolby Systems, partir du
PCM avec une frquence de 48 kHz sur 16 bits.
Le dbit est de 64 kbps 448 kbps, avec 384 kbps tant le dbit
normal des 5.1 canaux et 192 kbps tant le dbit normal de la stro
(avec ou sans codage surround).
Les combinaisons de canaux sont (front/surround) : 1/0, 1+1/0 (dual
mono), 2/0, 3/0, 2/1, 3/1, 2/2, et 3/2.
Le canal LFE est optionnel avec tous ces combinaisons.

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 51

DVD Vido - Partie Audio


MPEG Audio
MPEG audio est un format sonore numrique et multi-canal, comprim
partir du PCM avec une frquence de 48 kHz sur 16 bits. Le DVD
supporte le MPEG Audio layer 1 et 2 uniquement.
Le MPEG Audio Layer III (MP3) et le MPEG-2 Audio AAC ne sont pas
supports par le standard DVD-Vido.
Le dbit variable est compris entre 32 912 kbps, 384 kbps tant le
dbit moyen. Le MPEG-1 est limit 384 kbps.
Les combinaisons de canaux sont (front/surround) : 1/0, 2/0, 2/1, 2/2,
3/1, 3/2 et 5/2. Le canal LFE est optionnel.
Le 7.1 ajoute les canaux central-gauche et central-droit, mais peu de
systme exploiteront tous les canaux.

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 52

26

DVD Vido - Partie Audio


DTS
DTS (Digital Theater Sound) est un format sonore (optionnel)
numrique et multi-canal (5.1), comprim partir du PCM avec une
frquence de 48 kHz et en 20 bits.
Le dbit est de 64 1536 kbps (bien que le DTS Coherent Acoustics
puisse aller jusqu' 4096 kbps pour une compression sans perte).
Les combinaisons de canaux sont (front/surround) : 1/0, 2/0,3/0, 2/1,
2/2, 3/2. Le canal LFE est optionnel.
Le standard DVD inclut un format de flux audio rserv au DTS, mais
les lecteurs de premires gnrations ne le reconnaissent pas.

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 53

DVD Vido - Partie Audio


THX
THX (Tomlinson Holman Experiment) de la socit LUCAS
n'est pas un format sonore.
C'est tout simplement un ensemble de traitement appliqu
par les amplificateurs certifis THX.
Le traitement THX 4.0 est ajout au Dolby Pro Logic.
Le traitement THX 5.1 est ajout au Dolby Digital.

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 54

27

DVD Vido - Partie Audio


SDDS
SDDS (Sony Dynamic Digital Sound) est un format sonore
numrique et multi-canal (5.1 7.1), comprim partir du
PCM 48 kHz.
Le dbit peut atteindre 1280 kbps.
SDDS est un format sonore pour une diffusion en salle bas
sur le format de compression ATRAC qui est aussi utilis par
le Minidisc.
Sony n'a pas encore annonc son intention de mettre en
oeuvre le SDDS sur le DVD.

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 55

MPEG-2 DVB
- Digital Video Broadcast Consortium de 220 membres de 30 pays tablit en
Sept. 1993 sous legide de lETSI/ISO pour normaliser
la diffusion de la vido MPEG-2 numrique :
par cble

DVB-C

DVB-T
DVB-S
DVB-I
DVB-MS

par voix hertzienne


par satellite
Interactive
Multipoint (MMDS - < 10Ghz)

Avec prservation des fonctions des systmes analogiques


existants (Teletexte, brouillage, accs conditionnel, )

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 56

28

DVB
Codage Source / Canal
Codage source : Compression et Multiplexage
MPEG-2 Video
MPEG Audio Layer II (Musicam) (non compatible avec Dolby AC3)
TRANSPORT STREAM Multiplex
PROGRAM STREAM Multiplex

Codage Canal : Modulation


DVB-S (ETSI 300 421)

: QPSK Quadrature Phase Shift Keying

DVB-C (ETSI 300 429)

: QAM Quadrature Amplitude Modulation

DVB-T (ETSI 300 744)

: COFDM Coded Orthogonal Frequency


Division Multiplexing

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 57

DVB I et DAVIC
DVB coopre avec le consortium DAVIC (Digital Audio Visual
Council), pour la conception de services multimdia avancs
interactifs (Internet, VOD, etc ).
Le Groupe DAVIC favorise lmergence de services
audiovisuels numrique en laborant de nouvelles normes en
matire de protocoles, dinterfaces et dinfrastructures afin
daccrotre leur interoprabilit.
Les spcifications sont bases sur les travaux de lUIT, lATM
Forum, lOSI, le DVB, IETF, etc pour combler les lacunes.

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 58

29

DVB-S
Norme la plus rpandue et utilis dans les 6 continents.
Mode de transmission QPSK - porteuse de 36 Mhz - 39 Mbps
MPEG2 TS : Audio, Video et Donnes transports par des Paquets
MPEG2 Transport Stream de taille fixe (188 octets)
Codage pour protection contre erreurs :
Code Viterbi (2/3 : 33 % doverhead)
Code Reed Solomon (204/188 avec 16 octets de FEC : 8%overhead)
Entrelacement des octets avant transmission

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 59

DVB-T
Norme approuve par ETSI en Fevrier 1997.
Mode de transmission OFDM
robuste aux chos multichemins provoqu par les immeubles
1705 porteuses de 2kHz (receveurs de faible puissance)
6817 porteuses de 8Khz
Codage FEC Reed Solomon pour la protection contre les erreurs

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 60

30

DVB-C
Mode de transmission QAM
porteuses de 8Khz - 38.5 Mbps (64-QAM)
Codage FEC Reed Solomon pour la protection contre les erreurs

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 61

US ATSC DTV
ATSC : Advanced Television Systems Committee fonde en 1987 et
regroupant 200 membres internationaux pour la dfinition des normes de
Diffusion terrestre de la TV Digitale (DTV) :
basse dfinition : SDTV
Haute definition : HDTV (A/53)

Normes bases sur :


MPEG-2 Video
Dolby AC.3 pour le Son

Norme HDTV concurrente de DVB-T et DVB-C (Europeenne)


En 1996, le FCC (Federal Communications Commission) adopte la norme
ATSC/53 (Sept. 1995) pour les USA. Puis rejoint par le Canada, la Core
du Sud en 1997, Taiwan et lArgentine en 1998.
Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 62

31

US ATSC A/53
HDTV Grand Alliance
Canal de 6 Mhz :
38 Mbps par voie hertzienne (5x la TV classique)
19 Mbps par Cble

Frquence dchantillonage vido: 27 Mhz


Codage des Presentation (PTS) et Decoding Time stamps (DTS) sur 42 bits)
Rsolutions :
Video standard
SMPTE 274M

Active lines Active samples/ line


1080
1920
1080
1920

Frame Rate
60 Hz (Entrelace)
30 Hz (Progressive)

Ratio
1:1, 4/3, 16/9
1:1, 4/3, 16/9

Audio : Dolby AC.3 : 48 Khz 16 bit/s = 384 Kbps

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 63

VOD

On peut classer les services de VOD en plusieurs catgories (Niveau


dinteractivit):
No-VOD : Les services Broadcast similaire la TV broadcast, pour
lequel lutilisateur est passif et na aucun contrle sur la session.
PPV-VOD : Les services Pay-per-view pour lesquels lutilisateur paye
pour des programmes spcifiques, similaire au CATV PPV services.
Q-VOD : Les services Quasi Video-on-Demand pour lesquels les
utilisateurs sont regroups par profil/intrt, les utilisateurs peuvent
intervenir en changeant de groupe.
N-VOD : Les services Near Video-on-Demand, pour lesquels les
fonctions davance ou de retour sont rendues par transition dans des
intervalles de temps discret.
T-VOD : Les services True Video-on-Demand, pour lequel lutilisateur
a un contrle complet sur la session (fonctions VCR).

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 64

32

VOD
- Equipements -

Serveurs de stockage
Serveurs de contrle de session
Terminalx utilisateur (set-of-box)
Infrastructure de communication

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 65

VOD
- SERVEURS RAID Redundant Array of Inexpensive Disks :
Architecture de serveurs de stockage haute tolrance aux
fautes, disponibilit et dbits.

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 66

33

VOD
- SERVEURS RAID (2)RAID level 0 :
un seul contrleur - un seul canal SCSI - et plusieurs disques
Segmentation des fichiers en blocs de 4 Ko avec distribution sur
plusieurs disques

RAID level 1 :
idem level 0 avec en plus disques mirroring

RAID level 2 :
un seul contrleur - plusieurs canaux SCSI - accs parallle
entrelacement de bits de fichiers diffrents sur un mme disque
ajout de codes de Hamming pour le contrle d erreurs

RAID level 3 :
idem level 2
ajout de codes de parit sur un disque ddi

RAID level 4 :
idem level 3 mais entrelacement au niveau secteur

RAID level 5 :
idem level 4 avec retrait/insertion chaud de disques
Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 67

VOD
- Cluster Fibre channel

Technologie dvelopp en 1988 pour le raccordement


hauts dbits de plus de 128 devices (Rseaux/Canal)
Exemple de Canal : SCSI
Exemple de Rseau : Ethernet

Permet de crer des serveurs accs multiples en


architecture rpartie

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 68

34

VOD
- Cluster Fibre channel (2) Standardis en 1994 par ANSI et OSI
Architecture en 5 couches de niveaux 1 et 2.
Dbit : jusque 1062,5 Mbps
Taux de transfert utile : 800 Mbps
Encodage 8/10 : 200 Mbps
Correction derreurs : 62.5 Mbps

Multiples Topologies possibles (boucle, point--point)


Multiples supports possibles : fibre, coax, UTP
Distance : jusque 10 km
Indpendant des protocoles suprieurs : ATM, IP, etc ...

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 69

VOD
- SET OF BOX Il sagit dun botier install chez labonn et qui lui permet dinteragir avec
le serveur de VoD partir de la tlvision ou de lordinateur, par
lintermdiaire dune tlcommande et/ou dun clavier

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 70

35

SET OF BOX
- Fonctions Dcompresser en temps rel le flot vido arrivant au botier
(MPEG1, MPEG2, ) ;
conversion N/A des flux vido (PAL, SECAM, NTSC) et afficher le
bon format lcran ;
Transmettre les requtes clients au serveur ;
Possder une capacit de stockage (mmoire) suffisante pour
contrler la gigue.
Contler les accs aux programmes (SimulCrypt,
Possder diffrentes interfaces rseaux (ADSL, FTTC, HFC,
ATM) et utilisateurs;

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 71

VOD
- Rseaux Solution propose par lATM Forum :

protocole ATM
protocole AAL5
Codage MPEG-2 CBR
Service ATM - CBR

Solutions proposes par IETF (Internet) :


sans serveur de streaming (HTTP)
avec serveur de streaming (RTP/RSTP)
compression H.263 ou codeurs propritaires

Boucle locale :
xDSL
FTTH
Cble ou HFC (Hybrid Coax-Fiber)
Hertzien (MMDS)
Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 72

36

UIT H.263
Dfinition:
norme de compression vido base sur H.261 et ddie la
vido trs bas dbits sur Internet, Rseaux locaux et
rseaux mobiles.
Dbits entre 5 Kbps 64 Kbps
Attendue pour fin 1999.
Incorpore dans le standard de terminal multimdia H.323
Applications : VidoConference sur IP, UMTS.

Formats vido en entre accepts :


CIF et SIF
QCIF
SQCIF

352x288
176x144
128x96

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 73

UIT H.263+
Dfinition:
Norme de compression vido base sur le codage
morphologique
Dbits entre 5 Kbps 100 Mbps
Incorpore dans la version 1 de MPEG-4
Applications : Vido sur IP, UMTS, .

Formats vido en entre accepts :


idem H.263
+ 2 fomats de haute qualit :
4CIF
16 CIF

Universit de Versailles
Laboratoire CNRS - PRiSM

704x576
1408x1152

Ahmed Mehaoua - 74

37

MPEG-3

Dfinition:
Norme de compression A/V ddie la TV
numrique haute dfinition.
Abondonne car application intgre dans MPEG2

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 75

MPEG-4
Dfinition:
Norme multimdia et non une norme spcifiant une technique de
Compression audio et/ou Vido.
MPEG-4 dfinit en ralit un :

ensemble doutils (de compression, de correction


derreurs, pour linteractivit et la scalibility)
un langage de description des objets multimdia et des
mcanismes pour les coder et les manipuler

Disponibilit :
Dbut de la normalisation : 1993
Version 1 - disponible depuis fin 1998 (intgre H.263+)
Version 2 - disponible fin 1999 - dbut 2000

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 76

38

MPEG-4
- Fonctionalits MPEG-4 ne cible pas des applications en particulies mais
propose un ensemble doutils pour une meilleure :
INTERACTIVITE :
Accs aux donnes multimdia par le contenu
(Content-based Multimedia Data Access Tools)
Manipulation des donnees et des flux multimdia par le contenu
(Content-based manipulation and bit-stream editing)
Codage de donnes multimdia naturelles et de synthses
(Hybrid natural and synthetic data coding)

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 77

MPEG-4
- Fonctionalits (2) COMPRESSION :
Meilleure taux de compression avec meilleure qualit visuelle subjective
(Improved coding efficiency)
Compression de flux/vues multiples et concurrents
(Coding of multiple concurrent data streams)

Codage hirarchique par le contenu

(Content-based scalability)

Robuste aux bursts derreurs

(Robustness in error-prone environments)

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 78

39

MPEG-4
- Edition/Manipulation -

- Incrustation de logos ou de sous-titres


Avant MPEG4 : dcompresser - diter - recompresser do dgradation de la qualit
Avec MPEG4 : insertion/limnination/modification
dobjets visuels dans lespace de compression possible

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 79

MPEG-4
- Stockage -

Avant MPEG4: mme fond de scne stock plusieurs fois


Avec MPEG4: un seul fond de scne stock

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 80

40

MPEG-4
- Transmission -

Avant MPEG4 : 3 niveaux de qualits (au niveau scne).


Avec MPEG4: 11 niveaux de qualits diffrentes (au niveau
objet) avec limination adaptative des objets multimdias
inutiles

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 81

MPEG-4
- Dcodage -

Avant MPEG4: dcodeur ncessaire avant affichage.


Nombreuses mises jours ncessaires

Avec MPEG4: tlchargement dynamique du dcodeur


avant la squence vido.

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 82

41

MPEG-4
- Prsentation -

Avant MPEG4 : rcepteur passif


Avec MPEG4 : rcepteur actif avec possibilit de composer
dynamiquement les scnes.

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 83

MPEG-4
- AVOAudio Visual Object (AVO) :
Une scne vido est dcompose en objets multimdia
indpendants,
Object visuel : une personne, un meuble, une carte,...
Objets audio : voix dune personne, le bruit de moteur
dune voiture,
Object donnes : texte, sous-titre, ...

Ces objets peuvent tre :


Naturels ou synthtiques : ils peuvent provenir dune
camra ou dun ordinateur. Un mixage est fait entre des
sources relles et des sources synthtiques.
en 2D ou 3D.
Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 84

42

MPEG-4
- Codec Vido -

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 85

MPEG-4
- Motion Estimation -

VOP : Video Object Plan

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 86

43

MPEG-4
- Motion Estimation -

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 87

MPEG-4
- System Objectifs :
La reprsentation/description des objets naturels ou de
synthses (API, C++, JAVA)
composition de scnes (BIFS : BInary Format for Scene)
issue de VRML

La gestion des donnes audiovisuelles (multiplexage


TransMUX, synchronisation, gestion des tampons mmoires).
La configuration des diffrents composants dun systme
MPEG-4

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 88

44

MPEG-4 - Architecture Decoding

N
e
t
w
o
r
k

TransMux

FlexMux
Primitive
AV Objects

Composition and
Rendering

...

...

...
Ex: MPEG-2
Transport

Elementary
Streams

BIFS

Audiovisual Interactive
Scene

Display and
Local User
Interaction

Object Descriptor
Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 89

MPEG-4
- Codage hierarchique Qualit 1

Flux vido de base

+
Flux vido d'amlioration 1
Qualit 2

Flux vido d'amlioration 2

Universit de Versailles
Laboratoire CNRS - PRiSM

.....

.....
Flux vido d'amlioration # N

Qualit 3

Qualit N

Ahmed Mehaoua - 90

45

MPEG-4
- AUDIO Objectifs :
Capable dintgrer les toutes dernires et futures technologies
de compression des images (Fractales, Ondellettes) et du sons
(TwinVQ, AAC).

Le codage des sons gnriques synthtiques se fait grce


un langage de description SAOL (Structured Audio
Orchestra Language) qui permet de dfinir un orchestre
dinstruments pouvant gnrer des sons sortant dun
instrument. MPEG4 ne dfinit pas la faon de synthtiser
un son mais la faon de dcrire la manire de le
synthtiser. Cela permet de dcrire donc dans le futur des
nouvelles mthodes de codage de sons.
Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 91

MPEG-4 v1 vs MPEG-4 v2

Possibilit de raliser efficacement du codage multi-vues


Amination des corps et objets
Amlioration du son (effets spatial, etc )
BIFS amlior (gestion multi-utilisateurs dune mme scne)
Dfinition dun nouveau format de stockage dobjets MPEG-4: .M4F

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 92

46

Codage Audio
- UIT Normes

Dbits qualit Voix

G.711
G.728
G.722
G.723

64 Kbps (PCM)
16 Kbps (ADPCM)
8 Kbps
5.3 Kbps

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 93

Codage Audio
- OSI MPEG-1 et MPEG-2 -

Compression
Layer 1
Layer 2
Layer 3

1:4
1:6 ..8
1:10..12

Universit de Versailles
Laboratoire CNRS - PRiSM

Dbits

Dlais

Complexit

192-440
96-128
8-56-64

19 ms
35 ms
59 ms

basse
moyenne
leve

Ahmed Mehaoua - 94

47

Codage Audio
- OSI MPEG-4 -

AAC
TwinVQ

Origine

Compression

Dbits Qualit CD

ATT
NTT-Yamaha

1:15
1:15

96 Kbps
80-96 Kbps

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 95

MPEG-7
Dfinition:
Pas une norme de compression
Ddie la description smantique des squences vido
Attendue pour 2002.

Objectif :
Pour linterrogation de bases de donnes multimdia.
Exemples de requte : Retouver toutes les squences vido :
comportant une voiture rouge.
avec cet chantillon de voix.
avec ce visage

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 96

48

Technologies Propritaires
Formats les plus rpandus pour les PC / MAC et sur Internet :
- QuickTime (Apple)
- Indo (Intel)
- CinPack (Cinpack)
- RealVideo (Real Networks)

Problme : non compatibles entre eux - besoin de pr-tlcharger


chacun des dcodeurs - volutivit.

Universit de Versailles
Laboratoire CNRS - PRiSM

Ahmed Mehaoua - 97

49