Le Signal Video Numerique PDF

Par : Jean DANIEL (Canada) http://pages.videotron.
com/danjean/
Guide Simplifi du signal vido Analogique NTSC
En Amrique du Nord, le standard pour les signaux vido analogique est appel
NTSC, qui nest pas le mme que pour les ordinateurs (VGA). Le vido tant un
mdium linaire, tout comme laudio, mais au contraire du film ou de la
photographie, il a t cr lorigine pour tre transmis "via les airs". Les images
doivent donc tre spares et transmises ou enregistres en une srie de lignes, une
aprs lautre. Ce qui fait qu nimporte quelle milliseconde, une image vido ne sera
simplement quun point se "promenant" sur un moniteur.
Le systme analogique que nous utilisons prsentement t tabli dans les annes
30, la couleur y a t ajoute au dbut des annes 50. Cest ce moment que le nom
NTSC est apparu, reprsentant le National Television Systems Committee, qui est le
comit qui tabli les standards utiliss en tlvision analogique actuellement. Il est
form de 525 lignes, avec un taux de rafrachissement de 30 frames/secondes
(29,97f/s).
Avec la tlvision numrique, le signal vido est reprsent par des chiffres (0 & 1).
Mais avec le signal analogique tout est reprsent par des voltages, et les voltages
sont affects par les longueurs de cbles, les connecteurs, la chaleur, les rubans, etc
& Idots; Cest pourquoi plusieurs ingnieurs vido affirment, la blague (???), que
NTSC veut plutt dire "Never Twice The Same Color"(jamais deux fois la mme
couleur). Deux autres systmes sont galement utiliss comme standards de
diffusion analogique, PAL (Phase Alteration Line), compos de 625 lignes, mais avec
un taux de rafrachissement de 25 frames/secondes et SECAM (Systme lectronique
pour Couleur Avec Mmoire), qui a la mme composition que PAL, mais dont la
couleur (Chrominance) est module en FM. PAL, comme NTSC, est aussi utilis pour
les enregistrements vido alors que SECAM est essentiellement un standard de
transmission.
Diffrents pays utilisent diffrents standards, cest pourquoi un signal de test a
finalement t dvelopp, quon a appel les "barres de couleur"(Color Bars) et qui
sont utilises comme standard pour assurer la consistance des images prsentes.
Les barres de couleurs "SMPTE" sont celles que nous rencontrons le plus souvent en
Amrique du Nord. SMPTE est labrviation de Society of Motion Picture and
Television Engineers , qui sont responsables dtablir la majorit des standards
utiliss en tlvision et au cinma. Ce signal est gnr par un gnrateur de barres
ou par une camra vido professionnelle. On les insre au dbut dune cassette afin
de permettre l'ajustement des couleurs et du niveau vido du document enregistr
sur la cassette. Pour lajustement, on utilise essentiellement deux outils;
Le Moniteur "Waveform":
Le moniteur waveform est un oscilloscope qui a t configur pour le signal vido. On
lutilise pour mesurer le voltage du signal et pour sassurer que toutes les pulsations
et tous les balayages du signal apparaissent au bon moment. Lutilisation premire
du waveform est de mesurer les diffrents niveaux de limage. Ces niveaux ne
doivent pas dpasser 100%(IRE), ni descendre sous la barre de 7.5%(IRE). Un signal
qui serait trop haut sera surexpos, alors quun signal qui serait trop bas sera trop
noir. En gnral, la couleur de la peau se situe autour de 70%, alors quun blanc avec
peu de dtails sera autour de 90-100% et des ombres seront en bas de 30% sur
lchelle.
Le "Vectorscope" :
Le vectorscope est un autre oscilloscope spcialis. Sa fonction est de mesurer
linformation relative aux couleurs. Dans le signal vido analogique, la couleur est
encode dans le signal principal laide dun "sous-transporteur"(SubCarrier). Cest
linformation des couleurs inscrites sur ce "sous-transporteur" qui est mesure par le
vectorscope. Elle est prsente lintrieur dun cercle. Au lieu de mesurer lintensit
des couleurs, elle mesure la saturation et la teinte (Hue). Le centre du cercle est
neutre, donc plus une couleur est prs du centre, moins elle est sature ou plus prs
du blanc et plus elle est loin du centre, plus elle est sature, ou fonce. Une couleur
peut tre fonce et trs sature ou claire et moins sature. Un noir ou un blanc
seront reprsent par un point au centre du cercle.
Le Correcteur de base de temps("Time Base Corrector ou TBC"):

De lui-mme, un magntoscope est incapable de jouer un signal assez stable pour
tre transmis correctement ou mme coup un autre signal (ex: en montage), sans
"dbarrer". Un TBC est donc utilis pour synchroniser le magntoscope avec les
autres signaux lintrieur du systme. Tous les quipements de diffusion (ou
montage) sont synchroniss partir dun signal commun, gnr par un gnrateur
de synchronisation (master sync generator). Sinon il y aurait perte de
synchronisation (limage roule et se dtriore) chaque fois quon change de source
et les fondues entre diffrentes sources seront impossibles.
Les TBC ont galement une autre fonction. Ils sont utiliss pour ajuster les niveaux
vido et de couleurs sur les magntoscopes. Quatre ajustements sont alors utiliss
qui ressemblent assez ceux dun moniteur tl. Chrominance/Saturation, Teinte
(Hue)/Phase, Luminosit (Brightness)/Black level et Contrast/Video level. On utilise
les barres de couleurs, normalement enregistres au dbut dun document, et la
combinaison Waveform/Vectorscope pour faire les ajustements ncessaires.
Le niveau vido est ajust grce au Waveform, de faon ce que la barre la plus
haute soit 100%(IRE) et le niveau de noir soit 7.5%(ligne pointille juste sous la
barre des 10%). Ensuite, on ajuste les niveaux de Chroma et Hue/Phase, avec le
Vectorscope, de faon ce que les 6 points soient lintrieur des 6 petites boites
tiquetes R, G, B et Y, C, M, les couleurs primaires et leur complments (Red,
Green, Blue, Yellow, Cyan et Magenta).
Le Code Temporel("Time Code"):
Le code temporel facilite l'assemblage des images lors du pr-montage et du
montage en assurant le reprage prcis des plans monter par l'indication de la
position en heure (HH :), minute(MM :), seconde(SS :) et numro d'image(FF: F pour
Frame). Le nombre d'images par seconde varie en fonction du support utilis: 24
images par seconde pour le cinma; 25 images par seconde pour la tlvision
europenne; 30 images par seconde pour la tlvision noir et blanc amricaine et
pour les applications strictement musicales; 30 images drop frame* par seconde pour
la tlvision couleur nord-amricaine. Ce code permet aussi la synchronisation entre
l'image et le son lorsqu'ils se prsentent sur deux supports diffrents, bande vido et
bande audio, disquette, etc.
Le code temporel longitudinal (LTC: Longitudinal Time Code) est destin tre
enregistr sur la piste audio d'un magntoscope. Le code temporel vertical(VITC :
Vertical Interval Time Code) est destin tre enregistr dans l'image vido(pendant
l'intervalle vertical, normalement sur les lignes 16 & 18) et peut tre lu des vitesses
trs lentes, mme lors d'un arrt sur image. Le code temporel MIDI (MTC: MIDI Time
Code) est destin tre lu par les appareils rpondant la norme MIDI et la norme
de synchronisme sur le code SMPTE. Il ncessite la prsence d'un convertisseur
SMPTE/MTC. Le code temporel SMPTE est un signal binaire de 80 bits, enregistr
sous forme analogique o les valeurs des 0(zro) correspondent une tension faible
et les valeurs des 1 une tension leve. On dit aussi chronocode.
Le premier codage temporel date de 1967(socit EECO). Deux ans plus tard, un
code temporel normalis est adopt aux tats-Unis par la Society of Motion Picture
and Television Engineers (SMPTE), et en Europe par l'Union europenne de
radiodiffusion(UER, en anglais EBU: European Broadcasting Union).
* Time code Drop Frame: Le signal vido comprend en ralit 29,97
frames/secondes, pour compenser ceci et arriver une dure relle prcise, on laisse
tomber des frames chaque minute, pour un total de 4 secondes/heure.
Le Signal Vido Numrique
Le principe de la numrisation d'une image vido est assez simple. La premire tape
consiste sous diviser chaque image vido selon une rsolution donne
(normalement 720 x 576 pixels pour une image vido normale) et associer une
valeur numrique chacun des lments qui forment la couleur de ce pixel (YUV ou
RGB) en utilisant une table de conversion de couleurs (normalement 24 bits par
pixels pour 16 millions de couleurs possibles en chaque point).
Ce procd de conversion doit se faire trs rapidement tant donn qu'une image
vido traditionnelle contient plusieurs milliers de pixels et que la vido analogique
PAL dfile 25 images par seconde. Heureusement, il existe actuellement sur le
march plusieurs puces permettant d'accomplir cette tche en temps rel.
L'image vido non compresse:
Si un signal vido (en NTSC) de 720x486 pixels de rsolution est numris en
utilisant la norme YUV 4:2:2, le fichier rsultant sera de 683.44 Ko par image ou
20.02 Mo/sec. C'est ce qu'on appelle le format non compress de ratio 1:1. Ces
valeurs sont calcules de la faon suivante:
720 pixels X 486 pixels X 16 bits/pixel= 699,840 octets/image.
Conversion octets/image en Koctets/image,
699,840 octets/image x 1 Ko/1024 octets= 683.44 Ko.
Conversion Koctets par image en Koctets par seconde,
683.4 Ko/image X 30 images/sec.= 20502 Ko/sec.
Conversion Koctets par seconde en Moctets par seconde,
20503.2 Ko/sec. X 1 Mo/1024 Ko = 20.02 Mo/sec.
Note: Ces calculs sont valides pour le format NTSC. Pour le PAL, les calculs donneront
environ 19.78 Mo/sec. en se basant sur la rsolution 720 x 576 pixels 25
images/sec.
Les limitations techniques:
La capacit de stockage:
Avec un dbit d'environ 20 Mo/sec, la vido numrique non-compresse exigerait
donc plus de 1.2 Go d'espace disque pour capter 1 seule minute de vido.
La rapidit de transmission:
L'autre problme auquel on doit actuellement faire face avec la vido numrique est
le transfert de ces donnes en format numrique. Certaines technologies permettent
actuellement le transfert des donnes vido numriques non-compresses sauf
qu'elles ne sont pas toujours facilement accessibles. Pour les technologies plus
accessibles il faut donc penser a rduire le dbit des donnes.
Les solutions pour rduire le dbit:
Le problme est donc de diminuer au maximum le nombre de bits ou d'octets utiliss
pour reprsenter une image et, par l, de rduire le dbit binaire ncessaire pour la
transmettre. La premire solution est de diminuer le nombre d'images par secondes,
sauf qu'en dessous de 15 18 images par secondes notre oeil commencera capter
une saccade plutt dsagrable.
La deuxime possibilit est de rduire le nombre de points de l'image par 2 ou par 4
sauf que la qualit visuelle de l'image rsultante sera passablement rduite, voire
mme inacceptable. La troisime possibilit est de coder moins d'informations de
couleur, sur 2 octets (16 bits) par pixel en 64 000 couleurs, par exemple, ou encore
sur un seul octet par pixel en palette de 256 couleurs. Pour les applications
multimdia, cette solution est acceptable et d'ailleurs trs recommande pour les
prsentations multimdia, mais pas pour le montage vido, mme amateur.
Toutes ces mthodes auront bel et bien pour effet de rduire le dbit des donnes,
mais la dgradation de l'image sera si importante que mme un amateur la
rejetterait. La seule vraie solution au problme de dbit est apporte par la
compression, aussi appele Bit Rate Reduction (Rduction du dbit binaire). Plusieurs
mthodes ont t mises au point avec plus ou moins de succs.
La compression des donnes:
Tout d'abord, il est important de savoir que les techniques de compression du flux de
donnes numriques sont principalement bases sur une constatation : une image
contient normment d'informations redondantes, redondance dont on peut
distinguer deux types:
La redondance spatiale:
Lorsque des informations sont similaires ou se rptent dans des zones de l'image
proches l'une de l'autre (dans une image, deux points voisins sont souvent
similaires).
La redondance temporelle:
Lorsque des informations se ressemblent ou se rptent dans le temps, mme si leur
position dans l'image a chang (deux images successives sont souvent relativement
similaires).
La compression va donc consister dterminer ces redondances et les liminer. La
contrainte lie la qualit de l'image nous oblige tre capables de reproduire
l'image originale intacte ou, tout au moins, une image trs proche de celle-ci. Cette
dfinition nous amne envisager deux types de techniques pour la compression.
La compression avec perte d'information:
Il existe diffrentes techniques permettant d'obtenir des facteurs de compression
nettement plus levs qu'avec les techniques rversibles. Mais, avec de telles
mthodes, l'image reconstruite aprs dcompression, bien qu'elle reste proche de
l'image originale, n'est plus identique. On parlera alors de mthodes de compression
irrversibles.
Cependant, mme si elles induisent des pertes d'informations dans les images, en
choisissant judicieusement le type d'informations qui seront perdues ou dgrades, il
est nanmoins possible de reconstruire des images d'une qualit telle que l'oeil
humain ne pourra les distinguer des images originales. En effet, l'oeil est plus
sensible certaines notions qu' d'autres. Ainsi, une dgradation des couleurs dans
une scne remplie d'objets en mouvement rapide passera inaperue alors qu'une
faible perte de qualit dans une image fixe comportant un dgrad de couleurs sera
immdiatement perue. Ces particularits de l'oeil humain sont exploites depuis le
dbut de la vido.
La vido numrique utilise galement au maximum les particularits de l'oeil humain

lorsqu'il s'agit de compression d'images. Nous obtenons ainsi une compression
visuellement sans perte d'informations. De ces constatations sont nes plusieurs
classes de mthodes de compression:
Le Variable Length Coding(VLC):
Il se base sur la constatation que certaines combinaisons de pixels sont plus
frquentes que d'autres. Ds lors, en recensant toutes les combinaisons possibles
d'un nombre donn de pixels, il est possible d'en tudier leur frquence d'apparition
dans une image. On attribue alors chaque combinaison un code dont la
longueur(nombre de bits) est d'autant plus faible que la combinaison apparat
souvent dans l'image. La premire application de cette mthode est bien antrieure
la vido. Le code morse rejoint la mme ide.
Le Differential Pulse Code Modulation(DPCM):
Il se base sur la constatation que, dans la plupart des images, les diffrences entre
deux pixels adjacents sont souvent faibles, les transitions franches (par exemple: un
rectangle noir sur un fond blanc) tant assez rares. Il est donc envisageable,
connaissant la valeur d'un pixel, de prdire la valeur de son voisin.
La Discrete Cosine Transform(DCT):
Elle se base sur la transformation d'une reprsentation spatiale d'un bloc de pixels,
c'est--dire position horizontale, verticale ainsi que l'amplitude, en une
reprsentation sous forme mathmatique diffrente. Cette reprsentation plus
compacte de l'image requiert de traiter moins d'informations. En effet, cette nouvelle
reprsentation ne se base plus sur une analyse spatiale (positions horizontale,
verticale et amplitude) mais sur une analyse frquentielle savamment calcule. Cette
technique est rendue possible grce l'utilisation d'une variante des sries de
Fourier. Celles-ci permettent de reconstruire une fonction partir d'une somme de
sinusodes multiplies chacune par un certain coefficient dit "de Fourier". La DCT
s'apparente cette mthode. La DCT, en elle-mme, ne comprime donc pas l'image.
Elle la reprsente simplement sous une forme qui se prte beaucoup mieux la
compression. Il ne reste alors plus qu' appliquer un codage intelligent des diffrents
coefficients.
La compression sans perte d'informations(Lossless):
Pour plusieurs personnes, rien ne peut rivaliser avec un original. En fait, la
compression "Lossless" est suprieure la vido non-compress dans le sens que la
qualit est identique et qu'en plus on sauve de l'espace disque tant donn que le
signal est compress. Le problme est qu'tant donn qu'il y a trs peu de
redondance dans une image vido, le gain n'est seulement que de 50% en moyenne.
Les standards actuels de compression:
Plusieurs standards de compression ont dj t dvelopps. Voici une liste non
exhaustive des mthodes de compression rencontres le plus frquemment ainsi que
leurs champs d'application.
Le JPEG(Joint Photographic Experts Group):
Il s'agit d'un standard international pour la compression d'images couleurs fixes
stockes sous forme digitale. la base, ce standard fut conu pour le monde de
l'impression et de la photocomposition. Il accepte n'importe quelle dfinition, tant
verticale qu'horizontale et autorise un nombre de bits par pixel compris entre 1 et 32.
La technique de compression utilise est base sur la Discrete Cosine Transform
(DCT). Cependant, conu pour les images fixes, il ne convient pas la compression
de squences vido.
Le Motion JPEG:
Il s'agit d'une extension du JPEG qui permet de traiter des squences d'images. En
ralit, il se contente de considrer une squence vido comme une succession
d'images fixes, chacune d'elles compresse sparment en utilisant le standard JPEG.
Puisque chaque image est compresse indpendamment des autres, le Motion JPEG
permet le montage l'image prs. Tant que l'on se contente de facteurs de
compression relativement faibles (de 2:1 4:1) il peut s'appliquer du travail de
production ou de postproduction de qualit et, optimis, il est quasi transparent.
Toutefois, lorsque le facteur de compression devient plus important (au del de
10:1), la dgradation des images devient telle qu'elle est aisment perceptible par
l'oeil humain. En outre, ces dgradations s'additionnent d'une gnration l'autre,
jusqu' devenir rapidement inacceptables.
Le MPEG(Moving Pictures Experts Group):
Comme nous venons de le voir, tant que l'on se contente de compresser des
squences vido en considrant chaque image sparment, le facteur de compression
peut difficilement dpasser 4:1 si l'on souhaite conserver un niveau de qualit
compatible avec un usage professionnel. Pour atteindre des facteurs de compression
suprieurs, il faut se baser sur les similitudes existant entre plusieurs images
successives. Cette constatation a donn naissance au standard MPEG. l'origine, le
standard MPEG prvoyait 4 niveaux (d'autres s'y sont ajouts depuis):
MPEG-1: destin aux applications multimdia.
MPEG-2: extension de MPEG-1 permettant d'obtenir une qualit d'image suprieure.
MPEG-3: destin la tlvision haute dfinition. Cependant, MPEG-2 s'est rvl
tellement performant qu'il a rendu inutile le dveloppement de MPEG-3.
MPEG-4: Originalement destin aux communications mobiles, sa forme originale n'a
rien voir avec le monde de la vido broadcast. D'autres dveloppements futurs
seront surveiller.
Le but du MPEG-1 tait de produire des images de qualit quivalente au VHS tout en
parvenant descendre un dbit binaire de l'ordre de 1.2 Mbits/seconde(1.5
Mbits/seconde en incluant le son).
Le MPEG-2 fut conu pour traiter des squences d'images entrelaces. Le but tait de
produire des images de la qualit d'un systme vido composite avec un dbit binaire
de l'ordre de 4 8 Mbits/seconde ou des images de haute qualit avec un dbit de 10
15 Mbits/seconde. Les domaines d'application principaux de MPEG-2 sont lis la
distribution de programmes vido: diffusion par satellite, tldistribution, Digital
Video Disc.
Comme on peut le voir, le MPEG offre un vaste ventail de possibilits, semble
flexible et permet d'atteindre une bonne qualit d'image. Ds lors, pourquoi ne pas
l'utiliser tout au long d'une chane de production vido professionnelle? Les raisons
sont multiples: MPEG conduit des systmes fortement asymtriques; le processus
de compression est beaucoup plus complexe que le processus de dcompression. Il
faut donc une puissance de calcul de loin suprieure pour la compression que pour la
dcompression. Ceci ne pose pas de problme lorsqu'il s'agit de distribuer des images
car, par dfinition, on compresse un seul endroit, lors de l'mission, puis l'on
diffuse les images qui sont dcompresses sur de multiples rcepteurs. Dans le cas
d'une chane de postproduction, il en va tout autrement; il faut pouvoir compresser et
dcompresser chaque maillon de la chane. De plus, le systme MPEG n'a pas t
conu pour faire du montage l'image prs, ce qui est un des pr-requis majeurs
pour faire de la postproduction. Des gnrations successives, entrecoupes de
traitements (effets), peuvent induire une perte de qualit qui s'avrera rapidement
inacceptable. MPEG n'a pas t conu pour permettre des oprations telles que le
"chroma key".
Paralllement aux travaux de MPEG, le secteur informatique a dvelopp ses propres
solutions pour amener la vido sur les crans des micro-ordinateurs. Les possibilits
d'affichage et de traitement permettaient, ds la fin des annes quatre-vingt,
d'afficher des images (fixes) de haute qualit, et de crer des animations

lmentaires.
Quicktime:
Apparu en 1991, Quicktime a t intgr au Systme 7 des Macintosh. Il s'agit d'un
environnement de dveloppement et d'excution qui permet d'associer des donnes
classiques des fichiers reprsentant des squences sonores ou vido. Quicktime
comprend essentiellement des formats de donnes standardiss, des procds de
compression/dcompression, et une interface utilisateur spcifique. L'extension
systme utilise est fonde sur le principe du maintien de l'isochronie des donnes,
et introduit donc le temps comme lment principal du systme d'exploitation.
Quicktime est surtout conu comme un ensemble de spcifications trs ouvert,
capable d'intgrer facilement un grand nombre d'volutions matrielles et logicielles,
sans remettre en cause les applications existantes.
Vido pour Windows:
Vido pour Windows est un ensemble logiciel commercialis par Microsoft permettant
la captation et la restitution de vido anime sur PC. L'excution de squences vido
est possible sans matriel spcifique, alors que la captation doit tre faite au moyen
d'une carte de numrisation. Une large compatibilit est permise grce la dfinition
de spcifications permettant d'intgrer des matriels aux fonctionnalits diffrentes.
Ainsi, travers un ensemble de pilotes, Vido pour Windows sera capable de
supporter des priphriques aux fonctionnalits diverses tout en assurant, autant que
possible, les fonctions manquantes au niveau logiciel.
Pas plus que Quicktime, Vido pour Windows n'est pas un algorithme de
compression. Il s'agit plutt d'une interface standardise entre le matriel et les
procds de codage et de compression, qui offre des API (interfaces de
programmation) relativement indpendantes du matriel. Cependant, comme Apple,
Microsoft a galement dfini des algorithmes de compression adapts diffrentes
situations (Microsoft Vido 1, Microsoft RLE compressor), et intgre ceux proposs
par des socits tierces, comme Indeo d'Intel. Plus qu'une technique de compression,
Vido pour Windows fournit en fait une plate-forme commune sur laquelle pourront
s'articuler divers procds de codage.
Le Digital BETACAM:
Propos par Sony, il est driv de techniques JPEG qui ont t soigneusement
adaptes aux travaux de post-production de haute qualit. Il utilise des signaux vido
4:2:2 et leur applique un facteur de compression faible de 2:1. Chaque trame tant
compresse sparment, il offre toutes les possibilits de montage requises pour un
usage professionnel. Son principal inconvnient est son faible facteur de
compression. Il est principalement utilis pour les applications de type Broadcast.
La Digital Video Cassette (DVC):
Il s'agit d'un nouveau format de cassette vido digitale dvelopp par le HD Digital
VCR Consortium form l'origine par Sony, Matsushita, Philips, Thomson, Toshiba,
Hitachi, JVC, Sanyo, Sharp et Mitsubishi. Ces 10 socits ont uni leurs efforts pour
proposer, en juillet 1993, la premire spcification du format DV. Par la suite, de
nombreuses autres socits se sont jointes au consortium qui compte aujourd'hui
plus d'une soixantaine de membres. Ce nouveau format utilise certains lments du
standard JPEG pour le codage de la vido.
La compression DV ne joue que sur les redondances spatiales l'intrieur de l'image
complte. Elle ne cherche pas rduire les redondances temporelles comme le fait le
MPEG. Elle utilise un facteur de compression de 5:1. Elle permet donc d'obtenir une
excellente qualit d'image en premire gnration, ce qui est l'idal pour un usage
grand public. Une heure de vido numrique en format composante(Y, R-Y, B-Y) peut
tre sauvegard sur une mini-cassette plus petite qu'une cassette audio DAT. La
qualit est considre comme suprieure au BetacamSP. Une autre cassette DV
lgrement plus grosse qu'une cassette 8mm peut contenir jusqu' 270 minutes
d'enregistrement numrique!
La technologie FireWire:
La norme FireWire, aussi connue sous le nom de IEEE-1394, a t introduite comme
une interface universelle pour la transmission des donnes sries haute vitesse
entre diffrentes composantes lectroniques telles que les disque rigides, les lecteurs
CD-ROM, les scanners et les cartes de capture vido. La technologie FireWire
supporte trois vitesses de transfert; 100, 200 et 400Mbits/sec. 16 priphriques
peuvent s'interconnecter avec une distance pouvant aller jusqu' 4 mtres entre
chaque priphrique. Le branchement se fait grce un fil 6 conducteurs regroups
en paires. Deux paires transmettent les donnes et les caractres de contrle tandis
que l'autre paire se charge de transporter l'alimentation (max. 60 W). Il existe aussi
des connecteurs quatre conducteurs dpourvus d'alimentation.
Il est important de faire la distinction entre la technologie FireWire et le DV. Les
termes sont souvent interchangeables, mais ont une fonction bien diffrente. En gros
on peut dire que la technologie Firewire est une affaire de plomberie. C'est un
standard de transmission. C'est une nouvelle manire de transmettre des
informations numriques travers un cble et une prise spciaux entre des
priphriques et un ordinateur. Le DV, quant lui, est un nouveau standard
d'enregistrement. C'est une nouvelle manire d'crire un signal vido compress sur
la bande magntique.
La tlvision numrique:
La tlvision numrique n'est plus dans le domaine du futur, elle est maintenant une
ralit dans le monde. Aux tats-Unis d'abord, o des satellites offrent depuis
quelques annes plusieurs dizaines de chanes de tlvision en numrique; en Europe
ensuite, o on assiste une vritable mobilisation depuis les premires semaines de
l'anne 1996. Ce qui a permis la rvolution numrique, ce sont les progrs raliss
dans la compression des donnes et plus particulirement les travaux du groupe de
normalisation MPEG (Moving Pictures Experts Group) dont furent issues entre autres
les normes MPEG-1 et MPEG-2.
Les avantages du numrique en matire de tlvision par satellite:
Grce la technologie du numrique, il est aujourd'hui possible de faire transiter
simultanment plusieurs programmes dans un mme canal satellite, l o on ne
pouvait en loger, en analogique, qu'un seul et unique. Cette possibilit d'acheminer
plusieurs chanes de tlvision numriques sur un mme rptiteur de satellite
permet de diffuser non plus quelques dizaines, mais quelques centaines de
programmes sur chaque satellite. Parmi les autres avantages du numrique, on peut
galement noter:
- La qualit constante des images et des sons en terme de transmission: Le
numrique est moins sujet aux perturbations extrieures que l'analogique et offre
une meilleure rsistance au bruit, au brouillage ou aux phnomnes d'cho.
- La facilitation de la compatibilit entre tous les pays: Plus de standards disparates
(NTSC, PAL, SECAM...) et une compatibilit accrue avec les quipements de
production qui sont dj numriques depuis longtemps.
- La rduction des cots: Cette multiplicit des canaux va de pair avec une rduction
du cot de la retransmission des programmes puisque, en toute thorie, on devrait
pouvoir diviser le prix actuel de la location de chacun des transpondeurs des satellites
par le nombre de programmes qui pourront y transiter.
Le codage Audio Numrique
L'Audio Engineering Society (AES) et l'European Broadcasting Union (EBU) ont tabli
conjointement une norme audio numrique connue sous le terme d'interface
AES/EBU. Cette norme propose des formats pour l'change d'informations audionumriques entre appareils audio professionnels, tout en garantissant la souplesse
ncessaire aux applications spciales. L'International Electrotechnical Commission
(IEC) a galement adopt un format bas sur la norme AES/EBU pour les appareils
audio grand public.
En bref, la norme de format AES/EBU dfinit comment deux canaux d'informations
audio sont priodiquement chantillonns et transmis sur une paire de fils torsads.
Les canaux audio Gauche et Droit sont multiplexs et sont auto-cadencs et autosynchroniss. Le format de mesure est indpendant de la frquence d'chantillonnage
recommande par l'AES et supporte, sur 24 bits, 32 kHz, 44,1 kHz et 48 kHz.
"Ne jamais transmettre ce que l'on ne peut pas entendre."
Cette compression audio, qui est entirement base sur les caractristiques de
l'audition humaine, s'accompagne de pertes et ne peut tre aborde sans une tude
pralable de ce sens. Il est surprenant de constater que l'audition humaine, et
particulirement en stro, a un pouvoir discriminatoire bien suprieur celui de la
vision et c'est pourquoi la compression audio doit tre envisage avec encore plus de
prcautions. Comme la compression vido, la compression audio ncessite plusieurs
niveaux de complexit en fonction du facteur de compression souhait.
Une autre considration importante dans l'enregistrement et la diffusion numriques
d'aujourd'hui est le monitoring du "point de crash" ou point d'atteinte du "niveau
d'entre maximum" admissible par un systme ou un quipement. Le format
d'enregistrement numrique est quelque peu plus tolrant, dans le sens o quelques
pointes "hors tolrance" tombent simplement hors de la gamme de l'appareil
numrique et ne sont pas chantillonnes. Une srie de "pops" ou de "sifflements"
qui pourraient srieusement compromettre un enregistrement analogique peuvent
tre automatiquement "attnus". Ce phnomne a entran quelques personnes
vers la fausse notion que les niveaux audio numriques pouvaient tre apprhends
de manire plus simpliste. Les appareils de mesure rudimentaires intgrs dans la
plupart des appareils numriques refltent cette attitude. Il est aussi ncessaire de
produire un volume plus consistant dans les enregistrements numriques que dans
les enregistrements analogiques. Avoir quelques prises "plus fortes" que d'autres est
plus acceptable dans le nouveau monde numrique que cela n'tait dans
l'environnement analogique. Il y a galement la mme ncessit de protger les
CRTES. L'ide qu'un "certain nombre" de crashs soit tolrable est simplement
fausse. Obtenir le volume au dtriment des crtes rsulte en une perte de dimension
et de clart.
Le mcanisme de l'audition:
L'audition se compose d'un processus physique l'intrieur de l'oreille et d'un
processus nerveux et mental qui se combinent pour donner une impression sonore.
L'impression que nous recevons n'est pas exactement similaire la forme d'onde
acoustique prsente dans le conduit auditif parce qu'une certaine entropie est
perdue. Les systmes de compression audio qui donneront de bons rsultats seront
donc ceux qui ne perdront que la partie de l'entropie qui est perdue dans le
mcanisme de l'audition.
Le mcanisme physique de l'audition se rpartit en trois parties: l'oreille externe,
l'oreille moyenne et l'oreille interne. En plus du pavillon, l'oreille externe comprend le
conduit auditif et le tympan. Le tympan transforme les sons incidents en une
vibration comme le fait un diaphragme de microphone. L'oreille interne opre en
utilisant ces vibrations transmises travers un fluide. L'impdance du fluide est bien
suprieure celle de l'air et l'oreille moyenne agit comme un transformateur
d'impdance qui effectue le transfert d'nergie.
On voit ci-dessus que les vibrations sont transfres l'oreille interne par l'trier, qui
agit sur la fentre ovale. Les vibrations du fluide de l'oreille interne parviennent au
limaon, une cavit du crne en forme de spirale (prsente droule sur la figure,
pour plus de clart). La membrane basilaire est tire sur toute la longueur du
limaon. Le poids et la consistance de cette membrane varient d'un bout l'autre.
Prs de la fentre ovale, la membrane est rigide et lgre et sa frquence de
rsonance est leve. l'autre extrmit, la membrane est lourde et souple, ce qui
fait qu'elle rsonne aux frquences basses.
La gamme de frquences disponibles dtermine la plage de l'audition humaine qui,
pour la plupart des gens, s'tend de 60 Hz 15 Khz. Les diffrentes frquences du
son incident provoquent la vibration de diffrentes parties de la membrane. Toutes
les zones de la membrane sont relies diffrentes terminaisons nerveuses qui
permettent une discrimination trs fine. La membrane basilaire est galement munie
de fins muscles commands par les nerfs et qui agissent ensemble dans une sorte de
contre-raction positive qui aurait tendance augmenter le facteur de rsonance Q.
Le comportement rsonnant de la membrane basilaire constitue une rplique exacte
d'un analyseur de transformes.
En raison de la thorie de l'incertitude, plus le domaine de frquences d'un signal est
connu, moins son domaine temporel est connu. En consquence, plus un systme est
apte dterminer la diffrence entre deux frquences, moins il est capable de
sparer le temps qui les spare. L'audition humaine a dvelopp un certain
compromis entre la discrimination incertitude temporelle et la discrimination de
frquence; ce compromis impliquant qu'aucune perfection n'est atteinte. La
discrimination imparfaite de frquences rsulte du fait de l'incapacit de sparer deux
frquences proches. Cette incapacit est connue comme un effet de masquage auditif
qui rduit la sensibilit d'un son en prsence d'un autre. La figure 3.2a montre que le
seuil d'audition est fonction de la frquence. La plus grande sensibilit se situe
naturellement dans la gamme de frquences de la parole.
En prsence d'une note pure, le seuil est modifi, tel quindiqu sur la figure 3.2b. Le
seuil est relev non seulement pour des frquences hautes, mais aussi pour quelques
frquences basses. En prsence d'une source sonore au spectre plus complexe,
comme de la musique, le seuil est relev presque toutes les frquences. Une
consquence de ce comportement est que le sifflement d'une cassette audio n'est
audible que pendant les passages trs doux de la musique.
La compression utilise ce principe en amplifiant les frquences basses avant
l'enregistrement ou la transmission et en les ramenant ultrieurement leur niveau
convenable. La discrimination imparfaite de temps montre par l'oreille est due sa
rponse rsonante. Le facteur de rsonance Q est tel qu'il faut qu'un son donn soit
prsent au moins 1 milliseconde avant qu'il ne devienne audible. cause de cette
rponse lente, le masquage peut se produire mme si les deux signaux concerns ne
sont pas simultans. Les masquages avant et arrire peuvent se produire quand le
son de masquage continue agir des niveaux plus faibles avant et aprs la dure
courante du son de masquage. La figure 3.3 dmontre ce concept. Le masquage
relve le seuil d'audition et les systmes de compression tirent parti de cet effet en
rehaussant le niveau "plancher" de bruit, permettant ainsi au signal audio d'tre
exprim avec moins de bits. Le plancher de bruit ne peut tre relev que pour les
frquences auxquelles le masquage agit. Pour maximaliser le masquage actif, il faut
dcouper le spectre audio en diffrentes bandes de frquence pour permettre
l'introduction des diffrentes quantits de compression et de bruit dans chacune
d'elles.
Codage en sous-bandes:
La figure suivante montre un compresseur bandes spares. Le filtre sparateur de
bandes est un jeu de filtres phase linaire, ayant tous la mme largeur de bande et
qui se recouvrent. La sortie de chaque bande consiste en des chantillons
reprsentatifs de la forme d'onde. Dans chaque bande de frquence, l'entre audio
est amplifie au maximum avant la transmission. Chaque niveau est ensuite ramen
sa valeur initiale. Le bruit introduit par la transmission est ainsi rduit dans chaque
bande. Si l'on compare la rduction de bruit au seuil d'audition, on s'aperoit qu'un
bruit plus important peut tre tolr dans certaines bandes du fait de l'action du
masquage. Par consquent, il est possible, dans chaque bande, de rduire la
longueur des mots d'chantillons aprs la compression. Cette technique ralise une
compression parce que le bruit introduit par la perte de rsolution est masqu. La
figure ci-dessous prsente un codeur simple bandes spares, comme ceux utiliss
dans la Couche 1 du MPEG. L'entre audio-numrique alimente un filtre de sparation
de bandes qui divise le spectre du signal en un certain nombre de bandes.
En MPEG, ce nombre est de 32. L'axe des temps est divis en blocs d'gale longueur.
Dans la couche 1 de MPEG, il y a donc 384 chantillons du signal d'entre, ce qui se
traduira, en sortie du filtre, par 12 chantillons dans chacune des 32 bandes. A
l'intrieur de chaque bande, le niveau est amplifi par multiplication jusqu' sa valeur
maximale. Le gain ncessaire est constant pour la dure du bloc et un seul facteur
d'chelle est transmis avec chaque bloc, pour chaque bande, de faon pouvoir
renverser le processus au dcodage.
La sortie du groupe de filtres est galement analyse afin de dterminer le spectre du

signal d'entre. Cette analyse permet de raliser un modle de masquage permettant
de dterminer le degr de masquage que l'on peut attendre dans chaque bande.
Dans chaque bande, plus le masquage est agissant, moins l'chantillon doit tre
prcis. La prcision d'chantillon est alors rduite par re-quantification en vue de
diminuer la longueur des mots. Cette rduction est aussi constante pour chaque mot
dans la bande, mais les diffrentes bandes peuvent utiliser des longueurs de mots
diffrentes. La longueur de mots doit tre transmise comme un code d'affectation de
bits afin de permettre au dcodeur de d-srialiser convenablement le flux de bits.
Couche 1 du MPEG:
La figure suivante montre un flux de bits audio MPEG Niveau 1.
Aprs le mot de synchronisation et l'en-tte, il y a 32 codes d'affectation de bits de 4

bits chacun. Ces codes dcrivent la longueur des mots des chantillons dans chaque
sous-bande. Viennent ensuite les 32 facteurs d'chelle utiliss par la compression
dans chaque bande. Ces facteurs d'chelle sont indispensables pour rtablir le bon
niveau au dcodage. Les facteurs d'chelle sont suivis des donnes audio de chaque
bande. Voici un dcodeur du type Couche 1.
Le mot de synchronisation est dtect par le gnrateur de temps qui d-srialise les
bits d'affectation et les donnes de facteur d'chelle. L'affectation de bits permet
ensuite la d-srialisation des chantillons longueurs variables. La re-quantification
inverse et la multiplication par l'inverse du facteur de compression sont appliques de
faon ramener le niveau de chaque bande sa bonne valeur. Les 32 bandes sont
ensuite rassembles dans un filtre de recombinaison pour rtablir la sortie audio.
Couche 2 du MPEG:
Cette figure montre que, lorsque le filtre de sparation de bandes est utilis pour
crer le modle de masquage, l'analyse de spectre n'est pas trs prcise dans la
mesure o il n'y a que 32 sous-bandes et que l'nergie est rpartie dans la totalit de
la bande. On ne peut pas trop augmenter le plancher de bruit car, dans le pire des
cas, le masquage n'agirait pas. Une analyse spectrale plus prcise autoriserait un
facteur de compression plus lev. Dans la couche 2 du MPEG, l'analyse spectrale est
effectue l'aide d'un processus spar.
Une FFT 512 points est effectue directement partir du signal d'entre pour le
modle de masquage. Pour amliorer la prcision de la rsolution de frquence, il
faut augmenter l'excursion temporelle de la transforme, ce qui est effectu en
portant la taille du bloc 1152 chantillons. Bien que le synoptique de la compression
de bloc soit identique celui de la couche 1 du MPEG, tous les facteurs d'chelle ne
sont pas transmis dans la mesure o, dans les images de programme, ils prsentent
un degr de redondance non ngligeable.
Le facteur d'chelle de blocs successifs excde 2dB dans moins de 10 % des cas et
on a avantage tirer parti de cette caractristique en analysant les groupes de 3
facteurs d'chelle successifs. Sur les programmes fixes, seul un facteur d'chelle sur
trois est transmis. mesure de l'augmentation de la variation dans une bande
donne, deux ou trois facteurs d'chelle sont transmis. Un code de slection est
galement transmis pour permettre au dcodeur de dterminer ce qui a t mis
dans chaque bande. Cette technique permet de diviser par deux le dbit du facteur
d'chelle.
Codage de transforme:
Les couches 1 et 2 du MPEG sont bases sur les filtres sparateurs de bandes dans
lesquels le signal est toujours reprsent comme une forme d'onde. La couche 3
utilise de son ct un codage de transforme comme celui utilis en vido. Comme
indiqu plus haut, l'oreille effectue une espce de transforme sur le son incident et,
du fait du facteur de rsonance Q de la membrane basilaire, la rponse ne peut
augmenter ou diminuer rapidement. Par consquent, si un signal audio est
transform dans le domaine frquentiel, il n'est plus ncessaire de transmettre les
coefficients trop souvent. Ce principe constitue la base du codage de transforme.
Pour des facteurs de compression plus levs, les coefficients peuvent tre requantifis, ce qui les rend moins prcis. Ce processus gnre du bruit qui pourra tre
plac des frquences o le masquage est le plus fort. Une caractristique
secondaire d'un codeur de transforme est donc que le spectre d'entre est connu
trs prcisment, ce qui permet de crer un modle de masquage trs fidle.
Couche 3 du MPEG:
Ce niveau complexe de codage n'est en ralit utilis que lorsque les facteurs de
compression les plus levs sont ncessaires. Il comporte quelques points communs
avec la couche 2. Une transforme cosinus discrte 384 coefficients de sortie par
bloc est utilise. On peut obtenir ce rsultat par un traitement direct des chantillons
d'entre mais, dans un codeur multi-niveaux, il est possible d'utiliser une transforme
hybride incorporant le filtrage 32 bandes des couches 1 et 2. Dans ce cas, les 32
sous-bandes du filtre QMF (Quadrature Mirror Filter) sont ensuite traites par une
Transforme Cosinus Discrte Modifie(Modified Discrete Cosine Transform) 32
bandes pour obtenir les 384 coefficients. Deux tailles de fentres sont utilises pour
viter les pr-oscillations la transmission. La commutation de fentres est
commande par le modle psycho-acoustique. On a trouv que le pr-cho
n'apparaissait dans l'entropie que lorsquelle tait suprieure au niveau moyen. Pour
obtenir le facteur de compression le plus lev, une quantification non-uniforme des
coefficients est effectue selon le codage de Huffman. Cette technique attribue les
mots les plus courts aux valeurs de code les plus frquentes.
Le codage AC-3:
La technique de codage audio AC-3 est utilise avec le systme ATSC la place d'un
des systmes de codage audio MPEG. DVB a aussi d l'adopter sous la pression des
industriels. Le systme AC-3 est bas sur une transforme et obtient le gain de
codage en re-quantifiant les coefficients de frquence. L'entre PCM d'un codeur AC-3
est divise en blocs par des fentres qui se chevauchent comme indiqu ci dessous.
Ces blocs contiennent chacun 512 chantillons mais, du fait du chevauchement total,
il existe une redondance de 100%. Aprs la transforme, il existe donc 512
coefficients qui peuvent, du fait de la redondance, tre ramens 256 l'aide d'une
technique appele Suppression par aliasing dans le domaine temporel (TDAC, Time
Domain Aliasing Cancelation).
La forme du signal d'entre est analyse et, s'il existe une volution significative dans
la seconde moiti du bloc, le signal sera spar en deux pour viter les pr-chos.
Dans ce cas, le nombre de coefficients reste le mme mais la rsolution de frquence
sera divise par deux et la rsolution temporelle double. Un indicateur (flag) est
plac dans le flux de bits pour signaler que cette opration a t effectue. Les
coefficients sont mis sous un format virgule flottante avec une mantisse et un
exposant. La reprsentation est l'quivalent binaire de la notation scientifique.
Les exposants constituent en fait les facteurs d'chelle. Le jeu d'exposants d'un bloc
produit l'analyse spectrale d'un signal d'entre avec une prcision finie sur une
chelle logarithmique appele enveloppe spectrale. Cette analyse spectrale est le
signal d'entre du modle de masquage dfinissant, pour chaque frquence, le
niveau jusqu'o le bruit peut tre augment. Le modle de masquage pilote le
processus de re-quantification qui diminue la prcision de chaque coefficient en
arrondissant la mantisse. Cette mantisse constitue une partie significative de la
donne transmise. Les exposants sont galement transmis mais pas intgralement
dans la mesure o la redondance qu'ils comportent peut tre ultrieurement
exploite.
A l'intrieur d'un bloc, seul le premier exposant (celui de la frquence la plus base)
est transmis dans sa forme absolue. Les autres sont transmis de faon diffrentielle
et le dcodeur ajoute la diffrence avec l'exposant prcdent. Quand le signal audio
prsente un spectre assez aplati, les exposants peuvent tre identiques pour
plusieurs bandes de frquences. Les exposants peuvent alors tre assembls en
groupes de deux quatre avec un indicateur dcrivant leur mode de groupement.
Des jeux de six blocs sont assembls dans une trame de synchro AC-3. Le premier
bloc de la trame comporte la donne complte pour l'exposant mais, dans le cas de
signaux constants, les blocs suivants de la trame peuvent utiliser le mme exposant.
Voici un schma du fonctionnement de l'encodeur AC-3:
Alors que celui-ci dmontre le fonctionnement du Dcodeur AC-3:
Le schma suivant montre comment le signal AC-3 est transmis et reu en DVB:
La Compression Vido MPEG-2
(Codage gnrique de films, vido et informations audio associes):

MPEG (Motion Picture Expert Group), form en 1988 d'un groupe d'experts en vido,
a eu la tche de dfinir les standards de compression des signaux audio-visuels. Le
grand principe du MPEG vido tant de "Ne jamais transmettre un lment d'image
dj transmis", son premier projet, MPEG-1, t publi en 1993. MPEG-1 supporte
principalement l'encodage vido allant jusqu' environ 1.5 Mbits/s, donnant une
qualit similaire au VHS et de l'audio stro 192 bits/s. Il est utilis pour les
systmes CD-i (compact disc interactive) et Vido-CD pour enregistrer le vido et
l'audio sur CD-ROM.
MPEG-2 est une extension du standard MPEG-1. Il est principalement un format
"broadcast" des taux de donnes ("data rate") suprieurs. Il propose des outils
algorithmiques pour encoder efficacement le vido entrelac, supporte une grande
chelle de "bits rate" et permet l'encodage "surround sound" multiples canaux.
Le format vido de postproduction numrique utilise 270 Mbit/s de dbit pour coder
les images. Sachant qu'un canal satellite accepte autour de 45 Mbit/s(valeur la plus
courante), on voit rapidement qu'il va falloir faire suivre un srieux rgime nos
images. Le standard MPEG-2 est capable d'encoder un signal tlvision standard un
"bit rate" allant de 3-15 Mbits/s(audio multi-canaux + vido + donnes auxiliaires) et
un signal tlvision haute dfinition de 15-30 Mbits/s. Les dcodeurs MPEG-2 sont
galement capables de dcoder les signaux MPEG-1.
Principes de la diffusion vido:
Les stations de tlvision europennes diffusent prsentement un "frame rate" de
25Hz. Chaque frame (cadre) est form de deux champs "entrelacs", donnant un
taux de champs ("field rate") de 50Hz. Le premier champ de chaque "frame" contient
seulement les lignes impaires du "frame"(la premire du haut sera la #1). Le second
champ contient quant lui les lignes paires (environ 20 ms aprs le premier champ).
Le signal tlvision nord-amricain est lui aussi "entrelac", mais avec un "frame
rate" dun peu moins de 30 Hz (29,97 Hz).
Pour les systmes vido autres que la tlvision, on retrouve souvent un signal vido
"non-entrelac"(par exemple pour la majorit des ordinateurs). En vido "nonentrelac", toutes les lignes d'un "frame" sont lues au mme instant. Le vido "nonentrelac" est galement appel "progressively scanned video" ou "sequentially
scanned video". Le signal RGB (red, green and blue) peut tre exprim en
composantes de luminance(Y) et de chrominance (UV). La largeur de la bande
passante de la chrominance peut tre rduite en fonction de la luminance sans
affecter de manire significative la qualit de l'image. En vido standard, le signal
vido component (YUV) sera chantillonn et numris pour former des "pixels" (voir
CCIR recommandation 601). Les termes 4:2:2 et 4:2:0 sont souvent utiliss pour
dcrire la structure d'une image numrique. 4:2:2 signifie que la chrominance est
sous-chantillonne horizontalement par un facteur de deux relatif la luminance.
4:2:0 signifie que la chrominance est sous-chantillonne horizontalement et
verticalement par un facteur de deux relatif la luminance.
La rgion active d'une image vido numrique standard est de 720 pixels X 576
lignes, pour un "frame rate" de 25 Hz. En utilisant 8 bits pour chaque pixels Y, U ou
V, le "bit rate" non compress pour les signaux 4:2:2 et 4:2:0 sera donc:
4:2:2 - 720x576x25x8 + 360x576x25x(8+8) = 166 Mbits/s
4:2:0 - 720x576x25x8 + 360x288x25x(8+8) = 124 Mbits/s
MPEG-2 est capable de compresser le "bit rate" d'un signal vido standard 4:2:0
jusqu' un taux de 3 Mbits/s. Plus le "bit rate" est bas, plus la qualit du signal
encod devient compromise. Pour un signal de diffusion numrique terrestre
standard, un "bit rate" d'environ 6 Mbits/s est gnralement accept comme un bon
compromis entre la qualit d'image et les impratifs de bande passante du
transmetteur (Cbles, Satellites).
Principes de rduction du "bit rate":

Le systme de rduction du "bit rate" fonctionne en enlevant l'information
redondante du signal avant la transmission, grce au codeur et en la rinsrant grce
au dcodeur. Deux types de redondances ont t cibls pour y arriver:
La redondance spatiale et temporelle o un lment commun plusieurs images
conscutives n'est transmis qu'avec la premire image. Pour les autres images, on ne
transporte que sa position dans l'image. C'est le cas d'un plan fixe, o l'on voit une
voiture qui va de gauche droite. On transmet une fois le dcor et la voiture et, pour
les images suivantes, on indique seulement la position de la voiture.
L'autre redondance exploite est la redondance spatiale. Si, dans la mme image, il y
a trois voitures identiques, elle n'est code qu'une seule fois. En y ajoutant la position
de chacune dans l'image, on peut reconstituer la scne. La valeur de chaque pixel
n'est donc pas indpendante, mais relie ses voisins, autant l'intrieur de la
mme image que par rapport aux images voisines. Jusqu' un certain point, la valeur
d'un pixel est prdictible en tenant compte de ses voisins.
La redondance psycho-visuelle:
L'oeil humain une rponse limite aux dtails spatiaux fins et est moins sensible
aux dtails prs du bord des objets ou des changements de plans. En consquence,
une rduction contrle, l'intrieur d'une image dcode par le procd de
rduction du "bit rate" ne devrait pas tre visible par un observateur humain. La
figure ci-dessous montre que la perception humaine du bruit nest pas uniforme mais
est une fonction de la frquence spatiale.
Un niveau de bruit suprieur est acceptable pour des frquences spatiales leves. Il
sensuit que le bruit vido est effectivement masqu par un fin dtail dimage alors
quil sera plus apparent pour les vastes zones unicolores. Sachant que les mesures de
bruit sont toujours pondres, on comprendra que cette mthode de mesure se
rapporte ce rsultat subjectif.
Codage spatial ou temporel:
Comme nous lavons dit, la compression vido utilise les avantages des deux
redondances (spatiale et temporelle). En MPEG-2, la redondance temporelle est
dabord rduite en utilisant les similitudes entre deux images successives. La plus
grande partie possible de limage courante est cre (ou prdite) en utilisant
linformation de limage dj mise. Quand on utilise cette technique, il suffit de
transmettre une image de diffrence qui limine les diffrences entre limage actuelle
et limage de prdiction. Limage de diffrence est ensuite soumise une
compression spatiale. Pour des raisons pratiques, il est plus facile dexpliquer la
compression spatiale avant daborder la compression temporelle.
La compression spatiale utilise la similarit entre des pixels adjacents sur une surface
unie et tient compte des frquences spatiales dominantes existant dans les zones en
amont. Le JPEG utilise uniquement la compression spatiale dans la mesure o ce
systme est conu pour la transmission des images fixes. Le JPEG peut cependant
tre employ pour la transmission de squences dimages fixes. Dans cette
application, appele Motion JPEG, le facteur de compression nest pas aussi bon que
si lon utilisait le codage temporel, mais il sera cependant possible deffectuer un
montage du flux de bits pour effectuer un montage image par image.
Codage spatial:
En codage spatial, la premire tape consiste effectuer une analyse de frquence
spatiale laide dune transforme. Une transforme est un outil mathmatique
permettant de traduire une forme donde en diffrents domaines et, dans notre cas,
dans le domaine frquentiel. Le rsultat dune transforme est une suite de
coefficients dcrivant lamplitude de chaque composante frquentielle prsente dans
le signal. Une transforme inverse reproduit le signal initial. Si les coefficients sont
grs avec une prcision suffisante, la sortie de la transforme inverse doit tre
identique la forme donde originale. La transforme la plus rpandue est la
transforme de Fourrier. Cette transforme cherche chaque frquence comprise dans
le signal dentre. Elle caractrise chaque frquence en multipliant le signal dentre
par un exemple de la frquence cible appele fonction de base et en intgrant le
produit obtenu. La figure ci-dessous montre que, lorsque la forme de signal dentre
ne contient pas de composante la frquence cible, lintgrale sera nulle, mais sil en
comporte une, lintgrale constituera un coefficient caractrisant lamplitude de cette
composante.
La transforme de Fourrier prsente linconvnient de ncessiter des coefficients pour

les composantes sinus et cosinus de chaque frquence.
Dans la transforme cosinus, la forme de signal dentre est complte avec son
image temporelle avant multiplication par la fonction de base.
L'illustration ci-dessus montre que cette opration de miroir limine toutes les
composantes sinus et double les composantes cosinus. La fonction de base sinus ne
se rvle donc plus utile et un seul coefficient reste alors ncessaire pour chaque
frquence.
"Intra-Frame DCT coding":
La Transforme Cosinus Discrte (DCT, Discrete Cosine Transform) est la version
chantillonne de la transforme cosinus, elle est utilise sous forme
bidimensionnelle en MPEG-2. Le bloc de 8x8 pixels est chang en bloc de 8x8
coefficients. Comme la transformation rside en une multiplication par une fraction, il
se produit un allongement du mot provenant du fait que les coefficients ont une
longueur suprieure celle des valeurs de pixels. Un bloc de pixels 8 bits devient
alors un bloc de coefficients 11 bits. Une DCT ne constitue pas alors une
compression, mais elle obtient, en fait, le rsultat inverse. Cependant, la DCT
convertit la source de pixels en une forme facilitant la compression.
La figure suivante montre le rsultat dune transforme inverse des coefficients
individuels dune DCT pour un bloc 8x8. Dans les images relles, diverses frquences
spatiales verticales et horizontales peuvent se produire simultanment et un
coefficient en un certain point en reprsente toutes les combinaisons possibles.
La figure montre galement les coefficients sous une forme donde horizontale
unidimensionnelle. La combinaison de ces formes donde avec diverses amplitudes et
une polarit quelconque doit permettre de reproduire toutes combinaisons des 8
pixels. La combinaison des 64 coefficients de la DCT-2D permettra de reconstituer le
bloc initial de 8x8 pixels.
En ce qui concerne les images couleurs, il est clair que les signaux de diffrence de
couleur devront galement tre traits. Les signaux Y, Cr et Cb seront donc
assembls en rseaux spars de 8x8 pixels et traits sparment. Dans la plupart
des signaux correspondant aux images de programme, la majorit des coefficients a
une valeur nulle ou proche de zro. Il ne sera donc pas ncessaire de les
transmettre. Il en rsulte une compression non ngligeable sans perte vritablement
consquente.
Motion-compensated inter-frame prediction:
Cette technique exploite la redondance temporelle en essayant de prdire le "frame"
tre cod partir d'un "frame" de rfrence. La prdiction ne peut tre base sur
une image "source" car la prdiction doit pouvoir tre rpte dans le dcodeur, l o
les images "sources" n'existent pas( L'image dcode n'est pas identique l'image
source car le procd de rduction du "bit rate" introduit des petites distorsions dans
l'image dcode). En consquence, l'encodeur contient lui-mme un dcodeur qui
reconstruit l'image exactement comme elle sera dans le dcodeur, ce qui permet de
faire des prdictions.
La prdiction la plus simple du bloc encoder est celle qui utilise le bloc le plus prs
de l'image de rfrence. Ceci permet de raliser une bonne prdiction pour les
rgions stationnaires de l'image, mais russissent moins bien dans les rgions o il y
a mouvement. Quand un objet se dplace sur lcran TV, il apparat un endroit
diffrent, mais il ne change pas beaucoup daspect. On introduit donc une mthode
plus sophistique, appele motion-compensated inter-frame prediction, qui consiste
copier(offset) tout mouvement translationnel qui existe entre le bloc qui est encod
et le "frame" de rfrence et utiliser le bloc ainsi cr comme prdiction. La
diffrence dimage peut tre rduite en mesurant le dplacement au codeur. Ce
dplacement est transmis au dcodeur sous la forme dun vecteur. Le dcodeur
utilise ce vecteur pour dcaler une partie de limage prcdente vers lemplacement
appropri dans la nouvelle image. Un vecteur concerne le dplacement dune zone
entire de limage appele macrobloc. La taille dun macrobloc est dtermine par
le codage DCT et la structure de sous-chantillonnage couleur.
Les blocs de prdiction sont crs de plusieurs manires diffrentes. Par exemple, un
bloc pourra tre prdit partir d'une image prcdente (forward predicted), d'une
image suivante (backward predicted) ou bi-directionnellement(bidirectionnally
predicted) en faisant une moyenne des prdictions prcdentes et suivantes. La
mthode utilise peut changer d'un bloc l'autre. Le codage bidirectionnel rduit
considrablement la quantit de donnes de diffrence ncessaire lamlioration du
degr possible de prdiction. Pour chaque bloc coder, l'encodeur choisit la meilleure
mthode pour maximiser la qualit de l'image selon les contraintes du "bit rate". La
mthode choisie est ensuite transmise au dcodeur pour reconstituer l'image
correctement.
Dans les images caractristiques de programme, les coefficients les plus significatifs
de la DCT se trouvent gnralement dans le coin suprieur gauche de la matrice.
Aprs pondration, les coefficients de faible valeur seront tronqus zro. On
obtiendra une transmission plus efficace si on met dabord tous les coefficients nonnuls et quun code indique ensuite que tous les autres sont zro. La scrutation
constitue une technique qui augmente la probabilit dobtenir ce rsultat car elle
met les coefficients dans lordre probable damplitude dcroissante.
La figure ci-dessus montre que, dans un systme non entrelac, la probabilit davoir
un coefficient de forte valeur est trs leve dans le coin suprieur gauche et trs
faible dans le coin infrieur droit. Une scrutation 45 degrs constitue, dans ce cas,
la meilleure solution. Dans la figure de droite, on peut voir la scrutation adapte
une source entrelace. Dans une image entrelace, un bloc de 8x8 pixels dune trame
couvre deux fois sa surface sur lcran, ce qui fait que, pour une dfinition donne de
limage, les frquences verticales paratront le double de leurs homologues
horizontales. Cest pourquoi le balayage idal, pour une source entrelace, sera
effectu en diagonale pente double. La figure de droite montre quune frquence
spatiale verticale est balaye avant la frquence spatiale horizontale identique.
Codage de lentropie:
Dans une image vido anime, toutes les frquences spatiales ne sont pas prsentes
simultanment, la matrice de coefficients de la DCT comportera donc des termes
nuls. Malgr la scrutation, des termes nuls apparatront encore au milieu des
coefficients non-nuls. Le codage RLC (Run Length Coding) permet de grer plus
efficacement ces coefficients. Quand une suite de valeurs identiques, comme des
zros, existe, le codage RLC met simplement le nombre de zros plutt que toute la
suite de bits nuls. On peut tudier la probabilit de rptition de certaines valeurs
particulires de coefficients dans la vido relle. En pratique, certaines valeurs se
rencontrent frquemment et dautres moins souvent. Cette information statistique
peut tre utilise pour effectuer ultrieurement une compression longueur variable
(VLC). Les valeurs les plus frquentes sont codes en mots de code courts et les
autres en mots plus longs. Pour faciliter la d-srialisation on peut utiliser un mot de
code comme prfixe pour les autres.
Un codeur spatial:
La figure suivante regroupe lensemble des concepts de codage prcdemment
voqus.
Le signal dentre est suppos tre la norme 4:2:2 srie en 8 ou 10 bits(SDI). Le

MPEG nutilise cependant quune rsolution de 8 bits; aussi, un tage de traitement
sera ncessaire pour arrondir les valeurs si le signal entrant est 10 bits. Les profils
MPEG effectuent un chantillonnage du type 4:2:0; un tage dinterpolation
verticale/filtre passe-bas sera alors ncessaire. Larrondi et le sous-chantillonnage
couleur introduisent une lgre mais irrversible perte dinformations, mais aussi une
rduction du dbit. Le format dentre de la scrutation dcran doit tre tel quil
puisse tre converti en blocs de 8x8 pixels. Ltage DCT transforme linformation
dimage dans le domaine frquentiel. La DCT neffectue pas de compression par elle
mme. Aprs la DCT, les coefficients sont tronqus et pondrs, ce qui correspond
une premire compression. Les coefficients sont ensuite scruts en zigzag pour
accrotre la probabilit de commencer par les coefficients les plus significatifs. Aprs
le dernier coefficient non-nul, un code de fin de bloc (EOB, End of Block) est gnr.
Les donnes affrentes aux coefficients sont ensuite compresses laide de codages
RLC et VLC. Dans les systmes dbit variable, la quantification est fixe mais, dans
un systme dbit constant, une mmoire tampon est utilise pour absorber les
variations intervenant au cours du codage. la suite de la transforme inverse, le
bloc de 8x8 pixels est recr. Pour obtenir un signal de sortie dcran balay, les
blocs sont stocks dans une RAM qui est lue ligne par ligne. Pour avoir une sortie
4:2:2 partir de donnes 4:2:0, il faudra utiliser une interpolation verticale comme
indiqu sur la figure suivante:
Dans un systme 4:2:0, les chantillons de chrominance sont intercals

verticalement entre les chantillons de luminance de faon ce quils soient
rgulirement espacs quand un systme entrelac est utilis.
Images I, P et B(I-Frames, P-Frames, B-Frames):
En MPEG-2, trois diffrents types dimages sont ncessaires pour effectuer le codage
diffrentiel et le codage bidirectionnel avec un minimum derreurs de propagation:
Les images I(I-Frames):
Sont intra-codes et ne ncessitent pas dinformations supplmentaires pour tre
dcodes. Elles ncessitent beaucoup de donnes comparativement aux autres types
dimages et cest pourquoi elles ne sont transmises que lorsque cela est ncessaire.
Elles consistent essentiellement en coefficients de transformes et nont pas de
vecteur de mouvement. Elles autorisent la commutation de voies et bloquent la
propagation des erreurs.
Les images P(P-Frames):
Sont celles qui sont dduites dune image antrieure qui peut tre de type I ou P. Les
donnes dune image P sont constitues de vecteurs dcrivant o chaque macrobloc
doit tre pris dans limage prcdente et des coefficients non transforms dcrivant la
correction ou les donnes de diffrence ajouter ce macrobloc. Les images P
comportent pratiquement la moiti des donnes dune image I.
Les images B(B-Frames):
Sont prdites bi-directionnellement partir dimages antrieures ou postrieures et
de type I ou P. Les donnes des images de type B consistent en vecteurs dcrivant
lendroit o les donnes doivent tre prises dans les images antrieures ou
postrieures. Elles contiennent galement les coefficients de transformes fournissant
la correction. La prdiction bidirectionnelle est si efficace que les donnes de
correction sont minimes et que limage de type P utilise pratiquement le quart des
donnes par rapport une image de type I.
partir de ces frames a t introduit le concept de Groupe dImages(GOP, Group Of

Pictures). Le GOP commence par une image I, suivie de quelques images P espaces
et entre lesquelles se placent les images restantes qui sont de type B. La fin du GOP
se situe la dernire image prcdant immdiatement une nouvelle image I. La
longueur dun GOP est variable, mais la valeur la plus courante se situe entre 12 et
15. En fait, si les donnes dune image B doivent tre utilises pour construire une
image ultrieure, ces donnes doivent rester disponibles dans le dcodeur. Par
consquent, le codage bidirectionnel implique que les donnes soient extraites de la
squence et provisoirement sauvegardes.
La figure ci-dessus montre galement que les donnes de limage P sont mises
avant celles de limage B. Notez galement que les dernires images B du GOP ne
peuvent tre transmises quaprs la premire image I du GOP suivant, dans la
mesure o elles ont besoin de son contenu pour tre dcodes bi-directionnellement.
Afin de replacer convenablement les images dans leur ordre, une rfrence
temporelle est incluse dans chaque image. Comme des en-ttes sont rgulirement
insrs dans le flux de donnes, un fichier MPEG-2 peut tre affich dans lordre
chronologique sur un ordinateur, par exemple. Lextraction des donnes dimages
dune squence, non seulement ncessite un supplment de mmoire dans le codeur
et le dcodeur mais aussi gnre du retard. Le nombre dimages bidirectionnelles
insres entre des images dautres types doit tre rduit pour diminuer le cot des
quipements et limiter le retard si celui-ci doit rpondre des contingences. Un
compromis doit tre fait entre le facteur de compression et le retard de codage.
Pour une qualit donne, lmission dimages I uniquement double pratiquement le

dbit par rapport une squence IBBP. Quand les facilits de montage sont
essentielles, une squence IB constitue un compromis pratique.
Pr-traitement:
Un compresseur essaie dliminer la redondance lintrieur de limage et entre les
images. Tout phnomne diminuant la redondance est indsirable. Le bruit et le grain
du film sont particulirement pnalisants car ils concernent la totalit de limage.
Aprs le processus de DCT, le bruit induit la prsence de plus de coefficients nonnuls, coefficients que le codeur ne peut pas distinguer des vritables donnes de
limage.
Une quantification plus svre sera alors ncessaire pour coder tous les coefficients,
rduisant alors la qualit de limage. Le bruit rduit galement la similitude entre des
images successives, accroissant par ce phnomne les donnes de diffrence
ncessaires. Tout artefact composite de dcodage, visible lentre dun codeur
MPEG-2, se retrouve naturellement reproduit par le dcodeur. Toute pratique
gnratrice de mouvement indsirable doit tre vite. Linstabilit dun support de
camra pourra crer, en plus de tremblements de limage, une augmentation des
diffrences dimages et des ncessits de transmission de vecteurs. Ceci se produit
galement sur des signaux provenant dun tlcinma dont les images tremblent si,
par exemple, les perforations du film sont endommages.
En gnral, il est important que la vido qui est susceptible dtre compresse soit de
la meilleure qualit possible. Si cette qualit ne peut pas tre atteinte, il est
souhaitable dutiliser une rduction de bruit ou tout autre procd de stabilisation. Si
un facteur de compression lev est ncessaire, le niveau dartefacts peut
augmenter, particulirement si la qualit du signal est faible. Dans ce cas, il est
souhaitable de rduire lentropie en effectuant un pr-filtrage avant lentre dans le
codeur. Le signal est donc soumis un filtrage passe-bas (low pass filter)
bidimensionnel qui rduit le nombre de coefficients et diminue le niveau des
artefacts. Limage sera moins fine mais une perte de finesse est prfrable un
niveau lev dartefacts.
Dans la plupart des applications en MPEG-2, on utilise lchantillonnage 4:2:0 qui
ncessite un sous-chantillonnage du chroma si le signal dorigine est en 4:2:2. En
MPEG-1, un sous-chantillonnage supplmentaire est appliqu afin de produire un
signal dentre ou SIF (Source Input Format) comprenant seulement 532 pixels.
Cette technique divise encore lentropie par un facteur supplmentaire. Pour des
facteurs de compression plus levs, on utilise un signal 176 pixels appel QSIF
(Quarter Source Input Format). Le sous-chantillonnage est un processus combinant
un filtre spatial passe-bas et un interpolateur.
En vido 50 Hz, deux trames successives reprsentent la mme image de film et il
nexiste pas de mouvement entre elles. Le mouvement alterne donc entre zro(entre
deux trames) et sa valeur de mouvement(entre deux images). Comme le mouvement
est transmis diffrentiellement, ceci se traduit par une srieuse augmentation des
donnes de vecteurs. En vido 60 Hz, un dfilement intermittent 3:2 est utilis pour
obtenir du 60 Hz partir de film 24 images par seconde: une image est constitue
de 2 trames, la suivante de 3, et ainsi de suite. Par consquent, une trame sur 5 est
compltement redondante. Le MPEG gre mieux les images de tlcinma en
supprimant la troisime du systme 3:2. Un code spcifique au 24 Hz alerte le
dcodeur qui recre la squence 3:2 en relisant une mmoire de trame.
Profils et niveaux:
laide des outils de codage dfinis dans MPEG-2, il existe des milliers de
combinaisons possibles. Dans un but de simplification, le MPEG-2 est divis en Profils,
chaque profil tant lui-mme subdivis en Niveaux.Un profil constitue la base la
palette des caractristiques dun codage dune certaine complexit. Un niveau est en
fait un paramtre dfinissant par exemple la taille de limage ou le dbit du flux de
bits. Il existe en principe 24 combinaisons possibles mais toutes nont pas t
dfinies.
Un dcodeur MPEG possdant un profil et un niveau donns doit pouvoir dcoder les
signaux manant dun profil et dun niveau infrieurs. Le Profil Simple(Simple Profile)
ne comporte pas de codage bidirectionnel, cest pourquoi seules les images de type I
et P pourront tre gnres par le codeur. Les dlais de codage et de dcodage sont
ici rduits et le matriel correspondant est plus simple. Le profil simple na t
seulement dfini quau niveau Principal (Simple Profile at Main Level, SP@ML). Le
Profil Principal (Main Profile) est conu pour une vaste gamme dutilisations. Le
niveau Bas utilise un signal dentre faible rsolution ne possdant que 352 pixels
par ligne. La plupart des applications de diffusion ncessite le Profil principal au
Niveau Principal (Main Profile at Main Level, MP@ML), appellation du MPEG utilis en
tlvision standard.
Le niveau Haut-1440 est un systme haute dfinition qui double la dfinition par
rapport au niveau principal. Le niveau Haut double non seulement la dfinition
horizontale, mais maintient cette rsolution pour le format 16:9 en portant 1920 le
nombre dchantillons horizontaux. Dans les systmes de compression utilisant les
transformes spatiales et la re-quantification, il est possible de produire des signaux
adaptables. Un processus dadaptabilit est celui o le signal dentre rsulte dun
signal principal et dun signal complmentaire. Le signal principal peut tre dcod
seul pour donner une image dune certaine qualit mais, si linformation du signal
complmentaire est ajoute, un certain aspect de la qualit peut tre amlior. Un
codeur MPEG conventionnel peut, en re-quantifiant fortement les coefficients par
exemple, coder une image avec un rapport signal/bruit modr. Si cette image est
localement dcode et soustraite pixel par pixel de limage originale, le rsultat
constituera limage de bruit de quantification. Cette image peut tre compresse et
transmise en tant que signal complmentaire.
Un dcodeur simple utilisera seulement le flux principal avec son niveau de bruit mais
un dcodeur plus labor peut dcoder les deux flux de bits et produire une image
moins bruite. Ceci constitue le principe de ladaptabilit SNR. Dautre part, le codage
des frquences spatiales les plus basses dune image HDTV(High Definition
Television) peut produire un flux principal quun rcepteur ordinaire SDTV(Standard
Definition television) peut dcoder. Si limage faible dfinition est dcode
localement et soustraite de limage originale, une image damlioration de la
dfinition est obtenue. Cette image peut tre code comme signal complmentaire.
Un dcodeur adquat sera capable de restituer limage haute dfinition. Ceci
constitue le principe de ladaptabilit Spatiale. Le profil Haut est compatible avec les
adaptabilits SNR et Spatiale et accepte lchantillonnage 4:2:2.
Le profil 4:2:2 a t dvelopp dans le sens dune plus grande compatibilit avec le
matriel de production numrique. Ce profil permet lexploitation en 4:2:2 sans
exiger la complexit supplmentaire du profil Haut. Un dcodeur HP@ML peut
accepter une adaptabilit SNR qui ne constitue pas en soi un impratif de production.
Le niveau 4:2:2 a la mme libert de structure de GOP que les autres profils mais, en
pratique, il est plus souvent utilis avec des GOPs courts pour faciliter les oprations
de montage. Le 4.2.2 ncessite un flux de bits suprieur au 4.2.0 et l'utilisation de
GOP impose quand mme un dbit suprieur pour une qualit donne.
(Codage dobjets audio-visuels)

MPEG-4 est un standard ISO/IEC dvelopp par MPEG (Moving Picture Experts
Group), comit dveloppant aussi les normes MPEG-1 et MPEG-2. C'est notamment
grce ces standards que la vido sur CD-ROM et la tlvision numrique sont
aujourd'hui possibles. L'objectif premier de la norme MPEG-4 tait de succder aux
normes MPEG-1 pour la compression et le transfert audio/vido et MPEG-2 pour la
tlvision numrique. Mais lors de l'laboration de la norme, il a t dfini un champ
d'applications et de fonctionnalits dpassant largement le cadre d'une simple
volution, la norme devient alors une vritable rvolution tant au niveau mme de
son concept qu'au nombre d'applications qu'elle touche. MPEG-4 devient la fusion de
trois mondes: l'informatique, les tlcommunications et la tlvision. Elle sera le
rsultat d'un effort international regroupant des centaines d'ingnieurs et de
chercheurs du monde entier et de divers milieux: universits, centres de recherche,
grands groupes informatiques (IBM, Microsoft, Sun, ...) et de tlcommunications
(AT&T, France Telecom, ...) et autres grands groupes industriels (Phillips, Sony, ...).
MPEG-4 a t finalis en octobre 1998. Cette norme est btie sur le succs futur de la
tlvision numrique, des applications graphiques interactives et du multimdia
(WWW), son but tant d'assurer une standardisation technologique tous les
niveaux; production, distribution et diffusion. Voici une vue d'ensemble du standard
MPEG-4, expliquant sur quelles technologies il se base, et quelles applications
supportent cette technologie. Nous ne dvelopperons pas la partie audio de MPEG-4
pour nous concentrer uniquement sur la partie vido.
Objectifs de la norme, cahier des charges et fonctionnalits:
Les objectifs de la norme sont assez vastes du fait du nombre important
d'applications touches. Le cahier des charges n'en est que plus prcis et complet:
Il dcrit de manire prcise tout ce qui touche au codage de la norme suivant une
nouvelle approche oriente objet. Une scne devient alors une composition d'objets
mdia hirarchiss, chaque objet tant dcompos en paramtres. Suit l'interactivit
de la norme. Le codage objet simplifiant l'accs aux objets, la manipulation et
l'organisation ainsi que l'intgration harmonieuse d'objets naturels et synthtiques.
Puis l'adaptabilit, qui est un des points forts de la norme qui se veut universelle
(toutes les applications, pour tout le monde).
L'Adaptabilit (scalability) permet la multi-rsolution base sur le contenu, la prise en
compte des chelles spatiales, temporelles, qualitatives, et de complexit.
L'adaptabilit du codage, du dcodage, du transfert. Il dfinit galement tout ce qui
concerne les problmes plus techniques comme la compression, la robustesse aux
erreurs, notamment pour les transferts et les environnements peu fiables, le transfert
(synchronisation des donnes, audio et vido) et la scurit. Ce cahier des charges
trs complet a pour but de satisfaire un grand nombre d'applications qui vont
maintenant tre dveloppes.
Les applications:
Le standard MPEG-4 fourni un ensemble de technologies satisfaisant le besoin des
auteurs, des fournisseurs et, finalement, des utilisateurs.
Pour les auteurs, MPEG-4 permettra la production de squences rutilisables. Il leur
permettra une grande flexibilit, autorisant l'amalgame de la tlvision numrique,
des animations graphiques et des pages web. En outre, ils auront la possibilit de
protger leurs uvres.
Pour les fournisseurs d'accs Internet, MPEG-4 offrira des informations transparentes,
qu'ils pourront aisment adapter la demande de l'utilisateur (par exemple:
l'adaptation en fonction de la langue de l'utilisateur), ainsi que le contrle des
transferts(gestion des pertes de donnes).
Pour les utilisateurs, MPEG-4 aura de nombreuses possibilits qui pourront tre
accessibles partir d'un simple terminal. Voici un large ventail de toutes les
applications concernes par les apports dune telle standardisation:
1.
La communication temps rel (vidophone, ...)
2.
La surveillance.
3.
Le multimdia mobile (mini portable faisant office de tlphone, fax, agenda,
... par liaison GSM ou satellite).
4.
Le stockage et la recherche dinformations bass sur le contenu.
5.
La lecture de vido sur Internet/Intranet sans avoir tlcharger toute la
source.
6.
La visualisation de scnes simultanment plusieurs endroits (tlconfrence
...).
7.
La transmission (tout types de donnes : vido, audio, ...).
8.
La postproduction (cinma et tl).
9.
Le DVD.
10.
Les applications de lanimation de visages: runions virtuelles, ...
11.
La hirarchisation et la gestion des objets audio dans une scne.
Buts de la standardisation:
Pour toutes ces applications, les buts de la standardisation MPEG-4 sont:
Empcher la non-portabilit par l'harmonisation des moyens de codage et de
dcodage.
Reprsenter des "objets mdias"(units sonore, visuelle et audiovisuelle), ces
units peuvent tre enregistres par un appareil photo, un microphone ou
gnres par un ordinateur.
Dcrire la composition des objets formant une scne audiovisuelle.
Synchroniser les diffrents objets mdia pour qu'ils puissent tre
transportables.
Permettre l'interaction entre l'utilisateur et le diffuseur.
Description Technique (essentiellement, l'aspect visuel de la norme.):
Structure gnrale, description:
La norme MPEG-4 propose une solution radicalement diffrente pour le codage des
vidos afin de satisfaire tous ses besoins dans les diffrentes applications quelle
propose. Les scnes audiovisuelles sont ainsi composes de plusieurs objets mdias
hirarchiss. Ainsi, dans l'arborescence de cette hirarchie, on trouve:
Des images fixes (background).
Des objets vido (objets en mouvement sans background).
Des objets audio (la voix associe l'objet en mouvement).
MPEG-4 dfinit donc prcisment la manire de dcrire une scne. La description
d'une scne code par MPEG-4 peut tre compare au langage VRML dans sa
structure et ses fonctionnalits.
Description dune scne:

Une scne audiovisuelle, code par MPEG-4, est dcrite comme un ensemble
d'lments individualiss. Elle contient des composants "mdia" simples regroups
par type. Ces groupes correspondent aux branches dun arbre de dcoupage o
chaque feuille reprsente un lment simple. Par exemple, si cette branche
correspondait une personne qui parle, elle serait divise en feuilles contenant le
fond, la parole et les divers composants graphiques reprsentant la personne en train
de parler. Une telle construction permet ainsi la construction de scnes complexes
tout en autorisant l'utilisateur ne manipuler qu'une partie des objets. Un objet
mdia peut donc tre associ une information. MPEG-4 fournit des mthodes de
codage pour les objets individuels.
La norme permet galement doptimiser le codage de plusieurs objets dans une
scne. Linformation ncessaire la composition dune scne est contenue dans la
description de la scne. Celle-ci est code et transmise avec les objets mdia. Ainsi,
pour faciliter linteractivit, la description de la scne est code indpendamment des
"Objets mdia" primitifs. Une grande attention est porte sur lidentification des
paramtres relatifs la scne. Ces paramtres sont donns par diffrents
algorithmes qui codent de faon optimale les objets. MPEG-4 autorise la modification
de ces paramtres sans avoir dcoder les objets mdia. Pour cela, ils sont placs
dans la partie description de la scne et non avec les objets mdia. Plus
gnralement, MPEG-4 standardise la faon de dcrire une scne, en permettant par
exemple:
de placer un objet n'importe o dans un systme de coordonnes.
d'effectuer des transformations gomtriques ou acoustiques sur un objet.
de grouper des lments "mdia" simples pour former un composant "mdia"
complexe.
de modifier les attributs d'un objet en transformant ses donnes.
de changer, interactivement, la vue et l'coute d'une scne.
Mais quelles sont exactement les informations donnes dans la description dune
scne?
La premire information donne la faon de coder un groupement dobjets. Une scne
MPEG-4 suit une structure hirarchique qui peut tre reprsente comme un graphe
acyclique. Chaque feuille du graphe reprsente un objet mdia. La structure de
larborescence nest pas ncessairement statique; les "feuilles"(avec leurs paramtres
de positionnement) peuvent tre changes. On peut aussi envisager den supprimer,
den remplacer ou mme den ajouter.
La deuxime information donne le positionnement spatial et temporel des objets.
Dans le modle MPEG-4, les objets audiovisuels sont la fois spatiaux et temporels.
Chaque objet mdia a un systme de coordonnes locales. Par ce systme il est
possible dattribuer un "tat" spatio-temporel et une chelle chaque objet. Les
objets mdia sont disposs dans la scne aprs avoir subi une transformation du
repre local au repre global, transformation dfinie par un de ses parents.
La troisime information donne la valeur qui est attribue la slection. Chaque
nud et feuille de larbre contient un panel dinformations. Certaines sont accessibles
et dautres restent fixes. Il est donc possible de les paramtrer loisir suivant les
informations donnes par lacteur et des contraintes dfinies par lauteur.
Enfin, la dernire information autorise une autre transformation pour les objets
mdia. La structure dune scne MPEG-4 est fortement influence par le concept de
VRML et ses possibilits dinteraction. Ceci reprsente lambition majeure de MPEG-4.
Interaction avec les objets "mdia" dans une scne MPEG-4:

L'utilisateur visualise en gnral des scnes respectant le dessein de leur auteur.
Mais, suivant la libert que ce dernier autorise, l'utilisateur a la possibilit d'interagir
avec la scne, ce qui lui permet entre autres:
de changer le point de vue ou d'coute d'une scne(par la navigation au
travers de la scne).
de dplacer un objet dans une scne.
de cliquer sur un objet pour obtenir des informations complmentaires sur
l'objet ou lui faire effectuer des actions spcifiques.
de slectionner une langue parmi celles qui sont proposes.
d'effectuer beaucoup d'autres actions complexes comme tablir une
communication entre deux personnes par un simple clic de souris ....
Codage des objets vido (VOP):
Vido naturelle, des outils standard:
Les outils servant reprsenter les objets visuels naturels avec MPEG-4 doivent
provenir d'une technologie standardise permettant le stockage, la transmission et la
manipulation de toutes les donnes de manire simple et efficace. Ces outils doivent
permettre galement de dcoder et reprsenter les images ou les vidos contenues
dans des VO (Vido Objects) et de les associer d'autres AVO (Audio-Video Objects)
pour crer une scne. Pour atteindre ce but et viter d'avoir une multitude
d'applications non conventionnes qui effectueraient quelques-unes de ces fonctions,
MPEG-4 propose des solutions et des algorithmes, regroupant la plupart des
fonctionnalits demandes par MPEG-4 comme pour:
La compression des images et des vidos.
La compression des textures mapping pour les maillages 2D et 3D.
La compression des maillages 2D implicites.
La compression des champs d'animation gomtrique des maillages.
L'accs alatoire de tous types de VO.
L'extension des fonctionnalits de manipulation des images et des squences
vido.
Le codage des vidos et des images bas sur le contenu.
Le re-dimensionnement des objets bas sur le contenu.
Le re-dimensionnement spatial, temporel et qualitatif.
La robustesse et la rsistance aux erreurs quel que soit l'environnement.
Toutes ces solutions seront fournies dans la partie visuelle de la norme MPEG-4.
Structure des outils de reprsentation des vidos "naturelles":
Les algorithmes de codage des images et des vidos MPEG-4 donneront une
reprsentation rationnelle des objets vido, avec pour but de respecter les
fonctionnalits bases sur le contenu. Mais MPEG-4 devra galement supporter les
fonctionnalits dj fournies par MPEG-1 et MPEG-2, soit la compression efficace des
images traditionnelles rectangulaires de diffrents formats, la frquence des images,
la profondeur des pixels, le taux de transfert, et les possibilits de redimensionnements spatial, temporel et qualitatif. MPEG-4 veut supporter les
algorithmes permettant un transfert efficace trs faible taux de transmission (VLBV:
Very Low Bit-rate Video, entre 5 et 64kBit/s) avec un taux de compression
satisfaisant, une grande rsistance aux erreurs et une faible complexit pour les
applications multimdia temps rel.
Toutes ces applications, prvues pour de faible dbit, devront tre aussi efficaces
haut dbit de transfert (jusqu' 4MBit/s). L'ide d'un codage bas sur le contenu
implique que MPEG-4 puisse coder et dcoder sparment les diffrents "objets
vido"(VO) d'une scne, afin de permettre une gestion simplifie de l'interactivit, la
manipulation et la reprsentation des objets vido, ainsi que le mlange entre objets
naturels et objets synthtiques (comme par exemple une scne avec un fond virtuel
et des personnages rels). Mais les algorithmes supplmentaires ncessaires la
gestion du codage bas sur le contenu ne devront tre qu'un ensemble additionnel
d'outils aux VLBV et HBV dj utiliss dans MPEG-1 et MPEG-2.
Codage des textures et des images fixes:
MPEG-4 utilise les algorithmes bass sur la mthode des ondelettes (wavelet) pour
compresser ce type d'images. En effet, cette compression est trs efficace quel que
soit le taux de transfert, tout en conservant ses capacits d'adaptabilit spatiale et
qualitative, ce qui est non ngligeable pour rsoudre les problmes d'interactivits
(notamment pour les changement de vue) et de texture des objets 2D et 3D dans les
images virtuelles.
Objets synthtiques:
Les objets synthtiques englobent une importante partie de l'imagerie par ordinateur.
Ces objets sont dcrits de faon paramtrique, suivant un modle que l'on peut
diviser en 4 parties:
La description synthtique du visage et du corps humain.
L'animation des champs du visage et du corps.
Le codage dynamique et statique du maillage avec les textures.
Le codage des textures suivant les vues.

Animation du visage:
L'animation d'un visage se fait partir d'un modle ayant une expression neutre
(FDP: Facial Definition Parameter) contrl par une srie de paramtres contenus
dans le FAP (Facial Animation Parameter). Pour animer un visage, il suffira donc de
tlcharger le modle, et d'envoyer les paramtres contrlant le mouvement du
visage qui se traduiront alors sur le visage neutre l'aide d'un systme prvu cet
effet par MPEG-4 (FIT: Face Interpolation Technique). Ce systme possde l'avantage
de n'avoir besoin que d'un visage neutre permettant d'une part d'acclrer la
formation des mouvements et, d'autre part, de pouvoir en crer de nouveau sans
avoir de modle d'expression prdfini. La partie du standard relative l'animation
des visages permet d'envoyer des paramtres de calibrage et d'animation des
visages synthtiques. Ces modles ne sont pas standardiss par la norme MPEG-4,
seuls les paramtres le sont:
Dfinition et codage des paramtres d'animation.
Positions et orientations des points caractristiques (points-clefs) pour
l'animation du maillage (modlisation "fil de fer") du visage.
Configuration des lvres correspondant aux phonmes de la parole.
Positions 3D des points caractristiques.
Calibration du maillage 3D pour l'animation.
Carte des textures du visage.
Caractristiques personnelles.
Codage des textures du visage.
Animation du corps:
La technologie d'animation du corps proviendra directement de celle du visage, afin
de garder l'esprit de standardisation de la norme MPEG-4.
Animation des maillages 2D:
Le maillage 2D est une partition d'un espace 2D par des polygones eux-mmes
rfrencs par une liste de nuds. La norme MPEG-4 utilise uniquement le type de
maillage triangulaire, longtemps utilis pour la reprsentation d'objets 3D. Ainsi, la
modlisation par maillage triangulaire peut tre considre comme la projection d'un
maillage 3D sur une image plane. MPEG-4 a voulu utiliser un maillage dynamique
triangulaire pour conserver la facilit de manipulation et les multiples fonctionnalits
qu'offre cette solution pour les objets 3D, comme pour la manipulation d'objet vido:
Amliorer le ralisme des scnes.
Modifier ou remplacer des objets.
Rendre plus robuste l'interpolation spatio-temporelle lors de la reconstruction
des images (en cas de pertes d'informations).
Pour la compression:
le maillage permet d'augmenter le taux de compression avec un faible taux
d'erreur.
Pour le codage des maillages 2D structure implicite:
Prdiction base sur le maillage et transfiguration de texture anime.
Modlisation 2D de Delaunay ou maillage rgulier avec suivi de mouvement
pour les objets anims.
Prdiction de mouvement et suspension de transmission des textures avec les
maillages dynamiques.
Compression gomtrique pour les vecteurs de dplacement.
Compression de maillage 2D reconstruction implicite de la structure et du
dcodeur.
chelonnage en fonction des vues:

En fonction de la faon dont on regarde une scne, toutes les informations ne sont
pas ncessaires. L'chelonnage permet de slectionner uniquement la partie utile de
l'information, et donc de transfrer une masse d'informations considrablement
rduite entre la base de donnes et l'utilisateur, donnes qui seront traites sous
cette forme rduite au codage et au dcodage(compression). Cette mthode est de
plus applicable aussi bien avec les ondelettes qu'avec le codeur DCT (Discrete Cosine
transform).
Codage des formes et de la transparence:
Le codage des formes sera support dans l'assistance la description et la
composition des images et des vidos conventionnelles aussi bien qu' celles des
objets vido. Les applications bnficiant des cartes binaires de formes sont surtout
les reprsentations d'images bases sur le contenu pour les images des bases de
donnes, des jeux interactifs, la surveillance et l'animation. Des techniques sont
fournies pour permettre un codage efficace des formes binaires. Une carte de
transparence binaire dfinit si un pixel appartient ou non un objet.
Le codage des formes en "niveaux de gris" ou en "transparence". Une carte "alpha"
dfinit la transparence d'un objet, qui n'est pas ncessairement uniforme. Des cartes
de transparence multi-niveaux sont frquemment utilises pour superposer les
diffrents "calques" des squences d'images. D'autres applications bnficiant des
cartes binaires de transparence sont les reprsentations d'images bases sur le
contenu pour les images des bases de donnes, des jeux interactifs, la surveillance et
l'animation. Des techniques efficaces sont prvues, permettant un codage efficace
aussi bien en niveaux de gris qu'en transparence. Une carte de transparence binaire
dfinit si un pixel appartient ou non un objet. Une carte des niveaux de gris dfinit
la transparence exacte de chaque pixel.
Les outils de MPEG-4:
Le standard visuel de la norme MPEG-4 permettra de coder des images et des vidos
avec des scnes synthtiques cres par ordinateur. A cette fin, le standard visuel
contiendra aussi bien des outils et des algorithmes supportant le codage d'images
relles et de vidos que des outils supportant la compression de paramtres
synthtiques 2D et 3D(maillages, textes, ...). Voici un aperu des fonctionnalits qui
seront supportes par les diffrents outils et algorithmes du standard visuel de la
norme MPEG-4.
Fonctionnalits supportes par les outils de MPEG-4:
Fonctionnalits conventionnelles et bases sur le contenu:
La diffrence entre un codeur VLBV, et un codeur MPEG-4 tient compte de l'aspect
bas sur le contenu. Les deux codeurs prsentent de nombreuses similitudes, mais le
codeur bas sur le contenu possde une extension pour la gestion des formes(shape)
et de la transparence. Les avantages des fonctionnalits bases sur le contenu sont:
Codage des images et de la vido bas sur le contenu pour permettre un
dcodage et une reconstruction adapts chaque type d'objet vido.
Accs alatoire au contenu des squences vidos pour permettre des
fonctionnalits telles que la pause, l'avance et le retour rapides.
Accroissement des possibilits de manipulation du contenu des squences
vidos pour permettre des fonctionnalits telles que les dformations de
textes, textures, images et squences vidos synthtiques ou naturelles lors
de la reconstruction du contenu de la vido.
Adaptabilit du codage des "objets vido":
MPEG-4 code tous les types d'images (images naturelles rectangulaires ou objets
contours complexes). L'adaptabilit de ce codage vient des prfrences qu'on peut lui
donner en fonction des besoins, comme par exemple:
Rduction de la complexit du dcodeur, et donc rduction de la qualit pour

des images dont la qualit n'est pas primordiale.
Rduction de la rsolution pour une utilisation en petite taille de grands
objets.
Rduction de la rsolution temporelle: squence vido lue avec moins
d'images par secondes.
Rduction de la qualit sans perte de taille ou de cadence.
Etc ...
Le but du codage MPEG-4 tant de donner nimporte quel utilisateur les mmes
possibilits dutilisation, quelles que soient ses capacits matrielles, la norme est
donc faite de manire pouvoir sadapter aux besoins et aux exigences de
lutilisateur. Ainsi, ladaptabilit de la norme se fait sur diffrents champs:
Adaptabilit de la complexit au niveau de l'encodeur pour permettre aux
encodeurs de complexit plus ou moins leve de gnrer un flux de donnes
valide pour une texture, image ou vido donne.
Adaptabilit de la complexit au niveau du dcodeur pour permettre un flux
de donnes reprsentant une texture, image ou vido, d'tre dcod par des
dcodeurs de niveaux de complexit diffrents. La qualit de la reconstruction
est, en gnral, relative la complexit du dcodeur utilis. Ceci pourrait
entraner le fait que des dcodeurs moins puissants ne puissent dcoder
qu'une partie du flux de donnes.
Adaptabilit spatiale qui permet aux dcodeurs de dcoder un sous-ensemble
du flux de donnes global gnr par l'encodeur pour reconstruire et afficher
les textures, images et vidos, une rsolution spatiale plus faible. Pour les
textures et images fixes, un maximum de 11 niveaux d'chelonnage spatial
sera support. Pour les squences vido, un maximum de trois niveaux sera
support.
Adaptabilit temporelle pour permettre aux dcodeurs de dcoder un sousensemble du flux de donnes global gnr par l'encodeur pour reconstruire
et afficher une squence vido une rsolution temporelle plus faible. Un
maximum de trois niveaux sera support.
Adaptabilit qualitative qui permet de sparer un flux de donnes en un
certain nombre de couches de faon ce que la combinaison d'un sousensemble de ces couches puisse tre dcode en un signal significatif. Cette
division au sein du flux de donnes peut s'effectuer aussi bien au cours de la
transmission que dans le dcodeur. La qualit de reconstruction est, en
gnral, relative au nombre de couches utilises pour le dcodage et la
reconstruction.
Cette adaptabilit permettra tous les utilisateurs du rseau d'avoir accs aux
applications temps-rel quelle que soit la configuration de leur machine (surtout si
celle-ci est limite).
Linteraction:
MPEG-4 permet lutilisateur de ne plus tre passif. Lutilisateur gre les
informations quil dsire. Il y a deux types dinteractions :
Celle du client.
Celle du serveur.
Le but est de permettre au client de pouvoir supprimer des informations quil ne
dsire pas ou bien daccder une surcharge dinformation (ex : changement de
langage ...). En outre, lutilisateur peut modifier les attributs de la scne en
changeant la position des objets, les rendant visibles ou invisibles, en changeant la
police des caractres, la couleur ou encore le volume sonore dun acteur de la scne
(par exemple un acteur peut tre isol dans une scne, il sera possible disoler
galement ses dires et de supprimer toute autre source sonore). Du ct du serveur,
son action peut permettre par exemple de changer de publicit au cours dun match
de hockey automatiquement, il peut accder aux mmes donnes que le client, mais
peut se rserver le droit dempcher certaines interactions.
Les droits de proprits intellectuelles:
MPEG-4 traite le problme des droits de proprits intellectuelles par insertion dans
les objets d'un code d'identification(IPI) donnant des informations sur le contenu, le
type du contenu et les droits attenant l'objet en question. Les donnes contenues
dans l'IPI et associes chaque objet peuvent diffrer, mme pour des objets
appartenant une mme image (par ex: droits libres sur le fond, mais restreints sur
le personnage). L'insertion de l'IPI au moment du codage implique galement
l'insertion des mcanismes de protection quivalent aux droits sur l'image (protection
contre les copies, facturation). Pour raliser une protection efficace, les mcanismes
utiliss sont trs complexes et sont dvelopps sous le titre de "IPMP" ...
Informations contenues dans les objets:
MPEG-4 permettra aussi d'attacher aux objets des informations complmentaires sur
eux et leur contenu. Ces informations (OCI) pourront tre envoyes textuellement en
mme temps que les objets, et pourront tre classifies suivant des tables
prdfinies mme en dehors de la norme.
Les formats supports:
Taux de transfert: entre 5 kbits/s et 4 Mbits/s
Formats: vido progressive et entrelace
Rsolutions: du format sub-QCIF au format TV
Efficacit de la compression:
Compression efficace de la vido quel que soit le taux de transfert.
Compression efficace des textures pour le plaquage de textures sur les
maillages 2D et 3D.
Les outils de MPEG-4 version 1:
MPEG-4 fournit un large et riche ventail d'outils pour le codage des objets
audiovisuels. Dans le but de permettre une implantation effective du standard, des
sous-ensembles des outils Systme, Vido et Audio de MPEG-4 ont t identifis afin
de n'tre utiliss que pour des applications spcifiques. Ces sous-ensembles, appels
"profils", limitent l'ensemble d'outils qu'un codeur aura implanter. Pour chacun de
ces profils, un ou deux "niveaux" ont t mis en place pour restreindre la complexit
de calcul.
L'approche est similaire celle de MPEG-2, alors que la plus connue des
combinaisons Profil/Niveaux est: "Profil principal @ Niveau principal". Une
combinaison "Profil@Niveau" permet un programmeur de codeur de n'implanter
que les sous-ensembles du standard dont il a besoin, tant qu'il maintient la
compatibilit avec d'autres outils MPEG-4 construit sur la mme combinaison. De
tester si ce module MPEG-4 respecte le standard (test de la conformit). Les profils
existent pour diffrents types de mdias (audio, vido et graphiques) et pour la
description de scnes. MPEG ne conseille pas de procder des combinaisons de ces
profils mais toutes les prcautions ont t prises pour que les diffrents types de
mdias se compltent aisment.
Profils visuels:
La partie visuelle du standard fournit des profils pour le codage des contenus visuels
naturels, synthtiques et hybrides naturel/synthtique. Il y a en tout cinq profils pour
le visuel naturel:
Le profil visuel simple fournit un codeur, efficace et rsistant aux erreurs,
d'objets vido
rectangulaires, adapt pour les applications de rseaux mobiles, tels que PCS
et IMT2000.
Le profil visuel simple adaptable ajoute au prcdent un support pour coder

des objets adaptables aux niveaux temporel et spatial. Il est trs utile pour les
applications qui fournissent des services sur plus d'un niveau de qualit
cause du dbit ou des possibilits limites du dcodeur, par exemple une
application Internet.
Le profil visuel 'noyau' ajoute au profil visuel simple un support pour coder des
objets adaptables de formes arbitraires et temporaires. Il est trs utile pour
les applications telle que celles qui fournissent une interactivit avec le
contenu relativement simple (applications multimdias sur Internet).
Le profil visuel principal ajoute au profil prcdent un support de codage pour
les sprites entrelacs et semi-transparents. Il est utile pour les applications
ludiques et interactives de grande qualit comme sur DVD par exemple.
Le profil visuel N-Bit ajoute un support pour coder les objets qui ont des
profondeurs pixelliques de 4 12 bits. Il est adapt l'utilisation en vido
surveillance.
Les profils pour les contenus visuels synthtiques et hybrides naturel/synthtique
sont:
Le profil visuel d'animation faciale simple fournit un moyen simple d'animer un
modle de visage, adapt aux applications telles qu'une prsentation
audio/vido pour les malentendants.
Le profil visuel adaptable ddi aux textures fournit des outils pour coder des
objets images fixes(texturs) aux dimensions adaptables utiliss pour les
applications ayant besoin de multiple niveau d'adaptation, tel que le plaquage
de texture sur un objet dans un jeu ou bien les camras numriques haute
rsolution fixes.
Le profil visuel basique d'animation 2D fournit une adaptabilit de l'espace, du
SNR et l'animation d'objets fil de fer pour des objets images fixes, ainsi que
l'animation simple d'objets visage.
Le profil visuel hybride combine les possibilits du profil visuel 'noyau' vu
prcdemment et dcode galement plusieurs objets synthtiques et hybrides,
objets image fixe face simple et anims inclus.
Profils audio:
Quatre profils audio ont t dfinis:
Le profil parole fournit le HVXC qui est un codeur paramtrique de la parole
trs faible dbit, un codeur CELP bande troite/bande large et une interface
Text-To-Speech.
Le profil synthse fournit une synthse par partition utilisant le SAOL et des
tables de sons ainsi qu'une interface Text-To-Speech pour produire des sons
et de la parole de trs faibles dbits.
Le profil adaptable est un super ensemble du profil parole. Il est adapt pour
le codage adaptable de la musique et de la parole pour les rseaux tels que
Internet et le Narrow band Audio Digital Broadcasting (NADIB). Le dbit est
compris entre 6 kBits/s et 24 kBits/s avec des bandes larges entre 3.5 et 9
kHz.
Le profil principal est un super ensemble trs riche de tous les autres profils,
contenant des outils pour l'audio naturelle et synthtique.
Profils graphiques:
Les profils graphiques dfinissent quels lments graphiques et textuels peuvent tre
utiliss dans une scne. Ces profils sont dfinis dans la partie Systme du standard:
Le profil simple graphique 2D fournit seulement les outils du BIFS (Binary
Format for Scene Description) ncessaires pour placer un ou plusieurs objets
dans une scne.
Le profil graphique 2D complet fournit toutes les fonctionnalits graphiques 2D
et supporte quelques fonctions comme les graphiques et les textes arbitraires,
qui peuvent tre en conjonction avec des objets visuels.
Le profil graphique complet fournit des lments graphiques avancs tels que
les extrusions et permet de crer une scne avec des lumires sophistiques.
Le profil graphique complet permet des applications telles que des mondes
virtuels complexes d'un trs haut ralisme.
Les profils de description de scne:
Les profils de description de scne, dfinis dans la partie systme du standard,
permettent de crer des scnes audiovisuelles avec seulement de l'audio, du 2D, du
3D ou du 2D/3D mixs:
Le profil 3D est appel VRML car il optimise l'interaction avec le langage VRML.
Le profil de scne audio prvoit un ensemble d'outils du BIFS (Binary Format
for Scene Description) pour l'audio seulement. Ce profil supporte des
applications de type radio diffusion.
Le profil de scne 2D simple fournit seulement les outils du BIFS pour placer
un ou plusieurs lments audiovisuels dans une scne. Ce profil permet de
crer des prsentations audiovisuelles mais sans possibilit d'interactions. Il
peut tre utilis pour des applications type tldiffusion.
Le profil de scne 2D complet fournit tous les outils du BIFS ncessaires la
ralisation d'une scne 2D. Ce profil est utilis pour des applications 2D qui
ncessitent une interactivit grande et spcifique.
Le profil de scne complet fournit le jeu complet d'outils du BIFS. Ce profil sert
raliser des applications telles que des mondes 3D virtuels dynamiques et
des jeux.
Les profils de description d'objets:
Ils comprennent les outils suivants:
Outil descripteur d'objet (OD).
Outil de synchronisation (SL).
Outil d'information sur les objets (OCI).
Outil de proprit intellectuelle et de protection (IPMP).
Actuellement, seul un profil est dfini et inclut tous ces outils. La raison principale de
la cration de ce profil n'est pas de crer des sous-ensembles d'outils mais plutt de
leur dfinir des niveaux. Ceci s'applique spcialement l'outil de synchronisation des
couches, MPEG-4 utilisant diffrentes bases de temps. En introduisant des niveaux, il
est alors possible, par exemple, de n'autoriser qu'une seule base de temps.
Problmes ouverts:
MPEG-4 est une rvolution, tant du point de vue de sa structure physique, que de
l'idologie qui en dcoule. C'est la base de tout ce qui touchera la communication et
le multimdia dans les annes venir, et quand on voit l'explosion de toutes ces
technologies, on imagine l'importance d'une telle norme. MPEG-4 n'en est qu' ses
dbuts, mais ses applications sont vastes et beaucoup de choses ont dj t
ralises. Malgr tout, le travail effectuer est encore long avant dobtenir des
rsultats convainquant pour tous les compartiments de la norme. En particulier, il
reste deux problmes majeurs rsoudre pour le codage des vidos naturelles,
savoir, l'estimation de mouvement et la segmentation de la vido en objets.
De plus en plus d'informations audiovisuelles sont accessibles sous forme numrique,

en tout endroit de part le monde et de plus en plus de gens souhaitent les exploiter.
Mais avant que quiconque ne puisse utiliser de telles informations, il sera ncessaire
de commencer par les localiser. Au mme moment, l'augmentation du nombre
d'informations potentiellement intressantes rend la recherche de plus en plus
difficile.
Des solutions sont dors et dj proposes pour faciliter la recherche d'information de
type texte. En effet, de nombreux moteur de recherche sont accessibles sur le Web
et font mme partie des sites les plus visits, ce qui montre une relle demande pour
ce type de produit. Il n'est cependant pas pour autant possible de chercher des
informations sur un contenu audiovisuel, puisqu'il n'existe en gnral pas de
descriptions reconnaissable de ce type d'information. En rgle gnrale, il n'est pas
possible de trouver de faon efficace une image de "la moto de Terminator II" sur le
Web, pour prendre un exemple. Dans certain cas particuliers, des solutions existent
cependant. Des bases de donne multimdias permettent aujourd'hui de chercher sur
le march des images partir de certaines caractristiques comme la couleur, la
texture ou la forme d'objet dans l'image.
Objectifs de MPEG-7
MPEG a commenc mettre au point un nouvel outil de travail pour rpondre au
problme dcrit prcdemment. Ce nouveau membre de la famille MPEG, appel
"Multimdia Content Description Interface"(MPEG-7) tendra les capacits de
recherche limites d'aujourd'hui pour inclure d'autres types d'informations. En
d'autres termes, MPEG-7 va spcifier une description standard de diffrents types
d'informations multimdia. Cette description devra tre associe au contenu luimme pour permettre la recherche rapide et efficace des informations qui intressent
l'utilisateur.
Ces "matriaux" incluent; images, graphiques, audio, vido et de l'information sur
comment ces lments sont combins dans une prsentation multimdia (scnario).
La description peut tre attache n'importe quel matriau multimdia, quel que soit
le format de la reprsentation. Mme si la description de MPEG-7 ne dpend pas de la
reprsentation du matriau, le standard s'appuie en un certain sens sur le standard
MPEG-4 qui fourni quand lui les moyens de coder des matriaux audiovisuel.
La description standardise des diffrents types d'information peut rsider en un
certain nombre de niveaux smantiques. Pour prendre l'exemple d'un matriau
visuel, un niveau d'abstraction bas pourrait tre la description de la forme, taille,
texture, couleur et composition. Les plus hauts niveaux donneraient des informations
smantiques comme; "il s'agit d'une scne avec une voiture rouge gauche et un
oiseau qui vole (dans le ciel)", codes sous une forme efficace. Des niveaux
intermdiaires pourraient aussi exister.
En plus de la description du contenu, il peut tre galement ncessaire d'inclure
d'autres informations, comme Le format (par exemple le type de compression
utilise) ou la taille. Cette information aide dterminer si le matriau peut tre lu
par l'utilisateur. On peut aussi penser aux conditions d'accs aux matriaux, qui
pourrait inclure des informations concernant le copyright et le prix, ou des liens vers
d'autres matriaux intressant.
Contrairement aux prcdentes versions du MPEG, MPEG-7 n'est pas un format de
compression. Ou en tout cas, pas seulement. Destin au multimdia au sens large du
terme, il vise encoder toute forme de donnes audiovisuelles, du texte la vido,
du modle 3D aux prsentations interactives. Mais surtout, le standard propose de
complter les donnes par leur description. MPEG-7 c'est, en rsum, "des bits
propos des bits". Autrement dit, un ensemble de donnes supplmentaires dcrivant
le contenu, son auteur, sa structure, ou mme les lments smantiques qu'il
reprsente. Le principe est la fois ambitieux et novateur et on imagine bien la
puissance d'un tel standard, notamment en matire de recherche sur le Web. C'est
d'ailleurs ce qui semble motiver ses concepteurs: "La principale ambition de MPEG-7
est de rendre les informations multimdias aussi faciles trouver sur le Web que le
texte l'est aujourd'hui." Par exemple, on pourrait imaginer un moteur qui parcourt le
Web la recherche d'une phrase musicale prcise: tapez quelques notes de musique
au clavier, et vous obtiendrez tous les morceaux comportant les mmes notes. Mme
chose avec les images, il sera possible d'identifier les fichiers comprenant un objet
d'une couleur donne, mme s'il ne s'agit que d'une partie de l'image. Du reste,
l'intrt n'est pas ngligeable en matire d'intgrit des donnes, et donc de respect
des droits d'auteur. Mais, bien qu'intellectuellement plaisant, MPEG-7 soulve
quelques interrogations.
D'abord, le poids final des fichiers encods avec ce format, dont on peut supposer
qu'il sera, par essence, plus important que celui de la description des donnes en
elle-mme. Ensuite la base existante, si l'on considre les milliards d'informations
numriques (fichiers image, audio et vido) dj encodes d'autres formats, on
peut s'inquiter de la vitesse laquelle se rpandrait un nouveau standard, encore en
cours de conception aujourd'hui.
Enfin, et surtout, on peut se poser la question de l'utilit relle d'une telle solution. La
recherche d'une succession de notes dans l'ocan de la musique mondiale peut
s'avrer intressante, mais srement pas pour le commun des mortels, qui se
satisfait trs bien d'une recherche plus classique par auteur ou par titre. En plus, il
existe d'autres solutions pour indexer, au besoin, des donnes multimdias. Qui ne
se souvient pas de l'affaire Clinton/Lewinsky. Peu aprs l'audition du Prsident, les
enregistrements vido des tmoignages taient disponibles sur AltaVista. Trononns
en courtes squences, ils taient indexs la fois automatiquement ( l'aide d'un
outil spcifique) et manuellement. Le rsultat tait probant; la saisie d'un texte
permettait d'identifier rapidement tous les extraits vido dans lesquels la phrase
correspondante avait t prononce (souvent, curieusement, le dispositif tait utilis
pour trouver le mot "cigare").
Il n'est donc pas certain qu'il soit lgitime de chercher imposer(et gnraliser) un
standard surpuissant, l o d'autres solutions "sur mesure" peuvent suffire. Dcrire
les donnes tout en les compressant est pourtant une tentative logique d'organisation
et de structuration du contenu numrique. Mais il est bien dommage que l'on s'en
proccupe si tard. Car finalement, le vrai problme de MPEG-7, c'est sans doute le
"7".
Prsentation du standard MPEG-7
Les donnes multimdia sont disperses dans de nombreuses bases de donnes.
Dans ce contexte, MPEG-7 se propose de standardiser la reprsentation de leur
contenu pour la recherche et le filtrage d'information. Beaucoup d'applications
peuvent bnficier de MPEG-7, telles que la recherche dans les bases de donnes
audiovisuelles (pour le mdical, l'ducatif, les loisirs, la surveillance, &Idots;), ou la
slection de programmes diffuss.
Qu'est ce que la norme MPEG-7?
- Un standard de description:
Le format MPEG-7 est compltement indpendant de la technique de codage ou de
stockage du contenu du document multimdia. On peut tablir une description MPEG7 d'un fichier MPEG-2 ou MPEG-4 bien sr, mais on peut faire de mme avec un film
analogique ou un journal papier. Il s'agit uniquement d'un standard de reprsentation
du contenu des documents. L'utilisation principale de MPEG-7 concernera
videmment les documents multimdia (contenant la fois vido et audio). Les
informations qui apparatront dans un document MPEG-7 seront de 5 natures
diffrentes, rsumes dans le tableau suivant:
Ensemble des
Fonctionnalit
lments
Cration et
production
Des mta-informations qui dcrivent la cration et la production du

contenu, elles dcrivent le titre, le crateur, le but de la cration.
Utilisation
Des mta-informations relies l'utilisation du contenu: Elles

comportent les droits d'accs, des informations financires, des droits
de publication. Ces informations peuvent faire l'objet de changement
durant la dure de vie du contenu audio-visuel.
Mdia
Ces informations dcrivent les caractristiques de stockage: Format,

lments pour identifier le mdia&Idots;
Aspects
structurels
Des descriptions d'un point de vue contenu: Ces informations

dcrivent les segments qui peuvent reprsenter des composantes
spatiales, temporelles ou spatio-temporelles du contenu audio-visuel.
Chaque segment peut tre dcrit par les caractristiques suivantes(la
couleur, la texture, la forme, la motion, d'autres caractristiques
audio&Idots;) et quelques informations smantiques lmentaires.
Aspect
Conceptuels
Des descriptions du contenu audio-visuel d'un point de vue

conceptuel. Ces informations ne sont pas indiques dans les
documents techniques du standard MPEG, car elles sont en cours de
standardisation.
- Les Limites:
Le standard MPEG-7 ne concerne absolument pas les aspects production et utilisation
des descriptions. C'est d'ailleurs dans cette optique que l'exemple suivant t cr,
il s'agit de produire et utiliser une description MPEG-7 sommaire( partir d'un ou
deux descripteurs).
Principe de description MPEG-7

- La philosophie:
Toute description MPEG-7, tant base sur le langage XML, est constitue d'objets
imbriqus. Cette imbrication se fait selon un certain schma descripteur, lui-mme
tabli partir d'un langage de dfinition de descriptions comprenant les lments
suivants;
Les descripteurs (D):
Ce sont des prsentations de caractristiques des lments. Ils dfinissent la syntaxe
et les smantiques de chaque reprsentation de ces caractristiques.
Les schmas descripteurs (SD):
Ils spcifient la structure et les smantiques des relations entre leurs composantes,
qui peuvent tre soit des descripteurs soit des schmas descripteurs.
Un langage de dfinition des descriptions (LDD):
Il permet la cration de nouveaux descripteurs ou schmas descripteurs. Il permet
galement d'tendre et de modifier les descripteurs et les schmas descripteurs
existants. Les outils et les systmes qui permettent de gnrer les descripteurs et les
schmas descripteurs du standard MPEG-7, qui permettent de les grer, les
manipuler&Idots;
Valeur d'un descripteur:
Instance d'un descripteur pour un ensemble de donnes Rq, les valeurs sont
combines avec les schmas de descriptions pour former une description.
Description:
Consiste en un SD et en un ensemble de valeurs de descripteurs dcrivant la donne.
- Hirarchie:
Les objets imbriqus formant une description MPEG-7 peuvent aussi bien tre des
descripteurs que des schmas descripteur(eux-mmes l'origine d'autres
descripteurs). Le diagramme suivant traduit cette hirarchie tout en nous rappelant
que le langage de dfinition des description permet une totale extensibilit du
standard.
De MPEG-1 MPEG-21
Cration d'une infrastructure Multimdia Inter-oprable
Le dbat au sujet du MPEG-4 se continue, ses spcifications sont disponibles depuis
quelques temps dj et le Internet Streaming Media Alliance (ISMA) publi ses
spcification sur le "streaming" Internet en se basant sur le MPEG-4. MPEG-4 est le
premier standard de contenu multimdia ouvert et comprhensible qui supporte
plusieurs industries du multimdia, comme MPEG-2 supporte l'industrie du DVD et de
la tlvision. Le standard bas objet qu'est MPEG-4 est la fois fine pointe de la
technologie et prt pour le futur; il pourras aisment incorporer les amliorations
technologiques si et quand elles se matrialises. En fait, une quipe conjointe du
MPEG/ ITU-T est incorporer un nouveau codec vido d'ici peu, demeurant ainsi la
fine pointe de la technologie du codec vido. Cette partie sera galement un standard
du International Telecommunication Union (ITU-T).
Le but demeure l'interoprabilit:
Pendant ce temps, le Moving Picture Experts Group n'est pas rest assis sur ses
lauriers. Il a rcemment finalis la premire version du standard international MPEG7 pour la description du contenu, qui sera publi par ISO sous peu. MPEG-7
complmentera MPEG-4 et ne tentera pas de le supplanter. MPEG-4 dfini comment
reprsenter un contenu; MPEG-7 spcifie comment le dcrire. Et l'horizon pointe un
autre standard ISO/MPEG, MPEG-21, qui visera apporter un cadre multimdia
rellement inter-oprable. L'essentiel de tous les efforts du MPEG est
l'interoprabilit, inter-oprabilit pour le consommateur. De faon s'assurer que
celui-ci sera capable d'utiliser le contenu et ne pas avoir s'en faire avec la
compatibilit des formats, codecs, metadata, etc...
MPEG-1 et MPEG-2 proposent des manires inter-oprables de reprsenter un

contenu audio-visuel, communment utiliss avec les mdias digitaux et en diffusion.
MPEG-4 tends ceci beaucoup plus d'applications travers des fonctions comme un
champ tendu du taux de transfert, son adaptabilit, sa rsistance aux erreurs, son
intgration homogne de diffrents types d'objets dans la mme scne, son interface
de gestion des systmes de droits digitaux et ses puissantes possibilits d'intgration
de l'interactivit l'intrieur du contenu. MPEG-7 dfini un cadre d'inter-oprabilit
bien au-dessus du "metadata" traditionnel. MPEG-7 possde des lments descriptifs
qui vont des caractristiques de base comme les caractristiques des couleurs, des
formes et des sons, jusqu'aux structures d'information de contenu de haut niveau. Il
est aussi unique pour ses outils pour structurer l'information de contenu. MPEG-7 et
MPEG4 forment un excellent couple, spcialement lorsque sont utiliss les objets de
MPEG-4. Avec MPEG-7 il est dsormais possible d'changer de l'information au sujet
de contenus multimdias d'une manire inter-oprable, rendant plus aise la
recherche de contenu et l'identification de seulement ce que vous voulez utiliser.
L'information contenu dans MPEG-7 sera ajout aux signaux "broadcast"; les VCR et
les engins de recherches pourrons l'utiliser, et il facilitera grandement l'administration
des contenus multimdias dans ce qui est souvent un large "entreposage". Les
archives audio-visuelles seront accessible beaucoup plus aisment grce MPEG-7.
Faire face aux problmes:
Ds le dbut, MPEG compris que plus d'inter-oprabilit dans les DRM(Digital rights
managements) est crucial une infrastructure multimdia ouverte. Il y a quelques
annes, MPEG pens intgrer, profondment l'intrieur des systmes de MPEG-4,
une srie de "plug-ins", appels "Interfaces to proprietary Intellectual Property
Management and Protection (IPMP)". Ceux-ci permettent, lorsque l'on veut jouer un
contenu particulier, d'utiliser le "plug-in" IPMP appropri. O l'obtenir pourra tre
signal l'intrieur du flux de donnes.
Mais ce n'est pas toujours assez, un lecteur de musique portable ne peut pas
tlcharger le bon systme IPMP, donc perte d'inter-oprabilit. Le problme rside
dans la standardisation des permissions. Chaque propritaire de contenu doit, par
exemple, pouvoir faire confiance tous les utilisateurs du contenu. Ce genre de
confiance est trs difficile standardiser, MPEG continu de travailler standardiser le
tout.
6 Milliards de producteurs de contenu:
Ceci nous amne au cadre multimdia MPEG-21. Pour arriver une relle interoprabilit, on aura besoin de plus que larchitecture IPMP dont nous parlions plus
haut. Selon son rapport technique, le but de MPEG-21 est de dcrire une image
gnrale de comment les diffrents lments servant construire une infrastructure
destin transmettre et "consommer" les contenus multimdia (existants et en
dveloppement) sont en relation lun avec lautre. En prsentant cette vision et en
commenant y travailler, MPEG-21 amen beaucoup de sang neuf au MPEG,
incluant des reprsentants de lindustrie du film, les gants de la musique et les
fournisseurs en technologie.
Le monde du MPEG-21 consiste en des utilisateurs qui interagissent avec des items
numrique (Digital Items). Un item numrique peut tre nimporte quoi, dune partie
de contenu lmentaire (une simple photo, une piste audio) jusqu une collection
complte doeuvres audio-visuelles. Un utilisateur peut tre qui que ce soit qui utilise
un item numrique, du producteur au vendeur au consommateur. Avec MPEG-21,
tous les utilisateurs sont gaux en ce sens quils ont tous leurs droits et intrts dans
les items numriques, et quils ont tous le besoins dtre capable de les exprimer. La
force motrice derrire MPEG-21 est la notion que la rvolution numrique donne
chacun des consommateurs la chance de jouer un nouveau rle dans la "chane
alimentaire" du multimdia. Il y a donc potentiellement 6 milliards dutilisateurs du
MPEG-21.
MPEG-21 cherche utiliser les standards existants lorsque cest possible, en faciliter
leur intgration et remplir les vides. MPEG est prsentement prparer une srie de
"parties" du standard MPEG-21. En contant le rapport technique comme la partie #1,

la seconde partie sera la "Digital Item Declaration", un schma concis et puissant,
bas sur le XML, pour dmontrer les items numriques. Un peu plus ambitieux est la
troisime partie de MPEG-21, la "Digital Item Identification and Description". Celle-ci
rglera le problme didentification unique des contenu numrique, dune manire
globale, et de donner un mcanisme de rsolution en mme temps que lidentification
unique. Imaginez que vous avez trouv une pice de contenu (trouv sur le web,
reu dun ami, trouv sur un CD, etc...) et que vous voulez le "consommer". Le
contenu est protg, mais une "digital item identification" vous indiquera o trouver
linformation sur ses droits. Linformation sur les droits est code en utilisant les deux
parties suivantes du MPEG-21, le "the Rights Expression Language, REL (part 5)" et
le "Rights Data Dictionary, RDD (part 6)". Ces deux parties ensemble permettent
lexpression des droits dans une forme interchangeable, en utilisant une syntaxe
standardise (REL) et des termes standardiss (RDD). Ces standards devraient tre
prt au dbut de 2003. Il est probable que le "Right expression language" sera bas
sur le XML, mais il tout aussi probable quil possde galement une reprsentation
binaire compacte, qui pourra tre utilis avec les contraintes de bande passante, en
condition de traitement en temps rel. Entre les parties 3 et 5, vues plus haut, le
travail sur un IPMP plus inter-oprable lintrieur de MPEG-4 t rcemment
inclus dans MPEG-21 comme la partie #4, parce quil sapplique tout aussi bien
MPEG-7, MPEG-2 et MPEG-1.
Un contenu qui sadapte lenvironnement:
Le 7me lment du cadre dapplication sera une description unifie de
lenvironnement dans lequel le contenu sera utilis. Ceci couvre les conditions
daccs, de terminaux et de rseaux. Le but tant darriver un accs multimdia
universel (Universal Multimedia Access), ou le contenu sadaptera de lui-mme, dune
manire transparente et dynamique, aux circonstances. MPEG-21 est dvelopp en
utilisant une approche par vagues, les diffrentes parties se suivant lune lautres
dans le temps. Les travaux futurs sur le MPEG-21 devrait vraisemblablement inclure:
"Content Representation"(comment les ressources mdias sont reprsents au del
des standards MPEG xistants), "Content Handling and Usage"(Interfaces pour grer
le contenu), et "Event reporting"(rapport dvnements).
Tous les utilisateurs bnficieront:
MPEG-4 prouve sa viabilit dans le march comme un standard multimdia ouvert.
L"cosystme" prends vie: serveurs, joueurs, "hardware" et "software", systmes de
test, noyau IP et outils dauteurs sont mis en oeuvre. Ceci reprsentera un pas de
gant vers une plus grande inter-oprabilit dans le monde du multimdia. MPEG-7
aidera grer labondance sans cesse grandissante de contenu et MPEG-21 rendra
linteraction protge avec le contenu de plus en plus transparent, galisant ainsi les
chances pour tous les participants dans la "chane alimentaire" multimdia. Les
diffrents utilisateurs ne peuvent quen retirer les bnfices.
Le Flux Elmentaire (Elementary Stream):
Premire couche syntaxique du MPEG, l'ES (Elementary Stream) est le signal brut en
sortie de compression. Dans la ralit, on ne travaille jamais directement avec ce
type de signal. Il reste cach au coeur des codeurs.
Un flux lmentaire ne contient rien de plus que ce qui est ncessaire au dcodeur
pour s'approcher au mieux de l'image. En MPEG, la syntaxe du signal compress est
strictement dfinie de faon s'assurer que les dcodeurs puissent l'interprter. Le
codeur n'a pas d'autre dfinition que l'obligation d'mettre selon la syntaxe
convenable. L'avantage de ce concept est qu'il s'approche du monde rel dans lequel
il y a vraisemblablement plus de dcodeurs que de codeurs. En standardisant le
dcodeur, on peut diminuer sensiblement le cot de sa fabrication. Inversement, le
codeur peut tre bien plus compliqu et plus onreux et il peut procurer une forte
amlioration de l'image sans tre pnalis par un cot excessif. Quand le codeur et le
dcodeur prsentent des degrs de complexit diffrents, le systme est dit

"asymtrique".
L'approche MPEG donne galement la possibilit d'amliorer la qualit de l'image en
redfinissant les algorithmes tout en conservant des flux de bits susceptibles d'tre
interprts par des dcodeurs de fabrication plus ancienne. Cette approche permet
galement d'utiliser des algorithmes privs de codage qui n'ont pas entrer dans le
domaine public.
Flux lmentaire vido:
L'illustration ci-dessous montre la structure du flux lmentaire vido. L'unit
fondamentale de l'information d'image est le bloc DCT qui reprsente un rseau de 8
x 8 pixels pouvant tre Y, Cr ou Cb. La composante continue est d'abord mise avec
une prcision suprieure celle des autres coefficients. Viennent ensuite les autres
coefficients et le code de fin de bloc (EOB, end of bloc). Les blocs sont groups en
macroblocs qui constituent l'unit fondamentale d'une image et qui peuvent faire
l'objet de la compensation de mouvement. Chaque macrobloc comporte, dans son
en-tte, un vecteur de mouvement bi-dimensionnel.
Dans les images B, les vecteurs peuvent tre vers l'avant ou l'arrire. La
compensation de mouvement peut tre base sur l'image ou la trame et cela est
indiqu, ainsi que l'chelle utilise pour la re-quantification des coefficients. Le
dcodeur se sert des vecteurs pour prendre les informations des images prcdente
et suivante pour btir une image prdite. Les blocs subissent la transforme inverse
pour produire l'image de correction qui est ajoute l'image prdite afin d'obtenir le
signal de sortie du dcodeur.
En codage 4:2:0, chaque macrobloc comporte quatre blocs Y et deux blocs de
diffrence de couleurs. Pour rendre possible l'identification de leur contenu(Y, Cr ou
Cb), les blocs sont mis dans un ordre particulier. Les macroblocs sont assembls en
tranches reprsentant toujours des bandes horizontales balayant l'image de la
gauche vers la droite. En MPEG, les tranches peuvent commencer n'importe o et
tre d'une taille quelconque. En ATSC, elles doivent commencer du ct gauche de
l'image.
Plusieurs tranches peuvent se placer sur la largeur de l'cran. La tranche est l'unit
fondamentale de synchronisation pour les longueurs variables et le codage
diffrentiel. Les premiers vecteurs d'une tranche sont mis intgralement tandis que
les autres sont transmis en mode diffrentiel. Dans les images I, les premiers
coefficients de composante continue de la tranche sont transmis intgralement et les
coefficients de composante continue suivants le sont diffrentiellement. Dans les
images de diffrence, cette technique ne se justifie pas. Si une erreur de bits se
produit dans un flux lmentaire, cela crera soit une rupture dans la d-srialisation
des symboles longueur variable, soit une erreur des coefficients ou des vecteurs
mis ultrieurement en mode diffrentiel. La structure en tranches permet de
retrouver rapidement le bon dcodage en fournissant un point de re-synchronisation
dans le flux de bits. Plusieurs tranches sont groupes pour constituer une image qui
est la part active d'une trame.
L'entte de l'image prcise si le codage de l'image est de type I, P ou B et comporte

une rfrence temporelle de faon que l'image soit prsente la bonne place. Dans
le cas de panoramiques ou de travellings verticaux, les vecteurs seront identiques
dans tous les macroblocs. Un vecteur global peut alors tre mis pour l'ensemble de
l'image et les vecteurs individuels deviennent des diffrences de cette valeur globale.
Les images peuvent tre combines pour constituer un groupe d'images (GOP, Group
Of Pictures) qui commencera par une image I.
Le GOP est l'unit fondamentale d'un codage temporel. En standard MPEG,
l'utilisation de GOPs est optionnelle mais elle est pratiquement ncessaire. Entre les
images I peuvent tre places diverses images de type P et B. Un GOP peut tre
ouvert ou ferm. Dans un GOP ferm, la dernire image B n'a pas besoin de l'image I
du groupe suivant pour tre dcode et le flux de bits peut tre coup la fin de ce
GOP. Si on utilise des GOPs, plusieurs GOPs peuvent tre combins pour produire une
squence vido.
La squence commence par un code de dbut de squence, suivi par un en-tte et se
termine par un code de fin de squence. Des en-ttes supplmentaires peuvent tre
placs au cours de la squence. Cette disposition permet de commencer un dcodage
n'importe o dans la squence comme cela peut se produire dans la lecture de
disques vido numriques ou de cassettes. L'en-tte de squence dfinit les tailles
horizontale et verticale de l'image, le rapport d'image, le format de souschantillonage de chroma, la frquence d'image, le type de balayage (progressif ou
entrelac), le profil, le niveau et le dbit de bits ainsi que les matrices de
quantification utilises dans les images intra-codes et inter-codes. Sans la donne
d'en-tte de squence, un dcodeur ne peut interprter le flux de bits et c'est
pourquoi les en-ttes de squence deviennent des points d'entre o les dcodeurs
peuvent dmarrer correctement leur opration. L'espacement entre les points
d'entre influence directement le temps que met le dcodeur oprer
convenablement aprs une commutation d'un canal l'autre.
Flux lmentaires audio:
Plusieurs sortes d'audio peuvent tre insres dans un multiplex MPEG-2. Ces
catgories comprennent l'audio code selon les normes des couches 1, 2 ou 3 du
MPEG ou l'ATSC. Le type de codage doit tre inclus dans un indicateur que le
dcodeur lira de faon faire appel au type de dcodage appropri.
Le processus de compression audio est sensiblement diffrent de celui de la vido. Il
ne comporte rien d'quivalent aux diffrents types d'image I, P ou B et les trames
audio contiennent toujours la mme quantit de donnes audio. Il n'y a galement
pas d'quivalence au codage bi-directionnel et les trames audio ne sont pas
transmises autrement qu'en squence naturelle.
En MPEG-2 audio, l'indicateur de l'en-tte de squence contient le numro de la
couche utilise pour la compression audio et le type de compression employ (stro
par exemple), ainsi que la frquence d'chantillonnage initiale. La squence audio est
organise en units d'accs (AU, Access Units) qui constitueront les trames audio
codes. Si le codage AC-3 est utilis, cette disposition est rpte dans l'en-tte de
squence. L'unit d'accs audio est une trame synchronise en AC-3. La trame AC-3
reprsente une excursion de temps quivalente 1536 chantillons audio, ce qui fait
32 ms pour un chantillonnage 48 KHz et 48 ms en 32 KHz.
Le Packet Elementary Stream:
Pour des raisons de commodit, les flux lmentaires continus transportant de l'audio
ou de la vido en provenance de compresseurs doivent tre diviss en paquets. Ces
paquets sont identifis par des en-ttes contenant des marqueurs temporels pour la
synchronisation. A partir des PES, on peut crer des Flux de Programme et des Flux
de Transport.
Paquets PES:
Dans le flux lmentaire en paquets (PES), un flux lmentaire continu est divis en
paquets d'une taille adapte l'application. La taille peut atteindre plusieurs
centaines de kilo-octets et varie en fonction de l'application. Chaque paquet est

prcd par un en-tte PES. Le paquet commence par un prfixe de 24 bits (prfixe
de dpart) et un identificateur de flux caractrisant le contenu du paquet(audio ou
vido), et si ncessaire, le type de codage audio.
Ces deux paramtres (prfixe de dpart et identificateur de flux) constituent le code
de dpart identifiant le code de dbut du paquet. Il est important de ne pas
confondre le paquet d'un PES et le paquet plus petit utilis dans les flux de transport,
ces deux lments portant malheureusement le mme nom. Comme le MPEG ne
dfinit que le flux de transport, et non le codeur, un concepteur peut dcider de
fabriquer un multiplexeur convertissant les flux lmentaires en flux de transport en
une seule tape. Dans ce cas, les paquets PES ne peuvent exister sous une forme
identifiable, mais ils font logiquement partie intgrante de la charge du flux de
transport. C'est d'ailleurs majoritairement le cas.
Marqueurs temporels:
Aprs la compression, les images sont extraites de la squence cause du codage bidirectionnel. Elles ncessitent une quantit variable de donnes et sont sujettes un
retard variable en raison du multiplexage et de la transmission. Des marqueurs
temporels sont priodiquement incorpors dans chaque image afin de verrouiller la
synchronisation entre l'audio et la vido.
Un marqueur temporel est un nombre de 33 bits constitu par la valeur d'un
compteur pilot par une horloge 90 KHz. Cette horloge est le rsultat de la division
par 300 de l'horloge de programme 27 MHz. Comme les temps sont rgulirement
espacs la prsentation, il n'est pas indispensable d'inclure un marqueur temporel
chaque unit de prsentation en sortie. Les marqueurs de temps peuvent, au lieu de
cela, tre interpols par le dcodeur mais ils ne doivent jamais tre spars de plus
de 700 ms, que ce soit dans le flux de programme ou le flux de transport.
Les marqueurs de temps indiquent quelle rfrence temporelle une unit d'accs
particulire appartient. La synchronisation des mouvements de lvres est obtenue en
incorporant des marqueurs de temps simultanment dans les paquets PES vido et
audio.
Quand un dcodeur reoit un paquet PES slectionn, il dcode chaque unit d'accs
et la sauvegarde dans une mmoire tampon en RAM. Quand la valeur du code
temporel de ligne atteint celle du marqueur temporel, la RAM est lue. Cette opration
a deux rsultats attendus. Primo, une correction de base de temps est effectivement
ralise dans chaque flux lmentaire. Secundo, les flux lmentaires vido et audio
peuvent tre synchroniss pour constituer un programme.
PTS/DTS:
Quand on utilise un code bidirectionnel, une image doit avoir t dcode quelque
temps avant d'tre prsente de faon pouvoir tre utilise comme source de
donnes pour une image B. Bien que, par exemple, l'on puisse prsenter les images
dans l'ordre IBBP, elles seront transmises dans l'ordre IPBB. Il existera donc deux
types de marqueurs temporels.
Le marqueur temporel de dcodage (DTS, Decode Time Stamp) indique quand une
image doit tre dcode, tandis que le marqueur temporel de prsentation (PTS,
Presentation Time Stamp) indique quand l'image doit tre prsente la sortie du
dcodeur. Les images B sont dcodes et prsentes simultanment, c'est pourquoi
ils ne comportent qu'un PTS. Quand une squence IPBB est reue, les images I et P
doivent tre dcodes avant la premire image B. Pendant que l'image P est en cours
de dcodage, l'image I est prsente en sortie de faon pouvoir tre suivie des
images B.
La figure prcdente dmontre que, quand une unit d'accs contenant une image I
est reue, les deux marqueurs DTS et PTS doivent exister dans l'en-tte et qu'ils
doivent tre spars d'au moins une priode d'images. Si le codage bidirectionnel est
utilis, une image P doit venir ensuite et cette image est galement dote d'un PTS et
d'un DTS, mais la sparation entre les deux marqueurs doit tre de trois priodes
d'images pour permettre l'intervention des images B. Ainsi, si une squence IPBB est
reue, l'image I est retarde d'une image, l'image P de trois images et les deux
images B n'ont aucun retard. La prsentation devient alors IBBP.
En clair, si la structure de GOP est change de faon ce qu'il y ait plus d'images B
insres entre les images I et P, la diffrence entre le DTS et le PTS des images P
sera augmente. Les indicateurs PTS/DTS de l'en-tte du paquet sont placs de faon
indiquer la prsence d'un PTS seul ou des deux marqueurs PTS et DTS. Les paquets
audio peuvent contenir plusieurs units d'accs et l'en-tte de paquet contient un
PTS. Comme les paquets audio ne sont pas transmis autrement qu'en squence
naturelle, il n'y a pas de DTS dans un paquet audio.
Le Flux de Programme et le Flux de Transport:
Les flux de programme et de transport constituent deux faons d'assembler plusieurs
flux de paquets PES.
Enregistrement contre transmission:
Pour une qualit d'image donne, le dbit de donnes variera selon le contenu de
l'image. Un canal dbit variable donnera donc un meilleur rsultat. Dans le domaine
des transmissions, la plupart des canaux sont fixes et le dbit global de bits est
maintenu constant par l'addition d'un bourrage (donnes sans signification).
Dans le cas du DVD, l'utilisation de ce bourrage constitue un gaspillage d'espace de
stockage. Cependant, on peut acclrer ou ralentir la vitesse d'un moyen de stockage
soit physiquement soit, dans le cas d'une unit de disque, en changeant les
demandes de transfert de donnes. Cette approche permet d'avoir un canal dbit
variable sans perte de capacit. Quand un support est relu, on peut ajuster la vitesse
de faon conserver le tampon moiti plein quel que soit le dbit dynamique qui
peut tre dynamiquement ajust.
Si le dcodeur lit dans le tampon une vitesse croissante, cela a tendance le vider
et le systme de l'unit de disque augmentera simplement le dbit d'accs pour
rtablir l'quilibre. Cette technique ne peut s'utiliser que si l'audio et la vido ont t
cods partir de la mme horloge, sinon elles se dcaleront dans le temps au cours
de l'enregistrement. Pour rpondre ces impratifs conflictuels, les Flux de Transport
et les Flux de Programme ont t imagins comme deux possibilits.
Un flux de programme est bien adapt un unique programme dbit variable dans
un contexte d'enregistrement (DVD); un flux de transport conviendra mieux la
transmission de programmes multiples dbit constant (Bouquet satellite et cble).
Dans le cas de la transmission, le dcodeur doit recrer la base de temps sous peine
de devoir supporter un dfaut ou un excs de charge. C'est pourquoi un flux de
transport utilise comme rfrence une Horloge de Programme (PCR, Program Clock
Reference) tandis que flux de programme n'a pas besoin d'horloge de programme.
Introduction aux flux de programme:
Un flux de programme est un multiplex de paquets PES qui vhicule plusieurs flux
lmentaires pralablement cods partir de la mme horloge-mre ou de la mme
rfrence. Le flux peut tre constitu d'un flux vido et de ses flux audio associs ou
seulement un canal de multi-programmes audio.
Le flux lmentaire vido est divis en units d'accs contenant chacune des donnes
compresses dcrivant une image. Ces images sont du type I, P ou B et chacune
comporte un numro d'unit d'accs qui indique la squence d'affichage convenable.
Une unit d'accs vido devient un paquet de flux de programme. En vido, la taille
de ces paquets varie. Un paquet d'images I sera, par exemple, plus grand que celui
d'une image B. Les units d'accs de l'audionumrique sont gnralement de la
mme taille et plusieurs d'entre elles constituent un paquet de flux de programme.
Ces paquets ne doivent pas tre confondus avec les paquets de flux de transport qui
sont de taille infrieure et fixes. Les limites des units d'accs vido et audio
concident rarement sur l'axe des temps mais cette absence de concidence n'est pas
un problme car chaque limite possde sa propre structure de marqueur temporel.
Flux de transport:
Un flux de transport est bien plus qu'un simple multiplexage de plusieurs paquets
PES. Dans les flux de programme, les marqueurs temporels sont suffisants pour
recrer l'axe des temps parce que l'audio et la vido sont verrouills sur une
rfrence commune. Pour tlcharger des donnes dans un rseau loign, un
impratif supplmentaire est ncessaire dans le dcodeur pour recrer l'horloge de
chaque programme. Cela impose un lment supplmentaire dans la syntaxe afin de
fournir la rfrence d'horloge de programme (PCR, Program Clock Reference).
Le flux de transport vhicule plusieurs programmes diffrents utilisant chacun un
dbit et un facteur de compression susceptibles de varier dynamiquement, mme si
le dbit global reste constant. Cette proprit est appele multiplexage statistique et
permet un programme supportant des images difficiles de prendre de la bande un
programme supportant des images plus statiques.
A chaque PES vido peut tre associ un certain nombre de PES audio et de PES de
donnes. En dpit de cette souplesse, un dcodeur doit tre capable de passer d'un
programme l'autre et slectionner convenablement les canaux de l'audio et des
donnes. Certains programmes sont protgs et ne doivent tre accessibles qu'aux
personnes ayant souscrit un abonnement ou acquitt une redevance. Le flux de
transport doit donc comporter l'information d'accs conditionnel (Conditional access
table) pour grer cette protection. Le flux de transport contient des informations
spcifiques de programme (PSI, Program Specific Information) pour s'acquitter de
ces tches.
La couche de transport convertit les PES de donnes en petits paquets autonomes de
longueur constante de 188 octets. Quand ces paquets parviennent au dcodeur, il se
peut qu'ils soient affects d'une certaine jigue. Le multiplexage temporel est aussi
une cause de retard mais son amplitude n'est pas fixe car l'allocation de bits n'est
pas fixe pour chaque programme. Les marqueurs temporels constituent une partie de
la solution mais la seule condition qu'une horloge disponible soit stable. Le flux de
transport doit donc comporter d'autres donnes permettant la reconstitution d'une
horloge stable.
L'exploitation d'un quipement vido numrique dpend grandement de la
distribution d'un systme d'horloge stable pour la synchronisation. En production
vido, le genlock est utilis mais, sur des grandes distances, la distribution d'une
horloge spare n'est pas commode. Dans un flux de transport, les programmes
peuvent provenir de diffrentes origines qui ne sont pas ncessairement synchrones.
Par consquent, le flux de transport doit tre capable de fournir des moyens de
synchro pour chacun des programmes. Cette synchro supplmentaire est appele
Rfrence d'Horloge de Programme(PCR, Program Clock Reference) et permet de
reconstituer une rfrence d'horloge stable partir de laquelle, par division, on
recre une frquence ligne dans le dcodeur de faon pouvoir utiliser
convenablement les marqueurs temporels dans chaque flux lmentaire.
On dfinit par consquent un programme comme un jeu de flux lmentaires
partageant la mme rfrence temporelle. Dans un flux de transport de programme
simple (SPTS, Single Program Transport Stream), il y aura un canal PCR qui recre
une horloge de programme pour l'audio et la vido.
Les Paquets:
La figure suivante montre la structure d'un paquet de flux de transport. La longueur
constante est de 188 octets rpartis entre un en-tte et une charge utile. La figure A
montre l'en-tte minimal de 4 octets. Les informations les plus importantes de cet
en-tte sont:
L'octet de synchro:
Cet octet est reconnu par le dcodeur de faon pouvoir d-srialiser l'en-tte et la
charge utile.
L'indicateur d'erreur de transport:
Cet indicateur est valid si le systme de correction d'erreur grant la fonction de
transport dtecte un taux d'erreurs de bits trop lev pour tre corrig. Il indique que
le paquet est susceptible de contenir des erreurs.
L'identification de paquet (PID):
Ce code de 13 bits sert faire la distinction entre les diffrents types de paquet. Il
sera dtaill ultrieurement.
Le compteur de continuit:
Sa valeur sur 4 bits est incrmente par le codeur chaque fois qu'un nouveau paquet
ayant le mme PID est mis. Il sert dterminer si un paquet particulier est perdu,
rpt ou hors squence. L'en-tte a parfois besoin de plus d'informations et, si c'est
le cas, les bits de contrle du champ d'adaptation sont placs pour indiquer que la
taille de l'en-tte est suprieure la normale. La longueur supplmentaire de l'entte est alors dfinie par la longueur du champ d'adaptation. Quand l'en-tte est
allong, la charge utile est diminue pour conserver une longueur constante au
paquet.
Rfrence d'horloge de programme:
Le codeur utilis pour un programme particulier sera pilot par une horloge de
programme 27 Mhz. Si l'entre provient d'une interface numrique srie (SDI,
Serial Digital Interface), la frquence d'horloge est divise par 10 pour gnrer
l'horloge de programme. Quand plusieurs programmes parviennent la mme unit
de production, il est possible qu'ils aient tous la mme rfrence. Si l'entre vido est
analogique, la frquence ligne sera multiplie par une constante dans une boucle de
phase verrouille (PLL, Phase Locked Loop) pour obtenir du 27 MHz.
Dans l'en-tte du paquet, le champ d'adaptation sert priodiquement introduire le
code PCR qui permet la gnration d'une horloge verrouille dans le dcodeur. Si le
codeur ou un multiplexeur change de source, il peut se produire une discontinuit
dans la rfrence PCR. Le compteur de continuit peut galement tre perturb.
Cette situation est gre par l'indicateur de discontinuit qui avertit le dcodeur de la
possibilit d'une perturbation. Sinon, la discontinuit crera une condition d'erreur.
La figure suivante montre comment le dcodeur utilise la PCR pour recrer une
version dporte de l'horloge 27 MHz pour chaque programme.
L'horloge du codeur pilote un compteur binaire permanent dont les valeurs sont
priodiquement lues et places dans le champ d'adaptation de l'en-tte en tant que
PCR. Comme le marqueur de temps de prsentation (PTS, Presentation Time Stamp),
le PCR comporte 33 bits et reprsente une valeur du compteur pilot par une horloge
90 Khz.
Chaque codeur gnre des paquets ayant une identification de paquet (PID)
diffrente. Le dcodeur reconnat les paquets associs l'identification correspondant
au programme slectionn et ignore les autres. Dans le dcodeur, un oscillateur local
(VCO) gnre une horloge nominale 27 Mhz qui pilote le compteur PCR. La valeur
du PCR local est compare au PCR de l'en-tte du paquet et la diffrence constitue
l'erreur de phase PCR. Cette erreur est filtre pour piloter le VCO afin que le PCR local
se verrouille sur le PCR de l'en-tte.
Un puissant filtrage du VCO vite au VCO d'tre modul par une jigue ventuelle
dans la transmission du PCR. L'indicateur de discontinuit rinitialise le compteur
local et peut tre ventuellement utilis pour attnuer le filtrage afin d'acclrer le
verrouillage du compteur local sur la nouvelle valeur temporelle.
Le MPEG implique que le PCR soit mis au moins 10 fois par seconde tandis que la
Diffusion Vido Numrique (DVB, Digital Video Broadcasting) spcifie une cadence
minimale de 25 PCR par seconde.
Identification de paquet (PID):
Dans l'en-tte du paquet de transport, un champ de 13 bits contient le code
d'identification de paquet (PID). Le PID est utilis par le dcodeur pour faire la
distinction entre les paquets contenant divers types d'information. Le dbit de bits du
flux de transport doit tre constant, bien que la somme des dbits de tous les
diffrents flux puisse varier. Cet impratif est ralis par l'adjonction de bits nuls
(contenant des " 0 ") dans la partie utile. Si le dbit utile diminue, plus de paquets
nuls sont ajouts. Les paquets nuls ont toujours la mme identification qui est 8191,
soit 13 " 1 ".
Dans un flux de transport donn, tous les paquets appartenant un flux lmentaire
donn comportent la mme identification. Les paquets appartenant un autre flux
lmentaire auront une identification diffrente. Le d-multiplexeur peut aisment
slectionner toutes les donnes d'un flux lmentaire donn en acceptant seulement
les paquets porteurs de l'identification convenable. On peut slectionner les donnes
d'un programme complet grce aux PIDs de l'audio, la vido et les donnes de
tltexte. Le d-multiplexeur ne peut convenablement slectionner les paquets que
s'il peut les associer au flux de transport auquel ils appartiennent. Il ne peut excuter
cette tche que s'il connat les PIDs. C'est le rle de l'information spcifique de
programme (PSI, Program Specific Information).
La Transmission en DVB
Une des principales caractristiques des canaux de diffusion numrique tient au fait
qu'ils peuvent subir des grandes dgradations sans que cela ne soit visible. Mais
lorsque l'on dpasse un certain seuil, la rupture de service est brutale et totale. C'est
tout ou rien.
Le BER (Bite Error Rate): Trois voies de transmission sont possibles; le satellite, le
cble et le rseau de diffusion hertzien. Il faut aussi garder l'esprit deux impratifs;
premirement, on doit employer les canaux dj existant (la largeur du canal est
impose) et deuximement, la tlvision numrique demande une transmission
qualifie de QEF(Quasi Error Free, quasiment sans erreur). Pour raliser cette
deuxime contrainte, il convient d'introduire une nouvelle notion; le BER(Bite Error
Rate ou TEB Taux Erreur Binaire). C'est tout simple. On va compter, la rception, le
nombre de bit erron reus sur le nombre total de bit reus. Si sur 1000 bits reus, il
y en a un de faux, on a un BER de 1/1000.
Les modulations employes seront donc choisies de manire trs attentive en

fonction du type du canal de transmission et un arsenal de technique de correction
d'erreur sera galement mis en place.
Caractristiques des canaux:
Satellite: Largeur de canal frquemment gale 36 MHz. Un signal provenant d'un
satellite subit une attnuation de plus de 200dB. On reoit donc un signal trs faible
et bruit.
Cble: Largeur de canal trs rduite, 8 MHz(rappelons que le dbit en sortie de
multiplexeur est d'environ 40MBit/s). Par contre c'est un milieu trs protg.
Rseau terrestre: Largeur de canal trs rduite, 8 MHz. Le systme choisi doit tre
insensible aux phnomnes d'chos.
Solutions:
Pour chacune des voies de transmission, DVB a dfini une chane de traitement et de
codes de correction d'erreurs suivi d'un type de modulation adaptes.
Modulation: QPSK pour le DVB S, QAM pour le DVB C et COFDM pour le DVB T.
Traitement: Brassage, entrelacement et filtre de Nyquist.
Correction d'erreur: Code Reed Solomon et code convolutif associ un dcodeur
de Viterbi.
C'est une combinaison de ces diffrentes techniques qui formera notre canal de
transmission. Voyons les tapes prliminaires indispensables qui vont permettre de
scuriser notre train TS et cela quelque soit notre canal de transmission.
Le brassage: Ici on veut rpartir l'nergie sur l'ensemble du canal de transmission.
En clair, viter les longues suites de 1 ou de 0 qui creraient une raie forte nergie
dans le spectre.Un signal connu qui possde cette caractristique est le bruit qui par
nature est alatoire et donc une nergie uniformment rpartie. Nous allons rendre
notre signal TS semblable du bruit en le multipliant par la sortie d'un gnrateur
Pseudo alatoire. C'est un dispositif simple form de 15 registres dcalage et d'un
OU exclusif.
Pour pouvoir faire le traitement inverse en rception, nous allons employer deux
mcanismes de synchronisation. Au premier paquet TS qui se prsente, on charge le
gnrateur avec un mot connu (le mot d'initialisation) et l'octet de synchro du paquet
(0x47) est complt pour devenir 0xB8. Huit paquets d'affils sont ainsi brasss. Au
neuvime paquet, le mot d'initialisation est de nouveau charg et l'octet de synchro
complt. La porte AND est active chaque octet de synchro pour ne pas les
brasser et ainsi conserver ces points de repre. L'nergie de notre signal est
maintenant rpartie sur tout le spectre et ceci mme si il n'y a pas de signal en
entre. En rception c'est le mme circuit qui est employ, on attend un octet ayant
le mot de synchro 0xB8 pour charger le mot d'initialisation et d-brasser les huit
paquets.
Codage Reed Solomon: Ce code est not RS(188,204,t=8), ce qui veut dire 188
octets en entre, 204 en sortie du codeur et 8 octets sur 188 peuvent tre corrigs.
C'est un code en bloc qui va ajouter 16 octets de redondance derrire chaque paquet
TS. Si plus de 8 octets sont dtects comme errons, le paquet est marqu comme
dfectueux. Pour comprendre l'esprit de ce code, on va l'illustrer avec un exemple
trs simple. Imaginons que nos paquets TS fassent 3 octets de long et que l'on
transmette le paquet suivant: 03 10 15 on va rajout deux octets de redondance. Le
premier est la somme de nos trois donnes soit 28, le deuxime est la somme
pondre des 3 octets. Chaque octet est multipli par son rang : 3*1 + 10*2 + 15*3
soit 68. Notre paquet la sortie du codeur devient donc : 03 10 15 28 68 Aprs
transmission et perturbation, le rcepteur reoit le paquet : 03 12 15 28 68 On refait
la somme simple 03+12+15=30 et la somme pondre 8*1 + 12*2 + 15*3=72.La
diffrence des sommes simples(28-30) nous donne la valeur de l'erreur et la
diffrence des sommes pondres divis par l'erreur est gale au rang de
l'erreur(7268)/2=2). On peut corriger notre paquet.
L'entrelacement: Une des choses les plus difficiles corriger est une longue suite
de bit ou d'octet conscutifs errons. On va donc rpartir, l'mission, les octets d'un
paquet dans d'autres paquets. Imaginons la suite de paquet de 5 octets suivante:
niche
chien
poule
tasse
fours
balles
video
audio
petit
porte
Chaque paquet est mis en mmoire horizontalement et relu verticalement. Ainsi si on
relit les paquets depuis le e de niche, cela donne les paquets suivants:
eeuaf nlsob esuav erlia sldup eedep soito
A la suite de la transmission, on reoit la squence suivante affecte d'erreur:
eeuaf nlsob esuav **lia s***p eedep soito
Aprs dsentrelacement, on retrouve les mots suivants :
e ---- tass* fou*s bal*es vi*eo ---On voit nettement que l'entrelacement a permis de rpartir les erreurs sur plusieurs
paquets. Seul un octet par paquet est affect et le code Reed Solomon, vu avant,
peut facilement corriger ces erreurs. Sans entrelacement, ce sont les mots complets
qui auraient t affects sans espoir de pouvoir les rcuprer. Dans la pratique on
utilise un jeu de registre dcalage et de commutateur pour placer chacun des
octets d'un paquet dans des 12 paquets diffrents.
A gauche l'entrelaceur et droite le desentrelaceur. Ce qui d'un point de vue paquet

se traduit par:
A: avant entrelacement,
B: aprs entrelacement,
C: aprs dsentrelacement.
Code convolutif: Lorsque l'on affronte des milieux trs bruits comme dans le cas
des liaisons satellites ou terrestres, il convient de renforcer encore les mesures de

protection des donnes transmettre. Nous allons mettre en oeuvre maintenant un
code convolutif. Si l'on regarde bit bit le signal, aucun lien ne les relie. Chaque bit
est rigoureusement indpendant. L'ide du code convolutif est de lier un bit un ou
plusieurs bits prcdents de sorte pouvoir retrouver sa valeur en cas de problme.
Voici le codeur utilis par DVB. On voit que chaque bit incident va gnrer deux bits
sortants et qu'il sera li aux 6 bit prcdents. Le bit 1 de sortie est un "OU exclusif"
entre les bits 1,2,3,4 et 7 tandis que le bit 2 de sortie est un "OU exclusif" des bits
1,3,4,6 et 7.
Avantage: Ce code dit "en treillis" va permettre de retrouver la valeur la plus
probable d'un bit en observant les bits prcdemment reus. C'est pas trs vident
expliquer mais c'est trs efficace dans la ralit.
Inconvnient: On vient de doubler le dbit du train TS. Quand on connat le prix du
bit transmis, on se doute que l'on va trouver une astuce pour amliorer le
rendement. L'opration de dcodage est ralis en rception par le dcodeur de
Viterbi.
Le poinonnage: Le rendement du codeur vu ci-dessus est de 1/2, 1 bit d'entre, 2
bits de sortie. Le poinonnage consiste amliorer ce rendement en ne transmettant
pas certains bits sortant du codeur convolutif. Si trois bits se prsente en entre de
codeur, on va en retrouver 6 en sortie mais on en transmettra que 4. Le rendement
sera alors de 3/4. On parle aussi de FEC 3/4 (FEC = Forward Error Correction).
Bien sur, ce poinonnage cre des erreurs puisque l'on ne transmet pas tous les bits.
En rception, dans le dcodeur de Viterbi, on remplace ces bits par des zros. De part
la robustesse et la nature du code convolutif choisi, on retrouve leurs valeurs la plus
probable. On est maintenant presque prt attaquer un modulateur numrique. Un
problme subsiste cependant. Le signal numrique est de forme rectangulaire et si on
le module ainsi, on obtient un spectre en frquence infini (un sin x/x). On va
rsoudre le problme en filtrant le signal de faon rduire la bande occupe. Le
filtre choisit est le filtre de Nyquist. Attention, dans le cas de la transmission par
cble, qui est considr comme un milieu protg, il n'y a pas d'application du code
convolutif et donc du poinonnage.
Filtre de Nyquist: Une explication plus complte viendra en son temps. Pour le
moment, on dira juste que ce filtrage va diminuer le dbit utile de notre signal en
fonction d'un coefficient appel Roll Off. La largeur de bande occupe sera gale :
W= Dbit utile x(1+Roll Off)
Les exemples de calcul de dbit, vu plus loin, illustrerons son emploi.
Le QPSK: La transmission satellite demande des codes de corrections puissants et
une modulation la moins sensible possible aux distorsions de phase et d'amplitude.
En effet la transmission est normment bruite, et les tubes des transpondeurs
travaillant en saturation, il est hors de question de travailler avec une information
module en amplitude.
Principe: Le choix s'est donc port sur une modulation QPSK(Quaternary Phase Shift
Keying ou modulation dplacement de phase 4 tats). C'est en fait une
combinaison de deux modulations d'amplitude porteuse supprime. Les deux
porteuses, appel I et Q, sont, bien sr, dphases de 90.
x valant +X pour un bit 0 et -X pour un bit 1 et y valant +Y pour un bit 0 et -Y

pour un bit 1. Un symbole transmis contient deux bits d'informations. On voit
galement, sur ce diagramme des constellations, que mme si les points deviennent
des tches, cause du bruit, ce n'est pas trs grave. Il suffit de savoir dans quel
quadrant se situe le point pour retrouver l'information.
Calcul du dbit utile: Pour revenir des considrations pratiques, nous allons
calculer le dbit utile en sortie de multiplexeur, en fonction de la largeur du canal
satellite. La largeur d'un canal satellite -3 dB est de 36 MHz. On a vu que, de part
le filtrage de Niquyst, le dbit du signal binaire que l'on va pouvoir transporter est
gale :
En satellite, le Roll Off a t choisi gale 0.35 (valeur qui est compromis entre une
bonne efficacit du filtre et un bon rendement). Donc pour une largeur de canal de
36MHz, on obtient un dbit utile de 26,6 Mbit/s. En pratique, on prend une largeur de
canal un peu plus importante, ce qui permet d'obtenir un dbit binaire de 27.5
Mbit/s. Cette valeur tant le dbit en sortie du modulateur, elle est gale au Dbit
Symbole (Symbol Rate) du transpondeur. Pour un transpondeur de 36 MHz de
largeur de bande, le Symbol Rate est de 27,5 MSymbol/s. On a employ une
modulation de type QPSK, un symbole transporte deux bits donc le dbit binaire brut
est de 55 Mbit/s. Dans cette valeur sont compris les bits de redondance apports par
le codage Reed Solomon et le code convolutif. Le dbit utile, en sortie de
multiplexeur, est gale : Dbit utile= dbit brute x rendement du code Reed
Solomon x rendement du code convolutif. Le rendement du code Reed Solomon est
gale 188/204 Le rendement du code convolutif est gale au FEC. D'o le tableau
suivant;
Pour un Dbit Symbole de 27.5 MSymbol/s sur un transpondeur de 36MHz de largeur
de bande
Le FEC sera choisi par l'oprateur, en fonction de critre technique et conomique.

Technique, car il faut un FEC adapt la puissance du transpondeur vu du sol, et la
taille des paraboles de rception. Un transpondeur en Wide Beam aura un FEC de
l'ordre de 2/3, 3/4 alors qu'un transpondeur en Super Beam pourra avoir un FEC de
3/4 ou 5/6. Un feed peut travailler en 7/8, les paraboles de rception professionnelle
faisant souvent plus de 2 mtres de diamtre. Economique, car au prix de location
d'un transpondeur, il vaut mieux passer le plus grand dbit utile.
Le QAM: Sur le cble, la problmatique est diffrente. C'est un milieu bien protg
mais bande rduite. On va donc choisir une modulation efficacit maximale, c'est
dire transportant un maximum de bit par symbole.
Modulation QAM: On va utiliser une modulation QAM (Quadrature Amplitude
Modulation) compose de deux modulations d'amplitude porteuse supprime en
quadrature comme pour le QPSK. L'quation reste donc:
La diffrence tient dans le fait que l'on va augmenter le rendement du code en
augmentant les valeurs que peuvent prendre x et y. Si chaque axe code maintenant
deux bits, on va transporter 4 bits par symbole et dfinir une QAM 16:
Si on veut 5 bits par symbole, on obtient une QAM 32:
Et si l'on code 6 bits par symbole, une QAM 64:
On pourrait aller loin comme a, mais l'on voit que plus on code de bit par symbole,
plus les symboles sont rapprochs et donc plus on est sensible au bruit. Un symbole
trs bruit et donc loign de son emplacement d'origine, peut tre confondu avec le
symbole adjacent (d'ou l'utilit des oprations d'entrelacement et de correction
d'erreurs). En pratique, la plupart des rseaux cbls travaillent en QAM 64.
Calcul du dbit utile: Ici la largeur du canal de transmission est de 8MHz (largeur
des anciens canaux analogique). On a vu que, de part le filtrage de Nyquist, le dbit
du signal binaire que l'on va pouvoir transporter est gale :
Le Roll Off choisi est de 0.15 (milieu protg et bande faible). Donc pour une largeur
de 8 MHz, le dbit binaire est au maximum de 6,96. Ce dbit est gale au Dbit
Symbole en sortie du modulateur QAM. Si nous travaillons en QAM 64, un symbole
reprsente 6 bits et donc le dbit brut, en sortie du multiplexeur est gal 6 x 6.96
soit 41.76 Mbit/s, codage Reed Solomon compris. Ici, je vous le rappelle, il n'y a pas
de codage convolutif. Le dbit utile est donc: dbit binaire utile = dbit binaire brute
x rendement du code Reed Solomon, soit dans notre exemple 41.76 x (188/204) ou
38.48Mbit/s. Sur un rseau cbl, le dbit binaire utile sera au maximum de 38.5
Mbit/s.
Transmodulation: Pour un oprateur cble, il est trs intressant de diffuser ses
abonns des transpondeurs complets provenant d'oprateur satellite. Il dmodule le
signal QPSK et re-module le train MPEG en QAM 64 en effectuant un transnitage
(changement dans les tables SI). Seule contrainte, le dbit utile du transpondeur doit
tre infrieur 38.5 Mbit/s. Ce qui revient dire que pour les transpondeurs
courants, le FEC doit tre infrieur ou gal 3/4(Voir Modulation QPSK).
Prenons le cas d'un transpondeur classique de FEC 2/3. Son dbit utile est de 33.79
Mbit/s. On passe la moulinette de Reed Solomon. Le dbit devient 33.79 x
(204/188)= 36.66 Mbit/s. La modulation QAM 64 transporte 6 bits par symbole donc
le Symbol Rate est de 36.66/6 = 6.11 MSymbol/s. La bande passante occupe sur le
cble sera gale 6.11 x (1+Roll Off), c'est dire 6.11 x 1.15=7.03 MHz. On est
bien dans le gabarit des 8MHz.
Transnitage: C'est l'opration qui consiste remplacer la NIT d'un flux DVB par une
autre pour changer le rseau d'appartenance d'un flux. En clair le cblo remplace la
NIT incidente de l'oprateur satellitaire par la sienne.
Le COFDM: Transmettre un train numrique par voie hertzienne n'est pas une mince
affaire et c'est pourquoi c'est la technologie qui a demande le plus de temps pour
merger. C'est celle du DAB (Digital Audio Broadcasting) qui a t adapte la
tlvision numrique. Voici quelques lments et avantages utiliss par le DVBT.
Aperu du COFDM (Coded Orthogonal Frequency Division Multiplex):
Le challenge relev est qu' la rception on puisse retrouver les symboles transmis
indpendamment des chemins multiples(rflexions, chos , antenne recevant deux
metteurs diffrents, effet doppler dans le cas de la rception mobile) emprunts
depuis le ou les metteurs. Par dfinition, les caractristiques d'un canal de
transmission ne sont pas constantes dans le temps. Mais durant un court laps de
temps, les caractristiques d'un canal hertzien sont stables. Le COFDM dcoupe le
canal en cellule selon les axes du temps et des frquences.
Le canal est alors constitu d'une suite de sous bandes de frquence et d'une suite de
segments temporels.
chaque cellule frquence/temps est attribue une porteuse ddie qui reprsente
un symbole COFDM. On va donc rpartir l'information transporter sur un ensemble
de ces porteuses, module chacune faible dbit par une modulation du type QPSK
ou QAM. Deux choix existent, le mode dit 8K(6817 porteuses dans le canal) ou le
mode dit 2k(1705 porteuses dans le canal). Chacune des porteuses est orthogonale
la prcdente.
Une mme suite de symbole arrivant un rcepteur par deux chemins diffrents se
prsente comme la mme information arrivant deux instants diffrents et qui
s'additionnent. Ces chos provoquent deux types de dfauts:
L'interfrence intra symbole: Addition d'un symbole avec lui-mme lgrement
dphas.
L'interfrence inter symbole: Addition d'un symbole avec le suivant plus le
prcdent lgrement dphas. Entre chaque symbole transmis, on insre une zone
"morte" appele intervalle de garde. De plus la dure utile d'un symbole sera choisie
suffisamment grande par rapport l'talement des chos. Ces deux prcautions vont
limiter l'interfrence inter symbole (celle ci se produisant au dbut des symboles,
c'est l'intervalle de garde qui est affect).
Synoptique d'un modulateur DVBT:

Un signal arrivant d'un multiplexeur subit les tapes suivantes: Un brassage, Un
codage Reed Solomon(204,188, t=8) Un entrelacement, Un code convolutif, Un
poinonnage Un filtrage, une modulation QAM ou QPSK, une modulation COFDM.
Quelques chiffres:
DVB a dfini les paramtres suivants: L'intervalle de garde Delta peut tre gale : 7,
14, 28, 56, 112 ou 224 s. Plus l'intervalle est grand plus le symbole est protg. La
dure utile d'un symbole est gale : 4, 8, 16, 32 fois Delta. La modulation des
porteuses peut tre: QPSK, QAM 16 ou QAM 64.
Avantages:
Le DVBT est compatible avec les installations de rception analogique dj en place
(antenne, distribution collectives) Le systme est insensible aux chos, il n'y a plus
de canaux interdits. Avec 25 Mbit/s utiles dans un canal, on diffuse 5 6
programmes o passe aujourd'hui un seul programme analogique. Possibilit de
grer des dcrochages locaux pour des chanes ou des programmes locaux.
Possibilit de rception hertzienne mobile de qualit. Introduction de rseaux dit SFN
(Single Frequency Network).Un programme est disponible sur une seule et mme
frquence sur tout le territoire. Possibilit d'une rception mobile parfaite.
Inconvnients:
Moins de canaux disponibles que sur le satellite. Cot de l'infrastructure des
metteurs terrestres. Complexit des dmodulateurs.
Les rseaux mono-frquence:
Les avantages de la modulation COFDM sont nombreux, mais un de ses intrts
principaux est sa capacit faire face aux chos, produits par des rflexions dues
l'environnement ou plusieurs metteurs fonctionnant sur le mme canal RF. En fait,
le COFDM peut employer des chos constructifs (c.--d.: ceux qui augmentent la
puissance reue) et ngliger les effets ngatifs des autres.
La modulation de COFDM offre aux radio-diffuseurs une nouvelle manire d'utiliser
leurs rseaux terrestres, soit la multiplication d'metteur sur le mme canal pour
augmenter la zone de couverture et transmettre plus de canaux. Pour raliser un
rseau mono frquence, il faut que les metteurs qui oprent sur la mme frquence,
en mme temps, transportent les mmes bits d'informations. Tous les metteurs du
rseau doivent tre synchroniss dans le domaine frquentiel aussi bien que dans le
domaine temporel. C'est par l'emploi du systme GPS que l'on rsout le problme.
Synchronisation temporelle:
La valeur d'intervalle de garde choisie pour le rseau a une grande importante sur la
topologie du rseau mme, sa dure rgit le temps maximum d'chos admissible par
le systme et, donc, dtermine la distance maximum entre les metteurs de cocanal. La fentre de temps, pendant laquelle les rcepteurs chantillonnent le signal
utile exclue la priode d'intervalle de garde, o le signal est fait d'un mlange de
deux symboles conscutifs de COFDM.
L'intervalle de garde doit tre considr globalement comme "budget de temps". Ce
sera sur cet intervalle non utilis que l'on pourra compenser une mauvaise
synchronisation temporelle d'un metteur du rseau. En pratique, l'oprateur de
rseau utilise 1 impulsion par seconde(1PPS, Pulse Per Second) issue d'un rcepteur
GPS. Cette rfrence de temps autorise insrer un marqueur de temps dans le
multiplex l'entre du rseau de distribution primaire pour permettre, dans chaque
metteur, au processeur de COFDM de retarder le multiplex entrant jusqu' ce qu'un
instant commun de temps de diffusion se produise.
Synchronisation frquentielle:
La frquence de chaque sous porteuse du canal sera troitement contrle et

surveille pour chaque metteur du rseau. Voici quelques petits schmas pour
rsumer les choses:
A: Dispersion d'nergie
B: Code Reed Solomon
C: Entrelacement
D: Code convolutif et
poinonnage
E: Filtrage de Nyquist
F: Modulation QPSK ou QAM
Les Tables SI/PSI(Service
Information/Program Specific
Information):
En analogique, un canal de
transmission transporte un programme de tlvision. Votre rcepteur, c'est--dire
votre tlviseur, se cale sur la frquence (qu'il a en mmoire) de la chane et dcode
le service qui est toujours de mme type, soit un service de tlvision.
Le cas du numrique est trs diffrent. Un canal de transmission transporte plusieurs
services de natures diffrentes. Dcoder un service de tlvision ne fait pas appel aux
mmes ressources du terminal que dcoder un service interactif. On transportera
donc dans le signal des informations qui permettront au terminal de connatre la
nature et la composition des services prsents dans un TS(transport stream). Par
extension, on inclura aussi des informations sur les autres TS de l'offre. Et, comme
on l'aura devin, ces informations seront transportes dans les tables.
Les tables sont diffuses rgulirement, chacune avec une rcurrence juge
suffisante par l'oprateur pour rafrachir les informations au niveau du terminal en
fonction du type de table, cela va de 100ms 30s.
Structure des tables
La structure est simple et gnrique, DVB a rserv une plage de PID pour les
transporter: 0 20. Une table est compose de sous-tables, qui peuvent ellesmmes tre composes de section.
Chaque section est compose d'un en-tte puis de boucles contenant des
descripteurs, ou Tag. Ces tags sont l'lment unitaire d'information. Comme son
habitude, DVB dfinit des tables et tags publics et laisse la possibilit de transporter
des tables et tags privs dfinis pour les besoins particuliers de l'oprateur. Enfin la
taille d'une section est limite 1024 octets pour la plupart des tables et 4096 pour
les autres. Voyons tout de suite la composition d'un en-tte de section.
En principe, une table est lue une fois puis le terminal se contente de surveiller son
numro de section. Si celui-ci change, il lit de nouveau la table. La description des
boucles sera aborde lors de la description de chaque table.
Les Tables PSI
PAT(Programme Association Table):

Elle porte le PID 0 et son table id est de 0. Pour chaque service physiquement
prsent sur le TS, elle associe le service, repr par son Program Number, un Pid
de PMT.
PMT (Program Map Table):
Son Pid est choisi par l'oprateur et son table id est gal 2. Il y en a une pour
chaque service physiquement prsent sur le TS. Elle dcrira les caractristiques du
service et de ses composantes.
CAT (Control Access Table):

A pour PID et table id 1. Elle permet au terminal de connatre les PID des voies EMM
qui sont prsentes sur le TS. On se rappellera que les EMMs transportent le
renouvellement des droits pour chaque carte d'abonns.
Les Tables SI (Service Information)
Pour ses besoins, DVB a ajout de nouvelles tables dites SI(Service Information) qui
peuvent tre utilises par le terminal et l'utilisateur pour naviguer travers les
services reus. Certaines sont obligatoires dans un flux DVB, d'autre sont
optionnelles.
Tables Obligatoires
NIT (Network Information Table):
A pour PID 16 et pour table id 64 ou 65. Cette table regroupe l'ensemble des
transpondeurs et des services rendus accessibles l'abonn par un oprateur. Toutes
les informations ncessaires au calage du terminal sont contenues dans cette table
(frquence, polarisation, FEC, SR, position). La table id est gale 64 si la table
dcrit le rseau de l'oprateur qui met cette table (NIT Actual )et gale 65 si la
table dcrit le rseau d'un autre oprateur(NIT Other).
SDT (Service Description Table):

A pour PID 17 et pour table id 66 et 70. Renseigne sur les services prsents sur un
multiplex; La table id est gale 66 si la section dcrit un service prsent sur le TS
(SDT Actual) et gale 70 si la section dcrit un service prsent sur un autre
transpondeur (SDT Other).
EIT present/following (Event Information table):

A pour PID 18 et table id 78 et 79. Donne des informations sur les vnements en
cours ou venir juste aprs l'vnement en cours (nom de l'mission, nom des
invits, heure de dbut, dure...) sur les services du multiplex ou des multiplex d'un
oprateur. La table id est gale 78 si la section dcrit les vnements d'un
programme du TS (EIT Actual) et gale 79 si la section dcrit les vnements d'un
programme d'un autre transpondeur.
TDT (Time and Date Table):

A pour PID 20 et table id 112. Donne la date et l'heure Universelles.
Tables optionnelles
BAT (Bouquet Association Table):
A pour PID 17 et table id 74. Cette table permet de grouper les services autrement
que par la notion de rseau (NIT). Un service peut appartenir plusieurs bouquets.
On peut faire, par exemple, des bouquets pour regrouper les chanes par thmes ou
encore faire des bouquets par zone gographique de rceptions.
EIT schedule (Event Information table) :

A pour PID 18 et table id de 80 95 et 96 111. Donne des informations concernant
les vnements venir sur une semaine, sur les services du multiplex ou des
multiplex d'un oprateur. Cela doit permettre de constituer un EPG (Electronic
Program Guide) c'est dire un guide lectronique des programmes.
RST (Running Status Table):
A pour PID 19 et table id 113. Permet de modifier le statut d'un vnement
rapidement. Un vnement est un lment de programme (une mission par
exemple). L'vnement peut tre stopp, dmarr dans quelques secondes, en pause
ou en cours.
ST (Stuffing Table):
A pour PID 19 et table id 114. Cette table dite de bourrage permet de venir
remplacer n'importe quelle section d'autres tables pour l'invalider.
TOT (Time Offset Table):

A pour PID 20 et table id 115. Transporte la date et l'heure Universelles, plus le
dcalage horaire pour le fuseau horaire de diffusion.
Les tables prives

Toutes sections de tables ayant un PID suprieur 20 et un table id compris entre
128 et 255 sont des tables prives dont le contenu a t dfini par l'oprateur. C'est
dans ce type de structure que sont transportes les informations des applications
interactives type Open TV ou MediaHighway.
Introduction la tlvision haute dfinition(HDTV)
Lorsqu'on entend parler de tlvision numrique (DTV, Digital Television), on parle

gnralement de transmission de signaux de tlvision purement numrique, ainsi
que la rception et la prsentation de ces signaux sur un tlviseur numrique.
Plusieurs des nouveaux systmes satellite, ainsi que le cble numrique et les DVD
utilisent un schma d'encodage numrique qui permet de prsenter une image de
meilleure qualit par rapport aux images analogiques. Par contre, l'information
numrique est convertie en format analogique pour pouvoir tre prsente sur un
tlviseur analogique (les plus rpandus actuellement). L'image ainsi prsente
reprsente une grande amlioration, si on la compare au VHS ou au cble
analogique, mais elle serait encore meilleure si on liminait la conversion
l'analogique.
Les signaux numriques pouvant tre diffuss soit par des moyens terrestres, par
cble ou par satellites avant d'tre capts chez vous. Aprs rception, un dcodeur
transforme le signal numrique et en alimente directement votre tlviseur
numrique. Une nouvelle classe de signaux numrique commence prendre sa place
dans l'chiquier de la tlvision numrique, il s'agit du format de Tlvision Haute
dfinition (HDTV, High Definition Television).
HDTV est un signal vido numrique (DTV, Digital Television) haute rsolution,
combin avec un son numrique ambiophonique (Dolby Digital Surround Sound, AC3). Il reprsente le standard de rsolution vido numrique le plus lev
prsentement sur le march. Cette combinaison cre une exprience audio-visuelle
extrmement enrichissante. Cependant, le HDTV require de la part des stations de
tlvision qu'ils s'quipent de tout nouveaux quipements de production et de
diffusion, et les consommateurs devront faire de mme pour recevoir le signal. Il
s'agit d'ailleurs l d'une des principale raisons pour laquelle l'implantation de ce
standard est plus lente que prvue initialement.
HDTV offre une rsolution d'image beaucoup plus leve que ce qui se fait pour le
moment, c'est d'ailleurs son principal avantage par rapport aux signaux numriques
standard. On parle ici de 720 ou 1080 lignes de rsolution, compar aux 525 lignes
auxquels les gens sont habitus en format NTSC, la diffrence est norme.
Des 18 formats DTV, 6 sont des formats HDTV et 5 de ceux-ci sont bass sur une
"analyse"(scanning) progressive et 1 autre sur une analyse "entrelace"(Interlaced).
Les 12 formats restants comprennent 1 format SDTV (Standard Digital Television) et
les 11 autres sont des formats EDTV (Enhance Digital Television(4 avec un ration de
16:9 et 7 formats conventionnels avec un ratio de 4:3). Les rseaux et stations de
tlvision ont le choix d'utiliser l'un ou l'autre de ces formats. Les principaux formats
susceptibles d'tres utiliss en HDTV sont:
720p 1280 X 720 pixels progressifs
1080i 1920 X 1080 pixels entrelacs(Interlaced)
1080p 1920 X 1080 pixels progressifs
Voici un tableau comparatif des diffrents standards existants:
SDTV (Standard Digital Television) consiste en un format digital standard de

480i/30Hz. Ce format est principalement utilis lorsque la largeur de bande passante
est une proccupation importante. SDTV utilise un taux de transfert d'environ 47Mbps.
EDTV (Enhance Digital Television) reprsente une amlioration par rapport au
SDTV, mais pas tout fait aussi bon que le HDTV. La rsolution verticale est limite
480 lignes, mais la rsolution horizontale varie de 640 704 lignes. Le standard
comprends des rapports de dimension de 4:3 et 16:9 et des taux de rafrachissement
de 24-30 et 60Hz, en plus de comprendre des signaux progressifs et entrelacs.
EDTV sera utilis lorsqu'une meilleure qualit d'image est dsir, mais sans utiliser la
mme largeur de bande que le HDTV.
HDTV (High Definition Television) utilise une bande passante d'environ 19
27Mbps* pour assurer une image de la meilleure qualit possible. Tous les formats
HDTV ont un rapport de dimension de 16:9, des taux de rafrachissement variant
galement de 24-30 et 60Hz.
"Entrelac (Interlaced)" et "progressif (progressive)" rfrent au systme
d'analyse(scanning) de l'image. En format entrelac, le systme prsente d'abord les
lignes impaires puis, dans une deuxime analyse (scan), les lignes paires. Lorsqu'il y
a 30 images par secondes, le moniteur montrera donc un demi frame chaque
soixantime de secondes. Pour des moniteurs plus petit, cela est moins visible, mais
lorsque les moniteurs deviennent plus gros, un problme peut apparatre dans
l'image, qui est appel "papillottement(flicker)". Le format progressif montre une
image entire chaque soixantime de seconde. Ce qui permet une image beaucoup
plus douce, mais utilise plus de bande passante.
Tous les formats DTV utilisent prsentement MPEG2 comme leur standard de
compression vido, tout comme les DVD-Vido. MPEG2 est un algorithme de
compression flexible qui s'adapte aisment aux hautes rsolutions du DTV.
En format de tlvision NTSC analogique (Amrique du Nord), l'image vido a 525
lignes, mais 480 seulement sont effectivement visibles. Un tlviseur normal aura
donc une rsolution effective d'environ 210,000 pixels. La rsolution maximum des
formats numriques (HDTV) permet une rsolution d'environ 2 000 000 de pixels, ce
qui reprsente environ
10 fois plus de dtails pour une image en Haute dfinition. On peut utiliser des ratios
de 4:3 ou 16:9, tel que montr dans la figure suivante:
Une mission de tlvision typique est enregistr directement en vido NTSC, ou

utilise un format film 35mm. Dans le cas du film, le signal est converti en signaux
analogues pour la diffusion. Le format d'image film (35mm) est de 1.37:1, ce qui
veut dire qu'il est 1.37 fois plus large qu'il est haut. Un tlviseur standard a un
format de 4:3(1.33:1), alors la conversion est assez facilement ralisable.
La tlvision haute dfinition, quand elle, offre une image contenant beaucoup plus
de dtails, ce qui permet un rsultat plus "propre". Les images que nous voyons dans
nos tlviseurs sont composes de petit lments appels "pixels". Chacun de ces
pixels est compos de trois "points de couleur" trs rapprochs (rouge, bleu et vert).
Avec les signaux NTSC analogiques traditionnel, 256 degrs d'intensit sont possible
pour chacune de ces 3 couleurs. Le rsultat donne une possibilit de 16,8 millions de
couleurs pour chaque pixel. Dans un systme analogique, les pixels sont un peu plus
haut que large. Par contre, avec un signal en HDTV, les pixels sont carrs et sont
galement plus petits et plus rapprochs entre eux. 1920 pixels horizontaux en
luminance Y (noir et blanc) et 960 pixels pour chacune des deux couleurs Pb et Pr
(soit la luminance moins le rouge, et la luminance moins le bleu). La dfinition
verticale est donc de 1080 lignes utiles. Cette dfinition permet d'obtenir des pixels
carrs, pour une image au format 16/9, puisque 1920/16 = 120 et 1080/9 = 120. Le
rapport tant identique si les points sont carrs, ce qui facilite toutes les oprations
numriques qui pourraient tre ralises partir de ces images. On pourra ainsi
mettre 4.5 pixels HDTV dans le mme espace qu'aurait occup un pixel NTSC. Il en
rsulte qu'un tlviseur HD peut prsenter 4.5 fois plus de dtails qu'un tlviseur
analogique NTSC.
Pour oprer avec les nouveaux standards HDTV, les diffuseurs devront se r-quiper
de a z, car les formats digitaux HDTV ont:
- Une image plus large.
- Une image beaucoup plus dtaille.
- Une qualit audio suprieure (5.1 canaux Dolby Digital, AC-3).
- La possibilit d'envoyer de l'information directement votre moniteur ou PC (la
transmission HDTV est base sur un flux de donnes digitale de 19.3 Mbps*).
En HDTV, le ratio utilis est de 16:9(1.78:1), ce qui est plus prs de celui utilis dans
les salles de cinma (1.85:1 ou 2.35:1). Prsentement les diffuseurs doivent utiliser
une mthode appele "pan and scan"(dcouper l'image complte un ratio de 4:3,
en liminant une partie de l'image), ou "letterbox" (prsenter l'image complte

seulement dans la partie centrale de l'image). Avec le format 16:9, utiliser le "pan
and scan" n'limine qu'une infime partie de l'image et le "letterbox" ne bloque que
trs peu de l'image. Le ATSC (Advanced Television Systems Committee) adopt le
ratio 16:9 "wide-screen" comme standard pour la tlvision haute dfinition
numrique car cela permet de prsenter beaucoup plus d'information dans votre
tlviseur. De plus, comme de plus en plus de films sont prsents la tlvision
et/ou en vido (DVD, VHS, etc...), cela permet de prsenter l'information au complet.
Au pralable on devait faire un "pan and scan" du document et, donc, couper une
partie de l'image. L'"association" cinma et vido/tlvision est donc plus facilement
ralisable.
Il est important de souligner que la diffusion des deux ratios(16:9 et 4:3) de signaux
numriques est possible, mme s'il est prsum que tous les signaux DTV seront
diffuss en ratio 16:9 dans un avenir peut-tre pas si lointain. Votre tlviseur
numrique pourra dcoder les deux ratios sans gard a son ratio "natif". Lorsqu'un
programme est transmit en 4:3, sur un tlviseur 16:9, l'image sera prsente en
"window-box", centre dans l'image, avec des barres noires verticales de chaque
ct. Lorsque vous regarderez un programme 16:9 sur un tlviseur 4:3, l'image
sera prsente en "letter-box", avec des bandes noires horizontales au dessus et en
dessous de l'image.
Non seulement l'arrive du DTV nous offre une qualit d'image presque parfaite, mais
le format inclus galement l'encodage audio numrique, qui amliore grandement la
qualit. Le standard audio numrique pour tous les formats DTV est le "Dolby
Digital". Ce qui permet au standard une vaste gamme d'algorithmes, selon les
besoins. "Dolby Digital" est un format beaucoup plus flexible que simplement le
format 5.1 canaux surround sound, il offre la possibilit d'encoder en formats 1.0
canaux (mono), 2.0 canaux (stro, incluant les option Dolby Pro-Logic et Pro-Logic
II). Les fans du cinma maison pourrons galement profiter du format 6.1 Extended
Surround Sound et le Dolby Digital EX. Dolby Digital utilisera seulement la quantit
de data ncessaire, selon les paramtres choisis.
Il est galement noter que le cble numrique, tel qu'offert prsentement, n'est pas
un signal DTV ( quelques exceptions prs). Il s'agit d'un signal analogique,
transform en numrique pour sa transmission et retransform en format analogique
de faon ce que votre tlviseur puisse le prsenter.
*- La largeur de bande passante utilise pour diffuser les signaux numriques n'est
pas fixe. Elle voluera en fonction de diffrents facteurs, dont les plus importants
sont le prix de la bande passante versus la qualit d'image et l'volution des
algorithmes d'encodage qui permettrons de rduire la taille du signal sans affecter la
qualit. Prsentement on prvoit utiliser entre 12 et 19 Mbps, mais ce chiffre pourrait
encore baisser.
Glossaire des termes et abrviations:

4:1:1 : Mthode d'chantillonnage de vido numrique par composante qui utilise un
chantillon luminance/Bleu Cb(composante bleue) et un chantillon luminance/Rouge
Cr (composante rouge) pour 4 chantillons de luminance(Y).
4:2:0 : Mthode d'chantillonnage de vido numrique par composante qui utilise un
seul chantillon Cb (composante bleue) et Cr(composante rouge), soit 1 ligne sur
deux, pour 4 chantillons de luminance.
4:2:2 : Mthode professionnelle d'chantillonnage de vido numrique par
composante. Tous les pixels sont chantillonns sur leur valeur de luminance(Y). Un
pixel sur deux est chantillonn pour la diffrence luminance/Bleu Cb(composante
bleue) et luminance/rouge Cr(composante rouge).
4:3 : Format de tlvision cran large dont le rapport d'cran largeur sur hauteur
d'image est 4 / 3 soit 1.33 fois plus large que haut.
5.1 : Configuration de haut-parleurs la plus classique du "Cinma maison" sur 4
enceintes plus 1 caisson spcial pour les effets de type explosion et effets spciaux
(sub-woofer).
16:9 : Format de tlvision cran large dont le rapport d'cran largeur sur hauteur
d'image est 16/9 soit 1.78 fois plus large que haut.
525/60 : Systme de diffusion TV de 525 lignes par image et 60 trames entrelaces
(30 images) par seconde. Correspond au standard de tlvision NTSC.
625/50 : Systme de diffusion TV de 625 lignes par image et 50 trames entrelaces
(25 images) par seconde. Correspond aux standards de tlvision PAL et SECAM.
1/2 D1 : Une des rsolutions d'image MPEG-2 de 352 x 576 (PAL/SECAM) ou 352 x
480(NTSC) utilise dans le format DVD-Video.
2/3 D1 : Rsolution d'image MPEG-2 de 480 x 576 (PAL/SECAM) ou 480 x
480(NTSC) exploite dans le format SVCD.
2-2 pulldown : Le processus de transfert d'un film cinma 24 images par seconde
en vido PAL/SECAM 25 images par seconde. Le film est enregistr avec une
augmentation de sa vitesse de lecture de 4 %.
2-3 pulldown : Le processus de transfert d'un film cinma 24 images par seconde
en vido NTSC 30 images par seconde en diffusant une des images en deux trames
puis la suivante en trois trames.
3-2 pulldown : Variation du 2-3 pulldown. La premire image est diffuse sur 3
trames au lieu de deux.
8/16 modulation : Une des tapes de la transformation de donnes brutes en
donnes stockes sur un DVD, aussi appele EFM+.
8-VSB : Acronyme pour la mthode de transmission utilise pour la tldiffusion
numrique terrestre au Canada et aux tats-Unis. Huit niveaux d'amplitude spars.
La technologie de diffusion "vestigial side-band" ou par bande latrale rsiduelle est
une technique de modulation analogique utilise pour rduire la largeur de spectre
requise pour la diffusion d'informations par cble ou terrestre.
AAU(Audio Access Unit/Unit d'Accs Audio) : Voir Access Unit.
A/B Roll Editing(Montage A/B RoLL) : Montage effectu en utilisant deux sources
vido, A & B, et un "mixeur" qui permet une varit de transitions entre elles.
A/B Switch : quipement qui accepte les signaux (Optiques ou lectriques) de deux
sources (A & B) et qui permet d'aiguiller de un l'autre, automatiquement ou
manuellement.
AC-3 : Standard audio pour 5.1 canaux approuv pour la tlvision numrique au
Canada. AC-3 offre une qualit audio numrique similaire au CD et fournit cinq
canaux de pleine largeur de bande: Gauche, Droite, Centre, Arrire (ou ct) gauche,
Arrire (ou ct) droit, plus un caisson d'extrmes graves, LFE, (effets de basse
frquence), pour un total de 5.1 canaux. AC-3 est un membre de la famille de
systmes de son dvelopps par Dolby Labs.
ACATS : Advisory Committee on Advanced Television Service.
Access Unit: Dans le cas de l'audio, un "access unit" est la reprsentation code
d'un "frame" audio. Dans le cas du vido, un "access unit" inclut toute l'information
code pour une image et tous les "bits" de remplissage qui suivent, jusqu'au prochain
"access unit"(non inclus).
ACL (cran d'affichage cristaux liquides) : Cette technologie offre un format
d'cran plat et utilise une couche de cristaux liquides trs mince. Elle offre une
brillance d'image trs leve et une bonne reproduction des couleurs. La taille des
crans HD ACL peut atteindre jusqu' 96 cm (38 po). La technologie ACL est
galement utilise dans plusieurs tl-projecteurs.
A/D : Convertisseur Analogue numrique (Analogue/Digital).
ADPCM (Adaptive differential pulse code modulation) : Technique de
compression d'un fichier audio qui encode la diffrence entre un chantillon sonore et
le suivant par prdiction, de manire non destructive ou destructive selon ses
dclinaisons.
AES/EBU (Audio Engineering Society /European Broadcasting union) :
Standard professionnel rgissant la vitesse de transfert d'information
audionumrique, et ce, travers deux canaux.
Afterburner : Dispositif permettant d'extraire l'information incorpore dans le signal
vido et de le transformer en format texte. Ce "texte" est alors "brl" sur l'cran
vido l'intrieur d'une fentre. Surtout utilis pour brler le "time code", mais aussi
pour d'autres informations pouvant servir la post-production, par exemple.
AIF (Audio Interchange File) : Un format de fichier audio dvelopp par Apple.
Les fichiers .AIF sont populaires pour transfrer entre les ordinateurs Macintosh et les
PC.
Aliasing : Dfauts ou distorsion de l'image tl ou de l'audio. Les dfauts
apparaissent souvent comme des lignes diagonales en escalier et des sautillements
ou points brillants. En vido numrique, l'aliasing est caus par un chantillonnage
insuffisant ou un mauvais filtrage du signal numrique.
Alpha channel : Information attache chaque pixel qui reprsente comment ce
pixel doit tre "mix" avec le background et/ou vido (transparence).
Analogique (signal)[Analogue Signal] : Mthode de transmission d'un signal
vido par la variation continue d'un signal lectrique.
Anamorphique (Anamorphic) : La compression horizontale d'une image 16:9 dans
un plein cran 4:3 qui entraine la distorsion verticale de l'image.
Anchor Frame : Un frame vido utilis pour les prdictions. Les "I-Frames" et les "PFrames" sont gnralement utiliss comme "anchor frames", mais jamais les "BFrames".
Ancillary Time Code (ATC) : Cette information de contrle de temps et d'adressage
(SMPTE RP188) est encode dans l'espace rserv au mtadata d'un signal vido
numrique. Elle contient le mme type d'information que le LTC et remplace le VITC
dans les systme de tlvision haute dfinition.
ANSI : American National Standards Institute.
API (Application Program Interface) : Une interface entre le systme d'opration
et les applications incluant la manire utilise par les applications pour communiquer
avec le systme d'opration et les services que celui-ci met la disposition des
applications. Par exemple un API pourrais rendre possible a un programme qui
l'utilise d'ouvrir des fentres sous Windows.
Artefact : Terme gnrique pour dfinir les lments indsirables et/ou dfectueux
dans une image vido (effets de blocs, bruits vido, etc.) et indpendant des rglages
du tlviseur. Les plus communs en vido analogue ont trait la couleur et/ou la
luminance. En numrique, ils consistent en macroblocks, qui ressemblent de la
pixellisation de l'image vido.
ASCII (American Standard Code for Information Interchange) : Un code
standard pour la transmission d'information consistant en 128 lettres, nombres,
symboles et codes spciaux qui sont chacun reprsents par un nombre binaire
unique.
Aspect Ratio (Format de l'image) : Rapport entre la largeur et la hauteur d'un
cran de tlvision ou de visualisation.
Asynchrone (Asynchronous) : Qui manque de synchronisation. En vido, un signal
est dit asynchrone lorsqu'il n'est pas en synchronisation avec le signal de rfrence
du systme.
Asynchronous Transfer Mode (ATM) : Protocole de transport de signaux

numriques permettant de transporter efficacement, l'intrieur d'un rseau
large bande, autant l'information flux constant que par vagues (constant rate and
bursty information).
ATEL : Advanced Television Evaluation Laboratory.
ATSC (Advanced Television Standard[Systems] Commitee) : Organisme
amricain charg des normes de diffusion numriques en tlvision. ATSC est devenu
le terme dsignant toute la nomenclature sur les standards de diffusion en
numrique.
ATTC : Advanced Television Technology Center.
AU(aussi SND) : Format de fichiers audio interchangeable utilis dans les
ordinateurs Sun Sparcstation, Nest et Silicon Graphics(SGI).
Authoring : Terme gnral employ pour dsigner la cration d'un titre vido (DVD,
Video-CD, SVCD, etc...), cela comprend l'encodage de la vido et des images, le
dessin des interfaces, l'organisation de l'interactivit, etc... Les logiciels qui ralisent
ce type d'opration sont appels des systmes auteurs.
AVI (Audio-Video Interleave) : Format de fichier utilis par Windows pour le
stockage des images vido et du son, dans lequel les donnes vido alternent avec
les donnes audio, acclrant ainsi la vitesse de restitution.
Axis : Le centre d'un cble de fibre optique.
Balanced Audio (signal Audio balanc) : Mthode de transmission d'un signal

audio rsistant aux interfrences qui consiste transmettre un signal et sa
contrepartie lectrique inverse. L'accumulation de bruit durant la transmission est
alors cancelle alors que les deux signaux sont re-combins la rception. Cette
mthode de transmission est surtout utilis pour dans le cas de cbles long et/ou
exposs.
Balayage entrelac : Certains tlviseurs HD et la plupart des tlviseurs
traditionnels utilisent la mthode de balayage "entrelac". Chaque cadre ou image est
affich en deux champs. L'image est affiche 30 fois par seconde en deux tapes.
Dans la premire tape, les lignes impaires sont affiches, et dans la deuxime, les
lignes paires. Chaque champ affiche la moiti de l'image avec les lignes de balayage
paires dans l'un et impaires dans l'autre. Le tlviseur n'affiche en ralit que la
moiti de l'image mais en raison du dfilement des cadres une vitesse de 30
cadres/s, l'oeil humain ne dtecte pas la moiti manquante.
Balayage Progressif : Le cadre o l'image apparat en entier immdiatement (un
seul champ, par rapport au balayage entrelac). Chaque ligne est balaye
progressivement en ordre. Certains tlviseurs HD utilisent la mthode de balayage
progressif. Cette mthode transmet et affiche l'image 60 fois par seconde en une
seule tape. L'image qui en rsulte est ainsi sans scintillements et sans artefacts, ce
qui lui confre plus de ralisme. Certains types d'crans, tels que ACL, plasma et
DLP, utilisent le balayage progressif, tandis que les crans CRT peuvent utiliser ce
type de balayage (ex. : crans d'ordinateurs) ou le balayage entrelac.
Bandwith (largeur de Bande) : L'intervalle complet de frquences requises pour le
fonctionnement d'un systme lectronique. Six megaHertz ont t allous aux
signaux de tlvision analogiques. Cependant, l'aide de la compression numrique,
beaucoup plus de donnes numriques peuvent tre transmises dans la mme
largeur de bande passante.
Baud : Unit de vitesse de transmission quivalent au nombre "d'lments de
signaux" par secondes. Baud est quivalent a "bits per second" dans le cas ou chaque
"lment de signaux" est gal exactement 1 bit. Le terme "baud rate" est utilis en
rfrence la vitesse de transfert utilise dans un transfert entre deux ordinateurs.
Normalement, le taux de transfert doit tre identique entre les deux ordinateurs si on
veut avoir une communication russie.
BER (Bit Error Rate) : Portion de bits transmise dans un signal qui est reu
incorrectement.
Bi-directional pictures ou B-pictures ou B-frames : Images (frames) qui utilisent
un frame futur et pass comme rfrence. Utiliss en compression numrique pour
augmenter le taux de compression.
Bitmap : Range de pixels bi-dimensionnels reprsentant la vido et les illustrations
graphiques.
Bit : La plus petite unit d'information selon laquelle la communication numrique est
base. Aussi l'impulsion (lectrique ou optique) qui transporte cette information.
Bit rate : La vitesse laquelle le flux d'information compress est envoy dans le
canal de transmission.
Blanking level : Dans un signal vido composite, indique le niveau sparant l'image
proprement dite de l'information de synchronisation.
Block : Un block est un ensemble de 8X8 pixels ou un coefficient DCT reprsentant la
luminance et la chrominance.
BNC : Connecteur coaxial utilis principalement en

vido.
Bouquet : Ensemble de programmes composant une
offre commerciale.
Bps : Bits per second.
Brightness (Brillance) : [Rglage de]Luminosit d'une image.
Broadband (Bande passante large) : Services de transmission en mesure de
matriser plus de frquences que celles requises pour la transmission de qualit de la
voix.
Brouillage : Codage d'un signal destin empcher sa rception sans un dispositif
spcifique assurant la fonction inverse.
Bytes (Octet) : Un groupe de bits de donnes traits ensemble. Un octet est
compos de 8 bits. Il y a les kilo-octets, les Mga-octets, les Giga-octets, les Traoctets, etc...
1 octet= 8 bits, 1 Kilo-octet (Ko)= 1000 octets,
1 Mga-octet (Mo)= 1 000 000 octets (1 million),
1 Giga-octet (Go)= 1 000 000 000 octets (1 milliard), etc...
Byte-aligned : Un bit, l'intrieur d'un flux de bits cods (bit stream), est align si
sa position est un multiple de 8 bits partir du premier bit du flux.
C : Abrviation pour chrominance.
Cadre : Voir Frame.
Canal : Un segment du spectre de 6MHz(largeur de bande) utilis pour la
transmission terrestre (chanes 2-69) ou par cble, qui transmet un programme
analogique NTSC ou encore un ou plusieurs programmes numriques.
CEA (Consumer Electronics Association): Association amricaine regroupant les
fabricants de produits lectroniques.
CAT (Conditionnal Access Table) : Table d'Accs Conditionnel. Indique au terminal
les pids transportant les EMM (les droits de chaque abonn).
CATV (Community Antenna Television, Cble TV) : Dans sa forme initiale, la
tlvision par cble tait un systme d'antennes desservant une communaut
spcifique.
Cb, Cr : Signaux de diffrence de couleur entre la luminance et la couleur bleue (Cb)
ainsi que la luminance et la couleur rouge (Cr).
CCD (Charged coupled device) : Capteur qui, l'intrieur une camra, transforme
les signaux lumineux et de couleurs en signaux lectriques susceptibles d'tre
enregistrs ou numriss.
CCIR (Comite Consultatif International des Radiocommunications) A t
transform en ITU (International Telecommunication Union).
CCIR 601 : paramtres de codage en studio de la tlvision numrique pour des
formats standards d'image 4:3(normalis) et 16:9(cran panoramique). Traitement
de la vido en composante 4:2:2. Ce standard est maintenant nomm ITU-R BT.601.
CD (compact Disc) : Un moyen de stockage optique invent par Philips et Sony.
CD-DA (Compact Disc Digital Audio) : Le format original de musique numrique
sur CD dfinis par le RED BOOK (stockage de l'information sous forme PCM) et
l'origine de tous les autres formats de CD.
CD+G (Compact disc plus Graphics) : Une variation du format CD qui incorpore
des informations graphiques dans les donnes audio ce qui permet l'affichage sur
lecteurs compatibles (CD-i par exemple) d'images ou de textes simplifis. Utilis
principalement pour des applications karaoks.
CD-i (Compact Disc interactif) : Standard de disques et de lecteurs multimdias
dfinis par le Green book en 1987 premiers lecteurs en 1991. Le CD-i supporte un
ensemble d'applications; films, jeux, ducatifs, culturels et bornes interactives et est
galement compatibles avec les disques Video-CD (avec carte FMV), Photo-CD, CD+G
et CD-Audio. A t principalement soutenu par Philips jusqu' son arrt en 1999.
CD-R : Disque CD enregistrable une fois. Dfini par le Orange Book.

CD-ROM (Compact disc read-only memory): Disque CD qui permet le stockage
de donnes informatiques.
CD-ROM XA (CD-ROM extended architecture) : Version hybride du CD-ROM,

avec un formatage de secteurs diffrents facilitant l'utilisation de donnes audio et
vido. Utilis pour les CD-i, Video-CD, Photo-CD.
CDTV : Canadian Digital television Inc.
CEMA (Consumer Electronics Manufacturers Association) : Association
amricaine regroupant les fabricants de produits lectroniques.
Channel : Un mdium numrique qui stock o transporte un flux (stream) de
signaux de tlvision numrique.
Character Generator (Gnrateur de Caractres) : Appareil utilis pour gnrer
des mots et/ou nombres en format vido. Les caractres seront subsquemment
surimposs sur le signal vido ou le "background".
Checksum : Une valeur simple de vrification de l'information, calcule en
additionnant tous les bytes d'un bloc. Peu fiable car elle ne vrifie que le total de bits
et non la validit de l'information.
Chroma : Caractristique de l'information couleur, indpendante de l'intensit de
luminance. Le "hue" et la saturation sont des qualits du chroma. Les objets noirs,
gris et blanc n'ont pas de caractristiques de chroma.
Chroma Key : Filtre qui permet une couleur spcifique dtermine dans une
squence d'tre rendue transparente.
Chrominance(C) : La composante couleur de la lumire, indpendante de la
luminance (Y). La chrominance est ajoute un signal noir et blanc pour produire
une image couleur, ce qui est le principe de diffusion des systmes de tlvision PAL,
SECAM et NTSC.
CIF (Common image/Interchange format) : Utilis pour l'change de contenu
mondialement.
1- Pour les ordinateurs, en 352x240 pixels.
2- Pour la haute dfinition numrique, la structure d'chantillonnage numrique
1920x1080 est le format tabli mondialement. Tous les paramtres techniques
relatifs au "scanning", la colorimtrie, les caractristiques de transfert, etc... sont
universels. Le standard est identifi comme ITU-R BT 709-3.
Cinch : Voir RCA.
Cliff effect (ou Digital cliff) : Rfre un phnomne que l'on retrouve dans les
systmes vido numrique dcrivant la dtrioration soudaine de la qualit du signal
due des erreurs de bit excessives, souvent caus par une longueur de cble
excessive, ou un problme de transmission. Le signal restera parfait mme si un de
ses paramtres approche sa capacit limite d'erreur. Par contre, un certain
moment, ces paramtres arrivent au point ou ils ne peuvent plus interprter
l'information de manire correcte et l'image devient totalement perdue.
Closed GOP (GOP ferm) : Groupe d'images fermes, c'est--dire dont la dernire
image n'a pas besoin de la premire image du groupe suivant pour tre dcode. Un
GOP ferm est destin permettre le placement d'un point de montage dans un flux
MPEG.
Closed Captioning : Voir Sous-titrage code.
Coarse Wave Division Multiplexing (CWDM) : Permet de transporter jusqu' 16
canaux d'information spars sur un unique cble optique en utilisant des longueurs
d'ondes diffrentes. Dune manire gnrale les longueurs d'ondes sont spares par
un intervalle de 20 nanomtres.
Coaxial : Cble compos d'un fil central isol transportant l'information entour
d'une tresse mtallique servant de fil de masse, immunisant par l le signal vhicul
contre les parasites.
Codage statistique (Stat Mux): Procd de codage permettant de faire varier le

dbit numrique reprsentant l'information transmettre en fonction de la richesse
de cette information. Le dbit baisse lorsque l'information est peu riche (correspond
peu de mouvement ou un contenu simple comme les dessins anims), et
augmente lorsque l'information est riche (correspond des mouvements rapides
comme les missions de sport ou un contenu riche comme les films).
Code Temporel ("Time Code"): Facilite l'assemblage des images lors du prmontage et du montage en assurant le reprage prcis des plans monter par
l'indication de la position en heure (HH :), minute (MM :), seconde (SS :) et numro
dimage (FF: F pour Frame).
Codec (Codeur-dcodeur) : Un appareil ou logiciel qui convertit les signaux audio
et vido analogiques en format numrique pour la transmission. Le codec reconvertit
aussi le signal numrique reu en format analogique.
Coded representation: Un lment d'information tel que reprsent dans sa forme
encode.
Coefficient: Nombre caractrisant l'amplitude d'une frquence particulire dans une
transforme.
COFDM (Coded Othogonal Frequency Division Multiplex) : Multiplex par division
de frquence orthogonale code. COFDM peut transmettre simultanment plusieurs
flux de donnes, chacun occupant seulement une petite portion de la largeur de
bande totale disponible. Son principal avantage est de rendre les chos constructifs,
offrant ainsi une rception sans interfrences, mme dans des conditions de
propagation difficiles. C'est le standard TVN europen auquel on a prfr le 8-VSB
en Amrique.
Color Black : Signal vido analogique prsentant une image noire. Ce signal est
souvent utilis en tant que signal de rfrence pour la synchronisation des
quipements.
Color Subcarrier (sous-porteuse couleur) : Frquence qui transporte
l'information sur la couleur dans un signal vido composite de base. Un signal de
synchronisation de 3.58MHz est ajout au dbut des lignes horizontales pour
permettre de synchroniser les circuits de dcodage des moniteurs de visionnement
avec la source vido.
Compensation de mouvement : Lors du dcodage d'un fichier MPEG, action de
reconstruire une image partir de vecteurs de mouvements appliqus sur des blocs
dj dcods.
Component Video (Composante): En produisant une image couleur, un systme
de tlvision commence avec trois canaux d'informations; Rouge (Red), Vert (Green)
et Bleu (Blue), que l'on appelle aussi RGB. Il s'agit d'une forme de vido component.
Dans le procd de transformer ces canaux pour la distribution, ils sont souvent
convertis Y, R-Y, et B-Y ou Y Pb Pr. Il s'agit l d'une autre forme de vido
component. Le terme component reprsente un certain nombre d'lments
ncessaires la formation d'une image.
Composite Video : Un seul signal vido qui contient l'information sur la luminance,
la couleur et la synchronisation. NTSC, PAL, et SECAM sont des exemples de
systmes vido composite.
Compression : Mthode de rduction du nombre de bits requis pour enregistrer ou

pour transmettre des programmes en enlevant les donnes redondantes et/ou les
donnes juges non essentielles de l'image et du son numrique. Le standard de
transmission de TVN au Canada utilise la compression vido MPEG-2 et le code de
compression audio AC-3. La compression permet la transmission de plus de
programmes sur un seul canal.
Compression dbit fixe : Techniques conues pour produire un flux de donnes
dbit constant.
Compression des donnes : Procd de rduction du dbit des donnes
numriques ralis en enlevant les donnes redondantes et/ou les donnes juges
non essentielles. Les donnes tant les lments d'information vido, audio et autres.
Conditionnal Access (Accs conditionnel) : Technique alliant des oprations de
brouillage et de gestion d'abonnement limitant l'accs aux programmes en diffusion
grce une carte puces assurant le dbrouillage dans le terminal de l'abonn.
Connecteur DB (Data Bus): Connecteurs situs l'arrire d'un ordinateur et
caractris par son nombre de broches (DB 9 ou DB 25, 15, 50 etc.).
Connexion vido composantes (Component Video Connections) : Maintenant

commune sur la plupart des tlviseurs de meilleure qualit, la vido composantes
n'entrane qu'une trs lgre compression. Les connexions vido composantes
possdent un cble pour la luminance (noir et blanc) et deux pour les signaux de
diffrentes couleurs.
Connexion vido composite (Composite Video Connections) : Mthode utilise
pour interconnecter appareils et priphriques vido (dcodeur numrique et
tlviseur analogique par exemple) qui transmettent le signal sur un seul cble. Cette
mthode n'est approprie que pour transmettre des signaux analogiques NTSC.
Connection S-Vido : Mthode d'interconnexion des quipements de vido (tels que
le DVD et le tlviseur analogique) par l'envoi d'un signal deux composants
spars, luminance (Y) et chrominance ou couleur encode (C). La connexion S-Vido
utilise un cble qui se termine en un connecteur miniature 4 voies (parfois un
connecteur 7 voies utilis pour les ordinateurs afin de permettre la transmission
d'un signal composite NTSC). La connexion S-Vido amliore de beaucoup la qualit
de l'image.
Constant bit rate (CBR) : Mode d'encodage vido du MPEG ou le flux de donnes
est compress un dbit constant. Un mme dbit d'information est affect pour
traiter les scnes simples et complexes encoder, ce qui limite la qualit de certaines
scnes.
Constant angular velocity (CAV): Systme de rotation de disque dans lequel la
vitesse de rotation du disque est constante. Les autres systmes sont le CLV et ZCLV.
Constant linear velocity (CLV): Systme de rotation de disque dans lequel la
vitesse linaire parcourue sur le disque est maintenue constante en augmentant ou
rduisant la vitesse de rotation du disque.
Content Protection for Prerecorded Media (CPPM) : Systme de protection du
DVD-Audio.
Content Protection for Recordable Media (CPRM) : Systme de protection des
DVD enregistrables.
Contraste : Diffrence de luminance entre les parties les plus claires et les plus
sombres d'une image.
Conventional definition television (CDTV) : Terme utilis pour dcrire le systme
de tlvision analogue NTSC. Voir aussi Standard definition television.
Conversion du format (Format Conversion) : Procd de codage/dcodage et de
r-chantillonnage de l'image permettant de changer le format des donnes
numriques.
Conversion vers le bas (downconversion) : Procd qui consiste rduire le

nombre de pixels et/ou format d'affichage (Voir conversion vers le haut).
Conversion vers le haut (Upconverting) : Procd qui accrot le nombre de pixels
ou le dbit d'images ou le format de balayage pour afficher une image. On y arrive
par interpolation des pixels existants pour en crer de nouveaux plus rapprochs. Le
procd n'accrot pas la rsolution de l'image. Utilis pour la conversion de la
dfinition standard en haute dfinition.
Convertisseur numrique : Appareil assurant la rception, le dcodage et l'envoi
au tlviseur (NTSC) dsign de l'image et du son de la transmission TVN
slectionne.
Convertisseur (set-top box) : Botier non intgr au tlviseur permettant au
tlspectateur de recevoir sur son tlviseur analogique les signaux numriques.
Convertisseur numrique/analogique (D/A, digital to analog) : Botier non
intgr au tlviseur permettant au tlspectateur de recevoir sur son tlviseur
analogique les signaux numriques.
Couche (Layer) : En MPEG-1 Audio, le numro de couche (1, 2, 3) correspond

l'utilisation d'algorithmes de compression diffrents.
CRC (Cyclic Redundancy Check) : Cycle redondant de vrification de la correction
de l'information.
Cross-interleaved Reed Solomon code (CIRC) : Mthode de correction d'erreur
utilise sur les CD.
CSA (Common Scrambling Algorithm): Algorithme d'embrouillage spcifi par le
standard DVB.
CTL (Control Track) : Piste de contrle permettant au magntoscope de retrouver
plus facilement la piste vido et lui fournissant galement des indications sur le time
code lorsque le VITC ou le LTC n'est plus lisible. Si le time code fait dfaut, le CTL
fonctionne au moins comme un compteur image relatif.
DARS (Digital Audio Reference Signal) : Signal de rfrence audio utilis pour la
synchronisation des studios audio numriques.
DAT (Digital Audio Tape) : Systme d'enregistrement numrique (32, 44.1 ou 48
KhZ, 16 bits, 2 canaux) sur bande magntiques (dbit 273.1Kbs, vitesse 8.15 mm/s)
initialement prvu pour l'enregistrement audio/son numrique (pro) mais aussi
souvent dtourn de sa fonction premire pour de l'enregistrement de donnes
"informatiques". Les lecteurs/enregistreurs DAT informatiques/audio sont bien sr
incompatibles entre eux.
Data element : Un lment d'information tel que reprsent avant l'encodage et
aprs le dcodage.
dB (Decibel) : L'unit standard utilise pour indiquer les gains et/ou perte de
courant le long d'un signal. Elle indique le ratio logarithmique du courant
"sortant"(output) divis par le courant "entrant"(input). Cette mthode d'chelonnage
des niveaux est importante tant donn que la sensitivit visuelle et sonore de
l'homme est logarithmique, ce qui reprsente une large gamme dynamique.
DBS (Direct Broadcast Satellite ou DTH, Direct to Home): Transmission directe
par satellite. Transmission faisant habituellement appel au codage MPEG-2 et la
transmission QPSK.
DCT (Discrete Cosine Transform) : Transforme Cosinus Discrte.
Dbit (taux) de transfert des donnes : Vitesse de transmission des donnes
exprime en "bits" par seconde (bps). Plus grande est la vitesse, plus de donnes
sont transmises, ce qui se traduit gnralement par une meilleure qualit d'image et
de son. La vitesse de transmission des donnes vido est exprime en mgabits par
seconde (Mbps, 106) et celle des donnes audio en kilobits par seconde (kbps, 103).
Decoded stream : La reconstruction d'un flux de bits compresss.
Decoder (dcodeur): Outils de dcodage d'un signal compress.
Decoding (process) : Procd dfini par le standard de tlvision numrique

consistant lire un flux de bits encods et recrer une image ou un signal audio.
De-embedding : Procd permettant d'extraire un signal d'un autre et de gnrer
deux signaux spars. Les deux peuvent tre des standards diffrents. Ce terme est
souvent utilis pour dcrire le procd d'extraction d'un signal AES audio qui est
intgr dans un signal vido numrique.
Degauss (dmagntisation) : Procd de dmagntisation d'un moniteur. Des
champs magntiques sont utiliss pour bouger le flux d'lectrons sur la surface du
tube cran. Un champ Magntique dfectueux peut parfois causer le flux d'lectron
d'aller l o il n'est pas suppos. Pour corriger cela, la plupart des moniteurs ont une
fonction de dmagntisation automatique lorsque le moniteur est ouvert. Les plus
sophistiqus ont la capacit additionnelle de le faire manuellement.
Delay (dlai) : Retard du signal. Le traitement de l'image au moyen des
gnrateurs d'effet vido, de convertisseurs analogique/numrique et du TBC
entrane un retard d'une plusieurs images. Les systmes de montage doivent tenir
compte de ce retard pour garantir le montage image l'image prs et de manire
synchrone.
Demux : Abrviation de "De-multiplexing", qui est la sparation de flux de data
"multiplexs" en signal distincts. Peut aussi rfrer la sparation de signaux AES
audio d'un signal vido numrique (voir de-embedding).
D-frame : "Frame" code selon le mode MPEG-1 en utilisant les coefficients DC
seulement.
Diffusion de donnes parallles (Datacasting): Transmission de donnes ou
d'informations supplmentaires relies ou non au programme.
Diffusion terrestre : Distribution des signaux de tlvision et de radio sur les ondes
de frquences UHF/VHF. Les diffusions peuvent tre analogiques ou numriques.
Digital Betacam (Beta numrique) : Format numrique en composantes. Son
faible taux de compression (2:1) garantit une image de haute qualit (4:2:2 pour 10
bits). Les camras peuvent enregistrer en 4:3 et 16:9.
Digital S : Format numrique en composantes de JVC. Bas sur la cassette VHS.
Taux de compression relativement faible (2.3:1).
DIN : Format de connecteur 5 broches.
Dispersion d'nergie (brassage) : Combinaison logique d'un signal numrique

avec une squence pseudo-alatoire pour rendre son spectre uniforme aprs
modulation.
DLP (Digital Light Processing/Traitement numrique de la lumire) :
Technique o l'image affiche est produite par un ensemble de micro miroirs
dynamiques form sur une plaquette, chacun pouvant reflter la lumire source pour
former un pixel sur l'cran. Chaque micro miroir contrle le niveau de lumire
transmis l'cran pour le pixel. La rsolution est dfinie par la taille de la plaquette
de micro miroirs. Cette technique est utilise par certains tlviseurs et projecteurs
HD de haute gamme.
Dolby Digital (auparavant Dolby AC-3) : Standard audio 5.1 canaux approuv
pour la tlvision numrique ATSC utilisant un rapport de compression approximatif
de 13:1. Fait appel six canaux audio spars: Gauche, Centre, Droite, Arrire (ou
ct) gauche, arrire (ou ct) droit et caisson d'extrmes graves-LFE "effets de
basse frquence"(considr comme le .1 en raison de sa largeur de bande limite).
Dans bon nombre de tlviseurs, les 5.1 canaux sont convertis en deux canaux
stro et ne fournissent pas le son complet ambiophonique des 5.1 canaux.
Downconverter : Convertisseur qui prends un signal Haute dfinition (HDTV) et le
converti en signal vido numrique standard (SDTV).
(Voir: Conversion vers le bas).
Downstream : Terme utilis en diffusion indiquant un point (quipement ou autre)

plus prt du point final de transmission.
Dpi (Dot per Inch, point par pouce [ppp]) : C'est le nombre de pixels crs sur
une surface d'un pouce. Plus ce nombre est grand, meilleure sera la rsolution et la
dfinition de l'image.
Drop Out : Dfaut d'enregistrement ou de lecture de la cassette vido. Sur les
bandes analogiques, il se manifeste par une ligne horizontale blanche, qui peut tre
partiellement corrige par le TBC. Sur les bandes numriques, un correcteur d'erreur
masque les drop outs. De plus, les informations de l'image tant rparties sur
l'ensemble de la piste vido, un drop out ne fait qu'lever lgrement le niveau du
bruit de l'image. S'il y a trop de drop outs, le correcteur d'erreur ne suit plus et des
blocs de mosaques apparaissent.
DSL (Digital Subscriber Line ou Digital Subscriber Loop) : Une manire de
transmettre de l'information par lignes tlphoniques ordinaires de cuivre, galement
appel High-speed DSL (HDSL, DSL haute vitesse).
DSM : Digital storage media.
DTH (auparavant DBS) : Service de tlvision livr directement la maison par
satellite.
DTS (Digital Theatre Sound System) : Standard audio ambiophonique multicanal
5.1 similaire Dolby Digital (Dolby AC-3) qui est le standard reconnu de la TVN. DTS
est utilis dans les cinmas et est prsent sur plusieurs DVD.
DTS (Decoding Time Stamp) : Marqueur Temporel de Dcodage en compression
MPEG-2. Indique quand une unit d'accs doit tre dcode.
DVB (Digital Video Broadcasting) : Diffusion vido numrique.
DVC (Digital Video Cassette) : Cassette vido numrique.
DVCR : Digital video cassette recorder.
DVD (Digital Versatile Disk) : Disque de mme format que le DC mais possdant
une capacit de stockage 7 fois suprieure sur un seul ct. Peut contenir des longs
mtrages et prises complmentaires en plus d'une bande audio plurilingue de haute
qualit.
DVE (Digital Video effects, Effets Vido Numrique) : Un DVE est cr en
prenant n'importe quelle source vido et en la manipulant l'intrieur d'un cadre
vido.
DVI (Digital Video Interactive, Vido Numrique Interactive) : Systme
interactif d'information multimdia o la vido numrique offre une image anime
plein cran avec la frquence d'images de la tlvision actuelle (jusqu' une heure
de vido). Les systmes CD-I et DVI proposent, outre le texte, son et graphique, des
images de qualit photographique et le moyen de se dplacer l'intrieur de cet
ensemble d'informations.
EBU : European Broadcasting Union.
ECM (Entitlement Control Message) : Composante de contrle d'accs permettant
de dsembrouiller une composante crypte. Transporte le mot de contrle et les
conditions commerciales du programme.
cran 4:3 : Format d'cran traditionnel d'un tlviseur NTSC de 4x de largeur sur 3x
de hauteur.
cran 16:9 : Format grand cran des tlviseurs numriques en Haute Dfinition et
de certains en dfinition standard, de 16x de largeur sur 9x de hauteur.
cran plasma (PDP): Cette technique construit une image d'aprs un grand
nombre de pixels forms dans un panneau en verre. Les pixels sont contrls
individuellement, offrant une image sans scintillements de brillance leve. L'cran
plasma s'installe au mur. Les crans PDP sont disponibles en tailles jusqu' 160 cm
et conviennent ainsi au home cinma.
cran de tlvision tube Cathodique (CRC/Cathode Ray Tube) : Tlviseur
utilisant le tube cathodique pour l'affichage, une technologie utilise depuis des
annes. L'image s'affiche sur un cran luminescent couche de phosphore balay par
un faisceau d'lectrons. Il peut produire des images lumineuses d'une excellente
rsolution.
EDH (Error Detection and Handling) : Mthode permettant de dterminer quand

une error de bit s'est produite dans un rseau vido numrique (SMPTE RP-165). On
inclus dans le "anciliary data" des bit de rfrences permettant de vrifier la qualit
de la transmission du signal.
Editing : Procd par lequel un ou plusieurs signaux vido (numriques ou
analogues) sont manipuls et/ou mlangs pour donner un nouveau signal la
sortie.
EIT (Event Information Table): Table d'Information d'vnement. Renseigne le
tlspectateur sur les programmes en cours et venir.
Electromagnetic Spectrum (Spectre lectromagntique) : Gamme des
frquences des radiations lectromagntiques, de zro l'infini.
Elementary Stream (Flux lmentaire) : Flux lmentaire de sortie d'un

compresseur et vhiculant un seul signal vido ou audio.
Elementary stream clock reference (ESCR) : Rfrence temporelle servant
synchroniser les dcodeurs du flux d'information.
Embedding : Procd permettant de combiner un type de signal avec un autre de
manire ce que les deux puissent tre transports en utilisant le standard d'un seul
des deux. Souvent utilis pour dcrire le procd permettant d'insr un signal audio
AES l'intrieur d'un signal vido numrique.
EMM (Entitlement Management Message) : Information d'accs conditionnel
dterminant les niveaux d'autorisation des services pour un dcodeur particulier. On
peut adresser un dcodeur ou un groupe de dcodeurs.
Encoder : Outils d'encodage d'un signal compress.
Encoding (process) : Procd dfini par le standard de tlvision numrique
consistant lire une image ou un signal audio et recrer un flux de bits encods.
Encryptage : Procd de codage des signaux qui requiert un code ou une cl
particulire pour la pleine reprsentation de la programmation et du contenu
disponible l'abonn du service de tlvision interactive ou tlspectateur qui
possde un tlviseur numrique.
ENG (Electronic News Gathering) : Terme utilis pour dcrire les moyens
lectroniques de reportage.
Entropie : Quantit d'information contenue dans un symbole de communication.
C'est aussi la limite infrieure de la compression sans pertes. Si une image est
compresse davantage que son entropie, il y a perte d'information. En thorie de
l'information, mesure de la perte d'information cause par les erreurs dues au
hasard, qui peuvent se produire pendant la transmission de signaux ou de messages.
Entropy coding : Encodage moindre perte, de longueur variable, d'une
reprsentation numrique d'un signal pour rduire la redondance.
Entry point : Rfre un point, dans un flux de donnes, aprs lequel un dcodeur
s'initialise et peut commencer le dcodage.
EPG (Electronic Program Guide/Guide de programmation lectronique) :
Affichage l'cran des canaux et des horaires des programmes.
ETSI (European Telecommunications Standards Institute) : Organisme
tablissant les normes europennes de tlcommunications.
Ethernet : Protocole standardis (IEEE 802.3) pour un LAN 10Mb/s. Ethernet est
utilis comme standard pour la transmission de mdia tel le cble coaxial et la fibre
optique.
Event (vnement) : Un "vnement" est dfini comme une collection de flux
lmentaires ayant une base de temps commune, tant associs la mme heure de
dpart et de fin.
FEC (Forward Error Correction) : Systme dans lequel une redondance est
ajoute au message, l'mission, de faon ce que les erreurs soient corriges
dynamiquement la rception dans le dcodeur.
FFT (Fast Fourier Transform) : Transforme de Fourier Rapide.

Fibre Channel (Fiber Channel) : Lien data haute vitesse capable de soutenir un
taux de transfert de 2 Giga bytes/sec en utilisant un cble de fibre optique. Le
standard supporte la transmission d'information pour les canaux les plus populaires
et les rseaux standard, incluant SCSI, HIPPI, Ethernet, Internet Protocol, et ATM.
Fiber-optic Cable (Cble de fibre optique) : Un cble transportant un faisceau de
lumire laser, encod de signaux numriques, plutt que de l'nergie lectrique. Fait
de fibre de verre lger, les cbles de fibre optique peuvent transmettre de grande
quantit d'information par secondes.
Field (champ) : Dans le signal vido entrelac, un champ est l'assemblage des
lignes alternatives dans un "frame". Un frame "entrelac" est donc compos de deux
champs: pair et impair.
FireWire : Interface de transmission srie haut dbit la norme IEEE1394,
dveloppe au dpart par la socit Apple. L'change des donnes se fait une
vitesse de 12, 25 ou 100 Mo/seconde. Connectable " chaud", c'est dire sans
teindre l'ordinateur, l'interface accepte jusqu' 63 priphriques connects
simultanment. Appele plus communment en vido, entre ou sortie DV, cette
interface a t galement renomme iLink par Sony.
Flux (Stream) : Envoi de donnes sur un rseau, tel que l'Internet, de faon
procurer ou simuler la transmission en temps rel de vido et/ou d'audio.
FM (Frequency Modulation) : Mthode de transmission dans laquelle la frquence
du transporteur varie selon le signal.
Format d'cran : Le rapport de la largeur d'cran sur la hauteur. Le terme

s'applique aussi l'image ou sa prsentation (Voir 16:9, 4:3, etc...). Les crans et
l'affichage traditionnels possdent un rapport de 4 sur 3. La TVSD autorise l'affichage
en 16:9, un format requis pour la TVHD.
FPLL : Frequency and phase locked loop.
Frame : Un frame contient des lignes d'information "spatiale" d'un signal vido. En
vido NTSC, il est compos de deux champs: pair et impair.
Frame Synchronizer : quipement qui re-synchronise un signal vido un signal de
rfrence, tel qu'un "genlock", bi-level ou tri-level sync.
Gamma : Le "niveau vido de sortie"(light output) d'un CRT(cathode ray tube/tube
rayons cathodique) est non linaire par rapport au voltage entrant. Cette "nonlinarit" reprsente une fonction exponentielle appele Gamma. Plus simplement,
plus les couleurs deviennent ples, plus l'oeil humain de la difficult les discerner.
Un ajustement Gamma est alors utilis pour compenser ce problme, de faon ce
que les gammes de couleurs d'un objet, tel les ombres, puissent tre discerns
correctement. Un ajustement incorrect du Gamma peut causer les couleurs d'avoir
l'air trop sombre ou trop claire, causant une perte des dtails.
Gnration : L'enregistrement original d'une image sera appel la premire
gnration. Une copie de cet original sera la deuxime gnration, etc...
Genlock : La synchronisation d'une pice d'quipement avec une autre en utilisant
un signal vido (ou autre) externe. Dans les systmes de diffusion et de
vidoconfrence, toutes les sources doivent tre synchroniss entres elles.
GIF (Graphics interchange format) : Fichiers d'information graphique, utiliss par

les ordinateurs et dvelopp par Compuserve pour la compression graphique
d'images. Maintenant communment utilis en Internet, la compression GIF est sans
pertes et supporte la transparence, mais ne permet qu'un maximum de 256 couleurs.
GOP (Group Of Pictures, Groupe d'images): Consiste en une ou plusieurs images
en squences. Un GOP commence par une image I et se termine par la dernire
image prcdant l'image I suivante.
GUI (Graphic User Interface): Interface de commande et contrle numrique pour

les usags d'un systme donn. Mac OS (Apple) et Windows (Microsoft) sont des
exemples de GUI, ainsi que les menus interactifs d'un lecteur DVD.
Half-Duplex transmission: Lien bidirectionnel dont le transfert de donnes est
limit un sens la fois. Aussi nomm "simplex transmission".
HDMI (High-Definition Multimedia Interface) : HDMI est une technologie utilise

pour le transport des signaux numriques TVHD (dcompresss), TVSD, audio et
contrle entre les appareils la maison comme le convertisseur et l'cran. Le
protocole est compatible avec celui de DVI mais les connecteurs sont plus petits. Les
donns sont encryptes sous le protocole HDCP afin de les protger.
High definition television (HDTV) : La tlvision haute dfinition une rsolution
d'approximativement le double de la tlvision conventionnelle autant dans les
dimensions horizontales (H) et verticales (V) et un ratio (HxV) de 16:9.
High level : L'chelle des paramtres d'encodage de l'image, tel que dfinis en
MPEG-2, qui correspondent la tlvision haute dfinition.
Hot Swap : Action ou procd d'enlever une composante lectronique d'un
quipement sans avoir au pralable ferm l'quipement.
HTML (HyperText Markup Language) : Langage de programmation
communment utilis pour la cration de pages Web sur Internet.
http (HyperText Transport Protocol) : Mthode utilis pour l'adressage de
domaines sur Internet.
Hue (teinte): Rouge, jaune, bleu, etc... reprsentent des "teintes" de couleur, ou
types de couleur. Hue est un paramtre de couleurs qui nous permet de distinguer
les couleurs entre elles.
IEC : International Electrotechnical Commission.
Input (Entre) : L'introduction d'un signal dans un appareil.
ISO (International Standard Organisation) : Organisme de normalisation

mondial.
Inter-coding (Intercodage) : Compression utilisant la redondance entre images
successives, galement appele codage temporel.
Interleaving (Entrelacement) : Technique associe la correction d'erreurs et qui
rpartit les paquets d'erreurs en plusieurs paquets plus petits. Aussi; rfrent au
systme d'analyse (scanning) de l'image. En format entrelac, le systme prsente
d'abord les lignes impaires puis, dans une deuxime analyse (scan), les lignes paires.
Lorsqu'il y a 30 images par secondes, le moniteur montrera donc un demi frame
chaque soixantime de secondes.
Intra-coding (Intracodage): Compression travaillant entirement l'intrieur
d'une image, galement appele codage spatial.
Intra-coded pictures ou I-pictures ou I-frames : Images qui sont codes en
utilisant exclusivement l'information prsente seulement dans l'image elle-mme et
ne dpendant pas de l'information des autres images.
IRD (Integrated Receiver Decoder) : Dcodeur Rcepteur Intgr. Appareil
combinant le rcepteur HF et le dcodeur MPEG.
IRE (Institute of Radio Engineers): Unit de mesure vido de 1 Volt (Peak), le
Peak Vido est divis en 140 units IRE. Ceci a t fait pour rendre plus efficace la
communication des niveaux de luminance. L'amplitude du signal vido, du noir
(blanking, zro volts) au peak des blancs est de 0.714286 volts ou 100 units IRE. Le
signal de synchronisation s'tend du noir (blanking) -0.285714 volts, ou -40 units
IRE.
Picture Black Level : 7.5 IRE (au dessus de zro volts)

Picture White Level : 100.0 IRE (au dessus de zro volts)
Blanking Level : 0.0 IRE (niveau zro volt)
Burst Pedestal : 0.0 IRE (niveau zro volt)
Synchronization : - 40.0 IRE (sous zro volts)
Le niveau des noirs a t lev au-dessus de 0 IRE dans les premiers temps de la
tlvision couleur pour palier certains problmes de transmission. La pratique se
continue toujours de nos jours. Le signal vido SMPTE component utilise galement le
systme IRE. Il est bas sur un systme de 700mVolt, par rapport 714mVolt en
vido composite.
ISDN (Integrated Services Digital Network) : Permet aux donnes d'tre
transmises haute vitesse sur le rseau tlphonique publique. ISDN opre partir
d'un taux de transfert de base de 64 Kbits/sec, jusqu' un taux de 2 Mbps
(communment appel ISDN-30, car il comprend 30 canaux de transfert de base). La
plupart du monde occidental prsentement la capacit d'installer le ISDN-2, avec
128 Kbps et une croissance trs rapide est prvue en gnral pour ISDN.
ITU : International Telecommunication Union.
Jack : Connecteur audio faisant transiter un signal mono ou stro, utilis
principalement pour les micros et les casques, les prises jacks existent en plusieurs
diamtres: 6.35, mais aussi 3.5mm pour les appareils Hi-Fi de salon et 2.5mm pour
les Walkman, les magntoscopes ou les cartes son informatiques (appel aussi MiniPhone ou Mini-Jack).
Java : Un langage de programmation d'usage gnral dvelopp par Sun

Microsystems plus connu pour son utilisation sur l'internet. Contrairement d'autre
logiciels, les programmes crit en langage Java peuvent fonctionner sur n'importe
laquelle plate-forme (incluant les set-top box), en autant qu'elles contiennent un
"java virtual machine" (java.sun.com).
JEC : Joint Engineering Committee.
Jitter : Variation de synchronisation d'un signal caus par la perte du signal de
rfrence de temps.
Jog : Fonction de montage permettant de se positionner prcisment sur une bande
vido ( l'image prs) grce, gnralement, une molette shuttle.
JPEG (Joint Photographic[Picture] Expert Group) : Groupe ayant dvelopp la
norme de compression d'images fixes. Algorithme de compression d'images fixes
stockes sous forme numrique. C'est le format d'image le plus couramment utilis.
Keyframe : Suite de paramtres qui dfinissent un point dans une transition, tel un
DVE. Par exemple, un Keyframe pourrais dfinir la grandeur de l'image, sa position
ou sa rotation. Tout effets DVE doit avoir un minimum de deux keyframes, dbut et
fin, bien que la majorit en utilisera plus que cela.
Khz (Kilohertz) : Mille cycles par secondes.
LAN (Local Area Network) : Un rseau qui connecte physiquement chaque
ordinateur ensemble, de faon permettre chaque utilisateur connect le partage
de fichier et/ou d'information.
layer : Un des niveaux dans la hirarchie des spcifications de systmes et de la

vido.
Level (Niveau) : Taille de l'image d'entre utilise avec un profil dtermin.
Letterbox (Boite aux lettres) : Lorsqu'une image en format 16:9 est affiche sur
un cran de format 4:3, deux barres noires s'affichent, l'une au-dessus de l'image et
l'autre au-dessous. Cet effet ou format d'affichage est dsign par bote aux lettres et
il apparat souvent lors de la transmission de films.
LTC (Longitudinal Time Code) : Manire de coder le time code (enregistrement en
horizontal le long de la bande).
Luminance : Partie Noir & Blanc d'un signal vido, transporte les informations sur la
brillance, le contraste, les qualits de lumire (et d'ombres) de l'image vido mais
pas les informations de couleur.
Lux : Unit de mesure de l'intensit de la lumire.
Macroblock : Zone de l'image reprsente par plusieurs blocs DCT de luminance ou

de diffrence de couleurs, blocs qui sont tous dplacs par un vecteur de
mouvement.
Main level : Paramtres de compressions numriques MPEG-2 correspondant une
rsolution maximum.
Main profile : Profile de spcifications d'encodage MPEG-2 qui devrait supporter un
large ventail d'applications.
Masking (Masquage) : Phnomne psycho-acoustique dans lequel certains sons ne
peuvent tre entendus en la prsence d'autres sons.
Mbps : 1 000 000 bits par secondes.
MCPC (Multiple Channel Per Carrier) : Plusieurs canaux par porteuse. Se dit
lorsqu'un transpondeur contient un ensemble de programmes multiplexs transport
sur une seule frquence.
Mtadonnes : Donnes complmentaires celles comprises dans un signal vido
mais non-visibles l'cran.
MHz (Megahertz) : Un million de cycles par secondes.
Microsoft DirectX : API de bas niveau qui permet une interface mdia utilisateur
pour les jeux et autres applications multimdias ncessitant de haute performance.
DirectX procure un accs aux services matriels (hardware), et utilise les
acclrateurs matriels ou les mules si les acclrateurs ne sont pas prsents.
MIDI (Musical Instrument Digital Interface) : Standard de connexion
professionnel pour le contrle informatique des instruments et priphriques de
musique. La plupart des rfrences n'invoquent que le standard donne", qui est
un flux de donne utilis pour contrler les instruments de musique et conserver la
"sortie"(output) de ces instruments.
M-JPEG (Abrviation de Motion Jpeg) : Norme de compression drive du Jpeg et
du Mpeg compltement adapte la vido. Chaque image est comprime, comme
une photo, ce qui autorise le montage image par image.
MMDS : Systme de distribution multipoints, multivoies. Systme de
"Cblodistribution" sans fil pouvant tre cod pour les services de tlvision la
carte.
Modem cble : Modem de donnes qui utilise la largeur de bande d'un systme de
cble. L'accs Internet par modem cble est beaucoup plus rapide qu'avec un modem
reli une ligne tlphonique rgulire.
Moniteur : Dsigne un cran dpourvu de dmodulateur (tuner). Il existe des
moniteurs de type vido ou informatiques. Par drivation, on emploie galement le
terme moniteur pour dsigner un tlviseur de diagonale rduite qu'on utilise
essentiellement des fins de contrle de l'image.
Monochrome : Signal de tlvision noir et blanc.
Montage off line (Off-line editing) : Premire tape du montage vido au cours
duquel on dtermine la structure du montage; elle s'achve par la confection d'une
liste de montage. Elle s'effectue souvent sur un format vido plus avantageux ou
dans une rsolution plus basse.
Montage on line (On-line editing) : Montage du matriel original effectu en
haute qualit sur un systme de montage linaire ou non linaire d'aprs une liste de
dcision de montage provenant du montage off line. A ce stade s'effectuent
galement l'talonnage, les effets et les titres.
Motion vector : Une paire de nombres qui reprsentent les dplacements
horizontaux et verticaux d'une rgion d'une image de rfrence pour prdiction.
MP3 (MPEG-1, Layer 3) : Format de compression qui utilise la couche audio de
MPEG-1. La technologie MP3 compresse les fichiers audio jusqu' environ 1/10 de sa
taille originale, tout en offrant une bonne qualit sonore. MP3 est devenu un CODEC
trs populaire pour la musique change sur Internet.
MP@HL(Main Profile at High Level) : Format vido principal du standard haute
dfinition.
MP@ML(Main Profile at Main Level) : Format vido principal du standard DVB.
MPEG (Motion Pictures Expert Group) : Groupe ayant dfini les standards de
compression d'images animes.
MPEG-1 : Rfre au standard ISO/IEC 11172-1 (Systmes), 11172-2 (Vido),
11172-3 (Audio), 11172-4 (Compliance Testing) et 11172-5 (Technical Report).
MPEG-2 : Rfre au standard ISO/IEC 13818-1 (Systmes), 13818-2 (Vido),
13818-3 (Audio), 13818-4 (Compliance).
Multidiffusion : Terme dsignant la diffusion sur un canal numrique de 2, 3 ou 4
programmes et/ou services de donnes l'intrieur de la bande de 6 mgaHertz de
base alloue.
Multiplexage statistique (Statistical multiplexing ou StatMux) : Multiplexage
de dbits de plusieurs programmes soumis au codage statistique prcdent, visant
exploiter les variations en sens oppos des dbits des programmes pour
optimiser(minimiser) le dbit global.
Multiplex de programmes (Multiplexing ou Mux) : Technique permettant de
transporter plusieurs programmes dans un seul canal de tlvision au lieu d'un seul
programme diffus, dans le cas de la tlvision analogique.
Network (Rseau): Interconnexion de deux ou plus entits de communication et

habituellement un ou plus nodes de communication.
NIT (Network Information Table) : Table d'Information de Rseau. Information

vhicule par un flux de transport et dcrivant plusieurs flux de transport.
Noise reduction (rduction du bruit): Le bruit constitue la part non signifiante de
l'information; il provient de l'enregistrement, de la compression (dans les systmes
analogiques, de l'enregistrement et du transfert). Une rduction cible du bruit
facilite la compression de l'image et amliore aussi la reprsentation de l'image
vido.
Nonlinear editing (montage Non linaire) : Non linaire rfre ce qu'on a pas
besoin de faire le montage d'une squence dans l'ordre final et ne demande pas de
copier les parties mesure. Permet d'accder n'importe quelle partie du montage
sans avoir re-copier ou recommencer le montage. C'est une mthode dite "non
destructive" en ce sens que ce n'est pas la vido que l'on change pour le montage
mais seulement la liste de montage.
NTSC (North America Systems[Standards] Committee) : Responsable de la
cration des normes de production et de diffusion de la programmation analogique au
Canada et aux tats-Unis, normes qui seront bientt remplaces par les normes de
diffusion numrique ATSC.
Null paquets (Paquets nuls) : Paquets de bourrage ne transportant aucune
donne et qui sont ncessaires au maintien d'un dbit constant quand la partie utile
varie. Les paquets nuls ont toujours un PID gale 8191.
NVOD (Near video on demand) : Accs rapide un programme (film, sports, etc)
ralis en rptant le dit programme sur plusieurs canaux avec un dcalage entre
chaque prsentations. Le tout ralis grce un serveur vido numrique.
Octet : Voir Bytes.
Omnidirectionnel : Pour un micro; capte le son venant de toutes les directions.

Output (Sortie) : Processus qui permet un systme d'exploitation ou un
programme d'application de transfrer des donnes vers un priphrique de sortie tel
que l'cran ou l'imprimante, ou de les stocker sur disque ou dans un fichier, ou
encore de les envoyer vers un autre ordinateur par un rseau.
Pack : Un pack consiste en un en-tte suivi de zro ou plus paquets. C'est une
couche dans le systme d'encodage de la syntaxe.
Packet (Paquets) : Terme utilis dans deux contextes. Dans les flux de
programmes, un paquet est une unit contenant une ou plusieurs units de
prsentation. Dans les flux de transports, un paquet est une quantit faible et de
taille fixe de donnes (188 ou 204 octets).
Packet data : Bits d'information contigus un flux d'information lmentaire prsent
dans un paquet.
Padding : Mthode consistant ajuster la longueur moyenne, en temps, d'un frame
audio avec la dure de l'chantillonnage PCM correspondant.
PAL (Phase Alteration Line) : Format vido analogique comportant 625 lignes par
cadres(frames), utilis comme standard par la plupart des diffuseurs europens et
dans d'autres partie du globe, sauf en Amrique du Nord et au Japon.
Parity (Parit) : Mthode pour la vrification de l'exactitude de l'information
transmise et/ou enregistre. Un bit de donne est ajout un ensemble de donnes
en tant qu'lment de vrification de la transmission. La parit peut tre paire ou
impaire. Pour la parit impaire, si le nombre de "1" de l'ensemble de donnes est
pair, un "1" est ajout au total pour le rendre impair. La mme chose est faite pour
un total pair afin de le rendre impair. L'ordinateur qui rceptionne le signal vrifie le
nombre de "1" et indique une erreur si le total est incorrect.
Pas de Pixel : Le pas de pixel est le nombre de pixels ou points de l'image dans un
tube cran. Plus il y a de pixels, plus l'image est nette. Les crans de tlvision HD
tube prsentent un pas de pixel variant gnralement entre 0.25 et 0.3 mm.
PAT (Program Association Table) : Table d'Association de Programme. Table qui
indique quels sont les PID de PMT des programmes du TS.
Payload : Rfre aux bytes qui suivent immdiatement le bit d'en-tte dans un
packet (paquet).
PCM (Pulse Code Modulation) : Systme de numrisation d'une source analogique
audio ou vido. PCM est un signal numrique non compress.
PCR (Program Clock Reference) : Valeur instantane de l'horloge du codeur qui
est place dans l'en-tte des paquets TS afin de synchroniser l'horloge du dcodeur.
PDF (Portable Document Format) : Format de fichiers utilis par Adobe Acrobat.
Les fichiers PDF contiennent une reprsentation trs compacte de texte et de
graphiques, et permettent aux documents avec du texte et des graphiques
complexes d'tre lus et imprims sur les systmes d'opration DOS, MacIntosh,
Windows et UNIX(SGI, Sun Solaris et Linux).
Pedestal (dcollement du niveau du noir) : Diffrence entre le niveau du noir et
le niveau de suppression, que l'on observe dans un signal vido composite transmis
un rcepteur de tlvision.
PES (Packetized Elementary Stream) : Flux lmentaire MPEG sous forme de
paquets.
Picture (Image): Image source, code ou reconstruite, consiste en trois matrices
rectangulaires qui reprsentent la luminance et deux signaux de chrominance.
PID (Program/packet Identifier) : Identification de programme. Cod sur 13 bits
et plac dans l'en-tte du paquet de transport pour pouvoir l'identifier.
PING (Packet InterNet Gopher) : Protocole, faisant parti du standard TCP/IP,
permettant de vrifier votre connectivit avec un autre quipement, ou de vrifier si
votre connexion TCP/IP fonctionne correctement. Trs utile pour "troubleshooter" des
problmes l'intrieur d'un rseau. Normalement, on "tape" quelque chose comme;
"ping 203.110.225.01", et on obtiens une rponse de cette adresse IP ... ou non.
Pixel (PEL, Picture Element) : Un pixel est un chantillonnage numrique d'une
image un point fixe.
Pixels : Points de lumire individuels rouges, verts et bleus qui constituent une
image.
PMT(Program Map Table) : Table de rpartition de programmes. Table qui indique
quels PID transportent les composantes d'un service (un PID par composante, bien
sr).
Point-to-point transmission : Transmission entre deux stations dsignes.
Port Srie (Com/serial Port) : Prise sur un appareil (ordinateur) permettant de le

relier un autre appareil via une ligne srie.
Predicted pictures ou P-pictures ou P-frames : Images codes par prdiction, en
fonction de l'image "I" ou "P" prcdente. La technique est appele "forward
prediction". Elles permettent une meilleure compression et servent de rfrences aux
images "P" et "B" suivre.
Pre-processing (Pr-traitement) : Traitement du signal vido prcdent le codage
MPEG. La rduction de bruit, le sous chantillonnage sont des exemples de
prtraitement.
Presentation time-stamp (PTS) : Un champ qui peut tre prsent l'intrieur d'un
Paquet PES et qui indique le temps de prsentation au dcodeur.
Profile (Profil) : Spcifie le niveau de syntaxe utilis.
Program Stream : Flux contenant des informations temporelles, vido et audio
compresses (DVD par exemple).
PSI (Program Specific Information) : Information spcifique de programme.
Information gardant la trace des diffrents programmes dans un flux de transport
MPEG.
PSI/SI : Terme gnrique pour les informations spcifiques MPEG PSI et DVB SI.
PSIP (Prononcer P-SIP, Program and system information protocol) : Une
spcification TVN de l'ATSC qui permet un rcepteur vido numrique de
reconnatre les informations des programmes des diteurs de contenu et de crer des
guides de programmation lectroniques l'cran.
PU (Presentation Unit) : Unit de prsentation. Image ou bloc audio compress.
Pulse (Impulsion) : Courant ou voltage qui change abruptement d'une valeur une
autre, et reviens la valeur originelle dans un laps de temps dfini. Utilis pour
dcrire une variation dans une srie d'ondes. Les parties de l'impulsion sont la dure
de monte, la dure de descente ainsi que la largeur et l'amplitude de l'impulsion. La
priode de l'impulsion se rfre la dure entre les impulsions.
QAM (Quadrature Amplitude Modulation, Modulation d'amplitude en

quadrature) : Technique de modulation qui modifie l'amplitude de deux porteuses
de mme frquence, dphases de 90 degrs ou en quart de cycle, en deux signaux
distincts qui emprunteront deux voies diffrentes.
QCIF (Quarter-resolution Common Interchange Format) : Format commun
d'change au quart de rsolution (176 x 144 pixels). Voir CIF.
QPSK (Quadrature Phase Shift Keying) : Modulation de phase quatre tats.
QSIF (Quarter-resolution Source Input Format): Format d'entre de source
quart de rsolution. Voir SIF.
Quantizer : Une tape de la compression qui, intentionnellement, rduit la prcision
des coefficients DCT.
QuickTime : Dvelopp par Apple, QuickTime est un standard d'enregistrement du
son, des images fixes ou animes. Les fichiers QuickTime se distinguent par leur
suffixe MOV, lorsqu'ils sont diffuss par Internet ou sur un CD-Rom.
RAID (Redundant Array of Inexpensive/Independent Disks) : Systme qui
organise les donnes parmi plusieurs disques durs afin d'assurer une plus grande
zone de stockage, une meilleure scurit des donnes et une meilleure performance
(temps d'accs et duplication des donnes plus rapides. Les donnes sont protges
grce la redondance des donnes, permettant de les extraire malgr une perte de
disques. Voici quelques exemples de Raids:
RAID 0: Pas de redondance ni de parit dans les disques. Si un disque est
endommag, toute l'information contenue sur la totalit des disques est perdue. Par
contre, comme la mthode n'a pas de systme de redondance, elle est gnralement
plus rapide que les autres mthodes.
RAID 3: Utilise un entrelacement des donnes similaire Raid 0, except que la
mthode utilise un systme de parit pour entreposer les donnes redondantes.
Cette mthode est plus efficacement utilise pour les images et graphiques.
RAID 5: Cette mthode utilise une approche diffrente pour la segmentation et la
parit par rapport RAID 0 et RAID 3. La mmoire complte est spare en
plusieurs ensembles de disques et on assigne un disque de parit un certain
ensemble de disques. Cette mthode est excellente pour le traitement transactionnel.
RAM (Random access memory) : Mmoire temporaire et volatile sur laquelle de
l'information peut tre crite, ou de laquelle l'information peut tre accde en
spcifiant une adresse.
Random access : Procd consistant commencer lire et dcoder un flux de
bits en un point arbitraire.
Rapport d'cran : Le rapport largeur/hauteur d'une image. Les tlviseurs standard
ont un rapport d'cran de 4:3. Ils sont 1.33 fois plus larges que hauts (4/3). Les
crans 16:9 ont un rapport d'cran de 1.78:1 environ. Le cinma gnralement
1.85:1. Le passage d'un format l'autre s'effectue par des traitements de type
Letterbox ou Pan and Scan.
RCA (Cinch) : Connecteur utilis en audio et en vido pour faire transiter un signal
entre deux appareils, via un cble coaxial. Prsent sur tous les camscopes ou
magntoscopes grand public ainsi que sur les chanes
Hi-Fi.
Rmetteur isofrquence : metteur numrique de faible ou trs faible puissance,

reprenant le signal reu d'un autre metteur numrique en service (dit metteur
pilote) et rediffusant le mme signal sur la mme frquence que l'metteur pilote.
Rendering (rendu d'architecture) : Procd de rendu d'une image, ou squence

d'image en temps non rel, dpendant de la vitesse du processeur de l'ordinateur
pour les rendus graphique et de composition.
Rsolution : Le nombre total de pixels disponibles pour l'affichage d'une image. Les
rsolutions plus leves autorisent un affichage plus dtaill rsultant en une qualit
d'image suprieure.
Rsolution maximale : Signal la rsolution la plus leve qu'un tlviseur ou un
cran peut accepter l'entre. Certains appareils d'affichage ne sont pas en mesure
d'afficher une telle rsolution et, en consquence, doivent convertir les signaux une
rsolution infrieure avant l'affichage.
Rseau SFN (Single Frequency Network, rseau frquence unique) :
Ensemble organis d'metteurs numriques utilisant la mme frquence et diffusant
obligatoirement le mme contenu de programmes, avec synchronisation des signaux
diffuss.
Rseau MFN(Multiple Frequency Network, Rseau frquence multiple) :
Ensemble organis d'metteurs, analogiques ou numriques, utilisant des frquences
diffrentes, diffusant ou non le mme contenu de programmes.
Rseau primaire : Partie d'un rseau de diffusion utilisant principalement des sites
points hauts et conu de manire assurer le maximum de couverture avec un
nombre minimal de sites.
Rseau secondaire : Partie complmentaire du rseau primaire dans un rseau de
diffusion destine couvrir les zones non couvertes par le rseau primaire en raison
du relief du terrain ou renforcer localement le signal.
Router : quipement comportant plusieurs entres et sorties permettant de changer
de sources vido rapidement sans avoir re-cbler.
RLC (Run Length Coding) : Systme de codage comptant le nombre de bits
similaires plutt que de les mettre individuellement.
RS : Notation abrge du codage de Reed-Solomon.
RS-232 : Standard de dfinition de ligne srie le plus rpandu. RS-232 spcifie les
signaux lectriques et la manire de les connecter.
RS-422 : En principe, standard pour la transmission srielle des donnes. Est utilis
comme synonyme pour le protocole de pilotage des magntoscopes Sony. Tous les
magntoscopes et les systmes de montage professionnels travaillent avec RS-422. Il
existe en diffrentes versions, les plus rpandu tant le format Betacam.
RU (Rack Unit) : Unit de mesurement standard quivalent 1.75 pouces, ou
45mm, utilis pour les bti d'quipements audio-visuels.
Safe Title Area : Standard d'ajustement des titres et gnriques pour un moniteur.
Correspond environ 80% de l'image totale. Les titres et le texte sont gnralement
gards l'intrieur de cette rgion pour s'assurer qu'ils puissent tre vu en entier.
SAP (Secondary Audio Programming) : Signal audio secondaire qui est transmit
en mme temps que le signal primaire. Activ mme le tlviseur, il permet
notamment de transmettre la portion audio d'une mission dans un autre langage, ou
d'inclure une piste descriptive.
Scalability (Adaptabilit) : Caractristique du MPEG-2 proposant diffrents niveaux
de qualit par la rpartition en plusieurs niveaux des donnes vido. Un dcodeur
complexe pourra alors produire une image de qualit partir de tous les niveaux de
donnes tandis qu'un dcodeur plus simple produira quand mme une image en
utilisant seulement le premier niveau de donnes.
Scanner : Appareil permettant de numriser/digitaliser des images ou des textes
crits.
SCPC (Simple Channel Per Carrier) : Un seul programme par porteuse. Se dit
lorsqu'un transpondeur contient un ensemble de programmes transports chacun sur
une frquence diffrente.
Scrambling : Opration consistant brouiller les caractristiques d'un flux vido,
audio ou d'information, de faon prvenir la rception non autorise de
l'information en clair. La gestion du procd est effectue sous le contrle du systme
d'accs conditionnel (conditional access system).
SCSI (Small Computer System Interface) : Technologie d'interface pour la

transmission de donnes informatiques haut dbit. Se prononce galement
"Skozy". Le haut de gamme, l'ultra 160 SCSI, garantit un taux de transfert de 160
Mo/seconde et permet de connecter de 7 15 priphriques. Un port SCSI se
reconnat son connecteur 50 broches (un port IDE est dot d'un connecteur 40
broches).
SDI (Serial Digital Interface) : Norme d'interface pour la transmission srie par
cble coaxial pour les signaux vido numriques en production, base sur un taux de
transfert de 270 Mbps.
SDT (Service Description Table) : Table dcrivant chaque service dans un flux de
transport.
SECAM (Systme lectronique pour Couleur Avec Mmoire): Standard
Europen qui a la mme composition que PAL, mais dont la couleur (Chrominance)
est module en FM.
Serial Interface (Interface srie): Interface de communication numrique dans
laquelle l'information est transmise et reue squentiellement l'intrieur d'un seul
cble, ou une paire de cbles. Les standards serial interface" les plus communs
sont RS-422 et RS-232.
Server (vido) : Ordinateur ayant une grande capacit de mmoire et de
traitement, qui est destin distribuer de la vido la demande sur un rseau un
moment spcifi par l'usager.
Set-Top-Box : Voir Convertisseur.
Shuttle : Fonction de montage vido gnralement implante sur une molette en
face avant de magntoscope et permettant de se positionner trs rapidement et
prcisment sur une bande que ce soit vers l'avant ou vers l'arrire.
SI (Service Information) : Information de Service. Informations incluses dans un
multiplex et dcrivant les contenus des diffrents services.
SIF (Source Input Format) : Format d'entre de source. Signal d'entre demirsolution utilis en MPEG-1.
Simulcast : Diffusion simultane en analogique et numrique d'un mme
programme, sur les mmes zones de couverture et sur deux frquences distinctes,
afin d'assurer une continuit de service en cas de remplacement par le tlspectateur
du rcepteur analogique par un rcepteur numrique. Les rglements de la CRTC
exigent que les diffuseurs transmettent la plupart de leurs programmes en simultcast
au fur et mesure qu'ils lancent les services TVHD.
Site point haut : Site de diffusion implant sur un point gographique lev par
rapport l'ensemble des points dans une rgion donne ou disposant d'un pylne de
grande hauteur, et utilis pour diffuser un signal sur une zone tendue.
Slot (Encoche) : Entaille pratique dans une carte de circuit imprim.
SMPTE : Society of Motion Picture and Television Engineers.
SNMP (Simple Network Management Protocol) : Protocole d'administration de
rseau dfinissant les interactions entre le gestionnaire et les agents.
SNR (Signal-To-Noise Ratio, Rapport signal/bruit) : Rapport tabli entre la
puissance du signal d'origine et la puissance du bruit, un point donn du systme.
SONET (Synchronous Optical NETwork, Rseau Optique Synchrone) : Mode de
transmission de donnes sur fibre optique, normalis aux tats-Unis, dans lequel des
canaux de transmission sont intgrs progressivement, par multiplexage temporel,
des canaux plus grands, au sein d'une hirarchie de niveaux base sur un codage
51,84 Mbit/s, dont tous les lments sont parfaitement synchroniss. Le rseau
optique synchrone, qui est d'origine amricaine, a t adapt pour l'Europe et a pris,
sur ce continent, le nom de hirarchie numrique synchrone. Le sigle anglais SDH,
mis pour synchronous digital hierarchy, est souvent employ. Dans le rseau optique
synchrone, le dbit de base, utilis pour dterminer les niveaux, est de 51,84 Mbit/s.
La hirarchie des principaux dbits est la suivante: 155,52 Mbit/s, 622,08 Mbit/s,
2,488 Gbit/s, 9,953 Gbit/s et 13,271 Gbit/s. Ces dbits correspondent
respectivement aux niveaux OC-3, OC-12, OC-48, OC-192 et OC-256. Dans ce mode
de transmission synchronise, il est possible d'extraire une seule unit de l'ensemble

des flux de donnes multiplexs, sans qu'il soit ncessaire de les sparer.
Source stream : Flux unique, non-multiplex, d'informations avant compression.
Sous-titrage cod : Flux des donnes compris dans le signal de diffusion qui
procure une description narrative textuelle du dialogue, des sons et des autres
lments de l'image dans le but d'aider les tlspectateurs avec des problmes
auditifs. Peut aussi servir dans d'autres applications audio secondaires.
Spectre de frquences : Le spectre de frquences est dfini par l'ensemble des
frquences utilises ou utilisables par les ondes radiolectriques. Suivant leur
frquence, les ondes radiolectriques prsentent des proprits particulires. C'est
pourquoi le spectre de frquences a t dcoup en bandes dans lesquelles on peut
considrer que les proprits restent relativement homognes. Les frquences
utilises pour la diffusion TV sont situes dans les bandes mtriques (VHF, longueur
d'onde de 10 m 1 m, frquences de 30 Mhz 300 MHz) et surtout dcimtriques
(UHF, longueur d'onde de 1 m 10 cm, frquences de 300 MHz 3 000 MHz).
Splicing : L'enchanement effectu au niveau du systme de deux diffrents flux
lmentaires. Le flux rsultant devra tre conforme aux standards de tlvision
numrique.
ST (Stuffing Table) : Table de bourrage. Remplissage des espaces libres, dans un
flux de donnes, avec de l'information autre (ex: rseau Internet ou donnes sans
signification).
Standard definition television (SDTV) : Terme utilis pour designer un systme
de tlvision dont la qualit est quivalente au NTSC. Aussi appel Standard Digital
Television, ou galement Conventional definition television.
Start codes : Codes de 32 bits insrs l'intrieur d'un flux encod qui sont uniques
ce flux. Ils sont utiliss pour diffrents usages, notamment pour identifier les
couches dans la syntaxe du codage. Ils consistent en un prfixe de 24 bits
(0x000001) et un identificateur de flux (stream ID) de 8 bits.
STC (System Time Clock) : Horloge commune utilise pour coder la vido et l'audio
dans un mme programme.
STD input buffer : Mmoire tampon, l'entre d'un dcodeur cible, utilis pour
stocker l'information compresse avant le dcodage.
Streaming (lecture en transit) : Technique de lecture de fichier multimdia
permettant un internaute de lire le fichier en temps rel, sans avoir attendre son
tlchargement complet. Lors de la lecture en transit, une mmoire tampon
emmagasine suffisamment de paquets de donnes pour permettre leur lecture en
continu au moyen d'un plugiciel (plug-in) de dcompression (le lecteur de contenu
multimdia) situ sur le poste client. RealAudio de Real Networks, Vivo Software,
NetShow de Microsoft et VDONet sont des appellations commerciales associes la
lecture en transit. Imagine au dpart par Netscape pour afficher le texte d'une page
Web sans que l'internaute ait attendre la fin de l'affichage des images, l'ide du
streaming a ensuite t reprise et popularise par Real Networks pour la transmission
et la lecture de fichiers en transit. Aujourd'hui, cependant, la notion de "streaming"
en anglais a volu vers le concept de "streaming media" et ne dsigne plus
seulement la lecture de fichiers lors de leur tlchargement, mais la diffusion sans
tlchargement de contenus multimdias compresss et leur lecture en temps rel,
ce qui restreint l'utilisation du terme franais lecture en transit aux seuls fichiers
tlchargs.
Stuffing (Bourrage) : Addition de donnes sans signification pour maintenir un
dbit constant.
Still picture : Une image fixe code consiste en une squence vido contenant une
seule image intra code.
Surround Sound : Implique normalement un systme audio comprenant plus de
deux canaux d'information. Les canaux additionnels fournissent l'ambiance, ou
l'information sonore ayant lieu ailleurs que dans les canaux droit et gauche.
S-Video : Type de signal qui transmet la luminance (Y) et la chrominance (C) par
des fils spars vitant par l le codage NTSC, PAL ou SECAM et l'invitable perte de
qualit en rsultant.
Symbol Rate (Dbit Symbole) : Dbit du signal en sortie de modulateur.
Sync (Synchronization Signals) : Le taux a lequel l'image est trace sur le
moniteur doit tre synchronise avec la source vido. Il y a 3 types de signal de
synchronisation en vido composite; salve de couleur (color burst), synchronisation
horizontale et verticale.
Synchronous (Synchrone) : Procd de transmission selon lequel les bits et le flux
de caractres sont rgls sur des horloges parfaitement synchronises, tant au point
de dpart qu' l'arrive.
System clock reference (SCR) : Code temporel l'intrieur du flux de donnes

permettant aux dcodeurs de se synchroniser.
System header : "L'en-tte systme" est une structure de donnes contenant
l'information qui rsume les caractristiques du flux DTS multiplex.
System target decoder (STD) : Un modle de rfrence hypothtique d'un procd
de dcodage utilis pour dcrire la smantique d'un flux DTS multiplex.
TCP/IP (Transmission Control Protocol/Internet Protocol) : Un ensemble de
protocoles qui assurent les transferts de donnes entre deux ordinateurs dvelopp
par le dpartement de la dfense US dans les annes 1970. TCP gouverne l'change
d'information squentielle, alors que IP dirige les messages sortant et reconnat les
messages entrants.
TDAC (Time Domain Aliasing Cancellation) : Technique de codage utilis dans le
systme de compression AC-3.
TDT (Time and Date Table) : Information temporelle utilise en DVB-SI.
Tlvision la carte : Lorsque des missions peuvent tre commandes en tout
temps la seule discrtion du tlspectateur.
Tlvision interactive : Programmation tlvise au contenu interactif qui ajoute
la tlvision traditionnelle l'interactivit qu'offre l'ordinateur.
TIFF (Tagged Image File Format) : Un format graphique largement utilis. Il
permet en effet un change facile des images entre diffrentes plates-formes (Mac,
PC, Unix). Les fichiers, relativement volumineux, peuvent toutefois tre compresss
sans aucune perte d'informations (compression LZW).
Time-stamp : Terme qui indique le temps d'une action spcifique telle l'arrive d'un
byte ou la prsentation d'une image de rfrence.
Throughput : Mesure indiquant quel flux de mdia peut tre transmit par un serveur
donn.
Time Base Corrector (TBC/Correcteur de Base de temps) : De lui-mme, un
magntoscope est incapable de jouer un signal assez stable pour tre transmis
correctement ou mme coup un autre signal (ex: en montage), sans "dbarrer".
Un TBC est donc utilis pour synchroniser le magntoscope avec les autres signaux
l'intrieur du systme. Ils sont galement utiliss pour ajuster les niveaux vido et
de couleurs sur les magntoscopes.
Time Code : voir Code temporel.

TOV (Threshold of visibility) : Point limite de ce qui est visible.
Traitement cinma progressif (Inversion 3:2) : Technique utilise afin
d'amliorer la qualit de l'image affiche lorsqu'il s'agit d'un film l'origine.
Transnitage : Opration qui consiste remplacer la NIT d'un flux DVB par une autre
pour changer le rseau d'appartenance du flux.
Transport stream (TS) : Signal multiplex compos de plusieurs programmes
vhiculs par paquets. Le d-multiplexage est effectu par l'identification des paquets
(PIDs).
Transport Stream packet header : Le premier champ d'un flux de transport.
Tri-level Sync : Signal de synchronisation utilis en HDTV.
Truncation (Troncature) : Raccourcissement de la longueur des mots par
suppression des bits les moins significatifs.
TSTD (Transport Stream Target Decoder) : Modle thorique de dcodeur de flux
de transport. Dcodeur cens avoir suffisamment de mmoire tampon de faon tre
compatible avec tous les codeurs.
TVED: Tlvision dfinition leve ou rehausse par rapport la tlvision
numrique de dfinition standard. Ne s'applique que lorsque l'on parle d'affichage de
formats dfinition standard suivant la norme ATSC. Offre une image de 480 lignes
en balayage progressif ou plus, au format 4:3 ou 16:9 et un son Dolby Digital.
TVHD (Tlvision Haute Dfinition/High Definition Television) : Le signal de
tlvision numrique qui utilise 720 lignes en balayage progressif ou 1,080 en
balayage entrelac pour l'affichage de l'image. L'image doit tre au format 16:9 et
possder une rsolution minimale d'environ 1 million de pixels. Doit pouvoir recevoir,
reproduire et/ou offrir le format audio numrique Dolby Digital 5+1. Le syntoniseur
est en mesure de recevoir tous les formats ATSC 3 et de les afficher dans leur format
d'origine.
TVN (Tlvision Numrique) : Englobe toutes les composantes de la tlvision
numrique dont TVHD, TVSD, diffusion parallle de donnes et multidiffusion
rpondant aux normes tablies par l'ATSC.
TVNC (Tlvision Numrique Canadienne) : Socit but non-lucratif reconnue
par le gouvernement et compose de membres des diffrents secteurs de l'industrie
ayant pour mandat de conseiller Industrie Canada sur le dploiement de la tlvision
numrique au Canada.
TVSD (Standard Definition Television/Tlvision dfinition standard): Se
caractrise par une image de format 4:3 ou 16:9 et un son ambiophonique. Des
variations dans le nombre de cadres/s, les lignes de rsolution et le type de balayage
(progressif ou entrelac) distinguent les 12 formats TVSD dans la norme ATSC.
UBR (Unspecified Bit rate, Dbit binaire non spcifi) : Dans un rseau ATM,
classe de service rserve aux communications non stratgiques, dans laquelle la
quantit de donnes pouvant tre transmises par unit de temps ne peut tre
dtermine l'avance et varie en fonction des possibilits du rseau.
UHF (Ultra High Frequency, Ultra haute frquence) : Bande d'ondes
dcimtriques dont la longueur d'ondes varie de 1 m 10 cm et la frquence de 300
Mhz 3000 Mhz. Cette bande comprend les bandes IV et V (470 Mhz - 830 Mhz :
canaux 21 65) utilises pour la tlvision.
UMTS (Universal Mobile Telecommunications System) : Terme dsignant la
troisime gnration de systmes de radiocommunications mobiles (la deuxime
comportait les systmes numriques comme le GSM, et la premire les anciens
systmes analogiques). L'UMTS est spcifi de manire offrir des services de
communication bidirectionnelle tendus allant des messages courts jusqu'aux images
mobiles en passant par la voix.
Unbalanced Audio (audio non balanc) : Mthode de transmission d'un signal
audio en utilisant un cble coaxial normal de 75Ohms d'impdance.
Unidirectionnel : Pour un micro; ne capte que le son ne venant que d'une seule
direction.
Upconverter : Convertisseur qui prends un signal vido numrique standard (SDTV)

et le converti en signal vido Haute dfinition (HDTV). (voir: Conversion vers le
haut).
Upconversion (Conversion vers le haut) : Procd qui accrot le nombre de pixels
ou le dbit d'images ou le format de balayage pour afficher une image. (Voir
conversion vers le haut).
URL (Uniformed Resource Locator) : Manire standard de donner l'adresse de
n'importe quelle ressource qui est sur Internet et fait partie du World Wide Web.
User Name : Un nom court et unique servant vous identifier chez votre
distributeur de services Internet ou tout autre rseau protg.
Variable bit rate (VBR) : Opration par laquelle le flux de bits varie en temps
durant le dcodage d'un flux compress.
VAU (Video Access Unit) : Unit d'accs vido. Une image compresse dans un
flux de programme.
VBI (Vertical Blanking Interval) : Priode de temps entre les images tlvises,
que l'on peut voir comme une ligne noire lorsque l'image roule. Le VBI contient les
signaux qui permettent aux syntonisateurs de conserver la stabilit de l'image
(synchro). Ils sont galement utiliss pour transporter d'autres informations tel que
le sous-titrage, v-chip, signaux de tests ou de contrle, etc...
V-Chip : Information sur le classement du programme encod l'intrieur d'un
signal vido diffus(ligne 21, champs 2) sous la forme d'un paquet XDS. Grce un
dcodeur (Set-top-box ou intgr), le tlviseur pourra empcher certaines missions
d'tre vue en empchant certain classements.
Vector (Vecteur) : paramtre de compensation de mouvement qui indique au
dcodeur le sens et l'amplitude du dplacement d'une partie de l'image prcdente
(macrobloc) pour prdire au mieux l'image courante.
VGA (Video Graphics Array) : Mode d'affichage graphique des moniteurs
d'ordinateurs avec une rsolution d'au moins 640 X 480 pixels.
VHF (Very High Frequency, Trs haute frquence) : Bande d'ondes mtriques
dont la longueur d'ondes varie de 10 m 1 m et la frquence de 30 Mhz 300 Mhz.
Cette bande comprend la bande III (174Mhz - 223Mhz: canaux 5 10) utilise pour
la tlvision.
VITC (Vertical Interval Time Code) : Manire de coder le time code
(enregistrement en vertical sur la bande, entre deux images).
VLC (Variable Length Coding) : Codage longueur variable. Technique de
compression affectant un code court aux valeurs les plus frquentes et un code long
aux valeurs les plus rares.
VOD (Video On Demand) : Tlvision la carte. Mode de diffusion de programmes
vido o chaque tlspectateur peut recevoir le programme qu'il souhaite au moment
o il le souhaite.
VRML (Virtual reality modeling language) : Standard ISO pour le Multimdia 3D
et les mondes virtuels sur Internet.
VSB (vestigial side-band, Bande latrale rsiduelle) : Technique de modulation
analogique visant rduire la largeur de bande du spectre requise pour la
transmission d'informations par cblodistribution ou par voie terrestre.
WAV (se prononce wave) : Format de fichiers audio compatible avec Windows. Un
fichier WAV peut tre enregistr 11KHz, 22 kHz, et 44 kHz, et en 8-bit ou 16-bit
mono et stro.
Wavelet (Vaguelette) : Type de transforme o la longueur de la fonction base
n'est pas fixe mais augmente quand la frquence dcrot.
Weighting (Pondration) : Mthode consistant changer la distribution du bruit
par la troncature amene par la multiplication de valeurs.
WYSIWYG (What you see is what you get) : Abrviation, "ce que vous voyez est
ce que vous avez".
X-Band : Frquences comprises entre 8.0 et 8.4 GHz.
XDS (Extended Data Service) : Utilise un systme de paquets d'information

incluent dans le signal vido diffus et pouvant comprendre l'heure, l'information de
classement de l'mission, un rapport mto, un site web, etc...
XLR : Format de connecteur audio 3 broches.
Y : Abrviation pour luminance.
Y/C-Video : alias S-Video.
YUV : Modle de couleurs utiliss principalement en vido dans lequel les couleurs
sont spcifis en fonction de leur luminance(Y) et leur degr de saturation des teintes
(composantes U et V).
Jean DANIEL http://pages.videotron.com/danjean/

Le Signal Video Numerique PDF

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Le Signal Video Numerique PDF

Transféré par

Droits d'auteur :

Formats disponibles

Par : Jean DANIEL (Canada) http://pages.videotron.

Guide Simplifi du signal vido Analogique NTSC

Le Correcteur de base de temps("Time Base Corrector ou TBC"):

Le Signal Vido Numrique

La vido numrique utilise galement au maximum les particularits de l'oeil humain

d'afficher des images (fixes) de haute qualit, et de crer des animations

Le codage Audio Numrique

La sortie du groupe de filtres est galement analyse afin de dterminer le spectre du

Aprs le mot de synchronisation et l'en-tte, il y a 32 codes d'affectation de bits de 4

Alors que celui-ci dmontre le fonctionnement du Dcodeur AC-3:

La Compression Vido MPEG-2

(Codage gnrique de films, vido et informations audio associes):

Principes de rduction du "bit rate":

La transforme de Fourrier prsente linconvnient de ncessiter des coefficients pour

Le signal dentre est suppos tre la norme 4:2:2 srie en 8 ou 10 bits(SDI). Le

Dans un systme 4:2:0, les chantillons de chrominance sont intercals

partir de ces frames a t introduit le concept de Groupe dImages(GOP, Group Of

Pour une qualit donne, lmission dimages I uniquement double pratiquement le

La Compression Vido MPEG-4

(Codage dobjets audio-visuels)

Description dune scne:

Interaction avec les objets "mdia" dans une scne MPEG-4:

Le codage des textures suivant les vues.

chelonnage en fonction des vues:

Rduction de la complexit du dcodeur, et donc rduction de la qualit pour

Le profil visuel simple adaptable ajoute au prcdent un support pour coder

La Compression Vido MPEG-7

De plus en plus d'informations audiovisuelles sont accessibles sous forme numrique,

Des mta-informations qui dcrivent la cration et la production du

Des mta-informations relies l'utilisation du contenu: Elles

Ces informations dcrivent les caractristiques de stockage: Format,

Des descriptions d'un point de vue contenu: Ces informations

Des descriptions du contenu audio-visuel d'un point de vue

Principe de description MPEG-7

MPEG-1 et MPEG-2 proposent des manires inter-oprables de reprsenter un

"parties" du standard MPEG-21. En contant le rapport technique comme la partie #1,

Le Flux Elmentaire (Elementary Stream):

dcodeur prsentent des degrs de complexit diffrents, le systme est dit

L'entte de l'image prcise si le codage de l'image est de type I, P ou B et comporte

centaines de kilo-octets et varie en fonction de l'application. Chaque paquet est

Les modulations employes seront donc choisies de manire trs attentive en

A gauche l'entrelaceur et droite le desentrelaceur. Ce qui d'un point de vue paquet

des liaisons satellites ou terrestres, il convient de renforcer encore les mesures de

x valant +X pour un bit 0 et -X pour un bit 1 et y valant +Y pour un bit 0 et -Y

Le FEC sera choisi par l'oprateur, en fonction de critre technique et conomique.

Si on veut 5 bits par symbole, on obtient une QAM 32:

Et si l'on code 6 bits par symbole, une QAM 64:

Synoptique d'un modulateur DVBT:

La frquence de chaque sous porteuse du canal sera troitement contrle et

Les Tables PSI

PAT(Programme Association Table):

CAT (Control Access Table):

SDT (Service Description Table):

EIT present/following (Event Information table):

TDT (Time and Date Table):

EIT schedule (Event Information table) :

TOT (Time Offset Table):

Les tables prives

Introduction la tlvision haute dfinition(HDTV)

Lorsqu'on entend parler de tlvision numrique (DTV, Digital Television), on parle

SDTV (Standard Digital Television) consiste en un format digital standard de

Une mission de tlvision typique est enregistr directement en vido NTSC, ou

en liminant une partie de l'image), ou "letterbox" (prsenter l'image complte