Vous êtes sur la page 1sur 26

Guide de la haute dfinition

Part One
Your vision. AVID REALITY.

Understanding HD with Avid

1
Chapter 1

Formats vido et chantillonnage

Formats vido et chantillonnage


Lorsquil sagit de HD et de SD, lun des aspects le plus dconcertant est sans doute le jargon abrg utilis pour dfinir lchantillonnage et les espaces colorimtriques, tels que RVB 4:4:4 et Y,Cr,Cb 4:2:2. Les noms de formats vido (par exemple, 1 080/24P), peuvent galement vous sembler quelque peu barbares si vous ntes pas familiaris avec cette terminologie. Consultez la section suivante pour une prsentation rapide des rapports dchantillonnage ou simplement comme aide-mmoire de rfrence.

Understanding HD with Avid


Les deux chiffres suivants correspondent aux frquences dchantillonnage des composantes de couleur pure numrise de Rouge-Y et Bleu-Y, intitules Cr et Cb. Selon le principe tlvisuel exploitant les limites de perception de lil humain dans le domaine de la couleur pure, les coupes permettant de rduire la quantit de donnes sont gnralement effectues au niveau de la chrominance plutt quau niveau de la luminance. Le format dchantillonnage le plus couramment utilis en studio est le 4:2:2 : sur chaque ligne, la frquence d'chantillonnage des deux composantes de couleur est deux fois moins leve que la frquence d'chantillonnage de luminance.

4:2:2 etc. (sous-chantillonnage de la chrominance)


En matire de tlvision numrique, les frquences dchantillonnage sont dfinies par des formules abrges, qui ont, plusieurs gards, un rapport assez loign avec le concept quelles dcrivent. Ces formules numriques ne sont pas des nombres absolus, mais expriment des rapports de frquences dchantillonnage ; un certain effort dinterprtation est donc ncessaire pour comprendre leur signification prcise. Le terme sous-chantillonnage de la chrominance fait rfrence ces rapports de frquence dchantillonnage. La plupart du temps, les premiers chiffres expriment la luminance (Y) et les deux derniers la chrominance ( lexception de 4:4:4 ou 4:4:4:4 abords plus en dtail ciaprs). Le premier chiffre est quasi systmatiquement un 4, signifiant que la luminance est chantillonne une fois par pixel produit dans limage. Dans quelques rares cas, une frquence dchantillonnage plus faible pourra tre utilise pour la luminance. Cest le cas par exemple du HDCAM, qui a gnralement recours au format 3:1:1. Le terme souschantillonnage dsigne l'utilisation d'une frquence dchantillonnage infrieure au nombre de pixels final.

Ligne 1

Y
CrCb

Y Y

Y
CrCb

Y Y

Y
CrCb

Y Y

Y
CrCb

Y Y

Ligne 2

Y
CrCb

Y
CrCb

Y
CrCb

Y
CrCb

Echantillonnage 4:2:2 des signaux de luminance et de diffrence des couleurs

Le format 4:1:1, utilis par certains formats DV et par le DVCAM, effectue, sur chaque ligne, un chantillonnage de Cr et Cb tous les 4 points dchantillonnage de Y. Il permet nanmoins datteindre un niveau de dtail de chrominance suprieur au PAL ou au NTSC.

Ligne 1 Ligne 2

Y
CrCb

Y
CrCb

Y
CrCb

Y
CrCb

Echantillonnage 4:1:1

Formats vido et chantillonnage


On peut galement raisonner de la faon suivante : si on effectue un sous-chantillonnage horizontal de la chrominance, comme cest le cas en 4:1:1, la mme opration ralise dans le sens vertical devrait, en toute logique, permettre une rpartition plus uniforme des informations de couleur. Ainsi, au lieu dchantillonner Cr et Cb sur la mme ligne, lchantillonnage de Cr s'effectue sur la premire ligne et celui de Cb sur la deuxime. La frquence dchantillonnage augmente alors sur chaque ligne pour passer une valeur Y sur deux. Ce type de procd est appel chantillonnage 4:2:0 (soit 4:2:0 sur une ligne et 4:0:2 sur la suivante) utilis en MPEG-2 et dans la plupart des processus de compression JPEG.

Understanding HD with Avid


Ce rapport dchantillonnage est utilis aussi bien en SD que pour la vido haute dfinition. Mme si la taille dchantillonnage est gnralement 5,5 fois suprieure, le format 4:2:2 reste le plus largement rpandu en studio HD. Pourquoi le chiffre 4 ? En toute logique, le premier chiffre devrait tre un 1, qui reprsenterait une relation dquivalence avec les pixels de 1:1, mais les normes tlvisuelles restent largement tributaires des formats existants. En effet, au dbut des annes soixantedix, les premires tentatives de numrisation de signaux de tlvision portaient sur des formats PAL et NTSC cods. Dans un cas comme dans lautre, la frquence dchantillonnage devait ncessairement tre calque sur celle de londe sousporteuse couleur, elle-mme rgie par un rapport fixe du nombre de lignes/frquences d'images. En NTSC, la frquence du signal de sous-porteuse quivaut 3,579545 MHz et celle du standard PAL-I 4,43361875 MHz. En comparaison, lchantillonnage des systmes numriques quivaut gnralement 4 fois le signal de sous-porteuse NTSC ou 3 fois le signal pour le PAL, soit respectivement 14,3 et 13,3 MHz. Une nouvelle tape dterminante a ensuite t franchie avec lapparition de la vido composantes Y, B-Y et R-Y (valeur de luminance plus deux composantes de couleur pure, appele galement signal de diffrence de couleurs), simplifiant considrablement le traitement de toutes les oprations courantes effectues sur les images (redimensionnement, lissage, conversions diverses normes ou compression, entre autres). La mme logique a t conserve dans le cadre du dveloppement de la norme dchantillonnage pour ce type de vido. Une certaine harmonisation entre les deux systmes de balayage 525/60I et 625/50I utiliss dans les diffrents pays a galement t introduite. Cette norme est connue sous le nom de norme UIT-R BT.601 pour lchantillonnage SD. 601 dfinit la frquence dchantillonnage de la luminance 13,5 MHz (produisant 720 pixels par ligne active) et chaque signal de diffrence de couleurs la moiti de cette frquence, soit 6,75 MHz.

Ligne 1 Ligne 2

Y
Cr

Y
Cr

Y
Cr

Y
Cr

Y
Cr

Y
Cb

Y
Cb

Y
Cb

Y
Cb

Y
Cb

Le 4:2:0 uniformise la rsolution verticale et horizontale des couleurs lors de lutilisation de pixels carrs.

En rgle gnrale, il est conseill dassocier aux images un signal cl (signal alpha). Pour synthtiser, une image cl est une image complte dont on na gard que les valeurs de luminance. Il est donc logique dajouter le chiffre 4 la formule ; on parle alors de format 4:2:2:4. Techniquement parlant, le 4:4:4 peut correspondre un chantillonnage complet du RVB ou, beaucoup plus rarement, des signaux des composantes Y, Cr et Cb. Si un canal cl est associ au RVB, on parle alors de codage en 4:4:4:4. Dans certaines situations, des techniques non standard seront plus indiques, telles que le sur-chantillonnage, qui permet une amlioration de la qualit dimage, condition dtre trait correctement. Vous pourrez voir dans ce cas des formats de codage du type 8:8:8, correspondant deux chantillonnages par pixel dans le cas du RVB.

Formats vido et chantillonnage


Et pour la petite histoire, on saperut un beau jour que cette valeur de 13,5 MHz tait quasiment identique aux 14,3 MHz quivalent 4 fois le signal de sous-porteuse du NTSC. En poussant un peu plus loin le raisonnement, il aurait t facile dtablir une correspondance encore plus proche entre cette frquence de 13,5 MHz et la multiplication par 3 du signal de sous-porteuse du standard PAL, ce qui aurait permis de simplifier largement le jargon pour le moins complexe utilis actuellement. Voil pourquoi ce nombre qui aurait pu tre un 3 et aurait d tre un 1 est devenu par convention un 4. En haute dfinition, les frquences dchantillonnage tant 5,5 fois plus rapides que pour la SD, lchantillonnage 4:2:2 largement rpandu en studio quivaut en ralit 74,25 MHz pour les valeurs Y et 37,125 MHz pour Cr et Cb.

Understanding HD with Avid


est telle que les informations de luminance les plus dtailles prsentes dans les images en SD sont fidlement reproduites, mme la frquence la plus leve (5,5 MHz). Pour la plupart des normes HD, lchantillonnage numrique de la luminance seffectue 74,25 MHz, soit 13,5 MHz multiplis par 5,5.
Voir aussi : 2,25 MHz, UIT-R BT.601

2,25MHz
Il sagit du plus petit multiple commun aux frquences de lignes TV 525/59,94 et 625/50, soit respectivement 15,734265 kHz et 15,625 kHz. Bien que rarement voqu, ce format a son importance puisquil constitue la base de toutes les frquences dchantillonnage de composantes numriques, pour la dfinition standard comme pour la haute dfinition.
Voir aussi : 13,5 MHz

1080I
Abrviation de rsolution 1 080 lignes, balayage entrelac. Il sagit du format le plus couramment utilis en haute dfinition. Il correspond 1 080 lignes et 1 920 pixels par ligne, avec balayage entrelac. Mais la mention 1080I elle seule ne permet pas de spcifier la frquence dimages, pouvant tre 25 ou 30 Hz, selon les normes SMPTE ou UIT.
Voir aussi : Format dimage CIF, Entrelac, UIT-R.BT 709, Tableau 3

24P
Abrviation du format 24 images, balayage progressif. La plupart du temps, ce format fait rfrence au format dimage HD 1 080 lignes et 1 920 pixels par ligne (1 080 x 1 920/24P). Cette frquence dimages est galement utilise en dfinition standard 480 et 576 lignes, avec 720 pixels par ligne. Cest souvent le cas dans le cadre dun montage hors ligne en 24P haute dfinition ou pour la cration de versions Pan and Scan recadres aprs conversion en HD. A linstar des projecteurs cinmatographiques, les crans 24P ont gnralement recours la technique de double obturation ; chaque image est affiche deux fois ce qui permet de rduire le scintillement susceptible de se produire cette faible frquence dimages.

1080P
Format dimage TV de 1 080 par 1 920 lignes, avec balayage progressif. La frquence dimages peut tre 25 et 30 Hz, comme pour le 1080I, mais galement 24, 50 ou 60 Hz.
Voir aussi : Format dimage CIF, Progressif, UIT-R.BT 709, Tableau 3

13,5MHz
Frquence dchantillonnage utilise pour le codage numrique 601 de la vido SD. Cette valeur tant un multiple des frquences des systmes de tlvision 525 et 625 lignes, elle permet un certain niveau de compatibilit entre les systmes numriques. La vitesse dchantillonnage

24PsF
Abrviation de 24P Segmented Frame. Ce standard attnue les diffrences qui existent entre cinma et vido, puisque la capture vido seffectue de faon identique celle dun film. Le format de la vido permet son enregistrement

Formats vido et chantillonnage


immdiat en numrique et garantit sa compatibilit avec les infrastructures vido haute dfinition existantes. Comme cest le cas pour un film, chaque image est donc capture instantanment dans son intgralit et non selon un balayage TV ligne par ligne du haut vers le bas o la capture du bas de limage est effectue 1/24me de seconde aprs la capture du haut de limage. Les images sont ensuite enregistres sur bande sous forme de deux trames (segments), lune comprenant les lignes impaires et lautre les lignes paires concordantes dans le temps, et sont alors parfaitement adaptes aux enregistreurs TV. Dun point de vue lectronique, ces images sont strictement identiques celles dun film ou dune transmission tl cinmatographique, la seule diffrence que la vitesse de lenregistreur est de 24 images/s. Cela confre au mtrage obtenu un aspect plus cinmatographique . Toutefois, en raison d'une frquence d'image plus rduite, le rendu des mouvements peut comporter certains dfauts. La norme UIT-R BT. 709-4 inclut galement le 25 PsF et le 30PsF.
Voir aussi : UIT-R BT. 709

Understanding HD with Avid


format 720P offre l'avantage de rafrachir l'image une frquence suffisamment leve afin de reproduire les mouvements en toute fidlit. Il est donc recommand pour la diffusion de comptitions sportives, les ralentis sur des actions, etc.

74,25MHz
Frquence d'chantillonnage couramment utilise pour la luminance (Y) ou pour les valeurs RVB de la vido HD. Equivalant 33 x 2,25 MHz, cette frquence fait partie de la structure hirarchique utilise pour le SD et le HD. Elle est dfinie par les normes SMPTE 274M et UIT-R BT.709.
Voir aussi : 2,25 MHz

Anamorphique
Ce terme qualifie une image dont les proportions d'origine ont t modifies. Le processus anamorphique, ou anamorphose, s'effectue grce une lentille auxiliaire qui compresse l'un des axes de l'image, gnralement l'axe horizontal, un taux donn. De cette manire un format d'affichage 1,85:1 ou 2,35:1 peut tre rduit horizontalement afin de produire une image au format cinmatographique 1,33:1 (4:3). Lors de sa projection, le film anamorphos passe par une autre lentille anamorphique qui tire l'image afin de lui rendre ses proportions d'origine. L'anamorphose est courante sur les crans larges SD. En effet, elle permet d'augmenter les dimensions de l'image de prs de 33 % en tirant simplement les 720 pixels qui la constituent. Ce procd s'applique galement aux lentilles de camra et permet de tourner en 16:9 avec une simple puce CCD de 4:3.
Voir aussi : Format d'affichage

601
Voir UIT-R BT. 601

709
Voir UIT-R BT. 709

720P
Abrviation du format 720 lignes, balayage progressif. Dfini par le standard SMPTE 296M et inclus aux normes de tlvision ATSC et DVB, ce format se caractrise par 1 280 pixels par ligne, 720 lignes et 60 images par seconde balayes progressivement. Il est majoritairement utilis par les professionnels de la diffusion devant transmettre dans une dfinition 720P. Grce son balayage progressif de 60i/s, le

Anticrnelage
Procd permettant de rduire le phnomne de crnelage. Grce ses filtres, l'anticrnelage spatial est particulirement utile pour attnuer les contours en dents de scie des lignes diagonales ou le scintillement des zones trs dtailles.

Formats vido et chantillonnage


Rien ne vaut cependant un meilleur chantillonnage et un traitement plus prcis pour viter le crnelage.
Voir aussi : Crnelage

Understanding HD with Avid


chaque composante et vite toute drive temporelle. L'chantillonnage de mmes coordonnes spatiales est le plus courant, mais il existe galement un chantillonnage interstitiel gnrant des chantillons de chrominance entre les chantillons de luminance.
Voir aussi : 4:2:2 etc.

CIF
Le format d'image CIF (Common Image Format), tel qu'il est dfini par l'UIT, est un format d'image commun actuellement trs utilis et destin simplifier les changes d'informations au format image au niveau national et international.
Voir HD-CIF

Espace colorimtrique
Espace couvert par un systme colorimtrique. Exemples : RVB, YCrCb, TSL (Teinte, Saturation et Luminance) pour la vido, CMJN pour l'impression et XYZ pour le cinma. Un nouvel espace colorimtrique peut s'avrer ncessaire lorsque vous changez de mdia, de plate-forme ou d'applications. Oprez avec prcaution, car tout changement suppose un traitement d'image complexe. Notez galement que des changements rpts risquent de provoquer une drive des couleurs. Par ailleurs, sachez qu'aprs avoir converti un espace YCrCb en RVB, ce dernier ncessitera davantage de bits pour maintenir le niveau de la plage dynamique. Par exemple, si l'affichage vido d'un espace colorimtrique YcrCb est de 8 bits par composante, celui de l'espace colorimtrique RVB aprs conversion devra tre de 10 bits.

Crnelage
Artefacts provoqus par un chantillonnage ou un traitement vido insuffisant. Consquence de la nature pixellise de l'image numrique, le crnelage spatial produit des contours en dents de scie sur les lignes courbes et diagonales de l'image, ainsi qu'un effet de scintillement sur les zones de dtails. Ce phnomne est d des frquences d'chantillonnage trop basses ou une prcision de traitement trop faible pour s'tendre aux dtails. Le crnelage dit temporel se produit lorsque la vitesse de l'action est suprieure la frquence d'images. Un exemple classique : les roues du train qui semblent tourner en sens inverse.
Voir aussi : Anticrnelage

Format d'affichage
Rapport largeur/hauteur d'une image. Les images HD utilisent un format d'affichage 16:9, galement exprim sous la forme 1,77:1, permettant d'augmenter d'un tiers le format tlvisuel 4:3 (1,33:1). Il est suppos produire des images plus spectaculaires, avec un champ visuel plus large qui permet d'attirer davantage l'attention du tlspectateur. Le format d'affichage d'une image exprim en pixels reprsente le rapport largeur/hauteur d'un pixel. Comme la plupart des applications informatiques, la haute dfinition utilise des pixels carrs, contrairement au SD. La diffusion en SD d'images au format 4:3 et 16:9 (crans larges) s'avre plus complexe, puisque le nombre de lignes et de pixels des

DTV
DTV (Digital Television), ou tlvision numrique, dsigne de faon gnrale les formats numriques SD et HD.

Echantillonnage de coordonnes spatiales identiques


Echantillonnage simultan des informations en luminance et en chrominance. Il assure la symtrie du temps relatif de

Formats vido et chantillonnage


crans SD reste le mme. Veillez donc ne pas altrer les formes de l'image en modifiant avec prudence le format d'affichage en pixels lors du passage d'un systme un autre. Les deux formats (4:3 et 16:9) tant utiliss pour l'image et pour l'affichage, faites preuve de discernement au moment d'associer l'image avec l'cran. Les images HD, et de plus en plus d'images SD, sont tournes en 16:9 alors que la plupart des crans SD possdent encore un format d'affichage 4:3. Ces crans tant encore trs rpandus, il est donc recommand d'afficher vos productions HD au format 4:3 letterbox, c'est--dire, de centrer l'image au format 4:3.
Voir aussi : ARC

Understanding HD with Avid


au niveau du systme colorimtrique. Fait assez rare pour tre signal, la norme tablie en la matire est accepte par l'ensemble des organismes au niveau international. Le format d'image 1 080 x 1 920 utilis en HD se rapproche de la rsolution 2K utilise pour l'laboration des films. On observe ds lors une rduction de la frontire entre tlvision et cinma. Cette frontire se rduit d'autant plus si l'on utilise une fentre 16:9 de la rsolution 2K : la diffrence de taille devient alors peine perceptible. De manire gnrale, tout format affichant au minimum une dfinition suprieure ou gale deux fois celle de la SD sur les axes H et V peut tre qualifi de haute dfinition. Suite au dbat sur les formats disponibles pour les futurs producteurs et stations de tlvision HD, la reconnaissance du format vido 1080-HD frquence d'images variable en tant que format vido standard par l'UIT a permis de clarifier la situation. Les stations de tlvision bnficient d'une certaine latitude quant au choix du format. Si ncessaire, la conversion du format vido standard doit nanmoins pouvoir s'effectuer de manire systmatique et produire un rsultat de haute qualit. `
2048

Format universel
Le format 1080/24P est parfois dsign sous l'appellation format universel pour la tlvision. En effet, il peut tre converti dans tous les autres formats et sa conversion produit des rsultats de haute qualit dans tous les cas.
Voir aussi : HD-CIF, Matre universel

HD
Tlvision haute dfinition. Selon la dfinition publie aux Etats-Unis par l'ATSC (Advanced Television Systems Committee) et d'autres organismes, l'appellation HD dsigne tout format tlvisuel possdant une rsolution horizontale et verticale environ deux fois suprieure celle de la tlvision classique (format NTSC analogique, 486 lignes visibles), un rapport hauteur/largeur 16:9 et une frquence d'images suprieure ou gale 24 images par seconde. Dans la pratique, cette dfinition s'avre moins stricte. En effet, l'appellation HD s'utilise galement pour dsigner le format 720 lignes x 1 280 pixels par ligne balayage progressif. La meilleure rsolution verticale obtenue avec le balayage progressif justifie en partie l'appellation HD de ce format. Outre les considrations lies au format, la distinction entre tlvision HD et SD se situe galement
1920

2K Film

1080-HD 1280 1080 720 720 576 & 480-SD 480 720-HD 1536 576

2K, HD and SD images sizes Voir aussi : Format dimage CIF, Facteur d'entrelacement

Video formats and sampling


Image active
Partie de l'image affiche par l'cran. Sur les systmes 525 et 625 lignes, par exemple, l'image active n'est respectivement constitue que de 487 et 575 lignes. De mme, la dure totale est de 63,5 s pour un systme 525 lignes et de 64 s pour un systme 625 lignes, mais seulement 52 53.3s contiennent rellement de l'information. Le signal continu utilise cet intervalle de temps supplmentaire pour revenir au dbut de la premire ligne du haut de l'image et redmarrer le balayage. Les formats SD chantillonns numriquement contiennent 576 lignes et 720 pixels par ligne (systme 625 lignes) ou 480 lignes et 720 pixels par ligne (systme 525 lignes) mais toute l'information ne tient que dans 702 pixels. 720 pixels quivalent 53,3 s. L'chantillonnage du signal s'effectue lors de l'effacement du signal analogique (blanking). Il dmarre juste avant l'extrmit gauche de l'image active et se termine aprs le retour au niveau de blanking du signal. Ainsi, les limites gauche et droite de l'image numrise sont incluses dans la ligne de balayage numrique. Ce mcanisme permet d'obtenir une continuit entre le signal invisible (blanking) et l'image active. Les systmes HD sont gnralement caractriss par leur nombre de lignes actives. Un systme 1 080 lignes, par exemple, possde 1 080 lignes de vido active, chacune compose de 1 920 chantillons. Pour adapter ce systme une connexion analogique, il suffit de l'associer une image plus grande, de type 1 125 lignes.

Understanding HD with Avid

Matre universel
Le format 1080/24P possde des proprits de conversion d'une dfinition et d'une efficacit optimales vers l'ensemble des principaux formats tlvisuels. Les rsultats obtenus aprs conversion sont toujours de haute qualit. Une bande matre monte dans ce format est parfois dsigne sous l'appellation matre universel .
Voir aussi : HD-CIF

Nomenclature systme
Terme utilis pour dcrire les normes tlvisuelles. Ces normes se prsentent sous une forme globalement explicite. Toutefois, les frquences de balayage vertical continuent de prter confusion. Par exemple, la norme 1080/60I implique une frquence de 60 trames entrelaces par seconde pour un total de 30 images. La norme 1080/30P correspond donc une frquence de 30 images par seconde soumises un balayage de type progressif. En principe, le dernier chiffre indique toujours le nombre de rafrachissements verticaux par seconde. Toutefois, le tableau 3 (ci-dessous) utilise une mthode diffrente. Il dfinit les frquences d'images (nombres d'images compltes), puis le type d'image (entrelace ou progressive). Dans ce tableau, le code de frquence d'images 5 quivaut 30 Hz, ce qui correspond 30 rafrachissements verticaux pour des images progressives et 60 rafrachissements verticaux pour des images entrelaces. Attention !
Voir aussi : Entrelac, Progressif

Image segmente
Voir : 24PsF

PAL et NTSC
Les normes PAL et NTSC n'existent pas en HD. Elles n'existent pas non plus dans la tlvision numrique SD nouvelle gnration (en dpit d'une conversion initiale dans les premiers formats d'enregistrement magntique numrique). La norme PAL signifie Phase Alternating Line

Formats vido et chantillonnage


(littralement ligne d'alternance de phase ) et constitue un systme analogique de codage colorimtrique extrmement rpandu. La norme NTSC (National Television Standards Committee) dsigne galement un systme analogique. L'utilisation des termes PAL et NTSC pour faire rfrence aux frquences d'images et aux formats vido plus ou moins lis la technologie analogique constitue une source de confusion mais reste toutefois d'actualit. Le terme 1080 PAL peut donc dsigner le format 1080/50I.

Understanding HD with Avid

Pixels carrs
Les pixels carrs dsignent un format d'affichage dans lequel les pixels dcrivent une zone carre de l'image affiche. Ce type de format caractrise notamment les normes de diffusion HD dans lesquelles les formats d'image dcrivent la longueur de ligne (nombre de pixels par ligne) et le nombre de lignes, pour un rapport exact de 16:9 (qui correspond galement aux proportions d'affichage des images). Certains types de pixels utiliss dans le cadre du format HD ne sont pas carrs. Le format HDCAM, trs rpandu l'heure actuelle, sous-chantillonne les lignes HD de 1 920 pixels et rduit ainsi la luminance 1 440 chantillons. Il s'agit l d'une fonction rserve au fonctionnement interne de l'enregistreur : les donnes entrantes et sortantes sont en effet constitues de pixels carrs. Sur le mme principe, le format 1080I HDV(2) se base galement sur une luminance 1 440 chantillons par ligne. Globalement, la pixellisation des images gnres par ordinateur repose sur le format carr, ce qui n'est pas le cas des images de tlvision HD numrique. Ce facteur est par consquent dterminant lors des transferts de donnes entre diffrentes applications ou du traitement de la proportion des images (prservation des formes circulaires).
Voir aussi : Anamorphique, Format d'affichage

Palette chromatique
Gamme de couleurs disponibles dans un systme d'imagerie. Les luminophores rouge, bleu et vert des crans de tlvision et les dispositifs de slection de couleur RVB couplage de charge ou les puces CMOS des camras dfinissent les limites d'affichage des couleurs. Ces limites sont dsignes par le terme palette chromatique . De nombreux procds interviennent entre la capture d'image sur camra et la visualisation sur cran. La plupart de ces procds se basent sur le format vido composante 4:2:2. Toutefois, certaines combinaisons de valeur de composantes ne correspondent aucune valeur RVB valide (par exemple, les combinaisons o Y est associ une valeur nulle). Les quipements gnrant des images directement dans l'espace colorimtrique composante (comme certains engins graphiques) peuvent produire des images dpassants les limites de l'espace colorimtrique RVB et les limites imposes par les normes PAL et NTSC. Ce type de situation peut entraner une surcharge des quipements, notamment des transmetteurs, parfois quips d'une fonction de dsactivation automatique visant prvenir tout risque d'endommagement. Certains quipements permettent de visualiser les zones de couleur dpassant les limites de palette chromatique de manire les retoucher avant l'apparition des problmes.

Quantification
La quantification se rapporte l'chantillonnage : il s'agit du nombre de bits utiliss pour raliser l'chantillonnage numrique d'un signal. En vido, la norme 8 bits est trs rpandue au niveau des produits grand public comme le DV. La vido HD utilise galement la norme 8 bits. Le format 8 bits peut dfinir 28 soit 256 nombres ou niveaux assigns des niveaux de luminosit d'image pour la conversion numrique d'enregistrements vido analogiques. Pour une meilleure prcision et une meilleure gestion des diffrents niveaux de traitement post-production, les

Formats vido et chantillonnage


applications vido de studio utilisent gnralement un chantillonnage 10 bits, gnrant ainsi 1 024 niveaux. En principe, la distribution des niveaux entre les zones de lumire et les zones sombres s'effectue de manire linaire (continue). Toutefois, dans le cas de la numrisation de films ngatifs prcdant l'intgration dans la chane intermdiaire numrique, la distribution s'effectue souvent sous forme logarithmique de manire resserrer progressivement les niveaux vers les zones les plus sombres de l'image. En effet, les films ngatifs comportent de nombreuses informations de contraste sur la scne d'origine, et les niveaux situs dans les zones sombres ou ombrages sont plus importants et plus visibles que ceux situs dans les zones de lumire. L'chantillonnage logarithmique redistribue les niveaux numriques disponibles en consquence (d'o l'chantillonnage logarithmique sur 10 bits). Ce procd est considr aussi efficace que la quantification linaire sur 13 bits. NB : la quantification possde un autre sens.
Voir la section Compression Vido 1

Understanding HD with Avid


d'image doivent donc s'effectuer l'aide des technologies informatiques. Les images 4:4:4 s'utilisent en principe uniquement pour les tches de post-production. La distribution des produits finis s'effectue gnralement au format 4:2:2.
Voir aussi : 4:4:4, Palette chromatique

10

Sous-chantillonnage
Dans un systme d'chantillonnage numrique, le souschantillonnage dsigne le procd de rduction du nombre d'chantillons prlevs sur un signal analogique par rapport au nombre de pixels disponibles dans l'image numrique. De manire gnrale, le sous-chantillonnage permet de rduire la quantit de donnes utilises pour former une image. Dans le systme d'chantillonnage 4:2:2 utilis en vido de qualit studio, chaque chantillon de luminance correspond un pixel (reprsent par le chiffre 4). En revanche, la frquence d'chantillonnage des deux signaux de chrominance est rduite de moiti (un chantillon pour deux pixels). Ce procd est appel sous-chantillonnage de chrominance, terme frquemment utilis pour dsigner les rapports d'chantillonnage en gnral (par exemple, 4:2:2, 4:1:1, etc.).
Voir aussi : 4:2:2 etc.

RVB
Rouge, vert et bleu. Les camras, les quipements tl cinmatographiques et la plupart des quipements informatiques produisent des images comprises dans cet espace colorimtrique. Dans le cadre d'un chantillonnage numrique, les trois couleurs sont prleves de manire uniforme au niveau de bande passante le plus lev. Les images 4:4:4 sont donc susceptibles de constituer une meilleure base de travail pour les oprations d'incrustation chromatiques avances. En contrepartie, elles occupent un espace de donnes 1,5 fois plus important que les images 4:2:2. En outre, aucun dispositif d'enregistrement magntique n'est en mesure de traiter les images 4:4:4 ; celles-ci doivent donc tre stockes sur un enregistreur de donnes ou sur disque. Enfin, aucune technique tlvisuelle ne permet de relier ces images. Les oprations de constitution de rseaux

Sous-chantillonnage de la chrominance
Voir aussi : 4:2:2 etc.

Tableau 3
Les formats vido autoriss par la norme de diffusion tlvisuelle numrique de l'ATSC sont rpertoris dans le tableau 3 du document Doc. A/53A.

Formats vido et chantillonnage


Tableau 3 Contraintes lies aux formats de compression
valeur de taille verticale 1080 720 480 valeur de taille horizontale 1920 1280 704 640 rapport hauteur/ largeur 1,3 1,3 2,3 1,2 code de frquence d'images 1,2,4,5 4,5 1,2,4,5,7,8 1,2,4,5,7,8 4,5 1,2,4,5,7,8 4,5 squence progressive 1 0 1 1 0 1 0

Understanding HD with Avid


En arithmtique binaire, la multiplication, trs courante dans le domaine du traitement vido (par exemple, lors du mixage d'images), gnre un rsultat dont la longueur quivaut la somme des deux nombres. Ainsi, la multiplication de deux valeurs vido de 8 bits gnre un rsultat de 16 bits. Cette longueur augmente chaque nouveau traitement. Certains quipements ont la capacit de traiter ce type de donnes. Toutefois, le rsultat devra en dfinitive tre tronqu afin de pouvoir tre exploit par d'autres dispositifs. Dans le cas de systmes HD, il peut s'agir d'une interface HD-SDI 10 bits ou d'un encodeur MPEG-2 8 bits. Dans cet exemple, si l'on dcide de tronquer le rsultat en supprimant les huit derniers bits, la valeur est rduite de 01111110, soit 126. En fonction du contenu vido et des traitements ultrieurs susceptibles d'aggraver l'erreur, cette troncation peut ou non avoir des rpercussions. Gnralement, ce type d'altration se traduit par un effet de bande sur les zones unies (sans dtail) peu lumineuses. Ce type de parasite peut notamment affecter les images gnres par ordinateur. Le choix de l'emplacement de troncation lors de la manipulation des quipements dtermine la qualit de conception et ne doit provoquer aucun dfaut visible, mme aprs plusieurs traitements. Pour ce qui est des manipulations externes, la connexion de dispositifs 10 bits et 8 bits ncessite une attention particulire. La troncation intelligente est appele arrondissage .

11

Lgende des valeurs codes au format MPEG-2 du tableau 3


rapport hauteur/largeur 1 = chantillons carrs 2 = rapport 4:3 3 = rapport 16:9 Code de frquence d'images 1 = 23,976 Hz 2 = 24 Hz 4 = 29,97 Hz 5 = 30 Hz 7 = 59,94 Hz 8 = 60 Hz Squence progressive 0 = balayage entrelac 1 = balayage progressif

Ce tableau rpertorie pas moins de 18 formats de tlvision numrique pour les systmes SD et HD. En raison de la confusion occasionne par cette diversit de format, la plupart des productions et des systmes HD se basent dsormais sur les formats 1080 lignes avec un balayage vertical de 24P, 25P ou 60I et sur les formats 720 lignes 50P et 60P.

Troncation (galement appele Arrondissage )


Rduction du nombre de bits utiliss pour la description d'une valeur. La troncation se pratique au quotidien. En effet, on pourra dire 1 000 au lieu de 1 024 ou encore, lorsqu'il s'agit d'argent, omettre les centimes pour mentionner uniquement les valeurs entires. La troncation s'utilise galement dans les systmes vido numriques. Lorsqu'elle est effectue bon escient, la troncation n'entrane aucune altration de l'image. Dans le cas contraire, elle risque d'affecter la qualit vido. Dcimale : Binaire : 186 x 203 = 37758 10111010 x 11001011 = 1001001101111110

Vido composante
La plupart des tlviseurs numriques classiques prennent en charge la vido composante, c'est--dire un mlange de luminance (Y) et de couleur pure base sur la diffrence de couleur des signaux R-Y et B-Y (analogique) ou Cr et Cb (numrique). Ces composantes sont drives du RVB propos par les appareils d'imagerie ou de tlcinma, les camras, les ordinateurs, etc.

Formats vido et chantillonnage


Le recours la vido composante s'explique notamment par le fait que ce format permet de compresser des images en couleurs. L'il humain voit beaucoup plus de dtails en luminance qu'en chrominance (zone de l'image correspondant l'information de couleur). Une simple conversion de RVB en Y, (R-Y) et (B-Y) permet d'accder exclusivement la chrominance et de rduire le volume de bande passante, sans grands changements visibles sur l'image. Ce procd est utilis par les systmes de codage couleur PAL et NTSC et a t mis en uvre dans les signaux numriques SD et HD composantes. Pour la vido numrique professionnelle, les signaux de diffrence de couleur sont habituellement chantillonns une valeur gale la moiti de la frquence de la luminance, comme pour l'chantillonnage 4:2:2. Il existe d'autres types d'chantillonnage numrique en composante, tels que le 4:1:1, utilis pour le DV (offrant moins de dtails), et le 4:2:0 utilis pour le MPEG-2.

Understanding HD with Avid


format vido composante analogique HD, ce qui est doublement incorrect. L'utilisation de la lettre Y reste correcte, mais tous les codages HD sont numriques et n'impliquent aucunement les ondes sous-porteuses ou leurs axes. A proscrire !

12

Y, Cr, Cb
Ces lettres dsignent le format numrique de vido composante. Y, Cr, Cb correspond la forme numrique de Y, R-Y, B-Y.

Y, R-Y, B-Y
Voir : Vido composante

YUV
Acronyme couramment employ pour dsigner toute norme impliquant le format vido composante. Cette forme abrge est souvent utilise outrance pour dsigner le format vido composante analogique SD (Y, R-Y, B-Y). Y est correct, mais U et V correspondent des axes de l'onde sous-porteuse couleur PAL moduls par des versions respectivement chelonnes et filtres de B-Y et R-Y. Curieusement, ce terme est toujours utilis pour dcrire le

Understanding HD with Avid

13

2
Chapter 2

Compression video : concepts

Compression video : concepts


La compression vido permet de rduire la quantit de donnes ou la largeur de bande passante utilise pour la description des images cinmatographiques. La vido numrique ncessite une quantit importante de donnes. Durant l're de la SD, de nombreuses mthodes de rduction du volume des donnes numriques ont donc t dveloppes. La HD ncessite jusqu' six fois plus de donnes 1,2 Gbits/s et 560 Go par heure de stockage. Le besoin en compression se fait donc plus pressant que jamais.

Understanding HD with Avid


par rapport celle de la luminance (par exemple, 4:2:2). Ce procd s'utilise pour la tlvision (NTSC, PAL et numrique). De mme, la perception des dtails faible contraste est infrieure celle des objets de plus grande taille dont le contraste est plus important. Pour ce faire, un procd appel DCT dcompose les blocs de 8 pixels de ct des images numriques en diffrentes frquences et amplitudes permettant ainsi de rduire (quantifier) les coefficients DTC (frquences et amplitudes) et donc la quantit de donnes. Ce procd intervient dans la plupart des mthodes de compression vido numrique utilises l'heure actuelle, notamment dans la compression AVR, DV, HDV, JPEG ( l'exception de JPEG2000) et les images I des formats MPEG-1, 2 et 4 et Windows Media 9. Les images sont ensuite retraites l'aide d'un procd de compression exclusivement mathmatique appel codage Huffman (procd permettant de rduire les donnes rptes). Les compressions MPEG-2 et plus rcemment MPEG-4 ajoutent une couche de compression en analysant les modifications d'une image l'autre grce l'tude des mouvements des macroblocs de 16 pixels de ct. Seules les donnes relatives aux mouvements (appeles vecteurs cintiques) sont transmises. Ces vecteurs constituent des images prdictives (B et P) contenant pour une dure identique beaucoup moins de donnes que les images I. En comparaison, la frquence d'envoi des images entires (images I, plus de donnes) la seconde est trs limite. La compression MPEG-2 s'utilise dans toutes les formes de transmission numrique au format DVD et HDV. La compression MPEG-4, plus volue et plus efficace, est dsormais utilise pour certains services HD et sera appele se rpandre trs largement dans le cadre du dveloppement des services de tlvision nouvelle gnration. Ces diffrents procds permettent d'obtenir des rsultats intressants. Toutefois, leur utilisation au niveau de la chane de production reste soumise des impratifs de qualit. Plusieurs cycles de compression (compression/dcompression) peuvent intervenir tout au long du processus de production et risquent donc de constituer un facteur d'erreur assez

14

Compression : introduction et gnralits


Le type et le niveau de compression dpendent du domaine d'application. Les quipements destins au march de la consommation (DVD, transmission, etc.) disposent d'une bande passante relativement faible et utilisent donc en principe un niveau de compression trs lev (faible dbit). Dans le domaine de la production et du montage en ligne, le niveau de compression est bien infrieur (dbit plus lev), car la qualit de l'image doit tre conserve tout au long du processus d'laboration de la bande originale. Les procds de compression vido reposent tous sur le principe de suppression des informations juges superflues, appeles dtails d'image redondants . Cette technique s'applique aussi bien aux images fixes qu'aux mtrages vido et cinmatographique. Plusieurs procds peuvent tre utiliss simultanment. La technologie numrique a permis le recours des mthodes complexes, par la suite intgres dans des puces de compression conomiques produites en srie. Tout d'abord, notre perception des couleurs (la chrominance) n'est pas aussi dveloppe que pour le noir et le blanc (la luminance). La rsolution couleur est donc rduite de moiti

Compression video : concepts


important. De plus, de nombreux procds de compression se basent la perception humaine et peuvent se rvler inadapts aux tches de production, de post-production et de montage. C'est notamment le cas des processus ncessitant une qualit d'image suprieure aux limites de perception de l'il humain (par exemple, les tches d'incrustation et de retouche de couleur). Le rendu aprs dcompression peut alors laisser apparatre certains dfauts.
Voir aussi : AVR, Vido composante, DV, DNxHD, codage Huffman, JPEG, JPEG2000, MPEG-2, MPEG-4

Understanding HD with Avid


entre chaque image. Cette opration peut s'avrer la fois trs complexe et peu fiable, et gnrer des artefacts de blocs au niveau de l'image.
Voir aussi : GOP, MPEG-2, MPEG-4

15

Compression intra-image (compression d'image I)


Compression vido effectue sur la base des informations contenues dans une seule image vido. Toutes les informations permettant de recrer l'image sont donc contenues dans les donnes compresses correspondantes et fonctionnent indpendamment des images adjacentes. La compression vido intra-image facilite les tches de montage qui peuvent s'effectuer au niveau des limites de chaque image sans ncessit de dcodage ni de recodage. Les rsultats obtenus suite l'dition vido base uniquement sur les images I constituent la premire gnration du montage. Les autres oprations (substitutions, fondus, mixages, gnration d'effets vido de mouvement, etc.) peuvent s'effectuer au niveau du signal de bande de base. Pour cela, les donnes vido doivent dans un premier temps tre dcompresses.
Voir aussi : AVR, DV, JPEG, MPEG-2

Blocs
Voir DCT

Codec
Le terme codec correspond la forme abrge de codeur/ dcodeur. Il fait gnralement rfrence un moteur de compression. Ce terme est source de confusion, car il est souvent utilis pour dsigner soit un codeur soit un dcodeur.

Compression inter-image
Compression vido gnrant les images prdictives compresses partir des informations de plusieurs images successives. La compression MPEG-2 avec un GOP suprieur 1 constitue un exemple typique de compression interimage. Le flux MPEG-2 contient un mlange d'images I et d'images prdictives de type B (prdiction bidirectionnelle) et de type P (prdiction simple). Les images prdictives ne peuvent pas tre dcodes sparment des autres images du GOP ; c'est donc l'ensemble du GOP qui doit tre dcompress. Ce systme de codage offre des performances satisfaisantes pour la transmission, mais ne possde pas la flexibilit ncessaire aux oprations de montage avances (le montage s'effectue uniquement au niveau des limites du GOP). Il ncessite galement une estimation du mouvement

DCT
Discrete Cosine Transform (transformation en cosinus discrets). Cette opration constitue la premire tape de nombreux procds de compression vido numrique, notamment la compression JPEG, MPEG-2 et MPEG-4. Elle consiste convertir les blocs de 8 pixels de ct des images pour les retranscrire sous forme de frquences et d'amplitudes. Les donnes obtenues ne sont pas forcment rduites. En revanche, une fois traites, les informations deviennent compressibles. Plus la frquence augmente, moins les dtails de faible amplitude sont visibles. Les coefficients sont progressivement rduits, souvent jusqu' atteindre

Compression video : concepts


une valeur nulle, de manire correspondre la taille de fichier requise par image (dbit constant) ou au niveau de qualit souhait. Ce processus de rduction, connu sous le nom de quantification, effectue la compression des donnes. Pour les applications d'enregistrement magntique, la taille de fichier est fixe et le procd de compression doit pouvoir occuper l'espace disponible sans dpasser le seuil limite. Ceci explique pourquoi le taux de compression ne constitue pas en soi une indication suffisante pour dterminer la qualit de l'image. La transformation DCT intervient au sein d'une image et constitue par consquent une compression intra-image (image I). Ce type d'opration s'inscrit dans le procd de compression le plus utilis l'heure actuelle dans le secteur tlvisuel.
Voir aussi : AVR, Taux de compression, DV, JPEG, MPEG-2, MPEG-4

Understanding HD with Avid

16

Facteur d'entrelacement
L'utilisation du balayage entrelac (par opposition au balayage progressif) n'entrane aucune rpercussion au niveau de la rsolution des images fixes. Toutefois, si l'un des lments de l'image subit un quelconque dplacement, le facteur d'entrelacement entrane une diminution de la rsolution, qui peut alors atteindre une valeur infrieure ou gale 0,7. Cette diminution est lie au dcalage temporel entre les deux trames entrelaces. Lors du mouvement, les dtails apparaissent en dents de scie, ligne par ligne, et il en rsulte un lger lissage global de la rsolution verticale.

GOP
Group Of Pictures (Groupe d'images). Terme utilis notamment dans la compression vido MPEG-2 et MPEG4. Il correspond au nombre d'images intercales entre deux images I intgrales : les images intermdiaires sont des images prdictives (de type B et P). Le GOP long dsigne en principe le codage MPEG-2 et 4. Pour la transmission, le GOP atteint souvent une demi-seconde, 13 ou 15 images (25 ou 30 images par seconde), ce qui permet d'obtenir le taux de compression requis.

Entrelac
Mthode d'organisation des lignes de balayage des images sous forme de deux trames (ou plus) entrelaces par image. La plupart des tlvisions utilisent un entrelacement 2:1 : les trames de lignes impaires (1, 3, 5, etc.) sont suivies de trames de lignes paires (2, 4, 6, etc.), ce qui permet de doubler la frquence de rafrachissement vertical. En effet, le nombre de trames entrelaces correspond au double du nombre d'images entires. Cette mthode garantit une meilleure interprtation du mouvement et une limitation du phnomne de scintillement sans augmenter le nombre d'images entires ni la frquence de bande passante du signal. L'inconvnient de ce type d'organisation se situe toutefois au niveau de la rsolution verticale et du traitement de l'image.
Voir aussi : Facteur d'entrelacement, Progressif

A typical group of pictures

Le montage MPEG avec GOP long constitue une opration dlicate, dans la mesure o la prcision dpend de la longueur du GOP. Pour contourner le problme, les images doivent tre retraites, gnralement l'aide d'un dcodeur. Le format HDV utilise la compression MPEG-2 avec un GOP de 6 images (format HDV1 ) ou de 15 images (format HDV2) permettant un montage bas sur des intervalles de 1/4 ou

Compression video : concepts


1/2 seconde. Un GOP de 1 correspond une vido image I uniquement modifiable chaque image sans ncessit de traitement supplmentaire. Les applications studio de la compression MPEG-2 utilisent des GOP extrmement rduits, de l'ordre de 2 pour le Betacam SX et de 1 pour lIMX (image I uniquement, sans image prdictive), ce qui permet de simplifier le montage au niveau de chaque image. D'autres formats (par exemple, les formats DV, DVCPRO HD et HDCAM, D5-HD) n'utilisent pas la compression MPEG mais se basent galement sur un dcoupage en image I uniquement.
Voir aussi : MPEG-2, MPEG-4

Understanding HD with Avid


verticales progressives (rafrachissement). La frquence 24 Hz est trs utilise en raison de sa compatibilit avec le format cinmatographique et de sa facilit de conversion vers l'ensemble des formats tlvisuels utiliss l'chelle mondiale. Les frquences 25 et 30 Hz correspondent aux frquences d'image SD existantes (celles-ci utilisent toutefois le balayage entrelac). Les frquences 50 et 60 Hz sont galement prises en charge. Toutefois, en raison des restrictions de bande passante, elles sont limites en termes de taille d'image (par exemple, 720/60P et 720/50P). A l'heure actuelle, le balayage progressif s'utilise normment dans le secteur de la production d'crans d'ordinateur et d'crans de tlviseur nouvelle gnration. La stabilit des images progressives facilite la perception des dtails. Ce type d'image facilite galement la tche des concepteurs (aucune difficult lie aux diffrences entre les deux trames d'image). L'inconvnient du balayage progressif se situe toutefois au niveau de la frquence de rafrachissement vertical. A des frquences de 24, 25 et 30 Hz, frquences pouvant tre utilises en tlvision HD avec les formats 1080 lignes, le phnomne de scintillement risque par consquent de devenir important. Pour viter ce phnomne, chaque image doit tre traite de manire s'afficher deux fois (procd comparable la double obturation des projecteurs cinmatographiques). Une faible frquence de rafrachissement risque galement d'entraner un problme de fluidit du mouvement (phnomne de bgaiement) lors d'une scne d'action ou lors de plans panoramiques. Grce au double rafrachissement vertical par image, le balayage entrelac possde un avantage dans ce domaine.
Voir aussi : 24PsF, Entrelac

17

Image I uniquement (Image I)


Forme abrge d'image intra uniquement.

Macrobloc
Bloc de 16 pixels de ct, compos de quatre blocs DCT adjacents. Les macroblocs permettent de gnrer les vecteurs cintiques utiliss dans le codage MPEG-2. La plupart des codeurs utilisent une technique de correspondance afin de dterminer l'emplacement de destination des blocs et ainsi gnrer les vecteurs cintiques permettant de dcrire le dplacement. Ce procd permet gnralement d'obtenir de trs bons rsultats mais connat galement ses limites, observables notamment lors de fondus lents vers le noir, o les erreurs de placement de bloc apparaissent clairement. D'autres techniques, comme la corrlation des phases, permettent d'obtenir une meilleure interprtation des mouvements.

Progressif (balayage)
Squence de balayage d'image. Le balayage vertical s'effectue de la premire la dernire ligne en une seule passe. La TVHD utilise plusieurs frquences d'image

Quantification
La quantification dsigne le procd utilis pour la rduction des donnes vido contenues dans une image I dans le cadre des mthodes de compression DCT (par exemple, AVC, JPEG, MPEG-2 et MPEG-4). La quantification intervenant

Compression video : concepts


lors du procd DCT permet de rduire de manire slective les coefficients DCT correspondant aux lments les moins visibles de l'image (frquences les plus leves et amplitudes les plus faibles). La rduction de nombreux lments une valeur nulle permet de rduire la quantit de donnes de manire significative. L'utilisation d'un niveau de quantification constant produit un rsultat de qualit homogne avec un dbit de donne variable selon la quantit de dtails des images. Il est galement possible d'utiliser un niveau de quantification variable. Ce procd entrane alors un dbit de donnes constant mais des images de qualit variable. La quantification variable s'utilise lorsque les donnes doivent correspondre une taille de stockage ou un canal dfinis (par exemple, lors d'un enregistrement magntique ou de l'utilisation d'un canal de transmission). L'objectif est alors de se rapprocher du seuil de capacit de stockage, sans le dpasser. La capacit atteindre cet objectif constitue l'un des critres d'valuation de l'efficacit des procds de compression DCT. NB : la quantification possde un autre sens.
Voir la section Formats Vido

Understanding HD with Avid


de compression, les procds de transmission se basent sur les images I et les images prdictives. Le format HDV permet d'enregistrer des donnes sur bande 19-25 Mbits/s, un dbit comparable la transmission HD un taux de compression d'environ 40:1, suivant la norme utilise. Le dbit de transmission et des enregistreurs vido est gnralement constant ; les images d'origine pouvant contenir une quantit de dtail htrogne, la qualit des images compresses peut varier. Les DVD utilisent en revanche souvent un dbit variable pour une qualit uniforme. Les taux de compression varient donc en fonction des exigences du matriel et produisent un rsultat homogne. Ceci explique en partie la qualit du rendu des DVD, mme dbit relativement faible (environ 4 Mbit/s).

18

Tolrance la compression
Les matriaux produisant de bons rsultats suite l'application d'un procd de compression sont qualifis de tolrants la compression . Ce facteur peut s'avrer important lors de la transmission impliquant une bande passante de donnes trs limite et des taux de compression levs. Les mtrages comportant d'importantes zones de couleur uniforme, peu de dtail et peu de mouvement (par exemple, les dessins anims, les gros plans et certaines pices de thtre) tolrent en gnral trs bien les procds de compression. La compression MPEG-2 se base sur les dtails spatiaux et sur les mouvements des images. L'augmentation considrable de ces deux facteurs risque d'affecter la qualit finale de l'image. C'est le cas notamment pour les sports rapides (par exemple, le football). Les images de faible qualit peuvent rvler une faible tolrance la compression. Les parasites sonores sont interprts comme des mouvements par les encodeurs MPEG-2 et MPEG-4 et gnrent des informations occupant l'espace ncessaire aux donnes utiles. Les conversions de frquence d'images de faible qualit entranant des sautes d'image peuvent galement fausser l'interprtation des

Taux de compression
Il sagit du rapport donnes (vido ou audio) non compresses sur donnes compresses. Ce taux ne dfinit pas la qualit audio ou vido obtenue aprs compression, qui dpend galement des performances du systme utilis. Dans le cadre d'applications de studio, la compression se situe normalement entre 2:1 et 7:1 pour la SD (formats d'enregistrement magntique D1 et D5 non compresss galement disponibles). Pour la HD, la compression se situe l'heure actuelle entre 6:1 et 14:1 (suivant les formats d'enregistrement magntique) et utilise exclusivement des images I. Pour la diffusion, les valeurs dpendent de l'utilisation de la bande passante disponible. Le taux se situe aux alentours de 40:1 pour la SD et autour de 50 ou 60:1 pour la HD (suivant le format utilis). Pour augmenter le taux

Compression video : concepts


mouvements, augmentant galement la quantit de donnes superflues au dtriment des dtails spatiaux pertinents. De tels parasites constituent par ailleurs un facteur d'erreur d'interprtation des mouvements, qui peut se traduire par un blocage de l'image. Pour viter ce type de problme, la chane de production doit reposer sur des quipements de qualit. Le choix du format vido peut galement s'avrer dterminant. Par exemple, les mouvements sont moins nombreux avec 25 images balayes en mode progressif qu'avec 50 trames entrelaces, ce qui facilite les oprations de compression. Le taux de russite peut ainsi augmenter de 15 20 %.

Understanding HD with Avid

19

Vecteurs cintiques
Utiliss dans les systmes de compression MPEG-2 et MPEG-4, les vecteurs cintiques dcrivent la direction et la distance parcourue par les macroblocs (16 pixels de ct) entre les images. L'envoi des informations de mouvement implique une quantit de donnes infrieure l'envoi d'une image I et permet donc de limiter le flux de donnes vido.

Understanding HD with Avid

20

3
Chapter 3

Compression video : formats

Compression video : formats

Understanding HD with Avid

21

Codage Huffman
Cette mthode de compression de donnes recherche les motifs rpts, auxquels elle attribue un code (variable selon sa frquence d'apparition). Ainsi, les rptitions trs frquentes possderont un code court et celles moins frquentes un code long. Ces codes sont attribus en fonction de la table d'Huffman. L'envoi de codes au lieu de donnes permet uniquement l'obtention d'une compression 2:1 sans perte. Pour cette raison, le codage Huffman est souvent associ une compression vido JPEG ou MPEG.

Cette section rpertorie les diffrents formats de compression vido actuellement utiliss. Les formats protgs par un copyright sont accompagns du nom de la socit propritaire.

AVC
Voir MPEG-4

DVC
DVC est un format de compression utilis pour les quipements DV conformes la norme CEI 61834. Bas sur le format DCT, il garantit une compression spatiale (intra-image) au format 5:1 et permet de rendre les chantillonnages vido 8 bits (720 x 480 NTSC 4:1:1 ou 720 x 576 PAL 4:2:0) un dbit de donnes de 25 Mb/s. La compression DVC s'utilise en DV, DVCAM, Digital8 et DVCPRO (avec PAL 4:1:1). Ses rsultats de compression sont particulirement bons lorsqu'on lui applique simultanment plusieurs quantificateurs. Dans ce cas, il slectionne systmatiquement le dbit le plus proche du dbit optimal pour l'enregistrement sur bande (25 Mb/s).

AVR
Le format AVR a t mis au point par Avid Technology. Il est constitu de diffrentes mthodes de compression vido M-JPEG compatibles avec ses systmes matriels ABVB non linaires. En compression AVR, la mme table de quantification (des coefficients) est applique chaque image du clip vido lors de sa numrisation. Ceci permet de conserver une rsolution M-JPEG uniforme sur l'ensemble du clip. Dans ce format, le taux de compression des donnes augmente en fonction de la complexit de l'image. Par exemple, un trs gros plan possdera gnralement un faible taux de compression tandis qu'un plan d'ensemble ralis lors d'une comptition sportive sera rendu un taux de compression lev. Pour ne pas encombrer la bande passante des systmes, le format AVR utilise le principe d'invalidation (aussi appel "rollback"). Ce mode de contrle continu du dbit des donnes vite que ce dernier dpasse la valeur maximale prdfinie. Il suffit donc que cette limite d'invalidation soit atteinte sur une image donne pour que les frquences spatiales leves de cette image soient supprimes des images suivantes, jusqu'au retour un dbit de donnes raisonnable.
Voir aussi : DCT, JPEG

DNxHD
Outre sa prise en charge par tous les systmes de montage Avid, le codage Avid DNxHD offre une compression de qualit avec des dbits de donnes et des tailles de fichiers rduits. Conu pour le montage, il permet de manipuler librement les projets HD sur des systmes Avid destins lorigine au SD : codage et montage HD, ajout d'effets, correction des couleurs et finitions. Il existe un format de compression DNxHD pour chaque besoin. En voici quelques exemples :

Compression video : formats


Format Rsolution Frquence d'images Dbit de donnes DNxHD 220x 10 bits 29.92 i/s 220 Mb/s DNxHD 185x 10 bits 25 i/s 184 Mb/s DNxHD 185 8 bits 25 i/s 184 Mb/s DNxHD 145 8 bits 25 i/s 135 Mb/s DNxHD 120 8 bits 25 i/s 220 Mb/s

Understanding HD with Avid

22

JFIF
Le format JFIF (JPEG File Interchange Format) est une mthode de compression utilise sur les systmes Avid non linaires bass sur la technologie Meridien. Il applique le mme dbit de donnes aux clips numriss, quelle que soit leur complexit, afin de garantir une qualit de rsolution constante. Chaque rsolution JFIF se dfinit par un dbit de donnes cible et une table de quantification. Lors de la numrisation, la table de quantification s'applique l'chelle linaire afin d'aligner le dbit de donnes actuel sur le dbit cible. Bien que les dbits de donnes appliqus soient sensiblement les mmes, la souplesse du format JFIF permet gnralement d'obtenir une image compresse de meilleure qualit qu'en compression AVR.

La compression Avid DNxHD conserve l'intgralit de la matrice et chantillonne le signal la norme 4:2:2. Ce format s'appuie galement sur de puissantes techniques de codage et de dcodage afin de garantir une qualit d'image constante sur plusieurs crations et processus. Avec Avid DNxHD, vous dcouvrirez la compression de qualit mastering. Son efficacit est telle que les projets HD peuvent dsormais tre traits par des processus reposant sur des rseaux et des espaces de stockage initialement conus pour des mdias SD. Sachez, par exemple, que les rseaux de mdias partags Avid Unity sont maintenant compatibles avec les mdias HD et que les processus HD en temps rel, beaucoup plus conomiques, peuvent galement tre assigns aux systmes Media Composer Adrenaline HD et Avid DS Nitris. Sachez enfin qu' l'heure actuelle, vous pouvez mme monter du matriel HD sur un ordinateur portable !
Pour de plus amples informations, visitez la page www.avid.com/dnxhd/index.asp.

JPEG
Le format JPEG (Joint Photographic Experts Group) est une mthode de compression d'images fixes normalise ISO et UIT-T offrant des taux de compression compris entre 2 et 100 %. Ce format possde trois niveaux de traitement : baseline (minimal), extended (tendu) et lossless (sans perte). Le codage JPEG baseline est le plus utilis en tlvision et en informatique. Lors de la premire phase de compression JPEG, les blocs de matrice de 8 pixels de ct sont compresss au format DCT, pour ensuite tre convertis en frquences et amplitudes. Cette conversion ne rduit pas en soi le volume de donnes mais elle permet de diviser les frquences : aux frquences leves moins visibles correspond un facteur de quantification lev (rduisant la plupart des frquences zro) et aux plus faibles, un facteur moins lev. Afin d'ajuster au mieux le taux de compression, le facteur de quantification peut tre dfini en fonction du volume de donnes (dbit de donnes constant) ou de la qualit d'image (qualit constante). La dernire phase de la compression JPEG consiste en un codage Huffman, c'est--dire un traitement mathmatique sans perte, permettant de rduire par 2:1 (voire plus) le volume des donnes dj compress.

H.264
Voir MPEG-4

Compression video : formats


Le codage JPEG baseline cre des fichiers .jpg semblables aux images I des compressions MPEG-1, MPEG-2 et MPEG-4, l'exception prs que les fichiers .jpg se basent sur des tables d'Huffman lgrement diffrentes.
Voir aussi : compression, taux de compression, DCT, codage Huffman, JFIF, M-JPEG

Understanding HD with Avid


cinma haut dbit (200 ou 300 Mb/s) et permet d'extraire les tailles d'images codes diffrentes sans recours au dcodage.

23

www
M-JPEG

http://www.jpeg.org

www

http://www.jpeg.org

JPEG 2000
Ce systme de codage avanc propose la mme compression spatiale des images que le format JPEG, mais s'adapte bien d'autres applications, des appareils numriques portables aux logiciels professionnels (scientifiques ou industriels). Mieux que le recours la traditionnelle compression DCT, ce format utilise une technologie de pointe aussi appele compression par ondelettes. Plus gourmande que le format MPEG, la compression JPEG 2000 tait considre, jusqu' trs rcemment, comme une technologie trop coteuse pour le secteur audiovisuel. Mais l'arrive sur le march de nouvelles puces, plus conomiques, devrait populariser ce format. Dans les secteurs audiovisuel et cinmatographique qui utilisent les technologies numriques, sa qualit d'image exceptionnelle annonce l're du JPEG 2000. Recommande pour le D-cinma, cette compression HD a dj t adopte par Grass Valley, qui l'a rcemment intgre sa nouvelle gamme de camra Infinity. Grce son analyse circulaire, zone par zone, la compression JPEG 2000 vite la gnration d'artefacts en blocs. Un lger bmol est noter concernant une certaine tendance la dgradation des zones complexes, ce qui constitue toutefois un problme beaucoup moins flagrant. Nanmoins, la technologie JPEG 2000 est volutive et progresse mesure que le nombre de bits augmente. De fait, elle offre dj une qualit d'image sans perte visible en HD et D-

Le format M-JPEG (Motion JPEG) est une compression JPEG destine aux images en mouvement. Afin de s'adapter au mieux chaque image, cette compression peut tre dfinie en fonction du volume de donnes (dbit de donnes constant) ou de la qualit d'image (qualit constante).
Voir aussi : AVR, JPEG

M-JPEG 2000
Equivalent du format JPEG 2000 pour les images en mouvement.

MPEG
La norme MPEG (Moving Pictures Expert Group) est constitue d'un ensemble de formats de compression dvelopps par un groupe d'experts dans le domaine de la vido et du son. Outre les formats de compression vido et audio (MPEG-2 et MP3, par exemple), la compression MPEG inclut des formats standards destins au matriel d'indexation, de remplissage et d'tiquetage.

www

http://www.mpeg.org

Compression video : formats


MPEG-2
Norme ISO/CEI 13818-1. Ce systme de compression vido a t initialement conu pour transmettre les signaux audio et vido numriques des taux de compression trs levs. Il s'agit actuellement du format de rfrence utilis dans la plupart des transmissions DTV mondiales. Il est galement trs rpandu dans les crations de DVD, de projets SD et HD et dans une multitude d'applications ncessitant des taux de compression vido levs. Le tableau suivant rpertorie les diffrents niveaux et profils qui constituent la famille MPEG-2. De nombreuses combinaisons sont possibles afin de rpondre aux exigences de chaque application. A noter cependant que toutes ces combinaisons seraient impossibles sans la phase pralable de dcodage en vido de bande de base, suivie de celle de recodage.
Profil Niveau
High (lev) High (lev) -1440 Main (principal) Low (faible) 720x570 15 Mb/s

Understanding HD with Avid


Dlibrment asymtrique, le format MPEG-2 est beaucoup plus simple dcoder qu' coder. C'est pourquoi les prix sont si bas pour les consommateurs et si levs pour les diffuseurs. Ce codage s'effectue en deux temps. Sensiblement similaire la compression JPEG, la premire phase du codage consiste compresser les donnes au format DCT intraframe (images I) puis leur appliquer un facteur de quantification afin de rduire leur volume. Au cours de la seconde phase, une compression inter-image permet de calculer le mouvement des macroblocs et de remplacer ces informations par plusieurs images I successives, afin de former un GOP. Le mouvement est ainsi transcrit en vecteurs cintiques, chacun indiquant une direction et une distance. Le volume de donnes de tous les vecteurs additionns est considrablement rduit par rapport celui requis par les images I. Remarque : le calcul des vecteurs cintiques n'est pas une science exacte. La qualit d'image peut varier considrablement selon le type de compresseur MPEG. Cependant, en raison du caractre dterministe de la dcompression, tous les dcodeurs fonctionneront de la mme faon. Le processus de codage passe obligatoirement en revue plusieurs images la fois, ce qui entrane des retards considrables. De la mme faon, le rendu des images est retard au niveau du dcodeur. Dans le cas des transmissions, ce retard peut atteindre une seconde. De plus, le format MPEG-2 est parfois utilis sur des circuits de diffusion dits de contribution , provoquant un retard caractristique. Lors d'un reportage en direct, par exemple, il se traduit par un dcalage entre la question pose en studio et la rponse du journaliste sur le terrain. Lutilisation de taux de compression trs levs est essentielle la transmission de donnes vido et audio HD dans de bonnes conditions. A titre indicatif, le matriel HD 10 bits non compress requiert une vitesse de transfert de 1 244Mb/s. Il s'agit ici de donnes 10 bits chantillonnes la norme 4:2:2. Dans le cas de donnes 8 bits chantillonnes 4:2:0, la transmission des donnes doit tre de 746 Mb/s. Nanmoins, les canaux de transmission ATSC (19,2 Mb/s) ou

24

Simple 4:2:0 I, B

Main 4:2:0 I, B, P
1920x1152 80 Mb/s 1440x1152 60 Mb/s 720x576 15 Mb/s 352x288 4 Mb/s

422P 4:2:2 I, B, P

SNR* 4:2:0 I, B, P

Spatial* High 4:2:0 4:2:0,4:2:2 I, B, P I, B, P


1920x1152 100 Mb/s 1440x1152 60 Mb/s 1440x1152 80 Mb/s 720x576 20 Mb/s

720x608 50 Mb/s

720x576 15 Mb/s 352x288 4 Mb/s

Profils et niveaux MPEG-2 * Les profils SNR et spatial sont volutifs.

Les profils indiquent lensemble d'outils de compression utilis. Les niveaux dcrivent le format (qualit d'image) obtenu pour du matriel HD pass en VHS. Le dbit est indiqu pour chaque combinaison profil/niveau. Les valeurs mentionnes correspondent aux niveaux et dbits maximaux. Des valeurs moins leves peuvent tre utilises. Les combinaisons adaptes au HD nouvelle gnration sont indiques en rose.

Compression video : formats


DVB (20 Mb/s, variable selon la largeur du canal, notamment) requirent une compression approximativement suprieure ou gale 40:1.
Voir aussi : DCT, GOP, compression intra-image, compression interimage. Macrobloc

Understanding HD with Avid

25

VC-1
VC-1 est une spcification de codec vido en cours de normalisation par la SMPTE (SMPTE 421M) et mise en uvre par Microsoft dans son profil avanc WMV 9 AD.
Voir WMV 9

MPEG-4
La norme MPEG-4 (ISO/CEI 14496) est un format de compression dvelopp par le mme groupe d'experts MPEG, actuellement utilis dans de nombreuses applications. En production audiovisuelle, il est essentiellement li la compression vido. Les formats MPEG-4 Part 10, AVC (Advanced Video Coding) et H.264 se rapportent tous au mme systme de compression. Le systme en question se base galement sur la compression DCT utilise par le codage MPEG-2. Il permet ainsi de produire des codecs plus efficaces, par le biais de techniques inter-image et intra-image. Plus complexe que le codage MPEG-2, le codage MPEG-4 garantit cependant des compressions de donnes pouvant atteindre 30 % environ, et parfois davantage. Les nouvelles gnrations de services tlvisuels sont conues pour diffuser en MPEG-4, en particulier pour le matriel HD, plus exigeant en ressource de bande passante. Ce nouveau format permet donc d'obtenir une meilleure qualit d'image ou de rendre davantage de canaux sur une mme bande passante. La compression MPEG-4 est parfois assimile au codage WM 9, mme s'il s'agit de deux formats diffrents.

WMV 9
Le format Windows Media Video 9 est un systme de compression audio et vido (codec) dvelopp par Microsoft. Souvent assimil la norme MPEG-4 AVC, ce systme semble lgrement plus performant, dans la mesure o il garantit des dbits de donnes plus bas. En outre, il est suppos possder un processus plus simple et s'adapter particulirement aux crations de contenu de type DVD HD.

www

http://www.chiariglione.org/mpeg