Vous êtes sur la page 1sur 26

INTRODUCTION LA VIDO NUMRIQUE

Gilles Boulet http://gillesboulet.ca Septembre 2001

Introduction la vido numrique

http://gillesboulet.ca

Page

1. La vido
1.1 La vision
Dans le phnomne de la vision humaine, un flux lumineux compos de photons frappe l'il. Dans l'il, les btonnets vont ragir l'intensit de la lumire (la luminance ou Y) et les cnes vont ragir la couleur (la chrominance ou C). Le cerveau effectue la synthse de ces informations pour composer une image. L'oeil humain est davantage sensible l'intensit lumineuse (Y) qu' la couleur (C).

1.2 La couleur
La vido utilise ce qui est identifi comme la synthse additive de la couleur. Dans le systme colorimtrique additif, les trois couleurs primaires sont le rouge, le vert et le bleu (RVB ou RGB dans la terminologie anglophone). En combinant ces trois couleurs primaires, il est possible de reproduire tout le spectre visible par l'il humain. L'cran de visualisation vido sera donc compos d'une srie de triades rouge-vert-bleu. L'activation de l'ensemble de ces triades formera l'image.

1.3 Le signal
En vido, c'est la camra qui transforme l'information lumineuse (photons) en signal lectrique (lectrons). En vido analogique, l'intensit de ce signal lectrique varie de faon continue. Le processus de transformation de l'information lumineuse en signal lectrique est le suivant : L'lment optique de la camra, l'objectif, spare la lumire en trois composants le rouge, le vert, le bleu. Cette opration est ralise en faisant passer le flux lumineux par une succession de filtres dichroques rflchissant certaines couleurs et en laissant passer d'autres. En vido professionnelle, les trois images sont projete sur trois capteurs photosensibles distincts forms chacun de centaines de milliers de points, gnralement entre 400 000 et 700 000. Ces capteurs sont nomms CCD (charged coupled device) ou dispositifs transfert de charge. Les camras domestiques ne sont gnralement quipes que d'un seul capteur CCD.

Introduction la vido numrique

http://gillesboulet.ca

Page

Pour chacun des points de chacun des capteurs, l'nergie lumineuse sera transforme en nergie lectrique. Ainsi, la sortie des capteurs, trois signaux lectriques d'intensit variable, un signal pour chacune des trois composantes. La lumire blanche est forme par la somme des trois composantes RVB. Toutefois, elle n'est pas compose des trois couleurs primaires en quantit gale. Les propositions sont les suivantes : 100% Y = 29.9%(R) +58,7%(V) +11,4%(B)

Une information supplmentaire devra tre ajoute ces signaux. Comme nous l'avons dit, une valeur doit tre tablie pour chacun des points des capteurs. C'est cette valeur pour chacun des points de chacun des pixels qui permettra de recomposer l'image sur un cran de visualisation, chacun des points de la surface d'affichage pouvant alors prendre la mme valeur qu'au moment de la capture par la camra. La restitution de l'information pour chacun des pixels se fait par balayage ligne par ligne de la surface de l'cran de reproduction, les valeurs enregistres pour chacun des pixels au moment de la capture tant transfres aux pixels de la surface de reproduction. Pour synchroniser ces balayages, un signal de fin de ligne est ajout pour chacune des lignes. Un signal de fin d'image est galement insr.

1.4 L'affichage
La technique de la composition d'image par balayage a une consquence : contrairement l'image cinma, l'image vido ne s'affiche pas d'un seul coup, elle s'affiche ligne par ligne, en commenant par le haut gauche pour finir en bas droite. Afin d'assurer une uniformit dans la luminosit de cet affichage, en d'autres termes afin que l'intensit lumineuse des pixels du haut de l'cran ne commence pas diminuer alors que ceux du bas viennent d'tre activs, une technique spcifique a t dveloppe. Il s'agit de la technique d'entrelacement. Un premier balayage est effectu sur les lignes impaires, puis un deuxime sur les lignes paires. Il faut donc deux passages pour recomposer une image complte. La frquence d'entrelacement s'appuie sur la frquence du rseau lectrique. Comme en Amrique du Nord la frquence des rseaux est de 60Hz, le systme de balayage est donc de 60 demi images, soit 30 images par seconde. De faon prcise, le taux de rafrachissement est plutt de 29,97 images par seconde.

Introduction la vido numrique

http://gillesboulet.ca

Page

La norme Nord-Amricaine en tlvision est le NTSC (National Television Standard Committee). L'image NTSC est forme de 525 lignes. De ces lignes, seulement 486 sont utilises pour afficher l'image. Les deux autres principales normes sont europennes. Il s'agit des normes PAL (Phase Alternation by Line) et SECAM (Squentiel Couleur Mmoire). L'image PAL ou SECAM est forme de 625 lignes dont 576 sont utilises pour l'image. Comme la frquence des rseaux lectriques europens est de 50 Hz, le systme de balayage est de 50 demi images, soit 25 images par seconde.

1.5 Le son
Le son fera l'objet d'un traitement distinct. Le signal sonore sera distinct du signal vido. Il sera galement enregistr sur des pistes distinctes sur le ruban vido.

1.6 Les formats denregistrement


En vido analogique, les signaux vido et audio seront enregistrs sur ruban magntoscopique. Il existe diffrents formats d'enregistrement. Le format RVB (Format DVD vido) Les trois informations pour chacune des trois couleurs sont encodes distinctement, vhicules sur des cbles spars et accompagnes d'un signal de synchronisation. Le format composante ( ou YUV ou Y, B-Y, R-Y ou Y,Cr,Cb) (Formats Betacam, M-II) Les informations de luminance (noir et blanc) (Y) et les informations de chrominance (couleur, R-Y et B-Y) sont enregistres sur des pistes diffrentes. Lors de l'enregistrement, on diminue la quantit d'information concernant la couleur. Pour y arriver, puisque nous savons que la luminance (Y) est compose de la somme des 3 chrominances (rouge, vert et bleu), il est donc possible de supprimer une des composantes couleur et de la reconstruire partir de la valeur Y et des deux autres valeurs, le bleu (B) et le rouge (R) : Y= (0,299 x R + 0,587 x V + 0, 114 x B) x 1 B-Y= (-0,299 x R - 0,587 x V + 0,886 x B) x 0,306 = U R-Y = (-0,299 x R - 0,587 x V + 0,886 x B) x 0,877 = V

Introduction la vido numrique

http://gillesboulet.ca

Page

Le format composite (Formats VHS, 8mm, U-Matic ou 3/4 po) Les informations de luminance (noir et blanc) et de chrominance (couleur) sont combines en un seul signal, transportes sur un seul cble et enregistres sur une mme piste magntique. Le format S-Video (Y/C) (Formats S-VHS, Hi-8) Format galement composite, il transmet les informations de luminance (Y) sur un cble et combine en un seul signal les informations de chrominance (U, V). Les deux signaux seront, par la suite, enregistrs sur une mme piste magntique.

1.7 La vido numrique


Le processus de captation de l'image vido en mode numrique est essentiellement le mme que pour la vido analogique. Un systme optique spare la lumire en trois composants. la sortie toutefois, plus d'enregistrement d'un signal lectrique mais plutt l'enregistrement d'une valeur numrique dfinie pour chacune des trois couleurs de chacun des pixels (RVB). Le processus de transformation d'un signal lectrique et valeurs numriques s'appelle la numrisation ou l'chantillonnage. Deux paramtres servent chantillonner un signal lectrique : la frquence d'chantillonnage et la quantification de l'chantillonnage ou le nombre de bits utiliss pour le codage. La frquence d'chantillonnage Il existe un thorme appel le thorme de Shannon. Ce thorme stipule que l'information vhicule par un signal dont le spectre est support born n'est pas modifie par l'opration d'chantillonnage condition que la frquence d'chantillonnage soit au moins deux fois plus grande que la plus grande frquence contenue dans le signal. La reconstitution du signal original peut tre effectue par un filtre passe-bas idal de frquence de coupure gale la moiti de la frquence d'chantillonnage. La bande passante d'un signal vido peut atteindre 6Mhz. Pour numriser ce signal, une frquence d'chantillonnage de 13,5Mhz sera donc utilise. En d'autres termes, le signal vido sera mesur 13 500 000 fois par seconde. Comme nous savons que l'il est plus sensible la lumire (luminance) qu' la couleur (chrominance), souvent, la frquence d'chantillonnage de la chrominance sera moins importante. Dans les faits, l'on utilise un chantillonnage 13,5Mhz pour Y (luminance) et 6,75 pour C (U et V). Cet chantillonnage est donc un chantillonnage 16 bits par pixel.

Introduction la vido numrique

http://gillesboulet.ca

Page

La quantification de l'chantillonnage Un certain nombre de bits serviront coder chacune des mesures. Nous savons que l'il humain discerne un maximum de 256 niveaux diffrents de luminance. Ainsi, un codage 8 bits est suffisant pour reproduire l'ensemble des variations perceptibles (28 = 256 combinaisons possibles) Comme chacune des composantes couleur de l'image sera quantifie sur 8 bits (8 bits Rouge, 8 bits Vert, 8 bits Bleu) (224 = 16 777 216 combinaisons possibles) un total de 24 bits (3 octets) seront utiliss pour coder les informations relatives un seul pixel d'une image.

1.8 Encombrement
Une image vido en format NTSC (National Television Standard Committee) a une rsolution horizontale de 720 pixels et une rsolution verticale de 486 pixels. Si nous utilisons un chantillonnage 4:2:2 de 16 bits par pixel, nous constatons qu'une seule minute de vido numrique non compresse ncessitera prs de 1,2 Go d'espace disque.

Petite mathmatique :

En mode binaire l kilo = 1024 (210) 1 kilo octet (Ko) ou kilo byte (Kb) = 1024 bits 1 mga octet (Mo) ou mega byte (MB) = 220 octets = 1,048,576 octets = 8 388 608 bits (1 octet = 8 bits) 1 giga octet (Go) ou giga byte (GB) = 230 octets = 1,073,741,824 octets = 8,589,934,592 bits

En informatique, le prfixe multiplicatif peut avoir deux sens, selon la base utilise, une base 10 ou une base 2. La base 10 correspond au Systme International (SI). Kilo 210 = 1024 octets Mga 220 = 1 048 576 octets Giga 230 = 1 073 741 824 octets Tera 240 = 1 099 511 627 776 octets Peta 250 = 1 125 899 906 842 624 octets Exa 260 = 1 152 921 504 606 846 976 octets Zetta 270 = 1 180 591 620 717 411 303 424 octets Yotta 280 = 1 208 925 819 614 629 174 706 176.octets Vido :
Rsolution - 720 x 486 x 29.97 images par seconde (ips) (720 x 243 x 59.94 champs par seconde) chantillonnage- 4:2:2 ( 2 Y : 1Cr, 1Cb ) Luminance (Y) 720 x 486 x 29.97 Ips = 10,487,102.4 octets/sec x 8 bits par octet = 83,896,819.2 bits/sec Chrominance R (Cr) 360 x 486 x 29.97 Fps = 5,243,551.2 octets/sec x 8 bits par octet = 41,948,409.6 bits/sec Chrominance B (Cb) 360 x 486 x 29.97 Fps = 5,243,551.2 octets/sec x 8 bits par octet = 41,948,409.6 bits/sec Total = 20,974,204.8 octets/ sec = 167,793,638.4 bits/sec Mo/sec 20, 974,205 / 1, 048,576 = 20.00256062 = 20 Mo/sec 20Mo/sec x 60 sec = 1200Mo/min 1024Mo par gigaoctet = 1,17Go/min Ainsi, une minute de vido aura un poids de 1,17gigaoctets

Audio :
chantillonnage 16 bits (2 octets) sur 2 pistes audio Frquence d'chantillonnage 44,100 (qualit CD audio) Un canal- 2 octets par chantillon x 44,100 chantillons par seconde = 88,200 octets/sec 88,200 octets/sec x 2 canaux = 176,400 octets/sec 0.17 Mo/s x 60 sec = 10Mo/min 1024Mo par giga octet = 0.01Go/min

Vido et audio :
20Mo/sec + 0,17Mo/sec = 20,17Mo/sec 1,17Go/min + 0,01Go/min = 1,18Go/min

Introduction la vido numrique

http://gillesboulet.ca

Page

1.9 Dbit de donnes


Alors que, au niveau de la taille des fichiers, la quantification repose sur des donnes binaires, lorsque l'on parle de dbit ou de taux de transfert, alors ces donnes sont dcimales. Ainsi un mgabit par seconde signifiera un million de bits par seconde et un mgaoctet signifiera un million doctets ou 8 millions de bits puisqu'il y a 8 bits dans un octet. Les abrviations gnralement reconnues sont les suivantes : Kbps kilobits par seconde = 1000 bits Kops kilo octets par seconde = 8000 bits Mbps mgabits par seconde = 1 000 000 bits Mops mgaoctets par seconde = 8 000 000 bits Sans entrer dans une discussion trop technique sur le dbit et le taux de transfert, mentionnons simplement qu'un signal vido NTSC plein cran non compress et chantillonn 4:2:2 ncessite un dbit d'un peu plus de 20 mgaoctets par seconde (20Mops) pour pouvoir tre affich correctement. Comme point de comparaison, soulignons qu'un disque DVD vido a un dbit maximal possible de 9,8 Mops, un cdrom 36X un dbit de 5 Mops, un lien Internet par cable-modem un dbit de 2Mops en rception, une liaison LNPA un dbit de 1Mops alors que le dbit d'une liaison modem par ligne tlphonique pourra varier de 14 56 kbps, en fonction bien sr de la vitesse des modems en communication. Il est donc ais de comprendre qu'il sera ncessaire de traiter le signal vido, en fonction du mode de diffusion prvu. Il existe une cascade de traitements possibles. Nous les verrons un peu plus loin. Une constante toutefois, plus l'on rduit la quantit d'information, plus la qualit objective puis subjective du document est affecte.

2. Le format DV
Il est ais de comprendre que, si la capture a t ralise l'aide d'une technologie vido numrique, le fichier pourra tre directement transfr sur disque rigide d'ordinateur pour tre trait. Si la capture a t ralise l'aide d'une technologie analogique, il faudra alors numriser le signal, soit traduire l'information lectrique en information numrique. Pour raliser cette opration, il faut quiper l'ordinateur d'un convertisseur analogique-numrique aussi identifi comme une carte d'acquisition vido.

2.1 Le format DV :
Afin de permettre que les fichiers et les supports pour les enregistrer demeurent de taille raisonnable, les formats d'enregistrement vido numrique effectuent une opration de compression des donnes dans la camra, au moment de la prise de vue. Il existe plusieurs formats de vido numrique. Le format sans le plus rpandu en ce moment est le format DV pour Digital Video. Ce format est fond sur une norme internationale cre par un consortium de 10 socits en 1993. Il existe des variantes du format DV, par exemple le format DVCAM ou DVCPRO. Mais les diffrences sont davantage lies au processus d'enregistrement des donnes sur un support physique qu'au processus de traitement et de compression du signal.

Introduction la vido numrique

http://gillesboulet.ca

Page

L'enregistrement se droule selon les squences suivantes : L'lment optique de la camra spare la lumire vers trois composants : rouge, vert et bleu (RVB) et transmet l'information un convertisseur. Le taux de transfert de la donne est alors de 248Mops.

4:4:4 Un convertisseur transforme le signal RGB en signal YUV (Y pour la luminance, U et V pour la couleur). Comme l'oeil humain peroit mieux la lumire que la couleur, lors de l'chantillonnage chaque valeur Y d'un pixel est chantillonne quatre fois, alors que les valeurs U et V ne le sont que deux fois, ce que l'on nomme la compression YUV 4:2:2. Ce premier chantillonnage rduit la taille de la donne d'un tiers sans dgradation perceptible par l'oeil. Le taux de transfert est alors rduit 165Mops.

4:2:2 Afin de rduire encore davantage le volume d'information, on utilise un convertisseur YUV 4:2:2 - YUV 4:2:0/YUV 4:1:1. Chaque pixel du signal rsultant garde sa mme valeur de lumire (Y), alors que quatre pixels se partage la mme valeur de couleur (U et V). Le dbit est alors de 124Mops.

4:1:1 A ce stade, la donne est rduite de deux tiers de sa taille initiale. On applique alors la compression DV au signal. Cette compression rduit le flux des quatre cinquimes ( compression 5:1 ) jusqu' un taux de transfert de 25Mops. C'est ce dernier rsultat qui sera enregistr sur la bande magntique.

Introduction la vido numrique

http://gillesboulet.ca

Page

3 Grammaire
L'image est l'unit de base en cinma et en vido. Le plan est, quant lui, constitu d'un enchanement d'images La scne est un ensemble de plans situs dans un mme temps, dans un mme dcor, et constituant un fragment de rcit cohrent. La squence est une suite de scnes qui peuvent se situer dans des temps et des dcors diffrents, mais qui constituent un sous-ensemble cohrent du rcit.

3.1 L'image :
Une image vido possde un ratio d'affichage et une rsolution couleur. Ratio d'affichage En vido, le format d'affichage le plus universel est le format 4:3 soit 4 units de largeur par 3 units de hauteur. L'cran est le plus frquemment dsign par sa diagonale. Ainsi un cran de 15 pouces aura 12 pouces de largeur et 9 pouces de hauteur. Un autre ratio existe. Celui de la tlvision haute dfinition qui est de 16 units de largeur par 9 units de hauteur (16:9). Il s'agit d'un format qu'on dit plus proche de la vision humaine normale. Il s'agit du format retenu pour la tlvision haute dfinition. Ce format a aussi t retenu car il s'agit d'un multiple du format 4:3.

Format 4:3

Format 16:9

Rsolution des couleurs : Il s'agit du nombre de couleurs qui sont affiches simultanment l'cran. En vido analogique, le nombre de couleurs affichable est infini puisque le signal est un flux lectrique constant. En vido numrique, le nombre de couleur affichable est un nombre fini puisqu'il dpend du nombre de bits qui sera consacr chacun des pixels de l'image. Ainsi, dans un agencement de couleurs RVB (rouge, vert, bleu), un codage 8 bits par pixel entranera une rsolution de 256 couleurs alors qu'un codage 24 bits permettra d'obtenir une rsolution de plus de 16,7 millions de couleurs. L'affichage 24 bits est parfois appel affichage en couleurs relles car l'oeil humain ne distingue qu'environ 6 millions de teintes chromatiques diffrentes, soit moins que n'en offre un ensemble de couleurs de 24 bits. videmment, mesure que le nombre de couleurs augmente, la taille du fichier s'accrot considrablement. Codage 8 bits = 28 possibilits de valeurs, soit 256 couleurs possibles Codage 16 bits = 216 possibilits de valeurs, soit 65 536 couleurs possibles Codage 24 bits = 224 possibilits de valeurs, soit 16 777 216 couleurs possibles

Introduction la vido numrique

http://gillesboulet.ca

Page

3.2 Le plan :
Un plan est compos d'une srie d'images fixes qui sont projetes un rythme suffisamment rapide pour donner au spectateur l'illusion de mouvement en se fondant sur le phnomne de la persistance rtinienne de l'il. Les images constitutives du plan sont donc projetes un certain rythme. On parle alors de rythme d'enchanement ou cadence de dfilement. moins de 18 images par seconde, l'il commence percevoir le scintillement et les mouvements commencent apparatre saccads. Le cinma utilise une cadence de 24 images par seconde. Le format NTSC 525/60 (lignes /trames) utilis avec le codage couleur est, quant lui, fond sur une cadence de 59.94 trames, soit 29.97 images par seconde - une diffrence de une sur mille. Il existe, en tlvision, une convention d'identification de chacune des images dune vido. Cette convention est le code temporel (time code) SMPTE (Society of Motion Pictures and Television Engineers). Ce code, lui identifie 30 images/sec. Le "Drop-frame time code" tablit une compensation en omettant de numroter deux images chaque minute, sauf la dixime. Cette convention est identifie comme celle du drop-frame. Il est noter que le systme PAL est, quant lui, exact et ne ncessite pas de "drop-frame". Pour crer un mouvement ralenti il faut enregistrer un plus grand nombre d'images dans une seconde, puis les projeter rythme normal, par exemple enregistrer 60 images d'un mouvement en une seconde pour par la suite les projeter au rythme de 30 images secondes. Inversement, si la capture est effectue 15 images secondes puis projete 30, il y aura acclr.

4. Ajustement du dbit au mdia de diffusion


La squence vido enregistre pourra tre diffuse sur support physique (cdrom ou dvdrom) ou sur rseau (LAN, Internet). Nous avons vu que les capacits des techniques des diffrents mdias varient grandement. Pour diffuser de la vido numrique, il est donc ncessaire d'ajuster le dbit au canal de diffusion c'est dire de diminuer au maximum le nombre de bits ou d'octets utiliss pour reprsenter une image. Il existe diffrentes solutions pour ce faire. La premire solution est de rduire la taille de la fentre ce qui aura pour consquence de rduire le nombre de pixels. Les principales tailles d'cran utilises sont :

640 x 480 320 x 240 240 x 180 160 x 120

Une fentre de 320 x 240 occupera le quart de l'espace d'une fentre de 640 x 480. Consquemment la taille du fichier et le taux de transfert ncessaire pour sa lecture seront considrablement diminus.

Introduction la vido numrique

http://gillesboulet.ca

Page

10

La deuxime solution est de diminuer le nombre d'images par secondes. La vido est projete une cadence de 30 images par seconde. En diminuant la cadence, on rduit encore la taille du fichier et le taux de transfert. moins de 15 images par secondes toutefois, l'il commencera capter une saccade dans le mouvement. La troisime possibilit est de coder moins d'informations couleur, en utilisant par exemple une palette de 256 couleurs. Cette solution occasionnera, elle aussi, dgradation de la qualit objective et subjective de l'image. La solution la plus efficace au problme de dbit est toutefois apporte par la compression, aussi appele rduction du dbit binaire (Bit Rate Reduction).

5. La compression
La vido numrique est l'un des applications informatiques les plus gourmandes tant en terme d'espace requis pour son enregistrement que de volume de dbit et de bande passante pour sa diffusion. C'est pourquoi tout type d'application vido numrique requiert l'application d'algorithmes de compression. La compression est le processus par lequel des fichiers volumineux sont rduits en taille en supprimant de ces fichiers toutes les informations redondantes. La compression va donc consister dterminer ces redondances et les liminer tout en prservant la capacit de reproduire les images originales intactes ou avec le moins de dgradation possible. Puisque la vido est un mdia dynamique, c'est dire que les images dfilent les unes aprs les autres dans le temps, on peut distinguer deux types de redondances :

5.1 La redondance spatiale


La compression par redondance spatiale consiste liminer les informations similaires dans des zones de l'image proches l'une de l'autre. Par exemple, dans le cas d'une personne interviewe, l'arrire scne ou le fond de l'image pourra tre fixe et d'une seule couleur. Par consquent les valeurs d'une grande partie des pixels de l'image seront semblables les uns aux autres. Dans un tel cas, plutt que d'assigner une valeur chacun des pixels, le codec gnralisera l'information une rgion de l'image plutt qu' chaque pixel individuellement. C'est pourquoi, au moment de la production, plus l'arrire scne est fixe et uniforme, plus la compression sera efficace. Par voie de consquence, un panoramique sur une fort de feuillus d'automne aux arbres agits par le vent sera peu prs impossible compresser.

5.2 La redondance temporelle


Alors que la redondance spatiale s'applique liminer les informations redondantes l'intrieur d'une mme image, la redondance temporelle travaille sur un ensemble d'images. Dans un plan, de nombreuses informations telles par exemple les formes ou les couleurs, sont redondantes d'une image l'autre. Pour effectuer la compression, l'algorithme dtermine une image cl (image I) et, par rapport cette image, l'algorithme ne dcrit que les informations divergentes dans les images situes aprs l'image cl (image P ou image prdite) et d'une image bi-directionnelle (image B), recompose partir des images I et P qui l'entourent.

5.3 MPEG
Le Moving Pictures Expert Group a t fond en 1987. Ce groupe a pour objectif de dfinir des normes internationales pour la compression numrique des images vido. Situation particulire, le MPEG est la fois une norme, un codec et un format de diffusion.

Introduction la vido numrique

http://gillesboulet.ca

Page

11

5.4 Principe de compression


La compression MPEG est base sur lextrapolation des informations. Elle utilise la redondance spatiale et la redondance temporelle. L'algorithme de compression enregistre tout dabord le fond de l'image, et ce, toutes les 12 images. Ensuite, il nenregistre que les dplacements des objets dans les inters images. Elle le fait de la faon suivante : limage I (Intra-frame): toutes les 12 images, une image est enregistre. Elle reprsente limage de rfrence. Elle est code indpendamment comme une image fixe. Elle est compresse suivant au format JPEG. limage P (Predicted frame): est une image calcule comme tant la diffrence entre limage originale correspondante et limage P ou I prcdente.

limage B (Bi-directional frame): est une image intermdiaire fortement compresse calcule comme tant la diffrence entre limage originale correspondante et la moyenne entre deux images P ou I, dont une est situe en avant et lautre en arrire.

5.5 MPEG 1 MPEG 4


MPEG 1 Aprs 5 ans dtudes, la norme MPEG 1 fut lance en 1992. Elle est principalement utilise pour la compression du son et de limage sur support cdrom. Grce leur technique, les concepteurs de MPEG 1 russissent atteindre un taux de compression de 26:1. La norme convient assez bien pour des vidos qui peuvent se contenter de dbits peu levs, entre 1 et 1.5Mbits/s. MPEG 2 La norme MPEG 2 est apparue en 1994. Elle permet d'obtenir une qualit dimage professionnelle. La norme permet de supporter des dbits allant de 4 20 Mbits/s. Elle est utilise pour la diffusion par satellite, la tldistribution, la tlvision haute dfinition et le DVD.

MPEG 3 La norme MPEG 3 devait sappliquer des mdias ncessitant des dbits de 20 40Mbits/s. Elle visait les applications relatives la tlvision numrique. Les paramtres de la norme MPEG 3 ont t englobs dans la norme MPEG 2. La norme MPEG 3 ne sera jamais dveloppe. MPEG 4 La norme MPEG 4 s'applique des mdias pouvant tre diffuss faible dbit, cest dire un dbit infrieur 64Kbits/s. D'autres versions de la norme MPEG sont actuellement en dveloppement, entre autre la norme MPEG 7 qui permettra l'indexation du contenu de la squence dans le signal vido lui-mme.

Introduction la vido numrique

http://gillesboulet.ca

Page

12

6. Distribution et diffusion
La vido numrique peut tre distribue ou diffuse. Pour la distribuer, elle est gnralement enregistre sur support physique tel un disque cdrom ou dvdrom. Mais, mme compresss, les fichiers vido sont, par nature, lourds : ils accaparent beaucoup d'espace disque sur les serveurs et sont particulirement gourmands en bande passante. De plus, la compression a ses limites. Toute compression dgrade la qualit du signal original. Cette dgradation est, jusqu' un certain niveau de compression, subjectivement imperceptible l'il. Cependant, lorsque la compression devient trop importante, la qualit objective de l'image et du son se dgrade rapidement jusqu' devenir inacceptable pour l'utilisateur. C'est pourquoi, dans des applications o le volume vido est important, les fichiers sont enregistrs sur un support physique et distribus. Un niveau de qualit minimale est alors garanti. Un prcieux espace sur les serveurs et les disques rigides des utilisateurs est galement sauvegard. La vido peut galement tre diffuse sur les rseaux informatiques. Malgr les limites qu'impose ce choix, de diffuser les contenus sur rseau, par exemple dans le cas d'informations devant tre mises jour frquemment ou encore d'informations devant tre indexes et recherches. Il existe deux modes de diffusion de la vido sur les rseaux : le tlchargement, la diffusion en continu, mieux connue sous l'appellation anglophone de streaming. La diffusion en continu peut quant elle tre faites soit en direct, l'vnement capt tant numris en temps rel et diffus sur les rseaux, soit en diffr, le fichier numris en compress tant alors dpos sur un serveur. Il existe trois principales architectures de duffusion vido sur Internet.

7. Architectures, codecs et formats de diffusion


Une architecture est une solution matrielle et logicielle permettant de produire, d'enregistrer et de diffuser des fichiers informatiques de mdias dynamiques. Une architecture comporte deux principaux lments: un serveur et un client. Les trois architectures les plus courantes pour l'audio et la vido sont Quicktime, RealSystem et Windows Media. Les trois architectures possdent leur logiciel client spcifique. Ainsi, le client Quicktime devra tre install sur le poste de l'utilisateur pour que celui-ci puisse lire des fichiers QuickTime (.mov). Certains logiciels clients peuvent toutefois lire plus d'un format. Ainsi le client Windows Media Player peut lire les formats .aif, .aifc, .aiff, .asf, .asx, au, .avi, .cda, .ivf, .m1v, .m3u, .mid, .midi, mp2, .mp3, .mpa, .mpe, .mpeg, .mpg, .mpv2, .rmi, .snd, .wax, .wav, .wma, .wms, wmv, .wvx, .wmz. Un codec peut tre un logiciel, une pice d'quipement ou combinaison des deux. Un codec (compresseur-dcompresseur) est utilis pour rduire la taille et le dbit de fichiers qui seraient autrement trop encombrants ou trop lourds. Un codec est donc utilis pour compresser des fichiers qui pourront tre diffuss dans diffrents formats. Pour pouvoir lire ces fichiers, l'utilisateur devra avoir le mme codec install sur le logiciel client de son poste de visualisation. Cinepak, Sorenson ou Indeo sont des codecs. Les codecs peuvent compresser les fichiers et les sauvegarder sous diffrents formats de diffusion. Par exemple, un fichier compress avec le codec Sorenson pourra tre sauvegard en format QuickTime (.mov) ou en Audio Video Interleaved (.avi). Certains Codecs sont partie intgrante d'une architecture donne. Ainsi les architectures Windows Media et RealSystem possdent leurs codecs spcifiques qui compressent les fichiers dans leurs formats propritaires, respectivement .asf (Advanced Streaming Format) pour Windows Media et .ra ou .rm (Real Audio ou Real Media) pour RealSystem. Un format est, quant lui, une organisation des informations d'un fichier informatique. Dans un environnement Windows, un format se reconnat son extension. Ainsi, une extension .wav

Introduction la vido numrique

http://gillesboulet.ca

Page

13

identifie un fichier Audio Wave et une extension .mp3 identifie un fichier audio MPEG Layer III audio.

7.1 Architectures
Quicktime Une des toutes premires architectures de vido numrique. D'abord dveloppe pour distribution sur cdrom, l'architecture a peu peu volu et permis une diffusion sur Internet d'abord en mode tlchargement, puis en transmission progressive pour enfin permettre la transmission en continu (streaming). Le serveur de transmission en continu Quicktime est gratuit. Il peut tre install sur diffrentes plates formes (Mac OS, Solaris, Linux, Windows NT). L'encodage Quicktime un niveau de qualit professionnel ncessite des outils spcialiss, par exemple l'encodeur Sorenson Video ou Sorenson Broadcaster ou encore des encodeurs audio complmentaires. Quicktime supporte la norme SMIL (Synchronized Multimedia Integration Language) qui permet de synchroniser la squence vido avec des pages HTML. Un des grands avantages du format Quicktime est sa parfaite compatibilit avec les systmes Mac OS et Windows. Cette caractristique est particulirement utile dans le cas de cdroms bi-systmes. Real System RealSytem dvelopp par RealNetworks est une architecture de transmission en continu. Elle ncessite un serveur ddi. Les cots de licence pour l'installation sur le serveur sont calculs en fonction du nombre de canaux simultans supports Real supporte le SMIL (Synchronized Multimedia Integration Language) qui permet de synchroniser la vido avec des pages HTML. Real permet la transmission en continu normale ou intelligente. Real est avant tout une solution de transmission en continu et c'est pourquoi on ne retrouve pratiquement jamais le format Real sur cdrom. Le logiciel Real possde son propre codec vido, le Real G2. L'encodeur doit aussi tre achet directement de RealNetworks. . Le client de base est gratuit mais la version disposant des fonctionnalits compltes doit tre achete. Windows Media Les fichiers Windows Media s'installent sur un serveur Windows NT. L'encodeur et le client sont gratuits. Pour encoder, Windows Media utilise une version modifie par Microsoft de la norme MPEG 4 appele MPEG-4 v3. Cette norme est lgrement diffrente de la norme MPEG 4 originale qui est quant elle base sur le format Quicktime. L'encodage produit des fichiers au format .asf (Advanced Streaming Format). L'architecture Microsoft fonctionne videmment en parfaite harmonie avec le systme Windows et Internet Explorer. Dans un environnement MacOS et Netscape certaines limites s'imposent.

Introduction la vido numrique

http://gillesboulet.ca

Page

14

7.2 Quelques codecs


CODECS VIDO : Cinpak Indeo Real G2 Sorenson MPEG-4 v3 CODECS AUDIO : Liquid Audio MP3 (MPEG Layer III Audio Qdesign Music Codec Real Audio Windows Media Audio

7.3 Les formats


FORMATS AUDIO .aif / Audio Interchange Format .mp3 / MPEG Layer 3 Audio .ra / Real Audio .wav / Wave Audio FORMATS VIDO .asf / Advanced Streaming format .avi / Audio Video Interleaved .mov / Quicktime Vido .mpg / MPEG 1 Video .rm / RealVideo

8. La vido sur rseau


Malgr la compression, la diffusion vido sur Internet est toujours confronte au problme de la limitation de la bande passante et du dbit. Un fichier vido, mme compress, peut avoir une taille de plusieurs mega octets, ce qui implique de longues minutes ou heures de tlchargement pour un utilisateur reli au rseau l'aide d'un modem tlphonique de faible capacit. C'est pour pallier ce problme que la solution de la transmission en continu ( streaming) a t dveloppe ;. Plutt que d'obliger l'utilisateur attendre tlchargement complet du fichier avant d'en dbuter le visionnage ds que la connexion au serveur est tablie. Il existe deux modes de transmission en continu. Transmission en continu dbit constant mthode de transmission du contenu par laquelle le contenu multimdia situ sur un serveur, puis lu grce l'envoi des donnes sur un rseau en flux continu. La transmission de donnes en continu permet d'couter ou de visionner une squence audio et vido immdiatement plutt que d'attendre le tlchargement complet du fichier. Transmission en continu intelligente Type de transmission en continu qui dtecte les conditions du rseau et ajuste les proprits d'un flux vido ou audio afin d'obtenir une qualit maximale.

Introduction la vido numrique

http://gillesboulet.ca

Page

15

9. La diffusion Web : une esthtique diffrente


La tlvision et l'ordinateur sont des mdias fort diffrents. Les rseaux tlvision et l'Internet sont aussi diffrents. Un utilisateur d'Internet et un tlspectateur auront, au moment o ils utilisent l'un ou l'autre des mdias, une attitude et un comportement fort diffrents. En effet, si le tlspectateur s'assoit gnralement pour couter des blocs de 30 minutes de faon continue, la session de navigation de l'Internaute est, selon les rsultats d'une enqute Nielsen / NetRatings de mars 2001, d'une dure moyenne 31 minutes et 16 secondes alors que le temps moyen d'arrt sur une page est de 54 secondes. La tlvision est un mdia dynamique dfilement linaire. Gnralement, une bonne mission de tlvision est une mission qui divertira ou informera, qui racontera une histoire, qui aura une structure narrative. L'Internet, quant lui, est avant tout interactif et rticulaire. L'utilisateur navigue sans ncessairement avoir de plan pralable prcis, il construit lui-mme ses enchanements, son cycle d'attention est beaucoup plus court. En ce sens, la diffusion vido sur Internet s'effectue dans un contexte sensiblement diffrent de celui de la diffusion sur les rseaux tlvisuels traditionnels. Ainsi, il est peu prs inutile, d'un point de vue d'efficacit communicationnelle, d'encoder une mission au format Real (.ra) ou MediaPlayer (.asf), de la dposer sur serveur et de croire que les utilisateurs s'y prcipiteront et resteront les yeux rivs sur leur cran cathodique pendant une longue priode de temps. Une des lois de l'Internet est que le doigt sur la souris est plus rapide que le doigt sur la tlcommande Le Web est interactif, l'utilisateur est naturellement port cliquer, bouger, copier, fusionner, rorganiser plutt que de rester au mme endroit et d'couter ou regarder l'histoire qu'on lui propose. L'utilisateur vient au Web pour faire quelque chose ou chercher quelque chose plutt que pour se laisser bercer par quelque chose. Ainsi, la grammaire de la Web vido est diffrente. Les squences destines tre diffuses sur Internet doivent tre courtes, les contenus segments. D'un point de vue davantage technique la compression vido doit tre bien comprise et applique. Les algorithmes de compression sont conus pour rduire les redondances spatiales et temporelles. Ainsi, au moment de la capture, la complexit spatiale et temporelle doivent tre rduites dans toute la mesure du possible. Les mouvements de camra, les changements de plan frquents, les transitions dynamiques sont exigeantes pour les algorithmes. La taille de l'affichage et les contraintes de rsolution font aussi qu'il est prfrable de construire les squences en utilisant davantage de gros plans et peu ou pas de plans grand ensemble. Toujours dans le but de minimiser la taille des fichiers et le dbit ncessaire, le nombre de couleurs dans les squences doit tre rduit au maximum. D'autres fonctionnalits peuvent galement tre ajoutes la vido utilise dans les environnements interactifs, par exemple des possibilits de recherche par contenu de squence. Le dveloppement des bases de donnes vido est un des exemples d'une telle application. La norme MPEG 7 supportera cette possibilit d'indexation.

Introduction la vido numrique

http://gillesboulet.ca

Page

16

Glossaire
AIFF
Initiales de Audio Interchange File Format, un format audio dvelopp par Apple Computers. Extension de nom de fichier : .aif

Analogique :
Mode de reprsentation de linformation par une valeur continue. On parle de communication analogique lorsque linformation transmettre est une grandeur physique concrte, comme le signal lectrique gnr par un microphone ou une camra.

Algorithme
Tout ou partie d'un programme qui effectue un calcul, ou une suite d'oprations. Par exemple, un algorithme de compression rduit la taille d'un fichier ; un algorithme d'affichage transfre les informations depuis une mmoire vers un cran.

AVI :
Fichier vido de Microsoft Windows (audio et vido entrelacs, enregistr sans compression ou avec une compression minimale). Extension de nom de fichier : .avi

ASCII
Initiales de American Standard Code for Information Interchange. Codage informatique d'origine amricaine qui dfinit la correspondance entre les caractres de l'alphabet et un ensemble de valeurs binaires. Par exemple la squence binaire 1010000 correspond la lettre P majuscule alors que la squence 1110000 correspond la lettre p minuscule.

Assemblage :
Montage lmentaire qui colle bout bout diverses squences vido et qui prcde le montage proprement dit.

Balayage
Parcours effectu par le faisceau d'lectrons que le tube cathodique envoie sur les lignes paires et impaires de diodes luminescentes recouvrant un cran de tlvision.

Bande passante
Capacit de transfert de donnes d'un systme de communication numrique, tel que le rseau Internet ou un rseau local. La bande passante est gnralement exprime en nombre de bits qu'un systme est capable de transfrer en une seconde. Les notions de bande passante leve ou de large bande font rfrence un rseau dot d'un taux de transfert de donnes lev. Elle exprime galement la capacit d'un canal transmettre un flot d'informations. La largeur de bande passante s'exprime gnralement en kilohertz (kHz) ou en mgahertz (MHz). La bande passante en tlvision est de 5,5 MHz. Celle du signal haute-fidlit en audio est de 20 kHz, ce qui correspond la gamme des frquences audibles.

Bit
Unit lmentaire d'information dont l'abrviation internationale est bit (BInary digiT). Il peut prendre deux valeurs codes 0 ou 1.

Introduction la vido numrique

http://gillesboulet.ca

Page

17

Cble
Matriel de transmission d'informations qui relie les composants d'un systme. Un cble est compos d'un ou plusieurs fils entours d'une ou de plusieurs gaines isolantes. Il se termine chaque extrmit par un connecteur. Un cble se caractrise par ses composants (nombre de fils qu'il contient, matriaux utiliss, type de gainage...), son dbit et sa longueur. Les cbles mtalliques les plus utiliss sont les cbles coaxiaux et les cbles paires torsades. Les cbles paires torsades sont constitus d'une ou plusieurs paires torsades. Ces cbles transmettent la fois en analogique et en numrique. Les cbles coaxiaux permettent de transmettre avec de hauts dbits sur de longues distances : sur une longueur de 1 kilomtre, des dbits suprieurs 100 Mbits/s peuvent tre atteint. Le cble coaxial est utilis pour la communication large bande un cot encore significativement infrieur celui de la fibre optique... Les cbles fibres optiques utilisent des fils de verre trs fins (1/10 mn) et transmettent, avec un minimum de pertes, les informations codes sous forme de flux lumineux. Ils se caractrisent par un important dbit - plusieurs centaines de Mbits/s jusqu' plusieurs Gbits/s. Ils sont utiliss de prfrence pour la transmission d'images et de sons.

Canal
1. ensemble de frquences attribues une chane de tlvision. 2. support de transmission d'informations, par exemple, un cble, une liaison hertzienne, une bande magntique ou une simple feuille de papier.

Capture :
Transformation d'un signal analogique sur ruban en un fichier numrique sur disque rigide. Cette opration est ralise par la carte de capture (ou d'acquisition) vido.

Carte d'acquisition vido


Carte permettant de transformer la source analogique en numrique et de compresser les donnes pour que l'ordinateur soit capable de les traiter. La qualit de capture est tributaire de la puissance globale de l'ordinateur et des ses priphriques. Les cartes d'acquisition vido intgrent aussi gnralement un circuit audio pour une acquisition audio totalement synchronise.

Codec
Abrviation de COmpressor/DECompressor. Les codecs sont des algorithmes informatiques que l'on applique aux fichiers images, audio ou vido afin de rduire leur taille. Ainsi, les fichiers requirent moins d'espace de stockage. Ils requirent galement une bande passante moins importante pour la transmission en continu sur un rseau. Pour dcompresser un fichier, un utilisateur doit possder le mme codec que celui utilis pour le compresser.

Composante (YUV ou Y , R-Y , B-Y ou Y,Cr,Cb)


Technique de composantes couleurs utilisant les voies de chrominance du rouge (R-Y= 0,7 R 0,59 V-0,11B) et bleu (B-Y= 0,89 B -0,3 R - 0,59 V), la luminance tant restitue par (Y= 0,3 R + 0,59 V + 0,11 B).

Composite
Signal unique contenant les informations de luminance (noir et blanc), chrominance (couleur) et informations de synchronisation.

Compression
Rduction de la taille d'un ensemble d'informations.

Cryptage
Opration qui consiste rendre illisible une information en la modifiant suivant un algorithme. Le cryptage est utilis par les chanes de tlvision page et, en informatique ou en transmission, pour la scurit et l'inviolabilit des donnes. En vido et en tlcommunication, on prfrera le terme de brouillage.

Introduction la vido numrique

http://gillesboulet.ca

Page

18

Dbit numrique
Nombre d'lments unitaires d'information (bits) transmis par seconde par un systme numrique. Il s'exprime gnralement en Mgabits par seconde (Mbits/s)

Dbit numrique vido


Dbit de donnes en acquisition vido. Exprim en nombre de bits par seconde, il dpend du nombre d'images par seconde, de la taille de l'image et de la profondeur de couleur (nombre de couleurs diffrentes possible que peut prendre un pixel). Le dbit numrique choisi pour la capture vido doit tenir compte des performances du disque rigide.

DIB (device independent bitmap)


Fichier image universel non compress qui enregistre chaque point de l'image (pixel) et qui peut tre lu par n'importe quel logiciel de dessin. Ce format de fichiers, gourmand en mmoire, s'utilise pour les importations / exportations entre logiciels. En principe, il est destin tre compress, sauf s'il doit servir de rfrence pour d'autres travaux : le plus souvent un fichier dib ou bmp servira de "master" pour la compression gif ou jpeg.

Drop Frame
Le format 525/60 (lignes /trames) utilis avec le codage couleur NTSC n'a pas une cadence exacte de 60 trames par seconde mais bien de 59.94, soit 29.97 images par seconde - une diffrence de une sur mille. Le time code SMPTE donne attribue un numro spcifique chacune des images, au rythme de 30 numros la seconde. Le "Drop-frame time code" tablit une compensation en suatant deux numros d'image par minute, sauf la dixime. Il est noter que le systme PAL, lui, est exact et ne ncessite pas de "drop-frame".

DV
Systme d'enregistrement numrique grand-public prsent pour la premire fois en aot 1995 la Funkausstellung de Berlin. Principal avantage: la multi gnration possible sans dgradation de la qualit audio et vido. De plus la qualit d'image et de son se rvle suprieure ce que l'on peut attendre des quipements analogiques grand-public, et ce, malgr la compression de 1:5. La luminance est chantillonne 13,5 MHz et la chrominance 6,75 MHz (4:2:0). Le son peut tre enregistr au choix en stro sur 16bits/48KHz ou, toujours en stro sur 12bits/32KHz. On conservera alors deux voies 12bits/32KHz pour un doublage son ultrieur sur un magntoscope numrique. Autres caractristiques techniques: les bandes possdent des pistes de 10um et une vitesse de dfilement de 18,8 mm/s. Tous les appareils DV sont compatibles, quelle que soit la marque. Une cassette enregistre sur un modle Panasonic sera parfaitement lisible sur un Sony, etc. La dure d'enregistrement des petites cassettes (mini DV), exploites par la quasi totalit des camscopes grand-public est limite 60 minutes. Des cassettes de grande taille (de 120 270 minutes) ont t dveloppes pour les magntoscopes. Au nombre des atouts du DV: l'enregistrement systmatique d'une time code, les sub codes, le gel d'image, le mode photo, la possibilit lors d'un montage ultrieur d'insertion d'image seule.

DVCAM
Systme d'enregistrement numrique professionnel. Si tous les produits DV grand-public prsentent les mmes caractristiques, il n'en est pas de mme pour ds que l'on touche l'univers pro. Ainsi, le DVCam sign Sony se rvle incompatible avec le DVCPro de Panasonic. A noter: un magntoscope DVCam peut lire une cassette DV. Certains rares quipements DV, comme le magntoscope Sony DHR-1000 peuvent cependant lire des cassettes DVCam et les enregistrer en DV. Mais en rgle gnrale un camscope DV ne saurait lire du DVcam. Caractristiques de la bande: des pistes de 15um et une vitesse de dfilement de 28,2 mm/s. Structure d'chantillonnage chrominance: 4:2:0. Dure maximal des grandes cassettes: 184 minutes. Pour le reste on retrouve les mmes spcifications que pour le DV.

Introduction la vido numrique

http://gillesboulet.ca

Page

19

DVCPRO
Systme d'enregistrement numrique professionnel. C'est la version Panasonic du DV Pro. Sa spcificit: il utilise des bandes Mtal Particules, prsente de pistes de 18um et une vitesse de dfilement de 33.8 mm/s. Sa structure dchantillonnage de la chrominance est de 4:1:1. Dure maximal des cassettes de taille moyenne: 63 minutes et des grandes cassettes: 123 minutes. N'accepte pas de petites cassettes. Ct compatibilit: un magntoscopes DVCPro peut lire des enregistrements DV ou DVCam quelle que soit la taille de la cassette. L'inverse n'est pas possible et seul un lecteur DVCPro peut dcrypter une cassette DVCPro. Pour le reste, on retrouve les spcifications du DV.

DVCR
Magntoscope numrique se prsentant sous forme de disque dur amovible.

DVD
Initiales de Digital Video Disc ou Digital Versatile Disc. Norme de vidodisque comportant des sons, des images numriques et des donnes. Les principaux acteurs de l'lectronique grand-public, l'information et l'industrie du divertissement se sont entendus sur les normes du DVD. Les fondateurs, qui se sont dclars le 24 janvier 1994, ne sont autres que Matsushita, Toshiba, Thomson, Hitachi, MGA, MGM/UA, Time Warner, Pioneer...Se sont notamment rallies cette alliance, les socits Sony et Philips qui dans un premier temps prvoyaient de faire bande part en commercialisant leur propre format de DVD. le vidodisque se prsente sous la forme d'une galette de 12cm de diamtre, d'une capacit de 4,7 Giga-Octets, soit une contenance 7 fois suprieure celle d'un CDRom sur une seule face. Il peut accueillir jusqu' 2h15 minutes de vido, qualit 500 points/ligne (MPEG2) et un son multicanal. Il devrait galement offrir des possibilits de multilinguisme (jusqu' 8 langues), de sous-titrage (32),un choix de rapport d'cran (4/3, Letterbox, Panscan et 16/9). Devraient galement tre commercialiss dans le futur des disques de 8,5 Go (4h) double couche, toujours sur simple face, ou encore des 9,4 (4H30) et 17Go (9H) double face/double couche. Interviendront aussi l'horizon 2000, des disques enregistrables une fois (3,8Go), voire rinscriptibles (2,6Go). Ds 1997 tous les majors de l'lectronique devraient sortir leurs lecteurs DVD. Les modles des diffrents constructeurs seront compatibles.

Echantillonnage
Pour tre numris, le signal vido ou audio modul doit d'abord tre dcoup selon des intervalles de temps prcis, selon une certaine frquence d'chantillonnage d'ailleurs trs leve (13,5MHz en numrique DV, par exemple). En effet, les chantillons unitaires doivent tre assez brefs pour reproduire fidlement les variations les plus fines et rapides de la modulation.

Fibre optique
Fibre constitue de silice ou de matire plastique utilise pour le transport de rayons optiques. Un systme fibre optique est un systme de transmission d'informations par cbles fibre optique utilis en tlphonie, tlmatique et tlvision.

Format d'cran
1. Taille de l'cran exprime gnralement par la dimension de sa diagonale (par exemple : 14 pouces, 17 pouces, 55 centimtres). 2. Rapport entre la largeur et la hauteur d'un cran (par exemple : 4/3, 16/9). Les crans les plus courants en tlvision ou en informatique ont un format 4/3, c'est--dire qu'un cran de 15 pouces (diagonale) a une largeur de 12 pouces et une hauteur de 9 pouces. La tlvision haute dfinition utilisera le format 16/9, plus proche du format du champ visuel et du format utilis au cinma.

Introduction la vido numrique

http://gillesboulet.ca

Page

20

GIF (graphics interchange format, Compuserve) :


Compression d'images non photographiques (dessins comportant des aplats de couleur). Le gif produit des images en 256 couleurs, sans dgradation. Une variante de ce format permet d'enregistrer des animations image par image (animated gif). Extension du nom de fichier : gif.

Interactivit
1. Type de relation entre deux systmes qui fait que le comportement d'un systme modifie le comportement de l'autre. 2. Proprit d'un message qui donne la possibilit l'oprateur qui le reoit d'intervenir sur le droulement du programme qui l'a mis. S'oppose linarit. 3. Ensemble des techniques et des procdures mises en uvre pour confrer cette proprit un message. Les diffrents degrs d'interactivit dpendent du support utilis et de l'metteur du message : une conversation peut tre trs interactive ou au contraire tomber dans le monologue, un livre peut tre un support interactif (ex : Bottin). Les supports lectroniques permettent diffrents niveaux d'interactivit. Comme dans un livre, mais de manire plus souple encore, le spectateur peut naviguer son choix, sauter d'une squence l'autre, revenir en arrire, demander des complments d'informations sur un point particulier... Ce qui est nouveau par rapport au livre, grce l'informatique, c'est que le programme peut suggrer ou imposer au spectateur diffrents droulements du rcit, en fonction de donnes prcises (identit du spectateur, chemin dj parcouru, rponses fournies par le spectateur des questions explicites ou implicites) ou en fonction d'un choix alatoire effectu par la machine...

Internet
Rseau mondial reliant plus de 20 000 rseaux de toutes tailles et environ vingt millions d'utilisateurs rpartis dans tous les pays. Internet est le prcurseur des autoroutes de l'information. Il utilise la commutation de paquets. Le transfert des informations se fait un dbit variant de 240 caractres par secondes ( partir d'un PC reli une ligne tlphonique) 150 000 caractres par seconde. A ce dbit, on peut changer de la parole, des documents graphiques, des photos couleurs.

JPEG :
Norme de compression des images photographiques (en 16 ou 24 bits) base sur les travaux d'un groupe de chercheurs "Joint Photographic Experts Group". La compression s'effectue par perte de qualit Extension : .jpg

MJPEG (Motion Jpeg) :


Norme de compression de la vido drive du Jpeg. Chaque image est compresse individuellement, ce qui se prte bien au montage image par image et aux effets spciaux. Le taux de compression s'exprime par une fraction. Ex. 1:3 : l'image a t compresse d'un facteur 3. Entre 1:4 et 1:7 on parlera de vido de qualit S-VHS ; au-del de qualit VHS... 1:1 exprime une compression nulle.

Modulation
1. Transmission analogique : la modulation d'un signal (appel onde porteuse) consiste transformer une de ses caractristiques (amplitude, frquence ou phase) par l'effet d'un autre signal contenant l'information utile pour faciliter le transfert de ce dernier (transmission, enregistrement ou reproduction). 2. Transmission numrique : la modulation dsigne la technique de modulation par impulsion et codage et ses drivs.

Multimdia
Technique de communication qui tend rassembler sur un seul support l'ensemble des moyens audiovisuels (graphisme, photographies, dessins anims, vidos, sons, textes) et informatiques (donnes et programmes) pour les diffuser simultanment et de manire interactive.

Introduction la vido numrique

http://gillesboulet.ca

Page

21

Multiplexage
Assemblage de plusieurs signaux en un seul, appel signal composite ou multiplex, pour faciliter la transmission. Le multiplexage est un procd rversible : il est fait de telle faon que les signaux composants puissent tre nouveau spars lors de la rception du signal composite.

Montage
Action qui consiste crer une squence vido dfinitive partir de squences brutes ("rushes") ou d'autres vidos. Le montage consiste couper, coller, insrer des plans ou squences...

Montage linaire
En reliant 2 magntoscopes (copie A-B) on peut, partir de bandes contenant les rushes, crer une "premire" bande appele "master" produite par l'assemblage de squences mises bout bout. Il est noter que la production du "master" est dj soumise la dgradation de la vido lors de la copie.

Montage virtuel ou non linaire


L'ordinateur gre des directives de montage partir desquelles on peut produire autant de "masters" qu'on le souhaite. Il est donc trs facile de revenir sur la dure d'une squence, d'interpoler des crans, de substituer une squence une autre mme si leur dure est diffrente etc. sans avoir tout refaire car l'accs aux images n'est pas squentiel mais alatoire. Les fichiers obtenus sur disque dur permettent de mener plusieurs projets de montage, ce qui est impensable en montage "cut".

Morphing :
Dformation progressive d'une image 1 vers une image 2. Le "morphing" produit une squence anime. Ne pas confondre avec le "warping", simple dformation d'une seule image.

MOV (movie) :
Nom des fichiers de vido numrique de QuickTime.

MPEG (Moving Pictures Experts Group, fond en 1987) :


Groupe d'experts charg d'laborer des normes de compression d'images animes et sonorises. La norme MPEG, adopte en 1990, vise rduire la taille d'un fichier d'images de 100 200 fois. Elle a t retenue par Philips pour la numrisation de l'image anime plein cran du CD-I. La norme MPEG2, destine la tlvision numrique, adopte en 1994, rduit la taille des fichiers image dans un rapport 1/15 1/40, ce qui permet de disposer d'une qualit amliore par rapport MPEG1. La particularit de MPEG2 est de couvrir l'ensemble des applications multimdia (tlcommunications, audio, images fixes et animes, applications interactives), et les supports associs (bandes magntiques, disques compacts, ordinateurs, tlvisions). En images animes, les normes MPEG se basent sur une continuit du mouvement pour ne retenir que quelques images dans le temps, qui seront effectivement captes, les images intermdiaires tant calcules. Extension du nom de fichier : mpg.

MPEG 1
Mis au point en 1992, avec comme rfrence technique d'alors le lecteur de cdrom simple vitesse et son dbit de 150 Ko par seconde. Cette contrainte a ncessit la rduction de l'image vido avant sa compression. Le Mpeg1 ne traite que des images de 352 x 240/288 pixels (format SIF, Standard Image Format) non entrelaces. Le taux de compression maximale est de 26.

MPEG 2
Propos en 1994, reprend la totalit des algorithmes de Mpeg1 qu'il optimise avec quelques complments. Il peut traiter des images de 752 x 480 pixels. Cette compression a t pense avec comme rfrence la tlvision numrique et le lecteur de DVD (dbit de 1200 Ko par seconde au minimum). N. B.: Il n'existe pas de Mpeg3. Les fichiers mp3 (fichiers son compresss de qualit CD Audio) appartiennent en fait la norme Mpeg1 pour l'audio (Mpeg Audio Layer3).

Introduction la vido numrique

http://gillesboulet.ca

Page

22

MP3 (Mpeg Audio Layer3) :


Norme de compression du son de qualit CD Audio. Un fichier compress cette norme occupe environ 1/12 de l'espace de son quivalent en wav. 3 minutes de musique occupent 30 Mo en wav et seulement 2 Mo en mp3. Ce format a d'ores et dj un norme succs car il permet de diffuser de la musique sur Internet. Extension du nom de fichier : mp3.

NTSC (National Television Standards Committee) :


Procd de tlvision couleur utilis aux U.S.A. et au Japon. 525 lignes, 60 trames par seconde, 30 images par seconde. Voir aussi PAL, SECAM.

Numrique (vido numrique) :


La vido est code par une suite de 0 et de 1 qui dcrivent prcisment chaque image. Le numrique est inusable (on peut lire un fichier numrique sans altrer son support) et n'est pas soumis la perte en cas de copies successives, contrairement aux copies de bandes bandes. L'norme flux de donnes ncessaire rend indispensable la compression.

PAL (Phase Alternative Lines) :


Procd de tlvision couleur utilis en Europe. 625 lignes. 50 trames par seconde, 25 images par seconde.

QuickTime ( Apple) :
Vido numrique dveloppe par Apple Computers pour le Macintosh puis porte sous Windows. Extension du nom de fichier : mov.

Rseau
Ensemble des moyens de transmission et ventuellement de commutation permettant l'change ou la diffusion d'informations. Un rseau Multimdia transporte des images, des donnes et des sons et permet ses utilisateurs de ragir de manire interactive aux programmes qu'ils reoivent. Une grande similitude existe entre tous les rseaux, quelle que soit la nature de ce qu'ils vhiculent.

Rseau hertzien
Rseau utilisant les ondes hertziennes comme support de transmission. Il est aussi appel rseau de faisceau hertzien. Il s'oppose au rseau cbl et au rseau satellitaire. Un rseau hertzien est constitu de stations relais installes au sol pourvues d'antennes et rparties sur l'ensemble d'une zone. Aux tats-Unis, on ne compte que 4000 metteurs/rmetteurs contre 17000 pour la France, pourtant 20 fois moins tendue.

Rseau Numrique Intgration de Services (RNIS)


Rseau plus connu sous son sigle RNIS disponible sur l'ensemble du territoire franais depuis 1991 et capable de transporter des images, des sons et des donnes informatiques. Il est principalement utilis dans le monde professionnel mais a t conu pour quiper le grand public. La plupart des pays industrialiss mettent en place de tels rseaux, crant ainsi un rseau l'chelle mondiale caractre multimdia.

Real audio / real video ( RealNetworks )


Procd de compression du son et de la vido permettant le "streaming" c'est dire la consultation du contenu d'un fichier au fur et mesure de son tlchargement sur Internet. Extension du nom de fichier : rm.

Rush :
Squence vido brute qui vient d'tre tourne. On appelle "drushage" le premier travail de montage qui consiste couper les lments indsirables de ces squences brutes.

Introduction la vido numrique

http://gillesboulet.ca

Page

23

SECAM (SEquenciel Couleurs Avec Mmoire) :


Procd de tlvision couleur dvelopp en France. 625 lignes. 50 trames par seconde, 25 images par seconde.

S-Vido :
Evolution de la vido composite qui spare les signaux de luminance (Y) et de chrominance (C) Pour le matriel (magntoscopes, camescopes) on parle de S-VHS.

Tlvision
Littralement " vision distance ", la tlvision recouvre l'ensemble des actions et des techniques mises en uvre pour produire, transmettre et reproduire des images animes sonorises.

Tlvision par cble


Tlvision utilisant des rseaux cblos pour la diffusion de ses programmes, par opposition la tlvision traditionnelle utilisant les faisceaux hertziens. La tlvision par cble permet l'utilisateur de recevoir un plus grand nombre de chanes avec une meilleure qualit d'image. C'est elle qui permettra la tlvision interactive.

Tlvision haute dfinition


Nouvelles caractristiques de diffusion de tlvision permettant d'amliorer fortement la qualit de l'image (en se rapprochant de la qualit du cinma), et de profiter d'un son strophonique.

Tlvision hertzienne
Tlvision dont la diffusion est faite par faisceaux hertziens relays partir de stations mettrices et rmettrices.

Tlvision interactive
Type de tlvision dans lequel le tlspectateur a une possibilit d'action sur le programme qu'il regarde : par exemple, la possibilit de choisir parmi plusieurs angles de vue lors d'une retransmission sportive ou de demander des dtails sur telle ou telle information pendant une mission ou de choisir sur catalogue un film ou une mission (vido la demande). L'interactivit est encore trs limite par rapport celle que peut offrir un systme informatique. Les principaux champs d'application de la tlvision interactive sont pour l'instant : les jeux, le tlachat, la vido la demande. Un systme de tlvision interactive est compos, en principe, des lments suivants : un terminal dcodeur dsembrouilleur, un systme de commande, un serveur multimdia de forte puissance, un systme de navigation grant l'accs aux chanes, un rseau permettant une voie de retour des commandes des tlspectateurs vers le serveur d'images.

Tlvision numrique
Type de tlvision o les signaux sont traits sous forme numrique d'un bout l'autre de la chane de l'image, du capteur de la camra jusqu'au rcepteur du tlspectateur : la production, la transmission, la diffusion, la rception et le stockage sont numriques.

Transmission en continu
Mthode de transmission du contenu, dans laquelle le contenu multimdia est situ sur un serveur, puis lu grce l'envoi des donnes sur un rseau en flux continu. La transmission de donnes en continu permet d'couter ou de visionner une squence audio et vido immdiatement plutt que d'attendre le tlchargement complet du fichier.

Introduction la vido numrique

http://gillesboulet.ca

Page

24

Transmission en continu intelligente


Type de transmission en continu qui dtecte les conditions du rseau et ajuste les proprits d'un flux vido ou audio afin d'obtenir une qualit maximale.

Vitesse de transmission
Vitesse laquelle un contenu vido et audio numrique est transmis en continu depuis une source, telle qu'un fichier, afin d'tre correctement restitu par un lecteur, ou vitesse laquelle un contenu binaire est transmis en continu sur un rseau. La vitesse de transmission se mesure gnralement en kilobits par seconde (Kbits/s), par exemple 28,8 Kbits/s. La vitesse de transmission d'un fichier ou d'un flux de donnes en direct est dtermine au cours du processus de codage, lors de la cration du flux. La bande passante correspond la capacit de vitesse de transmission totale d'un rseau. Pour qu'un contenu audio et vido soit correctement restitu lors de sa transmission en continu sur un rseau, la bande passante du rseau doit tre suffisamment leve pour prendre en charge les vitesses de transmission de tous les contenus transmis simultanment.

WAV
Format de fichiers son introduit par Microsoft dans Windows. Peu ou pas compress, ce format produit des fichiers volumineux. Extension du nom de fichier : wav.

Y/C
Norme vido qui code les signaux de luminance et de chrominance sparment . Est utilise par le format S-VHS.

Introduction la vido numrique

http://gillesboulet.ca

Page

25

Academy
Cr en 1910. Restera le standard jusqu'en 1927. D'abors ratio 1,37:1, sera rduit 1,33:1 de 1927 1953 pour laisser de la place la piste son optique.

1,33:1

Cinrama
Le plus large des formats jamais employ. Dvelopp par la Paramount et utilis ds 1952, il ncessitait l'emploi de 3 camras et 3 projecteurs. L'cran courbe accentuait l'effet panoramique.

3:1

Camera 65
Dvelopp par la MGM. L'image est anamorphose par une lentille cylindrique. Il n'y eut qu'une dizaine de films tourns dans ce format.

2,76:1 Cinmascope
Utilis pour la premire fois par la Fox en 1953. Utilise aussi une lentille anamorphique compresse sur la largeur comme pour le format Panavision. Le format Cinmascope n'est plus utilis depuis 1965.

2,55:1

Panavision
Utilise aussi l'anamorphose pour la projection. C'est le standard le plus utilis aujourd'hui.

2,35:1 Super Panavision 70


N'est plus utilis. Quelques films clbres tels, par exemple, My Fair Lady et Exodus ont t tourns dans ce format.

2,20:1 Academy Flat


Le grand standard actuel pour les films tourns en 35mm .

1,85:1 Tlvision 4:3 1,33:1


Standard TV pour toutes les missions hors cinma. Il est aussi utilis en photographie 35mm. Correspond exactement au format Academy de 1,33:1

Tlvision 16:9
Trs proche du Academy Flat de 1,85:1. Standard d'affichage adopt pour la HDTV. Le choix du 16::9 tient aussi au fait qu'il s'agit d'un multiple de 4:3 (4:3x4:3 = 16:9)

1,77:1

Introduction la vido numrique

http://gillesboulet.ca

Page

26