Vous êtes sur la page 1sur 43

Universit de Technologie de Belfort Montbliard

par S. Lamrous

La vido numrique

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

Ire partie : De lanalogique au numrique


Dfinition :
La vido regroupe l'ensemble des techniques permettant la visualisation ou l'enregistrement d'images animes accompagnes de son, sur un support lectronique et, non de type pellicule argentique. Le mot vido vient du latin video qui signifie je vois . C'est un terme abrviatif de vidophonie ou vidogramme.
(source: http://www.techno-science.net)

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

Les camras vidos


Fonctionnement dune camra vido
Premire tape : La lumire issue de lobjectif est dcompose en ses trois composantes primaires rouge, verte et bleu Chaque composante est ensuite envoy sur un capteur qui ragit lnergie lumineuse reue en mettant des lectrons
Le signal lumineux est transform en signal lectrique analogique

Un peu dhistoire.
Les premires camras vido : utilisation de tubes cathodiques balayage pour convertir lnergie lumineuse en nergie lectrique. Dans les annes 50 :
Un seul tube par camra => des images en noir et blanc (niveaux de gris)

Plus tard, intgration de 3 tubes => rception et traitement spar du rouge, vert et du bleu
3

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

Les camras vidos


Les premiers inconvnients
Fragile
fabrication en verre surface photosensible

Phnomne de rmanence
traine lumineuse sur les zones fortement claires de la scne lors des mouvements de camra

Sensibilit aux champs magntiques


une camra ne fonctionnait que dans des environnements exempt de tels champs

Ncessite un rglage parfait des 3 tubes


5

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

Les camras vidos


Milieu des annes 80 :
Les capteurs CCD (Charge Couple Device, ou dtecteurs couplage de charge)
Un CCD = un rseau dlments sensibles la lumire (photosites) Un photosite gnre une quantit dlectrons proportionnelle lnergie lumineuse reue Permet de rsoudre les problmes des tubes cathodiques
Aucun phnomne de rmanence, avec une excellente sensibilit la lumire Insensible aux champs magntiques Rsistant aux chocs

1 CCD pour les camras et appareils photo grand public 3 CCD pour le matriel professionnel (amliore le traitement de chaque composante primaire Rouge, Vert, Bleu)
6

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

Le signal vido
Application du principe de la photographie numrique la vido
Une image = un ensemble de pixels Un pixel = des donnes RVB Une vido = un ensemble dimages Un exemple : Une vido dune seconde, utilisant 25 images par seconde Chaque image est compose de 720*576 pixels cods en RVB (1 octet par composante)
Soit une vido de 30 Mo/s stockage des donnes problmes de transport et de

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

Standards de la vido analogique


Formats de diffusion vido lis la tlvision analogique Chaque pays dispose de son format de diffusion.
NTSC (National Television Standards Committee)
Continent Nord-amricain et Japon Frquence du courant lectrique = 60 Hz Frquence daffichage du NTSC = 29,97 images par seconde (ips) sur 525 lignes

PAL/SECAM (Phase Alternating Line / SEquentiel Couleur Avec Mmoire)


En Europe Frquence du courant lectrique = 50 Hz Frquence daffichage du NTSC = 25 ips sur 625 lignes
8

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

Standards de la vido analogique


Les perceptions de loeil humain
Au moins 40 clats par seconde impression dclairement continu laide dune source lumineuse mettant de faon discontinue Une frquence de 20 40 impression de scintillement Audessous de 20 clairement saccad

Les trames
PAL/SECAM : 25 ips Chaque image = deux demi-images (ou trames) projetes successivement 50 clats par seconde impression de continuit parfaite 1 image = 1 trame des lignes impaires + 1 trame des lignes paires
9

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

Le signal vido analogique est donc dcoup en 25 ou 29,97 images (frames) par seconde, elles-mmes divises en 25x2=50 ou 29,97x2=59,94 trames (fields), celles-ci tant leur tour analyses en 312,5 ou 262,5 lignes Astuce de lignes incompltes (dbut, fin) pour amliorer la fluidit de laffichage des images successives

Trame paire

Trame impaire

Image
Limage complte obtenue par entrelacement des deux trames.
Le 10/06/2009

Ligne incomplte (systme PAL/SECAM) Pour le systme NTSC situation inverse

10

Universit de Technologie de Belfort Montbliard

par S. Lamrous

chantillonner la ligne
En vido analogique, unit minimale = la ligne Nombre de lignes standard utilis (PAL/SECAM ou NTSC) Nombre de points par ligne Image tlvise standard : la largeur de limage est 1,33 fois plus grande que sa hauteur
NTSC : 480 lignes 640 points par ligne
Cette rsolution thorique est lorigine du clbre affichage VGA de 640x480 sur les moniteurs informatique

PAL/SECAM : 575 lignes T (trame)

768 points par ligne

X (points par ligne)


11

Y (lignes)

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

Standard de la vido numrique


En 1970, prise de conscience de numriser la vido En 1982,
Adoption dun standard unique de la tlvision numrique de qualit broadcast, nomm Rec. 601 par lUIT (Union Internationale des Tlcommunications).
la qualit broadcast dfinit une vido dont la qualit technique (couleur et luminosit du signal vido notamment) la rende diffusable par une chane de tlvision Les camescopes grand public ne sont pas de qualit broadcast

Norme Rec. 601


Nombre de points actifs par ligne = 720 Nombre total de points par ligne
NTSC : 858 et PAL/SECAM : 864
12

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

Standard de la vido numrique


Norme Rec. 601
Nombre de points par secondes
PAL : 625 lignes/s * 864 points/ligne * 25 ips = 13 500 000 points/s NTSC : 525 lignes/s * 858 points/ligne * 29,97 ips = 13 500 000 points/s

En codage RVB,
13 500 000 points/s * 3 valeurs/points * 8 bits/valeur = 324 Mbit/s soit environ 40 Mo/s Une vido de 90 minutes 210 Go / vido 44 DVD

13

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

Principe des systmes vido analogiques


Principe de la tlvision noir et blanc
Une camra balaye l'image bidimensionnelle par un faisceau d'lectrons qui se dplace trs rapidement de gauche droite et plus lentement de haut en bas, produisant un signal lectrique en fonction du temps. Elle enregistre l'intensit lumineuse A la fin du balayage, le faisceau revient l'origine pour recommencer. Le rcepteur reoit lintensit en fonction du temps et rpte le processus de balayage pour reconstruire l'image.
14

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

La tlvision couleur
La tlvision couleur utilise ce mme principe de balayage Au lieu de balayer l'image avec un seul faisceau, elle en utilise trois, un par composante primaire : Rouge, Vert et Bleu A lmission, les signaux RVB sont combins linairement en un signal de luminance et deux signaux de chrominance, pour assurer la compatibilit avec les tlviseurs ou les missions noir et blanc.
15

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

Luminance et chrominances
La luminance quantit de lumire = niveaux de gris symbole Y
La somme des intensits lumineuses reues et transformes en courant lectrique par les trois CCD ddis respectivement au rouge, au vert et au bleu. Non linarit en luminance des tubes cathodiques fonction de transfert non linaire : la correction gamma nouvelles valeurs R,V et B Pondration de ces valeurs par des coefficients dtermins en fonction de la sensibilit variable de lil aux diffrentes couleurs primaires.
16

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

Luminance et chrominances
Luminance (ou plutt luma !)
Y = 0,299R+0,587V+0,114 B Y [0; 255] Y = paramtre luma (luminance) Pour des besoins de synchronisation et de traitement du signal, UIT Rec. 601 a rduit la plage de ces valeurs lintervalle : Y [16; 235] La formule de calcul de luminance devient : Y = 219 (0,299 R+0,587 V+0,114 B) + 16 220 niveaux :
la valeur 16 correspond au noir (R=V=B=0) la valeur 235 au blanc (R=V=B=255)
17

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

Luminance et chrominances
Les chrominances
Constituent les autres composantes du signal Informations concernant les couleurs
chrominance rouge (CR) chrominance bleu (CB)

(CR) et (CB) = la diffrence entre le signal de luminance et les signaux des couleurs rouge et bleu. expressions des chrominances CB et CR (Standard UIT-R Rec 601) : CB=128+128*(1/0,886)*(B-Y) CR=128+128*(1/0,701)*(R-Y) CB [-128;128] et CR [-128;128]
18

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

Luminance et chrominances
Image dorigine RVB YCRCB

V
"Monster Inc.", dessin anim des Studios Pixar 2001 - Disney / Pixar

CR

CB
19

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

Luminance et chrominances
Avantages Permet un tlviseur Noir et Blanc de recevoir les missions en couleur et inversement, un tlviseur couleur de diffuser les missions en noir et blanc.
Passage du signal RVB en composantes YCBCR autorise une rduction de flux dinformations transitant dans les cbles ou sur une onde porteuse. Adaptation de la quantit dinformation affecte chaque composante, en fonction des capacits et des performances spcifiques de la vision humaine.
20

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

Luminance et chrominances
La perception des dtails par lil humain est plus fine en niveaux de gris quen couleurs Or, la luminance niveaux de gris et les chrominances les couleurs
Le signal de luminance devra donc tre riche en information de dtail; Il est inutile de donner autant de finesse aux signaux de chrominances
21

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

Norme 4:2:2
La norme 4:2:2 dfinit le standard de production pour la vido numrique de qualit broadcast 100% de la luminance, 50% de CB et 50% de CR. Sans perte de qualit notable Rduction de 33% de la taille des donnes 8bits/composante 216 Mbit/s au lieu de 324 Mbit/s

Codage des lignes selon la norme 4:2:2 Luminance Chrominance(CR, CB)


Le 10/06/2009

22

Universit de Technologie de Belfort Montbliard

par S. Lamrous

Norme 4:1:1
Les valeurs de chrominance ne sont enregistres sur chaque ligne que pour un pixel sur quatre
100% de luminance 25% de chaque chrominance

23

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

Norme 4:2:0
Disposition co-sited

Disposition mid-sited

La chrominance est code 1 pixel sur 2, pour 1 ligne sur 2 Co-sited : les chrominances sont situes entre 2 valeurs de luminance, alignes sur la mme colonne (exemple: MPEG-2) Mid-sited : chaque chrominance est entoure de 4 valeurs de luminance
24

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

Normes 4:1:1 et 4:2:0


Norme 4:1:1 et 4:2:0
Equivalentes en terme de quantit dinformation totale Dans les deux cas la chrominance est divise par 4

Frquence dchantillonnage
De la luminance : 13 500 000 points/s soit 13,5 MHz Chaque chrominance : 13 500 000 points/s * soit 3,375 MHz Do : la frquence dchantillonnage requise par ces deux normes est de : 13,5 MHz + 3,375 MHz + 3,375 MHz = 20,25 MHz

Cette rduction de frquence dchantillonnage permet une rduction du flux dinformation


20 250 000 points * 8 bits/point = 162 Mbit/s (dbit total)
25

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

Rcapitulatif des diffrentes normes


en PAL/ SECAM
Normes

Luminance
Rsolution Horizontale Rsolution verticale

Chrominances
Rsolution Horizontale Rsolution verticale

Dbit Dbit utile en total en Mbit/s Mbit/s


248 166 124 124 324 216 162 162
26

4:4:4 4:2:2 4:1:1 4:2:0

720 720 720 720

576 576 576 576

720 360 180 360

576 576 576 288

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

IIe partie : La compression vido


La compression dun flux de donnes numriques repose essentiellement sur lexploitation de la redondance, cest--dire lexcs dinformation de type
spatial, temporel

27

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

La compression spatiale
Principe :
Exploite la similarit des pixels lintrieur dune mme image Images obtenues par ce type de compression nommes intra La 1re image dune squence vido de type intra

MJPEG (Motion JPEG)


Extension du JPEG (Joint Photographic Experts Group) Ide : Appliquer chacune des images dune squence vido les techniques de compression utilises pour les images fixes. Chaque image est traite indpendamment Avantage : permet le montage limage prs et les travaux de postproduction Inconvnient : faible taux de compression Adopt par le format DV (Digital Video)
28

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

La compression spatiale

29

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

La compression temporelle
Principe : Exploiter les similarits existant entre des images successives Identifier les informations redondantes dans le temps, mme si leur position dans limage a chang Compression temporelle unidirectionnelle Similarits entre image courante et image prcdente Image de diffrences = images delta
Image courante (n) Diffrences Image delta

Flux dimages

Image prcdente retarde (n-1)

30

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

La compression temporelle unidirectionnelle


Compression dune longue squence vido
Une seule image intra suivie dimages delta
Pour afficher une image quelconque, partir de la premire image intra, obligation de calculer toutes les images successives il est impossible de commencer la lecture dune vido au milieu dune squence

Images intra ou images de rfrence (key frame)

La solution propose :
Introduction dimages intra assez frquemment Compression de type Cinepak ou Indeo (Intel Video)
Une image rfrence intra suivies de 4 12 images delta

Images delta

31

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

La compression temporelle bidirectionnelle


Lors dun dplacement de la camra vers la droite, De nouveaux lments apparaissent sur limage. Limage n contient des lments prsents dans n-1 et n+1.
pour minimiser la taille des donnes enregistres, une analyse bidirectionnelle permet de ne mmoriser ni les lments contenus sur limage n-1 ni les lments de n+1

n-1

n+1 32

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

La compensation de mouvement
Mouvement des lments => augmentation des diffrences Compensation de mouvement = enregistrement de ces mouvements sous forme de vecteurs Compression bidirectionnelle et compensation de mouvement sont utiliss par lalgorithme de compression vido MPEG

33

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

IIIe partie : La norme MPEG


Entre 1989 et 1992, le Moving Picture Experts Group met au point une norme vido et audio permettant la diffusion vido numrique Norme adopte fin 1992 et baptise MPEG Algorithme de compression hybride de type prdiction transformation.
Hybride : plusieurs techniques de compression Une boucle de prdiction pour la compression temporelle Une transformation DCT suivie dune quantification pour la compression spatiale

Compression de type asymtrique


Le codage est quatre fois plus long que le dcodage
34

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

La norme MPEG
Plusieurs spcifications MPEG
MPEG-1 : vido numrique bas dbit (de 0,8 1,5 Mbit/s) MPEG-2 : amlioration de la qualit de la vido et adaptation des dbits plus importants (de 6 40 Mbit/s) MPEG-4 : norme de compression pour les applications ne disposant que de trs faibles dbits (exemples: vidophonie, multimdia mobile, surveillance, etc.)

35

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

MPEG-1
Objectif :
Permettre la restitution, partir dun CD, de 72 minutes de vido numrique plein cran (image et son) au rythme de 25 ou 30 images par seconde Soit 1,44 Mbit/s (contre 166 Mbit/s en norme 4:2:2)

Rsultat :
Qualit de la vido comparable celle obtenue partir dun magntoscope VHS Pas de qualit broadcast

36

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

MPEG-1
Mthode :
Rduction de format : norme 4:2:0, mid-sited, avec balayage progressif et non entrelac
On ne prend en compte quune trame sur 2 de limage originelle Et on ne conserve quun pixel sur 2 de cette trame Pour allger la chrominance, on passe de 4:2:2 4:2:0, ce qui permet de ne coder quun pixel sur 2, seulement pour une ligne sur 2
352 * 288 pixels pour la luminance, 176 * 144 en chrominance

Enfin, on compresse (comme dans MJPEG) les redondances spatiales.


37

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

MPEG-1
3 types dimages :
Les images intra ou images de rfrence, notes I
Redondances spatiales Ces images servent de rfrence pour le calcul des images P et B, ainsi que pour le dcodage. Une image sur 12 au moins doit tre de type I

Les images prdites P


Construites partir des images I laide de vecteurs de mouvement et calcul des diffrences

Les images bidirectionnelles B


I B B P B B P B B P B B I

10

11

12

13

38

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

MPEG-1
Agencement des images
Dcompression dune image P ncessite la prsence en mmoire dune image I Dcompression dune image B exige la prsence simultane dans la mmoire de 2 images:
(I et P) pour les images 2 et 3 (P et P) pour les images 5, 6, 8 et 9 (P et I) pour les images 11 et 12.

I
1

I
13

P
4

P
7

P
10

B B
2 3

B B
5 6

B B
8 9

B B
11 12

39

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

MPEG-2
Extension de MPEG-1 Objectif :
Traitement dimages entrelaces (2 trames = 1 image) pour une qualit quivalente ou suprieure celle des systmes vido composite avec un dbit de lordre de 4 8 Mbit/s et, pour des images de haute qualit, avec des dbits de 10 15 Mbit/s

Domaines dapplication :
Diffusion des chanes de tlvision numrique par cble ou satellite Distribution de vido de haute qualit sur disque compact DVD (Digital Versatile Disc)
40

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

MPEG-2
Compression spatiales et temporelles identique au MPEG-1 La diffrence essentielle = dfinition de plusieurs niveaux de qualit
Low level : 352 pixels par ligne, 288 lignes Main level : 720 * 576 pixels (rsolution UIT-R, Rec 601) High-1440 level : premier format de haute dfinition, soit 1440 * 1152 pixels High level : haute dfinition avec 1920 * 1152 pixels

41

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

MPEG-4
Beaucoup plus quune simple amlioration du MPEG1 et MPEG-2 Objectif :
Pour les applications de trs bas dbit (de 5 64 Kbit/s)

Mthode :
Nouvelle approche du codage et de la compression de limage anime et du son, fonde sur une analyse du contenu en objets mdias (visuels ou sonores) hirarchiquement structurs et susceptibles de traitements spcifiques Un objet = une personne, un arbre, une voiture ou encore une voix, une squence musicale, un bruit, etc.
42

Le 10/06/2009

Universit de Technologie de Belfort Montbliard

par S. Lamrous

Exercice
a. En mode composantes, il est possible dappliquer une frquence dchantillonnage deux fois moins leve pour le signal de chrominance. Combien dchantillons au total obtient-on par consquent pour chaque seconde de vido Rec.601? b. Avec une quantification sur 10 bits, quel sera le dbit numrique total ? c. Quel serait lespace mmoire exig par le stockage dun film de deux heures en norme 4:2:2 non compress ? d. Combien de temps faudrait-il pour transfrer une telle quantit dinformation sur une ligne ADSL haut dbit (20 Mbits/s) ? e. Quelle serait lconomie en termes de stockage et de dbit total en se contentant dune quantification sur 8bits au lieu de 10 ?
43

Le 10/06/2009