Vous êtes sur la page 1sur 205

TIV 2

Europe : freq de tram 50HZ


USA : freq de tram 60HZ
(2 standards diffrents) (le courant lctrique a une priode fixe de 50 ou 60 HZ par exemple)
Fin de cours 1, graphique : 3 situations diffrentes, une correspond la situation normale, puis on
observe que par exemple le niveau des noirs reprsent par une ligne, qui de base est plus basse par
exemple est relev, donc les noirs sont attenus et les niveaux sont plus levs.
Configuration efg eng ? Juste avec une cam ?
(six clos : dcor blanc d'un studio (une tenture noire, le fond bleu, le green screen, blue screen etc.)
Anecdote du prof
le rajout du second moniteur (a ne fonctionne plus) pq ? Signal de luminance transport de la cam
au moniteur (Equivalent de thvenin, norton (Simplification pour trouver la tension etc.)
L'avantage de norton et thvenin permet d'arriver qqchose de trs simple electriquement parlant.
La cam donne le courant, gnre une tension et cette tension fournit le waveform, c'est donc un
gnrateur de tension.
Le moniteur : c'est la rsistance, reoit le courant, symbolis par une rsistance d'entre.
Schma pg 78, montre le couplage camra moniteur, cam (source de tension et rsistance) moniteur
(rsistance)

Si on a un waveform et qu'on le connecte, ou le fait-t-on ? (sur le schma) il se trouve dans le


cble du schma 78 entre les deux petits points aprs la rsistance. On le connecte l'entre du
moniteur ou la sortie de la camra.

DESSIN 1
1 volt = puissance faible
faire en sorte que le couple transporte un maximum d'nergie de l'un l'autre, et que a s'affaiblisse
le moins possible, condition ? RS = RI les deux rsistances gales entre elles. (premire condition
pour que la P transmise soit la plus forte), deuxime condition, les frquences transmises sont
leves, pour cette raison l on doit adapter l'impdance au niveau de la transmission donc on prend
l'impdance du cble qui vaut 75 Ohms, des systmes avec imp. De sortie et d'entre = 75 Ohm
Ce qui nous intresse finalement c'est de voir ce qui se passe au niveau de la tension V.
Dans ce circuit, que va-t-il se passer ? Rsistance et gnrateurs ensemble, quand on a une tension
qu'on applique une circuit avec deux rsistances ? Qu passa ? Il y a un courant qui va passer du
gnrateur et qui va boucler par la terre, le courant il est quoi dans les deux rsistances ? Le mme.
Le courant est unique.
Le gnrateur de tension va gnrer un courant dans le circuit, loi d'ohm (V = R/I)
e=(Rs+Ri).I
v= (tension l'entre du moniteur) Ri. I
Le courant on le connait pas et il n'est pas utile donc on va l'extraire
I = V/Ri

donc,
e = (Rs + Ri) . V /Ri
v = e . Ri/Ri+Rs
Ri et Rs valent tous les deux 75 Ohms
Donc v = e/2 (75/150 = 1/2)
Si on est 700 mv au niveau du v sur le schma, au niveau du gnrateur de tension on est 1,4 v
(le double de 700)
Le gnrateur parfait de la cam fournit 1,4 v pour le blanc.
On fournit l'extrieur 700 mv pour le blanc, si on est au niveau du noir 0 mv, 2x0 = 0
DESSIN 2
(donc tout ceci concerne toujours l'anecdote et c'est la situation normale pour le calibrage cam
moniteur)
(Mnt on rajoute un second moniteur, on le connecte la suite du premier moniteur, donc c'est une
seconde rsistance)
Quand on connecte, on partage le courant, quel courant ? Celui de 1,4 V
1,4 V = blanc
-600 mv = synchro
0 V = Noir
700 mv = gris moyen
Qu'est ce qui change dans l'quilibre ? Le courant il se divise en deux, et comme les deux
rsistances sont les mmes, la moiti du courant passe dans Ri et la moiti du courant qui passe
dans l'autre moniteur. Ce qui veut dire que la premire quation n'est plus juste, on peut toujours
dire que e= R totale x le courant (I)
et que
La tension v = Ri.I (sauf qu'il n'est plus le mme) il vaut mnt I/2

Le gnrateur E induit une tension qui gnre un courant qui passe dans RS et une seconde perte de
tension dans la rsistance du premier moniteur qui est Ri x I/2
e=I. R + R. I/2
e= R.V/R.2 + R. V/R. 2/2 = 2V + V
e= 3V
V= 1/3.e
DESSIN 3
On peut pas empiler nimp quel quipements, les quipements sont connects par des signaux qui
sont du courant et des tensions, la loi d'ohm s'applique, le pbm arrive ici en connectant ce deuxime
moniteur, l'image devient plus grise, les blancs deviennent gris et donc tous les niv. Sont crass et
la bonne raction est de modifier le circuit lectrique et non ce qu'on voit sur le moniteur, car on
corrige sur la cam en montant le diaph et donc la tension va monter et dpasser 1,4 V donc
l'enregistreur va chopper ce niveau l, une image qui alors devient satur.
Il fallait garder 1,4 V la crte.
Solution ?
Distribuer correctement en mettant un amplificateur, regnre la cam sur plusieurs sorties
Ou
Un petit commutateur analogique pour les moniteurs, change l'impdance d'entre du moniteur et la
rendre infinie, si on change l'impdance d'entre (qui l vaut 75 ohms), si on la rend infini
(signifie ? Cb y a t'il de courant qui passe dans une rsistance infini ? Aucuns, donc la situation
donne un courant qui vaut 0 dans la deuxime entit et donc on retrouve 700 mv pour le blanc dans
la premire entit, mais alors on a pas de courant dans le deuxime moniteur ? Si si, on fait en sorte
que les circuits lectroniques de la cam soit gales l'infini, le moniteur mesure, la luminance est
proportionnelle la tension.
Un court circuit, appliquer la mme tension aux deux endroits. Impdance d'entre infinie, le
courant est alors nulle mais l'impdance est quand mme l .
ANALOGIE, la tension et l'eau, si on prend de l'eau, un barrage c'est une tension, si on prend le
niveau de l'eau en amont et en surface, c'est peut-tre 100 m, si on ouvre une vanne, l'eau coule et
quand l'eau coule, c'est l'quivalent du courant, elle change le niveau des deux cts et la tension
change. Si on fait pas couler d'eau, le courant change pas. (trolololol)
Pas de courant circule mais mme tension donc du coup on garde un moniteur avec une image
correcte.
Si on connecte rien la camra ?
Pas d'quipements, de moniteurs
que vaut la tension la sortie de la cam ? 1,4 V
Les signaux vidos c'est de l'lectricit, quand on change un circuit, on change les signaux, en
analogique p.e y a une liaison directe entre les niveaux qu'on vhicule et ceux qu'on affiche.
PICTURE LINE UP GENERATOR EQUIPMENT (PLUGE)
Permet de rgler le moniteur en noir/blanc
Mire compose de deux parties : une premire invisible, qui est la zone de noire gauche des 4
blocs. Si tu augmentes la luminosit tu peux les voir apparatre, dans les 3 barres (invisibles) les
niveaux sont diffrents.

Comment alors rgler le brightness du moniteur (DESSIN4)


Qu'est ce qu'on doit voir sur l'image du moniteur, l'image correcte ? On doit voir la troisime
colonne , la 5mv
-5 mv on n'est pas cense la voir, la 0mv c'est le noir tout court et le 5 mv c'est le gris
Le brightness permet de rgler l'talonnage du moniteur (Les niveaux, on dplace verticalement les
niveaux (noir blanc)
Contraste (c'est l'amplitude)
Comment s'assurer que le contraste soit correct ? On utilise la seconde partie de la mire avec les
4cases, chacunes a un niveau de gris diffrent (25% 50% 75% 100%)
Pour le rgler ? Faire en sorte que les niveaux de gris soient carts les uns des autres.
Quand c'est mal rgl (Slide) on voir que 3 cases.
Le contraste se rgle de manire faire en sorte que les 4 cases soient discernables.
DONC, brightness 3 barres et 4 cases pour le contraste.
AVEC TOUT CA ON A LE CONTRASTE ET LE BRIGHTNESS.

Waveform : reprsente les niveaux de tension de l'image, on envoi ligne par ligne
on regarde ligne par ligne ( EXERCICE 1 )
Ici on regarde toute l'image, on superpose tous les waveform des lignes de l'image.
En gros tu repasses chaque fois par la mme ligne, on les mets l'uns sur l'autre. Sinon faudrait
reprsenter 625 lignes, l c'est en mode image en gros !

Le PLUGE ne sert qu' rgler le moniteur.


Multiplex:dans la mme signal.
Lignes utiles : affiches
Lignes : 625 au totales (mais 575 585 affiches, utiles)
Y = 0,3 R etc.. (perception de l'oeil, sensibilit)
0 Y 1 (1 blanc)(0 noir) (analogique?)
0 RVB 1 (Numrique?)

Aspect frquentiels du signal de luminance

On filme une scne + cble qui relie cam et moniteur, tout est adapt
On allonge le cble mnt, une bobine de 200m et l'image devient floue.
Le fait d'ajouter ce cble floute l'image, on perturbe le circuit lectrique de nouveau.
Changement de tension, frquence leve, en analogique plus le cble est long moins bien c'est.
Tous les phnomnes physiques sont passe bas, donc les cbles sont passe bas.
La caractristique du cble en temps que passe bas influence et rduit le signal ?
Quelle est la gamme de freq qu'on utilise alors ? Pour de la vido par exemple 20 Khz c'est
beaucoup.
On sait pour l'instant que le signal est dcompose en image et l'image en ligne.
Sur base de cette info, calculons les plus hautes freq que l'on doit transporter dans le signal !
Bande passante : variations du signal
Essayons de calculer la plus grande bande passante, variation possible (maximum minimum
maximum minimum ou variation noir blanc noir blanc, cherchons donc la plus forte variation!)
Plus la frquence est leve plus les barres de l'image se rapproche

L'oeil est isotrope, il a les mmes proprits quel que soit l'angle de vue.
Que sait-on de l'image ? Elle est limite par des lignes, si on prend la frq. Verticale de l'image.
Si on sait qu'il y a 575,585 images, donc on a dfini que l'acuit visuelle pour la SD c'est 1 ligne
blanche, une ligne noire etc.. donc si on veut que la tl ait les mmes proprits verticalement que
horizontalement..(?)

donc sur le moniteur on va compter le nombre de lignes que l'on peut afficher verticalement et
horizontalement. Donc combien de cycles dans l'image ( N/b = 575/2)
sur l'cran, des 585 lignes par hauteur d'image, il y a 585/2 cycles cycles par image (cy/H)
mais si on filme une mire sur une camra, si on dplace verticalement la mire, d'une demi hauteur
de ligne, qu passa ?
Les capteurs ccd vont alors moiti fournir le blanc et moiti fournir le noir donc on obtient du
50%, du gris.
Donc mal cadr une mire a des rpercussions norme.
Solution ? Moins de lignes dans l'image, de plus grosses lignes par exemple.
Le nombre de lignes est dfini par le facteur de KELL (1 sur racine de 2 = 0,7, on ne prend que
70% la dfinition optimale de l'image)
On prend donc 30% en moins de lignes.
585/2 x 0,7 (cy/H)
On rduit la rsolution maximum de l'image avec le facteur de KELL.
L ce qu'on vient de faire c'est du verticalement

HORIZONTALEMENT
On pivote la mire de test de 90
Combien de lignes a-t-on mnt horizontalement ? a dpends du format, prennons le 4/3 tl donc
585/2 x 0x7 x 4/3 (Cy/L) on peut donc compter 33% en plus de lignes.
Comment traduire ces variations en Frquence ?
Passer de Cy/L (Cycle par largeur d'image) en Hertz (1 cycle par seconde = 1 hertz)
Diviser le nbr de variations par la dure de la ligne
25 variations sur 1 seconde = 25 Hz par exemple
la partie visible de la ligne dure 52 ms et 64 le tout.
(585/2x0,7x4/3)/52 ms = 5MHZ (5 millions de variations sur 1 seconde)
Le waveform de ceci nous donne un truc super frquentiel.

Le cble devra donc passer 5 Mhz, au maximum, le minimum c'est 0 (1 image qui est blanche, du
continu). VALEUR FONDAMENTAL. (dfinir la bande passante de la couloir, comment on
numrise l'image etc...)

liaison entre le contenu frquentiel et l'aspect de l'image ?


Que se passe-t-il si on peut passer moins de 5 Mhz dans l'image.
Analysons une image moiti blanche et moiti noir.
Waveform ?
(DESSIN 5) (Onde carre)
Fourier (application)
Dcomposition en srie : nimp quel signal priodique on peut le dcomposer en une somme de
sinusoides.

Ce signal (onde carre) on peut l'obtenir en superposant des sinusoides.


On part du continu (slide). (signal 0 1 donc moyenne = 0,5)
on ajoute la sinusoide, elle est dcale de 50% (DESSIN 6)
Comment on voit que les deux ondes (continu et sinusoide) se ressemble mais pas parfaitement,
pour amliorer la ressemblance, on ajoute une autre sinusoide, avec une frq particulire, la
sinusoide de base (1, s'appelle la fondamental) et on rajoute une deuxime sinusoide qui vaut 3x la
fondamental (DESSIN 7) puis x5 puis x7 puis x9, a tends vers mais a n'est pas parfait sauf si on
rajoute une fondamental quivalente l'infini x la fondamental.
(THEORIE DE FOURIER)
La sinusoide est la forme d'onde qui n'a qu'une seule frquence et nous permet de savoir quel

frquence on transporte (fondamental)


L'harmonique (onde base) puis tu montes, nom de la premire frquence.
Donc on a mit la continu puis la fondamental (harmonique 1)
(ON EST TOUJOURS SUR L'IMAGE A MOITIE NOIRE ET BLANCHE, C'EST SON
WAVEFORM).
Je suis un cble,
si on supprime la dernire harmonique du schma du slide, la 19e, le signal sera moins bon qu'avec
l'infini bien sur. Si on allonge le cble, on perd encore une harmonique, le signal sera de moins en
moins bons.
La grosseur du cble influence le filtre passe bas.
Si on filtre cette image noire et blanche on va avooir un dgrad

Slide suivant, on va jamais au noir et jamais au blanc.


La premire 500 KHZ
la 2 1MHz
la 3 2 MHz
etc...
1 peak sinusoide 500 Khz
Puis 1MHz
Bonne dfinition
Si on rduit la bande passante de moiti maintenant, la dernire sinusoides disparaissent pcq elles
sont filtres, si on rduit 2MHz les 5 Mhz ne passent plus (filtrs).
En filtrant le signal on a retir des composantes dans le signal, l'image devient de moins en moins
composes.
Si on met a bout bout (slide, qualit de l'image)
si on passe de 5 3 Mhz, elle sera moins dtailles, LES FREQUENCES CE SONT LES
DETAILS .
Si on garde que les hautes frquences, on aura que les contours. (3 Mhz vers la droite du schma,
donc les hautes frquences donc de 2 5MHz pour les hautes frquences).
Reprenons l'image noire et blanche, si on la met dans un petit cble, on aura une image quivalente,
et le waveform d'origine.
Si on allonge le cble maintenant, on va avoir une image avec dgrade.
(SLIDE)
Pour l'image multi burst. Les barres de droites sont perdues (ajout de cble)
(ajout de cble 2) on aura plus que 1,2 mga qui passe.

On prend un cble trs court avec l'image d'origine


Les hautes frquences reprsentent les dtails de l'image, si on filtre = floue
Frquences basses = aplats

C'est progressif, ds les premiers m du cble, y a dgradatio

Aspects temporels du signal couleur

La couleur est rgie par le fonctionnement de l'oeil humain


Lois de grassman.
Au nombre de 3 :
La premire dit qu'il faut 3 paramtres pour reprsenter une couleur. (cone rouge vert et bleu)
Moyen : de vhiculer 3 signaux, les mmes que ceux qui sont utiles aux cones de la vision humaine
(R V et Bleu)
RVB, pas n'importe lequel, correspondent aux primaires vues.
On analyse l'image et on en retire cette quantit de couleur.
Si on prend des barres couleurs.
Si on prend le signal vert (Slide) y a du vert dans les 3 premires barres.
(cble du vert, il y a 3 cbles) (WAVEFORM DU VERT)
WAVEFORM DU ROUGE (il passe de 0 700 puis 0 etc..) il est dans le blanc, jaune, magenta et
rouge. Pas de synchro par contre cette fois, On transporte la synchro dans le vert !!! on ne voit pas
la synchro dans le rouge
WAVEFORM DU BLEU (pas de synchro non plus) (1 barre sur 2) (blanc, cyan, magenta, bleu
fonc)
ON A DONC VU JUSQUE LE SIGNAL NOIR/BLANC, LE RVB
R Vs (pcq la synchro est l) B (3 cbles)

Toutes les cartes VGA utilise ce type l (pour les pcs)


En vido on n'utilise pas a.
Non sens historique (dans les annes 60, on commence installer la tv couleur, on a un parc de
tlviseur compos de bcp N/b et de quelques tlviseurs couleurs)
Non sens conomique
Un tlviseur N/B reoit comme unique signal : la luminance.
Il faut 3 param. Pour la tl couleur, pour que les tl reoivent une chane en couleur, il faut moins
la luminance, donc Y.
Grassman, pour avoir de la couleur, il faut 3 paramtres (Y obligatoire), les autres ? Y V B Par
exemple car Y = 0,3 R + 0,59 V + 0,11B donc si Y V B, R = Y 0,3 R + 0,59 V + 0,11 B.
COMPATIBILITE DIRECTE (pour que tous les tlviseurs ait ce qu'il faut pour avoir de la couleur,
ceux en NB non mais au moins ceux qui ont achet un tv couleur ont de la couleur)
TV nb = Y, 0,0
Le choix des paramtres.
Y, R-Y, B-Y
Y = 0,3 R + 0,59 V + 0,11 B
R Y = R 0,3 R 0,59 V 0,11 B
= 0,7 R 0,59 V 0,11 B
B-Y= B 0,3 R 0,59 V -0,11 B
= 0,89 B 0,3 R 0,59 V
N/B (condition) = R = V = B
Remplaons R par V et par B
Du R partout
= 0,7 R 0,59 R 0,11 R = 0
Remplaons B et R par V
Du V partout
= 0,7 V 0,59 V 0,11 V
Donc quand l'metteur met Y, R-Y, B-Y, il ne reoit que Y.
Y, 0, 0.
WAVEFORM de ces 3 signaux.
Calculer R-Y et B-Y (EXERCICE 2)
Pas de synchro pour R-Y ni B-Y car a passe en dessous de -300 MV sur la waveform
Mode parade : afficher les trois signaux en ligne l'un derrire l'autre.
Pour voir si tout rentre dans la waveform.
Cr et Cb, numrique de R-Y et B-Y
Reprsentation RY BY en diagramme

(DESSIN 6)
2. (couleur bordeau) Dsatur (plus de blanc ou de gris) (entre 0,2 et 0,4 Y) Ceci permet en
reprsentant les points qu'on a un axe d'cart par rapport au centre qui donne la saturation de
la couleur, plus elle est vers le centre plus elle sera proche du gris, dsatur.
3. 3.1 (Orange) en interprtant la position dans l'espace, l'cart par rapport au centre et l'angle
on peut interprter la couleur et la saturation.
4. Si on change la luminance, on obtient diffrentes valeurs de couleurs (dpends de 3
paramtres, Y RY BY)
Slide diagramme spectrale
Tonalit = angle.(ou teinte)
On retrouve les 3 conditions pour une couleur selon grassman mais de manire diffrentes, plus R
RY BY mais l'angle pour la teinte, la saturation,

Il y a plusieurs vecteurscopes selon les units qu'on a

R-Y en vertical, B-Y en horizontal, toujours !


(vecteurscope = cercle)
On peut un peu dpasser les 700 mv pour les dtails dans les blancs, overheight
Transport de 3 signaux (3 cbles) Y RY BY
Dfauts dans l'image (calendrier?)
Les contours de la chrominance sont dcals, signaux dcals.
Pourquoi ? Si les cbles n'ont pas la mme longueur, a dcale les signaux.
Chrominance et luminance dcales.
Solution : le patch.
Si prsence d'un dfaut, comment le mettre en vidence ?
Comparer deux signaux
Y R-Y
et
Y B-Y
Cmt ? On cre une image ou Y varie comme une sinusode, a devient des barres verticales
On prend une freq. Particulire, on cre l'image tel que B-Y soit une sinusode qui n'a pas la mme
frquence et on fait en sorte que les deux signaux, sinusode soit en phase, ait la mme valeur au
milieu de l'image, si on fait la diffrence entre les deux a donne une sorte de noeud papillon, on a
videmment 0 au milieu de l'cran.
500 kHz pour y
510 kHz pour BY RY

Aspects frquentiels du signal couleur

L'oeil voit moins prcisment en couleur qu'en noir et blanc.


Parce qu'il y a une lentille dans le chemin optique, elle difracte, pour le cristallin de l'oeil c'est ce
principe, les composantes RVB ne se retrouve pas au mme endroit dans l'oeil. La position des
cnes ne tient pas compte des dcalages. On voit donc plus flou en couleur.
View finder en noir et blanc pour plus de dtails.
5Mhz par couleurs = 15MHz au total, or non on n'a pas la mme puissance de signaux pour chaque
couleurs.
On passe chaque signaux dans un filtre donc l'image sera floue car elle n'aura plus 5 Mhz, pour
rajouter du dtails on va aller en chercher dans Y. On prend la partie haute du contenu frquentiel de
Y, les contours, en le filtrant en passe haut pour rcuprer du dtails. On additionne les deux, on
retrouve une image si on choisit bien la valeur des filtres : l'image correcte.
Compression non destructrice (poids)
Quand on place le filtre 1/4 de labande passante, dans ce cas l l'oeil ne voit pas de diffrence
entre l'image non filtre et l'image filtr.
K = 0,25

Quand on fait le calcul de la bande passante, on a 1,25 1,25 ,125 Mhz par couleurs et 3,75 Mhz de
luminance (car 3x 1,25)
BANDE PASSANTE DE LA COULEUR = 7,5 Mhz

qu'est ce qu'on fait de la bande passante ?


On rpartit la bande passante sur les trois signaux, on donne 5 Mhz pour Y et 1,25 pour R et 1,25
pour B. (R-Y et B-Y).
Comparaison des barres de couleur
RVB en dessous.
Comment savoir comparer les signaux (dans le slide rvisions) Y RY BY, Bande passante plus
faible (5 Mhz vs 1,25 Mhz et plus la bande passante est faible plus les variations sont lentes).

TIV 3
SYNTHESE

waveform : traduction temporelle du signal.


R-Y c'est la mme chose que pour y sauf que son waveform est diffrent.
Y : synchro et les signaux varient entre 0 et 1.
la condition pour qu'on ait du noir et blanc il faut que R=V=B
si on choisit Y R ET V
R-Y et B-Y s'annule quand on fait du noir et blanc, solution qui permet d'avoir la couleur quand
c'est ncessaire sans pour autant empcher les tlviseurs noirs et blanc d'afficher du noir et blanc.

Cours 3, dbut.
200
201
Schma fiff pour une webcam live
par exemple : (Camra stream live internet)
Camra connect un encodeur qui va vers le web
rgie (local)
mlangeur (outil)
Habillage
Sortie du mlangeur, on part vers du stream
ENG : nom utilis pour les camras seules qui vont filmer des sujets. (electronic news gathering)
Play out : sujet pr mont, diffusion du sujet, insr dans le flux gnral.
PGM : signal final de la rgie (Programme) (signal avec le composite et tout dedans)
202
En amont pour alimenter le serveur avec les squences diffuser on a la chaine de post prod, station
d'ingest, du montage, etc. + stockage online + archivage
Broadcasting : diffusion
Feed : dans des missions on rajoute des images en live qui viennent de l'extrieur. Camra sur
place avec transmission satellite.
Schma : 3 catgories de signaux (3 couleurs), la partie centrale, toutes les flches oranges =
signaux en temps rel, la camra envoi son image en temps rel au mlangeur, le serveur envoi tout
en temps rel au mlangeur, les signaux temps rels. Quand on regarde la partie post prod, ce qu'on
n'change ce sont des fichiers, pas des signaux, (un blu ray, une carte mmoire : on peut pas mettre
un waveform pour voir l'intrieur ce qui se passe) on change donc entre les diffrents lments
des fichiers qui sont stock pour tre soit diffus aprs soit diffus en live donc on utilise des
serveurs qui vont stocker les fichiers (archivage ventuels)
Le temps rel (Live)
Les signaux dans le schma live, on a une contrainte de dimension pas trs grande, on doit
transporter les fichiers live une certaine distance, les camras sont rarement 3km de la rgie. La
distance ne sera pas 200 km sauf si c'est un feed quoi avec dportation de moyen sur place et les
transmettre par un canal de transmission qui a des contraintes contrairement au moyen via cble
vido car on maitrise l'environnement. A Longue distance on ne maitrise pas l'environnement, les
chanes tl n'ont pas de satellites, elles doivent louer des canaux de transmission.
Quand on loue un canal satellite, on paye au Mbit qu'on utilise. (Feeds : contribution)
Broadcasting, transmission, diffusion, full contraintes aussi pcq on doit atteindre beaucoup de gens,
pour faire en sorte que bcp de gens regardent, donc contrainte sur le dbit qu'on va envoyer car la
connection internet des gens est faible dbit, pareil pour la tl.
4 types de signaux diffrents au total, ceux sans contrainte, ceux temps rel mais qui ont la
contrainte de devoir passer par un petit tuyau + problme de dbit, signaux temps rel mais il faut
l'envoyer beaucoup d'endroit donc on rduit le dbit encore plus, + les signaux qui sont des
fichiers en ralit.
(Non HD)
Feeds : de l'ordre de 20 30 Mbit par seconde

Live : de l'ordre de 300 Mbit par seconde


Broadcasting : de l'ordre de 4Mbit par seconde
SIGNAUX NUMERIQUES
Signaux SD (Norme UIT 601)
204

Signal Y, version analogique (gauche)


Numrique : transform en flux binaire (0 et 1) on va qqlpart retrouver un stream avec un flux en 0
et 1.

205

Comment faire ? Donc, pour avoir de l'analogique on a fait deux sgmentations, une lie au temps,
25 images par seconde, 50 demi images par seconde qui s'enchane dans le temps donc on ne tient
pas le compte de ce qui se passe pendant 2 instants d'chantillonnages (?) puis on a dcompos
l'image en ligne et dans ces lignes la luminance B-Y il y avaient des variations(?) de luminance(?)
maintenant on va donc ajouter un troisime niveau d'chantillonnage et dcompose ces lignes en
pixels et donc on a une variation sgmente, donc la valeur ne varie plus progressivement d'un point
l'autre de la ligne mais par secteur.
(205) image mal dfinie gauche : analogique, image mal dfinie droite : numrique
La version analogique : signal reprsent par une tension variant dans le temps
La version numrique :signal reprsent par deux niveaux (0 et 1)
(Faon de transporter le signal)
NUMERISATION
1.ECHANTILLONNAGE : prendre un chantillon un certain moment)
2.QUANTIFICATION ; Une fois qu'on a fait le 1. On va mesurer le signal, la mesure est encore
analogique, (niveaux de tensions) c'est de l'analogique mais chantillonn, avec les pixels tu as des
valeurs RVB donc a change chaque pixel contrairement l'analogique ou les valeurs varient tout
le temps. Puis on va faire la quantification(transformer l'cart de 0 1 en 0 256 par exemple)
(donner une chelle de rfrence et convertir les valeurs quantifie telle que 0,45 dans 206. en
411 ) (classement des chantillons par taille puis on leur donne la bonne valeur en gros)
3.CODAGE (transformer ces valeurs en binaire)

208.

Points jaunes = chantillons.


Si on ne prend que 1 chantillon, la valeur obtenue ne reprsentera pas la forme du signal
lectrique.
Trouver le bon nombre d'chantillons*
Pour a il y a des rgles....
Flche jaune = valeur relle de l'chantillon, qu'on va comparer par rapport l'chelle, (se trouve
entre deux graduations ou se trouve sur une graduation, on va insrer une petite erreur cela,
l'erreur de quantification) (l'chelle slectionn doit tre suffisamment petite que pour l'oeil humain
ne voit pas l'erreur en question!).
Codage : transformer le 940 en 0 ou 1 donc a donne 1110101100
On avait dcid en analogique que la synchro tait par niveau (0 et 700 mv = (?), -300 mv etc..) a
veut dire que c'tait dj une forme de numrique. En numrique, la synchro sur le slide 208, n'a pas
t chantillonn, c'est plus intelligent, mais comment la transporter alors ? Quid ?
209.

La bande passante dfinit le nombre de pixels. Reprsente le nombre de lignes verticales qu'on peut
mettre sur l'cran.
Le nombre d'chantillons (220.) au min. Un pour un pixel blanc, un pour un pixel noir, un pour un
pixel blanc etc... (une valeur prise pour chaque ligne verticale)
Si on prend un pixel pour chaque ligne verticale, on a combien d'chantillons par seconde ? On aura
alors 10 millions de cycles d'chantillons. 5MgaHertz = 5 millions de cycles par secondes.
Car 1 hertz c'est un cycle.
Si on a 5 millions d'alternances, 1 alternance =
Bulle 1 = mesure du noire p.e
Bulle 2 = mesure du blanc p.e
2mesures par cycles minimum donc 10 millions
d'chantillons par cycle
Donc freq d'chantillonnage : au minimum 10 MgaHertz
Thorme de Shannon, Nyquist : freq d'chantillonnage au minimum gale 2x la freq minimum
du signal
216 - 220

Spectre : 0 5 millions de Mhz


chantillonn un signal = multipli ces spectres autour des multiples entiers de la frq.
D'chantillonnage. Le spectre du signal chantillonn va tre beaucoup plus complexe.
Si on veut alors repasser dans l'analogique (pour l'oeil qui est analogique) (conversion en
analogique, faut bien pour l'oeil faon..)
Aliasing : si on ne cligne pas des yeux on ne verra pas le dfaut.

50 priode par seconde : Europe (PAL)


60 priode par seconde : USA (NTSC)
on veut que le nombre d'chantillons par lignes soit toujours le mme et que les chantillons soient
aligns verticalement les uns au dessus des autres.
221.

*
Les chantillons sont pas forcment les uns au dessus des autres, cmt faire en sorte qu'ils soient bien
aligns verticalement ? Il faut que sur une largeur de l'image on ait un nombre entier
d'chantillonnage (x).
la freq d'chantillon est un multiple entier de la freq. De ligne
Conditions :
1. la freq. d'chantillon est suprieur ou gale 2x la freq max
2. la freq. d'chantillon est suprieur au USA qu'en Europe.
3. la freq. d'chantillon est un multiple entier de la freq. De ligne
Bande passante = BP !
Frquence d'chantillonnnage = FE !
La FE est un multiple entier de la freq de ligne.
Freq. De ligne Europe = 15625 Hz,
Freq. De ligne USA = 15734 Hz
On veut que les deux FE soient les mmes. On va donc leur chercher un nombre commun, on fait
x144 pour l'europe et 143 pour les USA = 2,25 MHz
MAIS LA CONDITION 1 n'est pas respect ! Il faut dpasser 10 MHZ, donc on fait x6
= 13,5 Mhz. (FE Y)
L'lment principal de la fe ? La bande passante, 1,25
Freq. Maximale de Y = 5 Mhz
de R-y et B-y = 1,25 Mhz

FE minimum = 2,25 (x)


13,5 Mhz /2 = Fe R-Y, B-Y = 6,75 Mhz.
La bande passante (bp) de ry et by est 4x plus faible que celle de y, l'oeil percoit 4x moins de dtails
pour ry et by que pour y, si la bp de ry et by alors a veut dire que la condition change, ce n'est plus
5 Mhz donc plus 10 Mhz au minimum mais 2,25 Mhz min donc on est la freq minimum : 2,25
Mhz pour Ry et By.
Mais si on divise par 4 13,5 Mhz, alors a ne marche pas (144x6/4, a fonctionne, 143x6/4, a ne
marche pas , le chiffre n'est plus entier par contre avec 2 a fonctionne ! On paye plus, on a plus de
dfinitions pour rien au final car les yeux ne voient pas aussi bien mais au moins la freq. Est bonne
en europe et aux USA). (donc cette frquence divise par 2 a nous donne 13,5 Mhz/2 = 6,75 Mhz
pour la FE RY et BY)
(au cours pass freq maximum de ry et by = 1,25 Mhz et y = 5Mhz) (rappel*)
222.
223.
(Trs gros zoom de l'image)
1 chantillon sur 2 de RY ET BY vu que la FE est 2x moindre.
1er de la ligne portera Y RY BY (CR CB, idem que RY BY)
2e de la ligne porte que Y
drrire le pixel il y a 3 chantillons (Y CR CB) en gros.
Ce systme porte un nom : Du 4 2 2
224.
Combien y a-t-il d'chantillons par lignes ? 864 chantillons de Y par ligne.
13 500 000/15 625 (FE/FL (Freq. De ligne).
Combien dure un chantillon ? 1/13 500 000 (l'inverse de la freq. D'chantillonnage)
Combien y a-t-il d'chantillons de CR ? On divise par 2, 864/2.
donc 432 chantillons de CR et CB par ligne.
HORIZONTALEMENT
Des 864 on prend 720 chantillons de Y visible sur la ligne.
Et 360 pour CR ET CB.
Alors que donc l'image fait au total 864 chantillons de Y + 432 Cr et 432 CB
Alors qu'en vertical on a 625 lignes mais 576 sont visibles.
IMAGES AVEC DE PLUS EN PLUS DE NIVEAUX
226
2Niveaux (noir et blanc)
erreur de quantification : 350
227
4Niveaux

228
8Niveaux (toujours pas suffisant)
229
16Niveaux (idem)
230
32 Niveaux (au niveau des visages a devient correct, on voit encore quelques dfauts dans les
visages)
231
64 Niveaux
232
128 Niveaux
233
256 Niveaux (l'oeil a besoin de 256 niveaux diffrents pour mesurer la luminance)
Si on regarde la luminance, mesur entre 0 et 1 ou entre 0 mv et 700 mv en analogique, en
numrique on va utiliser 256 niveaux, degr sur l'chelle* pour arriver ce que l'oeil ne peroivent
pas de diffrences.
Erreur de quantification moindre au plus on monte dans les niveaux.
L'encodage, conversion en binaire, on va aller plus loin que 8 bits, la limite minimum est 8 bits, on
va souvent au dessus car on ne se contente pas que de l'afficher, on fait des calculs dessus aussi.
10 bits (1024 niveaux), norme trs rpandues.
Si on fait du traitement sur chacuns des pixels en 10 bits, l'erreur va tre masque dans ce que l'oeil
ne verra pas, on aura 4 x plus de niveaux qu'en 8 bits (256) on a donc suffisamment de dtails avant
que l'erreur ne devienne visible, si on fait du traitement c'est en 10 bits
On peut faire le mme calcul pour la couleur, l'oeil a besoin de la mme quantification pour CR et
CB.

235.
236.

Si RVB varie entre 0 et 1 alors Y et BY RY varie un peu diffremment


Mapper : lier
au 1024 niveaux disponibles
on va donc du niveau 0 1023
on va interdire des niveaux, les bloquer, 4 niveaux en bas et 4 en haut (de 0 3 et de 1023 1020)
Il reste 1016 niveaux pour transporter la luminance.
Pourquoi afficher du blanc plus blanc que blanc, pcq tous les tlviseurs n'ont pas tous le mme
blanc.
En analogique on a pris l'habitude de donc prendre des niveaux un peu en dessous de 0 (pas -300
non plus mais genre -50 mv) et (750 mv)
On a dtermin une zone de tampon pour aller un peu au dessus,dessous des zones nominales
La plage de valeur nominale (= normal), donc le 0 en grandeur colorimtrique correspond au niveau
64 en numrique, le 1 en grandeur colorimtrique correspond 940 en numrique)
64-940 valeur dcimale = niveaux de quantification (correspond au 1024 niveaux qu'on a)
On met le 0 512 pour qu'il soit au milieu de la plage.
+0,7 = 960 pour CR (Sur le schma)
Pour 8 bits tu fais /4
Pour 12 bits tu fais x4
Pareil pour BY (sur le schma)
Quand on est en dessous de 512
Valeur colorimtrique (-0,7 to 0,7) (numrique 512 etc..) (analogique en mv)

Exercice
Valeur de CR CB et Y en numrique.
(Le blanc et le jaune avec le prof)
(FEUILLE EXERCICE)
242

Le waveform a le mme aspect en analo qu'en num.


Ce qui change par contre c'est la synchronisation.
On a rserv des niveaux interdis.
03
1020 1023 (a fait 8 niveaux au total dans le 10 bits)
interdis, a aucuns moments on peut utiliser ces valeurs pour un code utile.
On peut pas avoir CB qui vaut 0 par exemple
a permet de mettre une balise dans le flux qui servira former la synchronisation, pour tre de ne
pas se tromper on va dans le flux pour indiquer que la synchronisation est l, on va mettre une
balise particulire. On va donc transporter dans le flux, la valeur 1023,0,0 (marque de valeur sure et
certaine le dbut de la ligne, on le fait deux fois sur le schma 242 d'ailleurs). (Ici il y a donc 2 top
de synchronisation qui en plus encadre la ligne utile).
(feuille dessin 2)
XYZ
1 F U H P3 P2 P1 P0 0 0
987 6 5 4 3 2 10
(Dessin 3)

XYZ c'est un mode 10 bit


1 FUHPPPP00 ce sont les 10 bits
(X)(Pas suivi)
Pourquoi 2 valeurs 00 fixe la fin, c'est pour la compatibilit avec le 8 bits.
1023 0 0 et le mode 0XYZ (40 bits) et vu que 1023 c'est le plus gros chiffre binaire en 10 bits a
vaut 1111111111 puis y a 2x 10 bits donc 2x (0000000000) puis le mode XYZ comme crit sur la
feuille sous le dessin 3 avec toutes ces modalits binaire crit comme telle sur le dessin 3, tout ce
truc correspond la synchronisation, au blanking vertical pour passer d'une trame une autre etc..
rcap 242, quand on arrive la fin de la ligne au dernier chantillon au 721e chantillon, on
retrouve le prambule qui recommence, 3chantillons spcifiques qui se suivent, ces valeurs sont
1023 (interdites) suivi de deux valeurs nulles aussi interdites donc aucuns moments on peut
confondre le prambule avec un niveau de la ligne, l'avantage c'est qu'il est unique caractristique et
reconnaissable, donc une fois qu'on la trouv le prambule drrire on a le mode XYZ avec 1 F U
Etc.. ce mode caractrise le pr ambule, si on est dans le blanking verticale etc.. donc le pr ambule
indique la synchro et XYZ la caractrise !
Les valeurs FVH nous permet d'avoir beaucoup d'infos
il y a deux modes synchro SAV au dbut et EAV en fin (Slide 243)
Les niveaux sont en dcimales, mais en ralit ils sont en binaires, et parfois mme en hxadcimal.
1023 en hxadcimal c'est 10 bit 1 ou 3FF
0 c'est 10 bit 0 ou 000 en hxadcimal.
On rajoute 4 bits d'info, (P1 P2 P3 P0) permettent de protger les valeur vfh et de corriger si il y a
une erreur (?) (slide 248)
XYZ
vfh (renseigne de manire utile en fct de la position geo dans l'image)
p1 p2 p3 p0 (bit, valeur de protection dduites des valeurs fvh)
247

249
si on regarde une ligne, c'est du 4 2 2
premier pixel y cr cb
le deuxime que y
comment a se prsente ?

(animation)
donc au bout du compte on a port 1440 chantillons (360 CB 360 CR 720 Y)
V=0?
H=1
F = sait pas si c'est la trame 1 ou 2
Puis on a une srie d'chantillon qui peuvent prendre n'importe quelle valeur
Ces donnes suppose inutile vont tre utilises pour des donnes auxiliaires, des tltextes, de
l'audio, on appelle a les ANCILARY DATA (dans le blanking horizontal)
H ANC pour ANCILARY DATE horizontal.

250
DERNIER BLOC DE SYNCHRO = 3FF 3FF 000 XYZ V=1
blanking vertical cache des donnes
ensemble de donnes non utilises car elles n'ont pas d'chantillons utiles, utilises pour des
donnes auxiliaires.
2fois 3FF car dernier bloc de synchro.

TIV 4
Rappel du dernier cours
paramtre chantillonnage (tape 1)
Dfinis par sa frquence.
Bande passante = analogique
Quantification (tape 2)
paramtre ? Cod en 1024 niveaux, 10 bits au lieu de 8 pour pouvoir aller un
peu plus haut que 100% et un peu en dessous.
Prambule : 1023 0 0 (3 premires valeurs interdites)
F trame
V le banking vertical ou horizontal
H en dbut ou en fin de ligne
P1 P2 P3 P0 Protge contre les erreurs de quantification.

Slide 250

V ANC : vertical ancilary data


H ANC : horizontal ancilary data
270 Mbit : dbit du signal qu'on a vu affich au slide 250.
13,5 Mhz (Y) + 6,75 Mhz (R-Y) + 6,75 (B-Y) = 27 Millions d'chantillons par
seconde.
27 millions chantillons par seconde et 10 bits par chantillons donc 270
millions de bits par seconde.
Freq chantillonnage x le nombre de bits par seconde = dbit
dbit = fe.n (exposant xn)
2 (exposant n) = nombre de bits, nombre de niveaux.
252.
Jeux olympique los angeles, rtb a les droits, rcupration des flux produit sur
place par les quipes international, chaque tv commente ces propres images
avec un commentateur sur place, on a un flux, et puis des dizaines de
commentateurs, sons diffrents. On doit vouter les signaux dans une salle
spcialise et les transporter vers la chane qui va les diffuser, pour l'image c'est

facile, le spectateur sait discerner diffrentes images les unes des autres alors
que l'audio c'est plus compliqu, il y a eu un pbm la rtb, or on a pas eu le bon
commentateur, ils ont pris un commentateur allemand, l'oprateur rtb devait pas
tre trs attentif. a a commut pendant le signal ? Le commentateur belge a en
clair, parl pour rien.
Solution : utiliser l'espace laiss libre dans le signal, H ANC, V ANC ? Mettre
l'audio dans la vido, et d'utiliser cet espace l pour transporter ce dbit
disponibles, ces donnes audio, donc l'audio sera accroch auto la vido.
Puis il faut sparer l'audio et la vido bien sur. On embede la vido (terme).
253.
EXERCICE
AES/EBU
FE = 48 Khz
Codage : 32 bits (ensemble pour un chantillon + codage) n = 32
L + R (Canal gauche et droit) (il faut 2 canaux)
Combien de pair stro on peut transporter dans le signal vido ?
(Moi)
864
720

=
144
625
576
=

49
720L
49 H
=35280
calculer le dbit zone verte et rose
combien de bits par seconde y a de donnes dispo dans ces zones (pr info)
pair stro 48 32 = 2 chantillons, divise l'un par l'autre et on a le nbr de canaux
dispos. Calculer le nbr de pixels puis chantillon puis bit
8 chantillons (synchro)
4 chantillons avant le signal vido utile et aprs pour chaque ligne (prambule
0 0 XYZ donc 4 chantillons)
40 bits sav
40 bits eav
80 bits par ligne
synchro est dans la zone H ANC (dbit total le dbit de la synchro le dbit
utile)
H ANC-40 bits
Bit par ligne x le nbrs de lignes x le nombre d'images.
(la synchro retire)
87500+ 35280
(total de pixels)
x2 245 560
(nombre d'chantillons)
x10 2 452 600
(nombre de bits par image)
x25 (nbrs de bits par seconde) 6 139 0000
(dbit par bit par seconde)
divise dbit audio par dbit vido
61 390 000 (vido)
48000x64
3 072 000 (audio)
=19,98
V ANC : 720x49 = 35 280
H ANC:625 x144 = 87500
1,
correction prof : (autre manire)
Dbit total = 270 Mbit/second

Dbit utile : 720x576 x2 x10 x25 = 207,36 Mbit/second


Dbit de la synchro : (retir la synchro) 4 (chantillons) x2 (car dbut, fin de
ligne) x10 (nombre d'chantillons) 625 (lignes par image) x25 (bit par seconde)
= 1,25 Mbit/second
Dbit disponible : 61,39 Mbit/s
Dbit audio : 48000x32x2 (gauche et droite) = 3,072 Mb/s
61,39/3,072=19,98, car 0,98 inutile, perdu adimensionnel, tu as de la place pour
19 canaux mais pas 0,98 canaux
On voit que globalement,dans le signal vido on a des donnes utiles, de la
synchro, des donnes auxiliaires pour transporter autre chose, etc..

slide 254.
UIT 601, 4 2 2 (rapport luminance chrominance)
mais les pixels sur l'cran c'est du rvb, par contre le transport se fait par cellule,
en CB Y CR, CB Y CR etc..
On va dduire des valeurs de Y CR CB qu'on aura transmis et comme on
transmet Y CR CB 1pixel sur 2, l'autre on transporte Y, donc il faut que les
valeurs de RVB soit tous en couleur, on va tendre la valeur de CB et CR sur les
deux pixels, on va doubler cette valeur. (x)
On voulait que la bande passante de la chrominance soit 2x moins leves que
celle de la luminance pour cette raison ? (wtf)

Slide 255

Slide 256
Slide 257

oeil isotrope : voit de la mme faon dans tous les axes.


4 2 0 on applique la mme chrominance horizontalement que verticalement.
4 2 2 (x) horizontal seulement(?)
4x moins sensible la couleur qu'au noir et blanc (sensibilit de l'oeil),
4 1 1, standard fort appliqu aux usa, au niveau des composantes, que pour 4
pixels spars, 4 chantillons de Y, on a 1 chantillon de CB et 1 de CR.
Moins prcis au niveau de la couleur, mais on ne peroit pas de diffrence car
on est au dessus de la performance de la vision humaine.
(rappel) 4 x x ? pour 4 chantillons de Y, il y a x chantillons de Cr et x
chantillons de Cb.

4 1 0, on transporte 1 chantillon de Y CR pour 16 chantillons de Y, grosse

rduction de l'information transmise, avantageux pour le traitement, mais


toujours au dessus de la perception visuelle humaine.
Utilis pour la distribution.
4 4 4, pour chaque pixel, on porte les 3 chantillons.
Slide 264 on voit qu'on a la mme rsolution sur Y CB CR
Dbit : 13,5 x 3
EXEMPLE AVEC UNE MATRICE DE 16 PIXELS
444
16 pixels
48 chantillons
Rapport : 1,5
422
16 pixels
32 chantillons
Rapport : 1
411
16 pixels
24 chantillons
Rapport : 3/4
420
16 pixels 24 chantillons
Rapport : 3/4
410
16 pixels
16 Y + 1 Cr + 1Cb = 18
Rapport : 1/2 (+ ou -)
(DESSIN 1)
Pbm gomtrique dans l'image
extrait 1, pbm de format
extrait 2 correct.
4:3 576 lignes sur 720 pixels
720/576 n'est pas gal 4:3

720x3/4 = 540 lignes.


Du vrai 16:9, on tend l'image horizontalement
720x3/4 x16/9 = 960 pixels
576 sur 960
pour obtenir 960 pixels qu'est ce qui change ? La FE
13 500 000/720 = 18750 x 960 = 18 Mhz (FE Y)
9 Mhz (CR CB)
donc le dbit augmente et on obtient donc 360 Mhz (180 + 90 + 90)
On passe donc de 270 360.
On doit donc changer les quipements
274

Faire de l'anamorphic, dans les 720 pixels Horizontal de l'image en 4/3, y


mettre les 960 pixels en 16/9, on applique donc une transformation gomtrique
horizontal, on compresse donc horizontalement l'image, on voit donc que les
visages sont crases, dans les 720 pixels on met l'information de 960, vu qu'on
a que 720 Pixels de Y, on doit faire un calcul.
Inconvnient de l'anamorphose : 240 pixels perdus jamais ! On peut les
recalculer mais les images seront floues.

Autre mthode ? LETTER BOXE


dans l'image 4/3 on inclue une image 16/9

On a alors 2 bandes noires qui apparaissent


perte qualit horizontal et vertical car on passe de 576 432 lignes
verticalement. Mais elle est exploitable sur n'importe quelle moniteur, elle a les
bonnes proportions.
Pillar boxe, crop sur les ct gauche et droit plutt que bas et haut
slide 278
Si on parle d'une image 16/9 anamorphic sur un 4/3 = letter box.
Slide 279
exemple d'image 4/3
slide 280
zoom dans l'image.
Pixels lgrement plus large que long.
281

Display aspect ratio (DAR) (affichage)


Pixel aspect ratio (PAR)
Storage aspect ratio (SAR) (stockage)
1,066 rapport entre la hauteur et la largeur du pixel, si il tait carr a ferait 1.
282
Exemple, extrait de film.
Gestion du format complique.

Slide 284
problme sur les lignes horizontales

dans la vraie vie on verrait une image uniforme, on verrait pas les lignes.
Exemple des chemises, avec des raies verticales.
Alliasing
on cre des Freq. Au dl de ce qu'on peut afficher.
UIT 601 mga zoom, slide 287, assez de pixels pour tenir compte des
variations de l'image mnt si on rduit la taille de l'image, on a encore ici assez
de pixel (288) sur un cycle bleu blanc on a 3 pixels, donc on a encore de la
marche, la marche c'est 2 pixels, si on rduit encore la taille de l'image, les raies
vont se rapprocher et cette fois-ci on atteint la limite de la rsolution (289) on
est limite de la rsolution, (290) cette fois ci on a dpass car on a 2 raies et 2
pixels, on a dpass la rsolution, on a l'impression que les freq. Se rduisent et
que les raies vont se r-carter. Cette fois-ci on a plus assez de pixels pour
reprsenter les lignes verticales.
293 synthse

ANCILARY DATA : Donnes auxiliaires, peut transporter de l'audio, textuelle,


pour autant que ce soit normalise
UIT601 norme, normalise, publie etc.. puis on a fait des extensions, en
augmentant 4 4 4 (pub,cinma) ou rduisant 4 2 0 (studio) 4 1 0 (transmission
au final)
297
Norme UIT601 : universelle.
chantillon 10 bits = 10 donnes
si on veut utiliser la puissance du numrique distance : la transmission SDI
objectif : arriver transporter dans un cble, les bits les uns aprs les autres, on
prend 1 chantillon de 10 bits et transporter les 10 bits les uns aprs les autres.
Il faut que a soit valable longue distance, on veut faire 200,300 m de distance
sans perte. Avantage sur l'analogique, car qd on transporte une image
analogique sur longue distance, elle perd de sa rsolution et devient floue.

300

10 cbles de donnes parallles


les mouvements de lignes sont comme dans le binaire 0 tu descends par
exemple, 1 tu montes, si tu es dj 0 la ligne continue.
On a 27 millions d'chantillons par seconde
en 10 cbles ! Pour chaque chantillon on a 10 bits, il faut 1 cble par bit de
l'chantillon. (30 bits au total)
Bas du graphique.
34 nano secondes pour passer de CB Y (du bleu au gris sur le graph) car 1/27
000 000
on divise le temps d'un chantillon en 10 parties donc 3,4 nano secondes la
partie, et tu fais comme prcdemment dans le binaire (conversion parallle
srie) 1 1 1 0 1 0 1 1 0 0 (comme dans le slide, dans la case bleue) et a c'est le
transport avec 1 cble, c'est 10 x plus rapide !
Reprsentation de la succession des bits de niveaux de chaque chantillons.

301 302 311

Si on prend un petit systme avec 10 cases mmoires, on prend 10 cases


mmoires et on va charger l'chantillon dans les 10 cases mmoire (301)
on va ensuite aspirer ces 10 cases mmoires en les vidant vers le bas en
affichant successivement les donnes, le 1 apparait alors
on a utilis 10 cases mmoires (registre dcalage).
314

Le cble agis comme un filtre passe-bas. On perd les hautes frquences (haute
frquence : quand a varie beaucoup), un signal carr c'est une somme de
sinusodes (fourier : fondamental + harmonique) on aur alors de moins en
moins d'harmoniques (315 avec 3 harmoniques) les signaux sont toujours
identifies 0 et 1, c'est discernable, le signal lectrique s'est un peu affaiblie
mais en numrique a ne change pas beaucoup l'image, en analogique on verrait
dj la diffrence. Si le cble s'allonge encore, on perd des harmoniques
nouveau et il nous restera que la fondamental (slide 315.1) mais la
discrimination entre 0 et 1 est toujours possible mme si le signal s'est abm !
Si on continue allonger le cble (baisse la bande passante), on peut toujours
dire que c'est 0 et 1, donc les chantillons sont toujours correct, l'image n'est pas
affecte ! On peut aller infiniment dans la rduction, jusqu' la confusion entre
le 0 et 1, cette config. Marche bien.

316, on a les 3 harmoniques, il faut que ce soit en dessous de 0,5 pour tre pris
comme 0.
316
317

on a une erreur sur un des bits.


Comment devrait-t-on faire pour que a marche correctement ?
On va essayer d'tre toujours dans le cas ou on sait discerner parfaitement 0 et 1
a marche bien pour autant que la valeur moyenne soit gale 0,5
comment amener la valeur moyenne 0,5 ?
On lance une pice, une chance sur 1 et 2. On utilise un encodeur pseudo
alatoire, on mlange les donnes avec un algorithme trs complique pour
qu'elle soit alatoire, on crypte les donnes pour qu'elles soient pseudo
alatoires, pendant le transport dans les cbles les donnes ont un look alatoire
et ensuite on dcrypte.
Ici en moyenne au slide 318 il y a 15 1 et 15 0

Slide 320

Pour valider les donnes, il faut un signale d'horloge qui va valider les donnes
un moment prcis. Ce qui compte c'est que un moment prcis elles prennent
une certaine valeur. On va regarder ces valeurs des moments prcis indiqu
sur le slide 320 par les flches du dessous. L'horloge donne le rythme
d'chantillonnage du signal.
Comment faire pour avoir le signal d'horloge l'encodeur et au dcodeur
on pourrait imaginer avoir une horloge des deux cts.
-Cas ou on a deux horloges diffrentes, on les synchronise.

Mais une montre finit toujours par prend du retard ou de l'avance, on ne sait pas
parfaitement synchroniser deux horloges et qu'elle le reste.
Ou alors on synchronise deux horloges avec une troisime horloge matre pour
s'assurer que tout soit identique mais mme dans ce cas a ne fonctionne pas.
Vitesse lumire
On a un dlai, T = L/V = 1/3x10^(-6) = 330 nano seconde
(graphique slide 320)
=3,4 ns
longueur de cble = 100 m entre l'encodeur et le dcodeur
Envoyer deux cble a ne marche pas pcq il faut qu'il ait la mme longueur, a
cote deux fois plus cher et c'tait pas l'ide, on parlait d'y arriver avec un seul
cble.
Si on prend un cas particulier comme un signal, qui a pour forme une onde
carr (donc 0 1 0 1 0 1 0 1), quelle frquence il a ce signal ? 270 Mbit/seconde
pour combien de cycle ? 2 donc 270/2 = 135 Mhz.
Il existe des composants lec. Sur base d'une frquence d'en re-synthtiser une
autre. On serait alors capable dans le dcodeur avec la frquence 0 1 0 1 0 1 de
135 MHz, de recrer la frquence de l'horloge qui a 270 Mhz en frquence.
Si on envoi 0 1 0 1 0 1 01 en permanence, le signal subit le dlai et arrive de
l'autre ct avec le bon dcalage il y a donc moyen partir de l'onde particulire
de 135 Mhz(...x) (repet) on est capable d'envoyer 135 000 000 de cycles 0 1 0 1
0 1 dans le cble.
Rajout d'un 3eme encodage, l'encodeur NRZI (none return to zero inverted ..)
encodeur qui se base sur les tats (0 1), c'est une bote qui entre un signal et le
sort par aprs. On cre un signal de sortie qui dpend de cette valeur.
(Dessin 2)
exemple de la porte (change de 2 tats)
si la lumire est allum, on change l'tat de la porte, elle s'ouvre et se ferme
toutes les 5 secondes par exemple.
(s'ouvre, se ferme)
si la lumire est teinte, la porte ne change pas d'tat toutes les 5 secondes.
1 = change d'tat
0 = maintient l'tat chang
1 nouveau = changement d'tat

donc si tu as un 1 tu passes 1 par exemple puis 3x 0 0 0 tu auras alors 3x 1


puis si tu as 1 nouveau tu passes 0 (changement d'tat) dessiner sur le slide
318. dessin 3.
premiere tape registre dcallage
deuxime tape : encodeur pseudo alatoires
troisime tape : encodeur nrzi
--> crer le signal SDI
globalement (327) l'encodeur son schma est celui-ci.
1. chantillons qui varient 27 millions de fois par seconde
2. on retire de cette variation une frquence, nouvel chantillon toutes les 34
nano secondes
l'horloge 27 Mhz synchronise, pilote l'encodeur pseudo alatoire et l'encodeur
nrzi (pour viter les longues srie de 0 ou 1)
3. Puis le driver permet que le cble soit pilot correctement
329.

Le symtrique, l'encodeur
1.EQ (galise)
2. Dcodage nzri (permet de retrouver les signaux tel qu'on les avaient
l'entre ?
3. Opration inverse
4. Quand on a une longue srie de 0 et de 1, comme au slide 314 (des 0 et 1
qui sortent du systme) il faut retrouver ou sont les chantillons, un
chantillon c'est 10 bits. (rcupration du flux srie?)
5. on regarde les donnes pour regarde quel moment on retrouve le
prambule pour se faire on stocke les 0 et 1 dans un registre qui fait 30
bits, et quand on se rend compte que les 30 bits forment le pr ambule,
partir de l on sait qu'on est synchronis avec un chantillon que 10 bits

plus loin on aura l'chantillon suivant le XYZ puis les 10 bits de


l'chantillon suivant jusqu' atteindre la fin de la ligne, donc avec la
rcupration du pr ambule on est capable aprs de dcouper les bons
chantillons plutt que de prendre une partie de l'chantillon Y ou de
l'chantillon Cr.
1. PLL : recrer la frquence au dcodeur. Pour tre synchrone avec
les tat 1 et 0.
1. Div par 10 : l'horloge de variations des chantillons est 10 x
plus faible que celle des bits, donc un moment il faut diviser
par 10 la frquence 270 MHz pour avoir 27 Mhz. 270 millions
de variations de bits sur le cble et 27 millions d'chantillons Y
CR CB, chacuns de 10 bits
Rcapitulation : variation rapide 0 1 0 1, alors le circuit de regnration de
l'horloge fonctionne, horloge qui a 270 Mhz, cette horloge continue mme
quand y a pas de variations 0 1 0 1, a permet de regarder les valeurs au bon
endroit, a permet de synchroniser l'encodeur nrzi et l'alatoire ainsi que le
registre de dcalage (grce l'horloge) si on s'arrte l on sait pas encore
retrouver les 10 bits du flux, il faut qu' un moment on disent stop pcq on a les
10 bits, pour arriver faire a, il faut synchroniser une autre horloge, cmt ? On
utilise la synchronisation et le pr ambule car il comporte 10 bit 1 et 20 bits
0 puis XYZ puis le premire chantillon CB, puis tu remplaces les 10 bits de
CB par les 10 bits de Y qui arrive aprs, si on a pas cette synchro par le pr
ambule au dbut on saura jamais couper dedans.
L'horloge permet de valider les donnes reues parce que dans le cble elles
sont pas propres(?)
332.
L'image prsente un dfaut
Des petits points blanc apparaissent
333.
Cble long en analogique = flou
si on tranporte un signal numrique sur 280 m de cble c'est bon, si par contre
on passe 300 m l'image devient inexploitable, la neige.
Pourquoi ? Tension tellement faible qu'on ne sait plus discerner les 0 et les 1, en
allongeant le cble. Plus moyen de rcuprer les 0 et 1
Slide 336 = taux d'erreur.
Cliff effect (effet de falaise)

337.
L'objectif est de regarder les niveaux que prennent les bits.
Il faut regarder l'enchainement des 0.
-Est ce que le niveau 1 et 0 sont diffrents
-Est ce que la variation est franche
338, on voit que la variation n'est pas super raide cause de la bande passante
du faible, les niveaux sont un peu plus flous la variation.
Diagramme de l'oeil, a ressemble un oeil et plus l'oeil est ouvert plus c'est
parfait. (permet de voir la tension et de voir si on se rapproche de l'effet de
falaise, il dpend des donnes).
342. on sait plus retrouver le signal 0 et 1 donc l il y aura des erreurs.
Au dl de 300 mtres ce qu'on va faire c'est qu'on va dcoder le signal sdi, puis
mettre un encodeur et ce sra bon, la technique pour une distance infini c'est de
mettre en place un systme de dcodeur, encodeur.
L'image la plus complique encoder (343) magenta + gris (mire de test) quand
on la branche l'encodeur sdi, quelle que soit l'image qu'on utilisera aprs, a
passera. Quand on la traduit en 0 et 1 elle est complique encoder car quand
on regarde la succession des chantillons qui sont utilises, on a pour la partie
du haut 18 0 qui suivent 2 1 puis 18 0 en permanence, et c'est complexe car il
n'y a pas autant de 0 que de 1, donc si l'encodeur marche mal il va avoir du mal
sortie la valeur correcte, pour le gris, on a l'inverse autant de 1 que de 0 sur
de longues priodes, donc a pose problme car si l'encodeur pseudo alatoire
et le nrzi pareil on va avoir un cas compliqu pour crer un signal 0 1 0 1 0 1.
Donc si cette image l fonctionne toutes les images fonctionneront.
348 (schma exploiter)
l'ide c'est de faire un calcul au sdi sur l'image les chantillons, une fois par
ligne, de transporter le rsultat du calcul dans les donnes auxiliaires et de faire
le mme calcul au bout de la ligne de transmission.
Permet de mesurer les erreurs en exploitation pendant la transmission dans le
cble, le calcul qui est fait au dbut du schma avant le transmission path
doit avoir le mme rsultat aprs la transmission sinon il y a une erreur dans la
ligne de transmission. C'est l'EDH !
349.
Comparaison analogique(cble PAL) numrique (du SDI)

Analogique et qu'on regarde au dbut du cble, on passe certaines frquences et


plus on va loin moins on aura de frquences dans le cble, on prend le multi
burst pour le voir, plus le cble est long il y a de frquences, donc l'image
devient de plus en plus floue. Et donc si le cble a une longueur de 3 m on a
perdu dj un peu de frquences (perte de dtails)
En numrique c'est diffrent, on a le mme problme pour les 0 et 1 transport,
ils subissent le mme filtrage, le diagramme de l'oeil se dteriore de manire
progressive pcq les 0 et les 1 comme les frquences dans l'analogique varie
dans le temps or l l'image ne change pas sauf si on atteint l'effet de falaise, la
dgradation du contenu, en analogique est progressive, en numrique elle est
brutale, la tension se dgrade progressivement mais comme est elle interprte
par des 0 et des 1 elles ne se dgrade pas comme celle de l'analogique cd de
manire progressive mais son changement est brutal, alors que la tension d'un
appareil analogique se dteriore progressivement donc l'image aussi.
351. Rsum (synthse)

2 conditions pour transporter en srie le signal et influe sur le schma bloque de


l'encodeur.
Il faut qu'il y ait autant de 0 et 1 et il faut savoir rgnrer une horloge au
rcepteur et donc il faut qu'il y ait cette condition assez de 0 et de 1 (et a c'est
l'encodeur nrzi qui aide le faire).
Le diagramme de l'oeil permet de voir ce qu'il y a dans le cble, les tats des
niveaux sans pouvoir discerner chaque bit qui passe.
Le sdi check field permet de se mettre dans les pires conditions, l'image la plus
complique encoder donc si une transmission fonctionne avec elle marchera
avec n'importe quelle image.

TIV 24/10
Cours 5
Rappel
Encodage SDI : de transporter les chantillons, les bits, qui sont dfinis l'uit 601 (la norme sd) sous
forme srie, dans un seul cas
objectif : srialiser les diffrents chantillons, registre dcallage : charger chantillons par
chantillons les donnes dans 10 registres (10 bits) et chaque coup d'horloge, on sort un bit
dcalage et on dcale ce qui reste et on parvient transformer en srie ce qu'on avait en parallle.
10 bits : 270 Mhz

Si on connecte ces 0 et 1 sur un cble, un cble relativement long, quelques mtres de la rgie, on
va donc voir ce qui se passe quand on envoi des 0 et 1 dans un cble.
Quand on envoi un signal de luminance dans un cble, si le cble est long, le signal n'est pas le
mme.
On a des 0 et des 1 (pg 314) on regarde des portions du signal, 3 tats 1 et 1 tat 0 par exemple
ou 2 1 suivi de 2 0.
On applique la mme thorie que pour l'analogique sauf que ici ce sont des signaux carrs,
pour le signal 2 1 et 2 0, si on retire des HF, le signal devient plus inclin, et au fur et mesure de
ces pertes de HF, le signal se dforme pour arriver un signal, mais l'intrt c'est que on distingue
toujours 0 et 1 avec ce signal, et puis au fur et mesure qu'il s'allonge on distingue tjrs 0 et 1,
regardons mnt pour le signal de gauche 3 tat 1 et 1 0, le cble s'allonge et on remarque que force
de rduire un certain moment, la bande passante faible, on distingue plus le 0 des 1.
Quand on compare le niveau de discrimination la valeur moyenne du signal, donc quand on rduit
les HF, ce qu'il reste du signal se centre autour de la valeur moyenne, on voit qu' un moment on
retrouve plus les 0 et 1, on voit 4 1 et 0 0. POUR CONTOURNER CE PROBLEME ?
Condition ? Pour qu'on ait la valeur moyenne centr sur la valeur centrale qui distingue le 0 et 1 ?
comment ? Avoir autant de 0 et de 1.
Pour arriver ce qu'il y ait autant de 0 que de 1 on utilise un quipement, L'ENCODEUR
PSEUDO ALEATOIRE (slide 319) (case 2) qui a un rgle qui fait que priori c'est alatoire, le
phnomne alatoire, l'ide c'est qu'on transcode avec une rgle que l'on connat et donc on fait en
sorte qu'il y ait globalement autant de 0 que de 1 en sortie de cette partie l.
APRES, problme ? On a des zones d'incertitudes aprs la premire rallonge du signal 3 1 et 1 0,
qui sont au dessus de 0,5, donc on va regarder le signal des moments bien prcis (ces moments
prcis c'est l'horloge : un signal carr qui varie entre 0 et 1 et quand il passe de l'un l'autre c'est le
moment ou il valide les donnes) ici on regarde (slide 320).

On doit adjoindre au signal de donnes, une horloge, qui permet de squencer et de regarder les
donnes des moments prcis
cela doit se passer l'encodeur et au dcodeur (une horloge) et que cette horloge soit en phase avec
les donnes, un gnrateur d'horloge l'encodeur et au dcodeur donc, donc 2 horloges le pbm ?
Elles ne restent jamais synchrone.
Elle finiront tjrs par avoir des rythmes diffrents.
Quand on augmente la longueur d'un cble, les donnes mettent plus longtemps, donc on va avoir
un retard et il se peut que pour contrer ce retard on regarde les donnes, le signal un peu plus tt et

on risque alors d'analyser le signal dans une zone d'incertitude qui allait passer en dessous de 0,5
mais qui est toujours au dessus de 0,5 (= 1 au lieu de 0)
Moyen ? RECONSTRUIRE L'HORLOGE AU RECEPTEUR
On va donc transporter dans le cble un signal qui ressemble l'horloge, on remet jour l'horloge et
on recommence. On transporter l'horloge, on synchronise au rcepteur, a reste valable un moment
puis on recommence.
On doit le faire souvent sinon elles vont driver.
Le signal le plus proche de l'horloge c'est celui ou on a (slide 324) (dure d'un bit : cycle de 0 1)
on peut transporter un signal qui a une frquence de 135 MHZ (que le 0 ou le 1), on fait en sorte
que dans le signal numrique on ait suffisamment de signal 1 0 1 0 1 0 1 0 1 0
Encodeur NRZI : dont le rle est de remplacer des niveaux par des variations, quand on a un 1
l'entre on inverse, si on avait 0 on restait au mme niveau, pour s'assurer que qd on a full 1, genre 4
1, on remplace cette srie par des 0 1 0 1 0 1 0 1 0 1.
on en a pas plus de 0 1 0 1 0 1 mais en tout cas on s'assure d'en avoir pleins de variations.
L'objectif c'est qu'on ait un code modifi.
[On fait une traduction du signal en numrique srie, proprit : autant de 0 et de 1 et suffisamment
de variations 0 1]
On recre l'horloge, on la recre rgulirement, on le fait chaque fois qu'on retrouve des 0 1 0 1 on
remet l'horloge jour.
Principe du pdalier, pour relancer le vlo. faire suffisamment frquemment pour ne pas que
l'horloge dcale
faire tous les 3,4 chantillons et a suffit.
326.
Les donnes passent par 10 cases mmoires et on fait des relations (x)
pour le cryptage d'un signal, comme le home banking, code, crypt nos donnes. La loi n'est connu
que par nous et notre banque.
327.
L'horloge des signaux, quand elle reoit les chantillons, elle est 27 Mhz (10x moins rapide)
PLL : outil qui permet de calculer une horloge, de la modifier, on augmente la freq par 10, 270
Mhz, a va cadencer les diffrentes tapes au dessus dans le graphique, 1 bit passe de l l (aux
diffrentes tapes)
Pour le signal sdi on met un amplificateur pour qu'il pilote le cble, que le courant soit assez lev
(driver) pour piloter le cble.
328.
Dcodeur

(Opration symtrique)
rcuprer le signal, on sait que au bout d'un cble on aura perdu les HF, donc il faut que les niveaux
qui sont proches de la moiti de 0,5, il faut donc les rhausser aux valeurs maximums, 0,6 faut le
mettre 1 et 0,4 0. (EQUALISATION)
ENSUITE
On recre l'horloge avec les 0 et 1 dans le signal, il y en a assez, on cre un oscillateur qu'on va
synchroniser avec les freq 0 1 0 1 (horloge interne, elle travaille pas toute seule, elle travaille avec
les variations 0 1 dans le cble)
a permet de synchroniser le fonctionnnement des diffrentes tapes (nrzi, registre de dcalage,
dcodeur pseudo alatoire)
Les donnes 0 et 1 faut les remettre en chantillons pour rcuprer les chantillons de 10 bits, on
prend 10 bits puis on les monte etc.. mais c'est plus lent mais priori on ne sait pas ou sont les 10
bons bits, car dans le flux 0 1 rien n'indique voil le dbut de l'chantillon, le seul moyen c'est de
retrouver dans le flux les 2 bons moments particuliers : le SAV (3 chantillons : le prambule : 1 ou
tous les bits valent 1 et 2 chantillons ou les bits valent 0) et le EAV
Dans 30 bits (10 bits 1 , 20 bits 0) ce coup d'horloge l on a le pr ambule donc 10 coups
d'horloge plus loin on aura le XYZ, puis 10 coups suivant on aura le premier chantillons de la ligne
(CB) puis 10 coups (Y) puis 10 coups (CR) etc..
Donc on sait dcouper correctement 10 bits par 10 bits, quand on peut les dcouper, toutes les 37
nano secondes, tous les 10 coups (x)
on a fait une transformation qui permet au dpart des chantillons de l'unit uit 601, de les encoder
pour que a passe sur un seul cble, on met tous les bits l'uns drrire l'autre puis on fait l'opration
inverse et on rcupre au bout du cble nos chantillons.

334. quand on allonge trop le cble, le clif effect : on commence confondre les 0 et 1, la distance
laquelle a apparat : + /- 280 m.

[1 bit = 3,7 nano secondes]


[27 millions de variations par seconde]
338 : diagramme de l'oeil
enchainement des valeurs 0 et 1, on sait juste que le niveau du 0 est tout en bas et le 1 tout en haut,
que la variations est marqu par les montes, descentes, pour voir le temps que a met pour passer
de l'un l'autre et si la distinction entre 0 et 1 est bonne !
Si on tat proche des 280 m de cble, le signal serait crases et les valeurs iraient un peu dans tous
les sens.
(Exemple slide 340)

343.
Tous les 0 et 1, d'un encodeur SDI, dpendent d'un signal d'entre et c'est l'image, et parfois l'image
amne un moins bon signal SDI ou l'on a moins facilement des 0 que des 1 par exemple, le signal
qui se met dans le pire cas c'est cette image-l, pour le magenta et pour le gris, l'un stresse la partie
NRZI, l'autre l'encodeur pseudo alatoire.
Si cette image fonctionne correctement alors n'importe quel image fonctionnera correctement.
Faudra pas que lorsqu'on met les barres couleurs a se passe bien puis quand on fou le signal vido
live a foire.
348. LE DH
Autre moyen de contrler une ligne
compter les erreurs dans la ligne
l'ide : on va faire un calcul sur l'image, on va le faire sur la dure d'une ligne, sur le contenu, le
rsultat on le met dans le H ANC, et puis au bout du cble on refait le mme calcul et logiquement
en transportant le rsultat du calcul l'entre on s'attend avoir le mme rsultat sinon a veut dire
que en chemin il y a des erreurs.
CRC : valeur qu'on insre
PAL (analogique) vs SDI (numrique)
perte de frquence dans l'image si on rallonge le cble, l'image devient de plus en plus floue
(analogique)
etc.

SYNTHESE

Page 353.
EXERCICE
Signaux binaires, dans le cbles, ceux qui prsentent les caractristiques d'un signal SDI
Le premier a pas mal de variations 0 et 1 donc pas mal, le premier est le meilleur.
Le deuxime n'a pas de variations 0 et 1 donc on ne sait pas synchroniser l'horloge

EXERCICE 2
270 Mbit par seconde = 4/3, l on demande pour du 16/9
le temps qui spare entre deux variations d'tats.
360 Mbit/s = dbit car si 4/3 = 270 alors 16/9 = 360 Mbit/s donc T = 1/360 000 000
slide 354.
EXERCICE 3
Diagramme de l'oeil A et B sont le signal la fin du cble, on demande de dire quel diagramme
correspond au cble le plus court et le plus long.
Plus l'cart est grand plus le signal est propre
plus on s'carte plus on perd les HF donc plus les niveaux se raproches, gauche les niveaux sont
moins rapproches, DONC CELUI A DROITE EST PLUS COURT, moins de HF transport
gauche donc plus long.
Car le diagramme de l'oeil permet de voir l'tat du signal dans le cble, si on distingue bien 0 et 1 ,
ici droite on voit bien que le 0 et 1 est bien faite mais moins bonne gauche car les niveaux se
rapprochent, on perd des HF = long cble donc gauche = long cble.
EXERCICE 4
Un systme EDH, on additionne les niveaux, on prend les chantillons Y CR CB et on fait une
somme, on prend une ligne, CRC (calcul dbut de ligne), recalcul aprs transmission pour une
image noir, rponse = 414 700, ce qu'on peut en dduire ?
Calculer la valeur au dbut de la ligne ? (on connait l'image, elle est noire, on sait que les
chantillons de Y pour le noir = (en numrique) 64) (64 = noir, 940 = blanc)
CR = 512
CB = 512
en analogique
Pour le noir,
Ry=0
By=0
et on les a mis 512 en numrique
ce qu'on dis c'est que le CRC (correcteur d'erreur)
4:2:2 combien d'chantillons d'une ligne pour Y = 720 chantillons de Y
CR = 360 qui vaut 512
CB = 360 qui vaut 512
donc 720 x 64 + 360 x 512 + 360 x 512 = 414 720 (pas gal 414 700)
Il y a une erreur, il est dans les alentours de 280 m.
EXERCICE 5
Les 30 bits, les 10 bits 1 et les 20 bits 0, permettent de retrouver le pr ambule (les 30 bits, 1023
(les 10 1) 0 0)
le premier ou le dernier chantillon de Y
on voit que ce qui suit c'est la synchro avec les 10 0 donc on en dduit que c'est les 30 bits du
dernier chantillons
F
V
H = 0 donc c'est le SAV
P3
P2
P1

P0
0
0
Cb ce sont les 10 bits suivants (0 1 0 0 1 1 1 0 0 1)
y ce sont les 10 bits suivants (0 1 1 1 0 0 0 1 1 0)
ce qu'il y a avant c'est le H ANC, de l'audio ou le CRC etc...
HD
Norme HD : quivalent : Paramtre HDTV : UIT709
Plus de pixels mais d'autres choses aussi
JUSTIFICATION DE LA HD
Pour la sd, on a considr comme acquis 625 lignes et 5(xx) affiches, on a calcules la bande
passante, on s'est pas demand si 625 lignes c'tait suffisant, on va calculer la valeur relle
ncessaire pour la vision humaine
-la rsolution (on va chercher un angle, l'angle le plus faible que l'oeil est capable de percevoir)
on peut regarder cmt l'oeil fonctionne (oeil, nerf optique, le cerveau)
pour y arriver, mesure, mesure sur une mire, compose de lignes noires et blanches, on va regarder
quel est l'angle le plus faible, on parle d'angle pas d'cart entre les lignes.
Dans quel groupe tu sais distinguer les noirs des blanche
MESURE ?
L'oeil est capable de voir 1 minute d'arc : c'est une mesure d'angle () 1/60 = minute
1/60 d'un degr
D = 2' (' = arc) (2 minutes d'arc) (2/60)
C = 1'
B = 45'' (45/3600)
A = 30'' (30/3600)
1 seconde d'arc = le cercle de 360 divis par 3600 (je crois)
1/3600 = 1'/60 = 1''
Dfinir l'angle de vision ?
Le point central
l'oeil n'a pas la mme densit dans tous les axes, en fixant le point central on ne sait pas compter
facilement les lignes sur le ct, les cellules ne sont pas rpartis uniformment sur la rtine
cne concentr sur l'axe optique (fova)
plus on s'carte moins il y a de cellules
En fixant la croix sur la gauche..
dans le champ visuel on n'a pas la mme comprhension de l'espace partout. On va jusqu' 220
comment on compense ce qu'on voit pas ? Ce qui arrive dans notre dos, on l'entend, l'audio est plus
distinctif drrire que devant. Devant c'est le visuel qui prime
On a 2 Devant nous qui nous permettent d'analyser correctement.
On a 20 Vision des mots, arriver dcrypter un mot complet.
On a 40 Vision des symboles (exercice de la croix a gauche, on voit un O un S, on fouille dans
notre rpertoire et on balance un mot)
On a 120 Vision des couleurs, d'ouverture ou l'on voit les couleurs correctement. (augmentation
btonnets, la nuit on voit mieux sur les cts que devant)

Si tu veux lire un mot la nuit tu le mets lgrement sur le ct dans ta vision et tu le liras plus
facilement.
[1 sec d'arc = 1/3600]
Pour la tlvision au dbut, pour la sd, on a retenu 14 d'ouverture, on a un cne ouvert de 14 et on
fait en sorte que l'cran soit dedans.
14

De sorte que chaque fois qu'on dplace le regard on trouve l'information directement.
SD = 4x la diagonale pour avoir les 14
672 lignes (dimension)
SD sous dimensionn, car sur l'cran on en a que 576, donc il nous manque une centaine de lignes
en SD pour avoir la bonne rsolution donc c'est logique qu'en sd il manque qqchose, ce qqchose est
accentu par deux phnomnes, le fait que les crans n'ont pas cess d'augmenter de taille, les
premiers crans fesait 12'' (pouces) il tait donc facile d'avoir une image dfinie avec cette taille
d'cran, plus on s'loigne d'un cran plus la rsolution maximum de l'oeil est content.
La distance moyenne entre l'cran et un fauteuil est peu prt 2,20 m, ce qui veut dire que lorsqu'on
augmente la taille de l'cran, la taille des pixels augmentent aussi sauf si on change le standard et
donc on finit par dpasser la taille du pixel qui correspond au 45 secondes d'arc.
Les meubles IKEA, ils sont prvus pour contenir des tlviseurs de 47'' maximum.
Le problme du 16/9, on a dans les annes fin 90 on est pass au 16/9 et il fallait garder la
compatibilit et avec le letter box on pert 140 lignes qui sont devenues noires et donc a veut dire
que l'image verticale a perdu en rsolution, on garde pas la mme taille de l'cran mais on tend les
lignes pour couvrir tout l'cran.
Ce qui veut dire que le contenu de 432 lignes, la rsolution est encore amoindries
ET PUIS, le pbm de l'informatique qui amne des crans proches avec dfinition trs grandes,
montrer ces photos de vac sur un cran SD = flou !
(3 PBM Vs SD)
Donc on a essay de calculer rellement les choses :
1. on va augmenter la taille de l'cran donc l'immersion, les 14 d'ouverture donne une immersion
faible, plus l'angle est grand plus on est dans l'image, l'ide c'est de passer au minimum 20
d'ouverture pour la HD. 20 min dans la diagonale donc !
On a 20, correspond si on prend les 45'' secondes d'arcs
20 x 60 x 60/45 = 1600
Si on calcul les pixels en diagonales, on doit avoir 1600 pixels en diagonale
Mais on calcul en longueur et largeur logiquement
on sait qu'il y a 1600 pixels en diagonale et on veut savoir la verticale
on prend comme rapport 16/9
donc 16/9 de H pour la largeur
donc on a
Hauteur
Diagonales
et 16/9 de H
Diagonale = H + (16/9).H
Diagonale = H x (1+(16/9))

H = D / [racine carre de 1+ (16/9)] = 0,49


1600 x 0,49 = 784
ll faut au minimum 784 lignes en HD pour que d'une part l'cran couvre 20 du champ visuel
(diagonale) et qu'en plus on respecte la rsolution maximum de 45'' d'arc.
Pour la HD, 20 2X D/2 la diagonale, DEMANDER AU PROF
dans le triangle en cours tu fais la tangente du triangle x l'angle 10 du triangle qui permet de
trouver la distance de visionnement, rapport entre la hauteur de l'cran et la distance pour
obtenir les 20
au minimum c'est 784 lignes, condition minimum, c'est du 16/9 uniquement, logique ? Rapport avec
SD ?
4/3 : 720 pixels sur 576 lignes
on va donc multiplier par 2 la rsolution en vertical et en horizontal
donc 960 x 2 pixels par lignes = 1920
On veut que l'cran soit rellement 16/9
donc on fait 1920 x 16/9 = 1080
1080 lignes horizontales et 1920 pixels en largeur, si on a 1920 pixels en largeur, il nous faut 1080
lignes horizontales.
PAR = 1
(Pixel aspect Ratio)
(DAR = 16/9 car 1920/1080 = 1 car 16/9)
Carr pour la HD car = 1
DEMANDER DIFFERENCE ENTRE DISPLAY ASPECT RATIO ET PIXEL ASPECT
RATIO
Puis y a le storage aspect ratio
DAR = PAR x SAR
par exemple
4/3 = PAR (multiplie) x 720/576
16/9 = 1 . 1920 x 1080 (donc 16/9) donc 1 ! (inmanquablement)
PAR = Taille du pixel
DAR = format du standard
(en dessous de 784 lignes = pas hd)
pour trouver relation direct avec la sd, on double en horizontal et en vertical, par rapport du 16/9
sd on aura 4x plus de pixels car x2L x2 H
AUTRE CONDITION
Utile pour l'volution, on a souffert du fait qu'il y avait pleins de standards diffrents (rappel)
on va sssayer mnt de rechercher obtenir le mme genre de rapport ici,
525 lignes 625 lignes, on nomme les standards sd par le nombre de lignes
en HD on appelle les standard par le nombre de lignes utiles, par du nombre de lignes au total,
comme en sd il y a des lignes inutiles, blanking H et vertical.
Combien ?
1080 lignes au total, il faut trouver un nbr de lignes au total qui permettent d'embarquer 1080 lignes,
on a 2 standards, 625 lignes (EU) 525 lignes (US) donc si on fait x2 on obtient 1250 et 1050
dans 1250 on met 1080
dans 1050 on met pas 1080

[(racine carr)525 x 625] x 2 = 1145 mais on n'a mit 1125, a permet d'embarquer le 1080 sr les
deux standards.
Les 784 lignes c'tait le minimum lgal pour la compatibilit avec la vision humaine. Donc la HD
va au dl de la vision humaine, donc on peut s'approcher plus proche de l'cran, dpasser les 20,
jusqu' 30 apparemment.
1920 pixels largeur
1080 pixels hauteur
1125 lignes
nombre de lignes pour 1920 pixels en largeur
Trouver la FE ! (pour la sd cmt avait-t-on fait?)
comment ?
-2x suprieur (Nyquist, shannon)
-mme Fe USA EU
-les chantillons soit align verticalement
rapport 4/3, 16/9, on trouve 9 Mhz
13,5 Mhz = sd (frquence maximum de 5 Mhz, mais on a prit un peu plus)
si on calcule la Fe pour du 16/9 en Sd on a vu que c'tait 18 Mhz
L'image est 16/9 mais 4x plus de pixels
Donc la Fmini E est 4x18 Mhz = 72 Mhz
(1) La fe doit au moins tre suprieur 72 Mhz (condition Nyquist)
(2) deuxime condition, tout comme pour la sd, need lien entre Fligne sd et Fligne USA EU,
quel soit un multiple entier de ces lignes --> n x 2,25 Mhz (pour relier frequence de ligne
USA EU)
(3) Combien de lignes en europe en HD, 25 x 1125 et pour les amricains, 30 x 1125
on prend un multiple entier de ces 2 calculs. DONC k x 25 x 1125 x 30 et on obtient 74,25
Mhz (plus petit multiple entier de frquence(x))
4:2:2
FE de CR : moiti de 74,25 Mhz
= 37,125 Mhz
pareil pour CB
Au total on a 150,5 Gbit/s
Combien de pixels par lignes du coup ?
74,25 millions d'chantillons de Y par seconde
et y a 1125 lignes par image et 25 images par seconde
74,25 x 10^6
/1125 x 25 = 2680 (Nombre de pixel par lignes)
pour les amricains = 2200 (car x30)
On connat la FE signaux HD Amricains et Europenne
Un des pbm hrit de la sd, c'est le mode de balayage, en sd on pouvait pas stock l'info localement,
il fallait adopter un systeme de balayage donc l'arrive de l'hd on a rflchi ce mode de balayage,
pourquoi pas passer en progressif ?
Pbm engendr par l'entrelacement.
(image canard)

on voit clairement une trame et la seconde tram(375.)


(car 20 mili seconde entre les 2)
Craint pour le traitement, pour la diffusion a passe)
pour l'arrt sur image, tel quel, a pue.
Ou on interpole l'image.
25 images par seconde, 2 trames 50 demi images, on filme 1 trame puis la 2eme (20 mili seconde la
trame)
En progressif (on a une image capture au mme instant, toutes les lignes sont captures en mme
temps, l'arrt sur image est ok, l'image gagne en nettet) quand on traite l'image seulement on le
voit.
La plupart du programme c'est de la fiction (24 images secondes) quand on diffuse le cin en tl,
on interpole pas la dernire image, on fait juste tourner le film plus vite, le film la tl est donc
plus rapide qu'au cin, plus court.
Mais 24 images compltes, quand on filme l'image avec un tl cinma, on est dans ce cas-ci car les
2 trames sont filmes en mme temps (progressif)

380.
2 modes de balayages.

Si on veut viter que l'image scintille, on doit avoir 50 images par seconde car la raison de
l'entrelacement c'est d'avoir 50 informations par seconde sur l'cran
si on fait 25 images par seconde on aurait l'impression que l'image disparait puis revient.
La FE de 74,25 Mhz va donc passer au double 148,5 Mhz pour Y, on va donc doubler les FE en 50
images progressives.
L'avantage c'est que l'image est plus nette.
1080 i = interlast = entrelac

1080 p = progressif
si on rsum
25 i ou 50 i
une trame sur 2
toutes les 20 ms
50x par seconde
On a 50 p
diffusion comme le 50 i
les lignes vont deux fois plus vite
FE deux fois plus vite
FL aussi
Toutes les 20 ms on rebalaye total l'image
2x plus d'informations
Dure d'une image 20 ms alors qu'avant c'tait 40 ms
Standard de diffusion
25 p = capture 25 images par secondes mais on peut pas afficher que 25 images secondes
on doit convertir
donne un effet un peu cinma car proche du 24 p
toutes les 40 ms on capture une image mais on peut pas l'afficher comme a sinon l'oeil peroit un
manque
25 psf capture les images en 25 p et les affiche en 50 i
une image complte toutes les 40 ms
on les affiche en 2 trames (cre artificiellement)
en dcalant les lignes 1/2 de 20 ms.
Mme effet qu'au cinma (mouvements saccads)
mais pas d'effet de scintillement
pas comme du 50 p(vision humaine)
donne des mouvements comme au cinma car chantillonn 24 i/s mais qu'on diffuse en 2x
a donne a 383.
Quand on cre un ralenti = cohrent mais dans le flux temps rel : un peu bizarre.
Progressive segmented frame (psf)
on prend l'image on la segmente en 2 frames.
Il nous reste savoir, le nombre de niv. De quantification, et cmt coder
quantification, on change pas, on reste sur 10 bits (majoritaire)
1024 niveaux
rpartition comme en sd (94 et 940 en nominal) etc..
pour le codage, petite diffrence mais quasi pareil
synchro de dbut et fin de ligne,
quel est le dbit ?
Dbit = n. FE = 10 x 74,25 x 10^6
2^n
Dbit Cr = 10 x 74,25 x 10^6/2
Dbit CB = 10x 74,25 x 10^6/2
=

1,485 Gbits/s
pour 1080 i
pour 1080 p ? 2x a
= 2,97 Gbits/s
Invention du standard intermdiaire
720p
c'est de dire on garde le mme dbit que l'entrelac mais on y fait du progressif
on rduit la rsolution de l'image mais en augmentant la frquence de l'image, image plus
nombreuses mais plus petites
le dbit reste constant on peut dire qu'il est li la taille de l'image. C'est proportionnel la largeur
x la hauteur, or on veut du progressif
progressif = double les images par secondes
on doit rduire la largeur et la hauteur de l'image
L/(racine carr de 2)
H/(racine carr de 2)
on double le nombre d'image
on garde le mme dbit
mais on aura du progressif.
Plus d'image donc moins de pixels.
1920/(racine carr de 2) = 1280
1080/(racine carr de 2) = 720
D proportionnel L x H x I
Pq racine carr de 2, si la surface veut tre divis par 2, on divise par racine carr de 2.
L x H/2 x 2I (image)
donc, L/(racine carr de 2) x H/(racine carr de 2) x 2I (image)
Partie visible de l'image : 1280 x 720
FE : 74,25 Mhz
on prend un chiffre suprieur 720 lignes
on prend 750
donc 1280 sur 720 (partie visible)
au total on a 750 lignes
combien de pixels par lignes au total il y a ?
750
720 ( l'intrieur)

1280
?
74,25 x10^6 / 750 x 50 = 1980
387.
On a rduit la taille de l'image pour garder un standard progressif et afficher plus d'images, plus

petites.
720 pas HD car en dessous des 784 lignes
intrt : avoir une image progressive.
390.
On change le triangle, pcq entre le moment ou l'on dtermin les paramtre de l'uit 601 et la hd, il
s'coule quelques annes, la hd se formalise dbut anne 2000, la techno volue et on peut revoir les
paramtres.
Les points dans le diagramme colorimtrique ne sont plus au mme endroit
nouvelle quations : Y = 0,2126 R + 0,7152 V = 0,0722 B
de Sd a HD il faut non seulement changer le nbr de pixel voir mme image par seconde mais en
plus on doit recalculer tous les pixels.
L'chelle intrinsque n'est plus la mme, l'quation de passage de l'un l'autre change.
C'tait une question d'examen l'an pass.
395.
Une mire de test.
709 601 (colonne)
on va faire en sorte de reprsenter 3 couleurs avec le mme d de luminance.
Si on met l'image en noir et blanc on peut voir si l'affichage se met en 601 ou 709 (slide 396)
si on voit une variation c'est pas le bon standard 396 = 709, pas 601
on ne peut pas convertir une image de sd en hd et inversment en ajoutant des pixels, il faut changer
la valeur des chantillons en gros.

400.
une autre diffrence en hd, en sd on avait en 4 2 2 d'aligns les chantillons et pour 1 pixel on avait
3 chantillons puis 1 CR 1 CB etc..
en HD --> 401.
Ordre (2 chantillons par pixel)
1 pixel qui porte Y cB
1 pixel qui porte Y cR [...]
Y cB
Y Cr
402.

En hd on ajoute 4 chantillons,
un premier qui nous dit quel ligne on est (un compteur, la fin de la ligne, le LN, line number,
comme il faut monter jusqu' 1080 mme 1125 (ligne pas visible) il faut qu'on dpasse 10 bit
('1024) donc on va jusqu' 11 bits.
2 chantillons 10 bit on a le compteur de ligne
puis 2 chantillons de CRC (dans chaque ligne on ajoute un calcul, qu'on stocke dans 2 chantillon)
le SAV est identique

au lieu d'avoir 8 chantillons utilis pour la synchro on en a 12 et en plus on les double pour le 1080
p car en 1080 p on a ojrd pas moyen de le transporter sur du cble, dbit trop lev. (sur de lafibre
optique oui mais pas le co axiale normal) si on sait pas transporter l'info sur un cble, on le fait sur 1
cble, on utilise 2 voies, deux cbles, un qui porte tous les chantillons de chrominance mais du
coup on met la synchronisation complte et un 1 de luminance et la synchro complte aussi, c'est
comme du 1080i sauf que il porte que la chrominance d'un ct et la luminance d'un autre, les 2
signaux portent au total 12 chantillons pour la synchro et au total 24 chantillons pour la
synchronisation.
410.

2 cbles ou l'info de l'chantillon progressif est transport.


Pour le 1080 p, dbit trop lev, voil pourquoi 2 cbles.
HD SDI (SDI Pour la HD) (mme principe, conversion parallle srie, encodeur pseudo alatoire,
encodeur nrzi etc.. sauf que le dbit plus grand, alors le prix payer c'est que les signaux sont plus
vite affecter par des longueurs de cbles, le clif effect apparat donc plus tt, 80m de longueur,
cble hd plus court (POUR LE 1080 i)
Synthse
paramtre de la hd, double la rsolution H et V
Utilise uniquement les images 16/9
s'manciper de l'entrelac.
Dual link : 2 cbles (1 CR CB, 1 Y)
HD SDI, identique, sauf ! La distance d'exploitation.
Traitement de l'image
Gain, niveau, teinte, saturation

SYNTHESE

416.
gain : rendre plus sombre ou clair en ouvrant la dynamique, en multipliant le niveau.
La gamme des niveaux
le seul outil que l'on regarde ici c'est le waveform
l on ne touche pas la couleur
417 barres couleurs

en augmentant ou en diminuant le gain, on crase ou on augmente la dynamique des niveaux


c'est un multiplication, on multiplie par 50%, 25% ou autre.
On a modifi le contenu mais pas la forme du signal, si on a une image noire et qu'on augmente le
gain, l'image reste noir.
en touchant au gain on touche la luminance.
419

Dcalage vertical dans le diagramme, de Y, on monte, on descend les niveaux, translations


verticales des niveaux.
2 modifications de niveaux et de gains
EQUATION
la nouvelle luminance
Y' = G.Y + N
420.
Modifier la teinte, c'est changer un des paramtres de la couleur
outil : vecteurscope, le waveform va rester identique car on n'aura pas toucher la luminance.
On va apercevoir une rotation des couleurs dans le vecteurscope.
421.
Rotation du vecteurscope
la distance par rapport au centre n'a pas chang.
422
Modifie la saturation
Fait que la couleur soit pure ou pas pure.
Gauche : on dsature l'image, on fait en sorte que les couleurs soit mlangs avec du blanc, moins
pur. p.e le rouge devient dsatur.
Droite : plus vive, plus satur
Outil : Vecteurscope, on va s'carter du temps en augmentant la saturation, l'inverse ils se
rapprocheront du centre si on sature.
424.
On modifie Y et CR CB
Modifier le gain et le niveau : indpendant de la modif teinte et saturation
Multipli Y par un gain et le dcal vers le haut ou le bas.
On soustrait 64 (valeur 0 du noir) ce qu'on veut c'est que quand on multiplie le noir par une valeur
a reste du noir, c'est pour a que l'chantillon qui rentre en premier chez Y slide 424 et puis il faut
limiter car on peut pas dpasser 1119 (dernire valeur limite) si on obtient par le gain et le niveau +
que 1119 il faut les arrter, si on soustrait et qu'on tombe en dessous de 4 (interdis, il faut s'arrter
4 grce au limiteur).
Pour trouver les bons chantillons, on rajoute 64 drrire.
-64 au dbut car on veut le mettre la valeur 0, de base il a une valeur chantillon donc 64 (qui vaut
0 mais on le fout 0 pour changer de type d'chelle en gros.
Graphique tableau
Angle = teinte
Y' = G . Y + N
C'B = CB. CosFi Cr . Sin fi
C'R = Cr . CosFi + Cb. Sin fI
quation : Connaissant la modification de l'angle (Fi) ,qd on la modifie, on modifie les couleurs (Cr
et CB)
DESSIN 1.

424.

Teta = teinte (angle)


Fi = modification de la teinte
Saturation = S = distance entre le centre,
Modifier la teinte, on modifie pas Y
Y = modifier par le niveau et le gain
CR CB = modifier teinte et saturation
m=pourcentage
424 suite.
Il y a des limiteurs pour viter de dpasser les limites, ne jamais passer en dessous de la valeur 4 et
1019 pour les signaux
si on modifie trop les variantes gain etc.. on peut dpasser ces valeurs, ce sera arrt par les
limiteurs.
Il est possible que quand on modifie ces valeurs, que on aboutisse encore des catastrophes.
426.
Pourquoi ct cour (vido) n'a pas su s'afficher, pq un fond noir ?
Tournage image
Modification de la luminance et chrominance pour donner une patte l'image et en faisant cela, on
a accentu la chrominance et la saturation de l'image ainsi que le constraste, jouer tous les niveaux
sur Y et C., l'encodeur plus rien ne passait.
R = 179/255 = 0,7
V = 179/255 = 0,7
B = 76/255 = 0,3
Monde colorimtrique :
DESSIN 2
Donc ct cour a bugg car il s'est automatiquement coup car le bleu est gal -0,028 or RVB doit
se situer entre 0 et 1 !
le traitement de l'image peut amener produire des couleurs illgales.

427.

On peut mesurer le fait que l'on quitte ou pas ces couleurs -> on utilise le diamond, diagramme en
diamant, pr qu'une couleur soit lgale, elle doit tre l'intrieur du cube.
On va projet le cube selon l'axe b et l'axe r !
on sait toujours pas si la couleur est devant le cube ou drrire
mais si on ajoute la seconde projection, celle selon l'axe R selon l'axe VB donc, on voit si
l'ensemble des points de l'image sont dans dans le cube. Si une des deux projections pour une des
couleurs de l'image est en dehors d'unes des projections alors on a une couleur illgale.

429.

L'ensemble des couleurs doivent se retrouver dans le graphique noire, et pas ailleurs, dans les
losanges.
Blancs : aux deux extrmits suprieur et infrieur (les deux extrmits, pas une la fois, les deux)
Noir : aucunes reprsentations
Si on a un mlange, le jaune (rouge et du vert)
jaune = tout en bas
gris 50% = au centre
DESSIN 3
431 : illgale.
Synthse
traitement d'image basique pour l'tallonnage
Diagramme diamond : permet de passer les valeurs en RVB.

TIV 6
compression d'image.
SD : Le sdi, c'est 270 Mbit/seconde
HD SDI : 1,5Gbit/seconde
algorithmes de compression
Le Jpeg
MPEG et H264 (driv du jpeg)
On a vu que si on prend un flux non compress, de l'uit 601, la sd par exemple, que le dbit de la sd
quand il est complet, on est 270 Mbit/seconde, qu'est ce qu'on peut faire pour rduire ce dbit ?
Enregistrer en 8 bits
Rduire l'chantillonnage
Rduire la couleur
Un nouveau format avec un minimum de mtadonnes. (il y a des chantillons vide dont on peut se

passer pour de la place), rduire ce qu'on va rellement stocker, a nous donnera le minimum de
dbit. (blanking) (pas la synchro, faut bien la mettre qqlque part)
270 Mbits/seconde
->207,36 Mbit en 4:2:2 c'est ce qu'il y a rellement dans l'image
rduire l'chantillonnage de la couleur
-> 155,52 Mbits/seconde
en 4:1:0 (standard couleur le plus faible en terme de dbit et toujours valide pour la vision humaine)
-> 116,64 Mbits/seconde
cette faon de rduire, est couteux, le 4:1:0 est d'une qualit moindre mme si il est toujours valide,
craint pour la traitement.
8 bits 4 :2 :2
-> 165,89 Mbits/seconde
4 : 1 : 0 en 8 bits = dbit le plus faible (post prod possible)
-> 93,31 Mbits/seconde (aucune marge de manuvre pour du traitement) (post prod impossible)
tallonnage ? Non, grosse plaque de couleur.
Juste enregistrer et diffuser mais pas plus
on rduisant le stockage des donnes utiles et en se mettant aux limites de la vision humaine on
divise presque par 3 le dbit.
Ca ce n'est pas de la compression.
Si on rduit la rsolution a se verra l'oeil, p.e 93 Mbits/seconde c'st le dbit non compress
minimum pour ne pas que a soit visible l'oeil humain.

536.
Algorithme de compression

Parce quon ne sait pas transporter limage non compress, on va le compresser.


Dans le fux dimage, il y a beaucoup de redondances. On va compresser l image.
En choisissant les grilles dchantillonnage, on peur rduire le dbit. On peut aussi rduire
le dbit, si on enlve le blanking et la synchro.
On peut par ex. passer de 270 MBit/s en 4:2:2 116,64 MBit/s en 4:1:0.
Il va falloir trouver un autre moyen pour balayer l image.
On peut rduire la rsolution.
On peut rduire le nombre de niveaux. On peut passer de 10 Bits 8 bits.
On peut passer de 4:2:2 en 10 bits et sans synchro et blanking (207,36 MBits/s)
4:1:0
en 8 Bits sans synchro et blanking (93,31 MBit/s).

JPEG (invent la base pour la compression d'image photo, l'ide tant de transporter des images
par les voies tlphoniques l'poque)
Le JPEG a t dvelopp pour les images fixes, il existe une variante MJPEG pour des
vidos.
On va essayer de changer le monde. On est dans le monde spatial, on dfinit pour
chaque pixel les paramtres. On va passer dans le monde frquentiel. L oeil est sensible
des basses frquences mais pas trs sensible sur les hautes frquences. La
consquence: si on fait une erreur sur les basses frquences, on le voit. Si on fait une
erreur dans les hautes frquences, on ne le voit pas.
On va essayer de transformer le monde spatial en monde frquentiel.
On peut dcomposer limage en pixels. On va prendre un petit rectangle de 4 pixels
(2x2).
Cet rectangle peut tre dcompos en rectangles avec juste 1 vrai pixel, les autres sont
teints. Si on Dit que sauf 1 pixels est blanc 100% et les autres noir. On multiplie ce
rectangle par la luminance du pixel. On le fait avec tout les 4. Ce rectangle est la somme
des 4 rectangles en N&B pondres par leur luminance. Mais comme a, on ne peut pas
encore rduire le dbit. Chaque pixel est aussi important que lautre.
(SCHEMA pg 32 TIV ALEX)

On va maintenant choisir comme image de rfrence un rectangle blanc. Il n y a pas


beaucoup de hautes frquences, cest uniforme. On choisis comme 2me rectangle un
rectangle dun cot noir et de lautre blanc. Pareil si on le fait horizontalement et
non pas verticalement. On choisis un rectangle ou la diagonale est blanc, tout autre est
noir (D3). On veut obtenir des image D0/1/2/3 pour pouvoir donner une importance la
frquence. On
va donner limportance maximale au rectangle noir et la moindre importance au rectangle
avec la diagonale. Les coefcients D vont exprimer l importance du pixel. Le D 0 (basse
frquence) est plus important que le D3 (haute frquence). Pour le D3, on peut choisir une
chelle plus rduite pour les niveaux, parce que l oeil ne le verra pas.
Ca sappelle Discrete cosine transorm (les coefficients).
On va dcomposer limage par groupes de 8 pixels x 8 colonnes (64 pixels). On
va
refaire des rectangles avec chaque fois des variances plus rapides, des plus hautes
frquences.
Pour des exercices, on va le rduire 4x4 pixels.
On va noter les petits graphiques comme dans un matrice.

On aura le DCT (calcul par un ordinateur, un chip,etc.) et puis on a la


Quantification. On va mettre des coefcients les images. On reprsente les petits
images dans un tableau. On fait une division de toutes les valeurs. La premire, on le
divise par 2, les
prochains par 4 etc. Si on divise les petits coefcients, ils vont disparatre.
On va utiliser un tableau de division pour diviser les valeurs. Ces valeurs ne sont pas
les mmes, par ce quon veut prendre compte de la frquence dans l image. On divise et
on arrondi. Si on fait la quantification inverse, on obtient plus le mme tableau de
coefcients. on a plus la mme image. Pour les basses frquences, il y a une erreur
beaucoup plus faible que pour les hautes frquences. Si on fait la DCT inverse, l image
nest plus la mme, mais lallure gnrale reste la mme.
Cest la Quantification qui rend la compression irrversible. Plus les coefcients dans la
table de quantification sont grands, plus grande est la compression. On a pas encore
rduit le dbit, on a juste transform le
dbit.
Ltape suivante cest lencodage entropique. On va essayer de faire une suite de
valeurs au lieu de faire un tableau (on veut obtenir un fux). C est l tape de compression.
On va faire une suite en les classant par les frquences. On les lis en zigzag, a va
regrouper les coefcients nuls la fin de la srie et les valeurs non nuls au dbut de la
srie (en gnral).
Logiquement il faudrait toujours 10 bit pour transmettre tout les coefficients. On
va changer a: on va indiquer le nombre de 0 qui prcdent le numro (il y a un 0

devant -2 ; 1/-2). Pour la fin, on va dire 0/0, a veut dire des 0 jusqu la fin. Ca rduit le
nombre
dinformations quon doit transmettre.
Cest RLC. On dveloppe un petit arbre pour savoir combien de bits il faut pour
transmettre les coefcients (409). En fonction des coefcients, on va choisir dans quelle
catgorie on est. C'est l'tape RS.

Sil y a une valeur (genre 0/2) apparait trs frquemment, on va utiliser un code
binaire
trs court pour rduire le dbit. Si une valeur n apparait juste 1 fois, on va pouvoir utiliser
un nombre de bits plus lev (// code morse).
On va utiliser le code Huffman (encodeur Huffman, voir p. 411) Il na jamais
de codes
courts qui sont compris dans des codes plus longs. Tout les codes sont uniques.
Le dcodage se fait de le mme manire. Le dcodage et le codage sont parfaitement
symtriques.
Le END of BLOCK (Juste des 0 la fin) est 1010.
En plus du code, il faut la table Huffman (pas toujours la mme) et la table
de
quantification. La quantification rend la compression irrversible, tout les autres
tapes
sont compltement rversibles. Entropie = streben eines systems nach unordnung.

Pour une distribution live, si on veut utiliser par exemple le MJPEG (Motion JPEG), il
faut que la compression se fait trs vite (40ms).
Une fois quand on a dfini la table de quantification, on ne connait pas encore le dbit de
limage, parce quon ne connait pas encore l image. La compression peut varier pour
chaque image. Cest un compresseur VBR (variable bit rate).
Mais un compresseur VBR nest pas utile pour transmettre parce qu il y a toujours un
dbit
maximum quon peut transmettre. Quand on dpasse le dbit, l image n est pas transmis.
On a donc invent le CBR (constant bit rate). On va chaque fois modifier la table de
quantification pour que le dbit reste toujours le mme.

Pour le MJPEG, on a une mmoire tampon (Buffer) aprs lencodage


entropique. On
a donc un tampon entre lencodage et la sortie. On va rgler la sortie de la Mmoire. Il
faut par exemple sortir 10 MBit par seconde, pas plus, pas moins. La mmoire va se
remplir sil y a trop de bit qui entrent et se vide s il y a pas assez de bit qui entrent. Il y a
une liaison entre la mmoire et la table de quantification (CTRL, Contrle). Sil y a trop
qui rentre, on va augmenter les coefcients de quantification. S il y a peu qui rentre, on va
diminuer les coefcients de la table de quantification.
Si on change souvent la table de quantifcation, cest un problme pour le
dcodeur. Il faut
toujours envoyer la table de quantification si on la change. Ca augmentera le dbit. Il faut
trouver un autre moyen.
Au lieu de transmettre toujours les tables de quantification, on va relier les tables de
quantification entre eux avec un coefcient. On va juste transmettre ce coefcients.
Il faut & agir sur le contrle. On ne va pas juste dfinir les limites pour le signal, mais on va
aussi dfinir des niveaux entre les limites pour pouvoir rgler le fux plus doucement.
Il faut garder les hautes frquences, les basses frquences, les bords des lments,

etc.
10 est la borne de compression quil faut pas dpasser en MJPEG.
539.
full redondance
si on prend juste un zoom dans l'image l'arrire plan, on voit que les pixels de l'image se
ressemble trs fort.
Or a vu que on prend chaque pixel de manire indpendante, mais donc pour chaque chantillon on
le transporte comme si le pixel tait seul or les pixels sont clairement group et leur association
forme une image donc plutt que de les transporter de manire seul on pourrait les lier, comme il se
ressemble trs fort, on pourrait dire que la Luminance du pixel d' ct est la mme avec une petit
valeur supplmentaire ou en moins, peut tre que quelques niveaux sur les 1024, donc on aurait peut
tre pas besoin de 10 bits mais voir meme 2,3 bits.
On voit donc pixel par pixel qu'il y a un peu de marge sans pour autant perdre de la qualit,
exprimer l'information autrement pour la transporter. (comment extraire la corrlation dans une
image) (comment les pixels sont lis entre eux) (exemple : quand le cerveau compresse l'info
(constant) avec quelques mots p.e, le cerveau reforme l'image (souvenir de vacance, pas besoin de
redtaill)).
Ici on va faire a de manire un peu plus basique, on va commencer par la compression image par
image.
Comment on compresse ? La vido c'est 25 ips, 25 ips souvent elles sont lies.
La corrlation spatiale
La corrlation temporelle

La corrlation spatiale
(intra image)
ou algorithme intra image
pbm ? L'image en sortie de l'encodeur, elle sera cod difframment, et au dcodage on retrouvera la
mme image, on aura subit aucunes pertes pcq l'algo est une traduction, on exprime de manire
diffrente mais on retrouve la mme image OR rduction de dbit faible.
Notre objectif c'est d'arriver rduire le nbr de bits par chantillons
dans ce modle pixel par pixel 539, comment savoir quel pixel est plus important ? Faire un
changement dans l'image pour exploiter ceci (?)

546.
Faire une erreur dans les HF, (dtails) personne constate l'erreur, le cerveau, la vision humaine est
sensible aux Basses frquences, donc une petite erreur dans les BF sera fort visible, par contre l ou
y a des HF, ce n'est pas si grave, si on fait des erreurs, h bien on voit pas de diffrences, trop
d'infos, le cerveau s'en rend pas compte,
540.
utiliser un oprateur,
541.
on parle d'un petit pav de l'image avec 4 pixels, on va s'intresser qu' la luminance, 4 images,
chaque image ou on a un pixel qui reprends la valeur du pixel de sa situation gographique,
le noir si on le met 0 a fait 0+0, imagine que y a4 projecteurs avec 4 filtres et ces 4 filtres sont les
4 qui sont l, si on projte du noir il n'y a rien qui passe.
Dcomposition en 4 images en une somme de 4 images qui ont des pixels soit noir/soit blanc
ces images de base sont pondres par une valeur, la valeur Y qui va pour chaque pixel, c'st donc la
somme pondre des images de base.
si on met des valeurs
Y0 Y1 etc..
Y0 c'est en fait la compo de 2 choses : la multiplication de Y0x (image ou le pixel est blanc 100%)
que l'on multiplie par la valeur de 0
On sait par contre toujours pas dire ou sont les HF et BF
Distinguer les HF des BF
On va donc comprendre des images avec rapport sur le contenu frquentiel
Carr avec 4 pixel blanc
Image uniforme (contenu BF car aucunes variations)
Carr avec variation verticale (Contenu en frquence plus leve, en frquence horizontal)
sur un waveforme a donnerait a
pareil (vertical)
noir blanc noir blanc
A nouveau c'est une somme pondre mais les valeurs ne sont plus les mmes (plus de Y 0 etc..)
D0 x cette fois
Calculer ?
Regarder pixel par pixel de quoi il est compos.
Si on regarde Y0, c'est la somme pondre de la tous les pixels situs en haut gauche donc Y0 =
D0 + D3
Y1 = D0 + 0xD1 + 0x2 + D3
Y2 = D0 + 0x D1 + D2 + 0x D3
Y3 = D0 + D1 + D2 + D3
D3 = Y0 D1
D1 = Y1 D0
D2 = Y2 D0
D0 = Y3 D1 D2 D3
D0 = Y3 (Y D0) (Y2 D0) (Y0 D0)

D0 = Y3 Y1 + D0 Y2 + D0 Y0 + D0
D0 = Y3 Y1 Y2 Y0 + 3D0
-2D0 = Y3 Y1 Y2 Y0
D0 = Y1 + Y2 + Y0 Y3/2
(Combinaison linaire de 4 images de base)
pondration = coficient qu'on trouve la fin (542. : 0,75 x, 0,50, ... par exemple)
542.
Y1 = 0,50
Y2 = 0,59
Y0 = 0,75
Y3 = 0,87
(Y1 + Y2 + Y0 Y3)/2 = 0,485
D1 = Y1 D0 = 0,5 0,485 = 0,015
D2 = Y2 D0 = 0,59 0,485 = 0,105
D3 = Y0 D0 = 0,75 0,485 = 0,265
On retrouve alors bien l'image d'origine.
Ce qu'on vient de montrer, la somme de tous les pixels en haut gauche de 542.
0,49
0,01
0,10
0,27

LES COEFICIENTS SONT OBTENUS EN ARRONDISSANT LES VALEURS


0,49 x = BF
On peut se permettre de discriminer les HF mais pas les BF, donc on peut foutre toute l'information
dans les BF et discriminer fond les HF.

HF = Full dtails dans l'oeil


En ayant rang l'image en 4 cof, ces coef n'ont pas tous le mme poids, le 0,49 est super
important ,pas d'erreur permis ! En 0,01 et tout on peut faire des erreurs vu que ce sont les HF, si
c'est 0,01 on peut faire 0,02 ou 0,03 et encore plus dans le cas du 0,27 on peut monter jusqu' 0,5.
on va donc concentrer l'information sur les basses frquences.
547.
Les 4 coficients D1 D2 D3 D0 (DCT)
Et les fonctions de base (dans le carr vert)
Les fonctions de base, et le contenu (les coef qu'on va discriminer pour les transporter
intelligemment).
Les vraies fonctions de base : 548.
l'image laquelle on applique la DCT c'est une image 8x8 pixels. On va dcomposer l'image que
l'on veut compresser en 8 sur 8
chaque bloc de 8 sur 8 sera exprim sous forme de DCT (de mnt 64 coeficient)
le premier dct multipliera la premire image du slide 548 puis la seconde jusqu' un contenu
frquentiel de l'image maximum du carr situ en haut droite dans le slide 548
en bas droite (contenu vertical le plus complexe)
On peut dire que le coef. Le plus important sera celui qui va pondr la premire image qui a un
contenu frquentiel bas, plus on va vers le bas et la droite plus le contenu frquentiel est lev. Plus
on ira vers le bas et la droite, plus on pourra discriminer.
C'est l'image qui est utilise dans la vie rel pour compresser le jpeg.

549.
On va rduire le bloc 4x4 (16 coficients contre 64 avec la table 8x8)
On reprsente les valeurs ngatives, la plus basse par le noir
les valeurs positives, la plus haute par du blanc
la valeur nulle, par du gris.
Quelles sont les images qui vont contribues ?
L'ide est de se dire je prends 8 images, de 4x4 et on veut savoir quelles sont les coef de la dct qui
vont contribuer ? Ceux qui sont pas nuls, la premire est uniforme donc tous les dct sont nuls sauf le
premier avec 1 1 1 1 , seul contenu non nul est le premier, si on multiplie le bloc par la valeur de la
luminance du pixel 4x4 blanc... (?)
Le deuxime avec une moiti horizontal noir ? Quelles sont celles surement pas utilises, les 3
dernires lignes qui implique une variation verticale (12 images de base non utilise)
comment compos cette image avec les 4 disponibles (premire ligne) la premire (valeur moyenne
de l'image), la deuxime (discrimination entre la gauche et la droite) etc..
de quel image on aura besoin ? La 1, La 2 car diffrence entre la gauche et la droite (invers)
(valeur ngative donc coef vers le bas dans le slide 552) et la 4 et pour discriminer la 2 correctement
on utilise la 4 qui nous fait obtenir le rsultat espr.
Faire les 6 derniers (exercices)
(en retirant les 2 premiers)
1) 1.1, 2.1, 4.1
2) 1.1, 2.1, 4.1
3) 1.1, 1.3, 3.1, 3.3
4) 1.1, 4.4, 2.2
5) 1.1, 3.1
6) Tous ?
7) Tous ?

560.
on va traiter diffremment chaque coefficients, on va donner plus d'importance aux coef BF, on va
ajouter une seconde tape, La quantification (Q) c'est une opration par laquelle on va rduire les
coefficients, on va les quantifier ? Comment ? En les divisant
on va les mettre sous forme d'une srie

562.
le plus important, le 1.1 (no error, un minimum en tout cas)
les autres on peut
on va appliquer une division sur chaque coefficients, une division entire. Certains coefficients, le
facteur sera d'autant plus grand que les frquences seront leves
563. 1.1 divis par 2 (mais donc on peut faire l'inverse aprs)
on va donc trouv une valeur pas entire donc on arrondit, ce qui veut dire qu'on fait une petite
erreur
le 2me, divis par 4
le 3 me, divis tellement fort qu'il ne va plus rien rest.
(ide : rduire les coef. en les quantifiant de sorte que l'erreur cre par la rduction soit d'autant plus
faible que ?)
565.

chantillon cod sur 4 bits


0 noir
15 blanc
(16 valeurs)
Dct appliqu au bloc
34 pour le coef de base
Table de quantification en orange (haut diviseur pour les HF pour qu'elle soit minimal)
le rsultat aprs quantification = coefficients quantifi
[2/8 = 0,25, arrondi = 0 pour rappel] [-0,49999 = 0, 0,5 = 1]
Pour chacuns des coefficients de la dct, on donc diviser par un lment de la table de quantification.
Pour obtenir la table des coefficients dquantifi, (dct inverse appliqu pour retrouv les pixels
d'origine) on voit qu'il y a des errreurs car 4x-2 = -8 et pas -9 etc..
quantification inverse : on retrouve pas les mmes coefficients, quantification, objectif ? Rduire la
proportion de chacuns des coefficients + erreurs d'autant plus grande que les frquences sont
leves.
Rduire l'amplitude des coefficients, on garde de grande amplitude pour les BF et plus faible pour
les frquences leves, ce pq la table de quantification est compos de petits diviseur pour les BF et
de grands diviseurs pour les HF
il nous reste que 4 valeurs non nuls aprs quantification, 8 coefficients sont passs 0, donc
clairement on a perdu de l'information, mais dans les hautes frquences c'est moins, on perd malgr
tout un peu dans les basses frquences.
On doit exprimer a de manire bien traduite mnt

application de plusieurs choses :


classer les coefficients par valeur croissante en premier lieu (combin horizontal et vertical) plutt
que de classer les coefficients ligne par ligne on va les classer en balayant en frquence croissante.
On va donc balayer en zig zag.
17

-2

-2

-2

donc 17, -2 -2 0 -2 0 0 0 0 etc...


on va essayer d'exprimer cette suite de manire intelligente, avec le moins de bits possible
dans la srie qu'il reste encoder, il y a des coefficients non nuls, certains sont grands, d'autres
petits et des 0, on va essayer d'exprimer cette suite sous forme intelligente, de manire ce que a
prenne le moins de place possible, comme il y a bcp de 0, on va remplacer chaque valeurs par une
paire de valeurs, cette paire indiquera le nbr de 0 qui suit la valeur et le 0 non nul ? (wtf)
0/17 (pas de 0 prcde 17)
0/-2 (pas de 0 qui prcde)
0/-2 (pas de 0 qui prcde)
1/-2 (un 0 prcde)
0/0
en exprimant les choses diffremment on a 10 valeurs ! Plutt que 16 !
mnt on voit que les coefficients, ils n'ont pas tous la mme amplitude. Si il est grand il faut bcp de
bits pour le transporter, on va classer chaque coefficients dans un tiroir, le tiroir c'est l'amplitude du
coefficient. (SLIDE 570.)
l'arbre exprime le nbr de bits ncessaire pour encoder chaque coefficients
les 17 et les -2.
si on veut encoder 10 par exemple, on sait que 10 a peut tre cod sur 4 bits.
17 c'est entre 4 et 5 bits (5 bits = 16 valeurs : -15 -8 et -8 -15
donc on prend 5 bits (on a besoin de 5 bits)
quivalent binaire de 17 = 1 0 0 0 1
sur 10 bits a donnerait 0 0 0 0 1 0 0 0 1, on prends que les 5 utiles.
L'objectif est d'encoder la valeur quantifie sur le nbr de bits strictement ncessaire.
0/5/17 pour coder la valeur 17 on aura besoin de 5 bits et y pas de 0 devant les 5 bits. On met que
les significatifs.
Pour les valeurs ngatives, comment coder ?
Tableau 570

quand on prend un bit, on peut distinguer 2 valeurs, la valeur 1 et pas 0 car pas besoin mais -1
quand on a deux bit on prendre transporter 4 valeurs (2 3, -2 -3)
quand on a trois bit on prend transporter 8 valeurs (4 5 6 7, -4 -5 -6 -7)
etc...
ce qui veut dire que en classant le coefficient dans une catgorie on dtermine le nbr de bits qui
vont le reprsenter.
10 : 1 0 1 0
-10 = (inverse les valeurs 1 et 0) donc 0 1 0 1
les coefficient sont juste numrots, on part du plus grand au plus faible.
(suite)
0/5/17
0/2/-2
0/2/-2
1/2/-2
0/0
0/5/10001
0/2/01
0/2/01
1/2/01
0/0
*****
Rduire le dbit : code frquente code binaire petit, code peu frquent code binaire grand.
Morse : poids dpends de la frquence des lettres, beaucoup de E = peu de poids transporter, on
applique un systme similaire, on utilise le code d'OEUFMAN (lololol) la pair 0/1 est remplac par
00 par exemple...
l'objectif ? Les codes qui ont peu de bits, doivent correspondre des codes frquents.
Donc ****
= 1 1 0 1 0 (0/5)
1010

10001

0 1 (0/2)

01

01

01

11011

01

Comment s'appelle les diffrentes tapes utilises


DCT (opration qui permettait par 8x8 ou 4x4 de passer des chantillons la rep freq de l'image)
Quantification (attribue une prcision chacuns des coefficient de la DCT en divisant lments par
lments la dct par l'lment correspondant dans la table de quantification)
Encodeur entropique (prpare l'encodage, permet de sparer les HF des BF, de discriminer les BF,
les traiter diffremment que les HF)
D'une part mettre les donnes en zig zag(Mettre les donnes de la mnire la plus efficace possible)
(mise en forme) ,
le RLC (encodage des 0, 0/0)
Puis l'tape de classe (on classe les coefficients)
puis l'encodage d'oeufman (ou on remplace les paires rs par un code dont la longueur est d'autant
plus courte que frquent)
Entropie : dsordre
Encodage entropique : retire le dsordre, purement rversible.

Dcoder ce code ? Comment ?


11010100010101010111011011010
code d'huffman.
1? non
11 ? non
110 ? non
1101 ? non
11010 ? oui
aucuns d'huffman commence comme un autre code d'huffman sinon on pourrait douter.
Il rpond deux proprits, la longueur dpend de la frquence d'apparition du code
mais en plus, aucuns code de huffman n'est compris dans un autre huffman.
11010 = 0/5 (sur les 5 prochains bits, on aura le coefficient quantifi, donc 1 0 0 0 1 = 17)
0/5 17
puis on a 0 1 = 0/2
puis on a 0 1 et vu que a commence par 0 c'est ngatif = inverse = 1 0 donc a fait 2 ou plutt -2
puis idem 0 1 = 0/2
-2
1 1 0 1 1 = 1/2
donc 0 1 est le coefficient quantifi = -2
puis 1 0 1 0 = 0/0
ENSUITE ON DECODE
17,-2,-2,0,-2,0,...... 0
17

-2

-2

-2

34

-8

-8

-8

donc

On remarque en regardant la dct inverse (le bloc reconstitu) il ressemble sans pour autant tre la
mme chose donc il y a des erreurs
Avec la dct inverse (quand tu as compresss, pour voir l'image il faut dcompresser, il faut repasser
des 0 et 1 encodage entropique dct inverse etc..)
0

12

11

10

11

12

11

11

10

573.
Rsum
1.(?)
2.la quantification elle privilgie les BF par rapport au HF
3.l'encodeur entropique tient compte de la post quantification et essaye d'exprimer avec le moins de
bits possible l'info venant de la quantification
4. (?)en 4 tapes (zig zag) + RLC (nbr de 0 prcdent), RS (classe les coef. Par catgories, nbr de
bits) Huffman (transforme les pairs RS)

576.
Fichier = code jpeg + dbit
quelle information important doit savoir l'encodeur pour lire le fichier, qu'est ce qui change ? La
quantification, elle donne le dbit, la table de quantification dtermine la qualit et le dbit. Entre
l'encodeur et le dcodeur il faut mettre la table de quantification, si on la connait pas on sait pas
dcoder.
Quelle autre information faut-il changer appart le code jpeg et la table de quantification ?
Faire varier la table huffman d'une squence une autre pour avoir un codage adapt
change entre l'encodeur et le dcodeur sinon pas moyen de dcoder? Table de quantification et
table de huffman.

EXERCICE
bloc de 4x4, dont la dct est droite.
3 tables de quantification Q1 Q2 Q3
choisir une table et effectuer,
taux de compression aprs codage jpeg
efficacit de la compression dpend de 2 facteurs :
table de quantification
des donnes (l'image)
Le problme c'est que le dbit final va dpendre des 2 facteurs,
si l'image est complexe : le dbit sera plus lev
Quand on applique le jpeg image/image, un flux vido c'est 25 ips, on peut appliquer du jpeg image
par image, si on veut garder le dbit constant, dans ce cas l on doit rguler le dbit, dpend aussi de
l'image, pour une mme table on aura un dbit qui varie.
Du VBR, variable bit rate : quand on accepte que le dbit varie
on fixe une table de quantification une fois pour toute.
CBR : dbit constant
584.
Faire en sorte que ce schma nous donne un dbit constant(?)
Compensation de ce qui peut varier
on va rajouter une mmoire tampon drrire qui va lisser les variations de dbit, le principe c'est
que quand on encode une image 25 x/s on a un flux jpeg qui rentre dans la mmoire tampon et
l'entre de la mmoire dpend du dbit qui sort de l'encodeur jpeg, si on compresse faiblement on a
un fort dbit et (inverse)
le codec fonctionne 50 mbit/s, alors on retire le tampon 50mbit x par seconde

Fonctionnement ?
Pbm ? Si on choisit mal la table, p.e dbit trop lev, dans ce cas l, la mmoire tampon va se
remplir remplir remplir et a va dborder.
Cette mmoire tampon sert aussi de rgulateur.
En fonction du remplissage on va modifier la table de quantification, si on se rend compte qu'elle se
remplit plus vite qu'elle ne se vide = dbordement = mettre des coef plus lourd dans la table de
quantification, et dans le cas contraire si on compresse trop que la mmoire se vide on peut
l'inverse mettre des coefficient plus faibles pour compresser moins.
585.
Q1 remplit, progressivement jusqu' 75% (max!) (min : 25%) si on continue c'est que la sortie n'est
pas assez rapide et la mmoire tampon va finir par atteindre une valeur excdente, alors ce
moment l on se rend compte qu'on remplit trop vite la mmoire tampon et par rtroaction on va
modifier la table de quantification, on augmente les diviseurs de la table pour rduire le dbit, si on
est fort dans le changement en suffisance, le dbit va chuter (Q2), la mmoire tampon se remplit
moins vite qu'elle se vide.
Le tampon lisse le dbit.
Dbit = image + table de quantif
dbit rentre dans la mmoire tampon un certain dbit
si il est trop fort on modifier la table de quantif. (comme si on fermait le robinet de la baignoire...
lawl)

Q3
La pente de remplissage est plus raide, elle se remplit plus vide,
on peut rguler le dbit pour faire en sorte d'avoir en sortie tjrs le mme dbit en gros
Table plus svre (gros chiffres, division donnera des chiffres plus faibles = rduire le dbit)
Table moins svre (petit chiffres, division donnera des chiffres plus hauts = augmenter le dbit)
Rguler le dbit : qualit de l'image varie.
IMPACT SUR L'IMAGE ? DE LA QUALITE
Quels sont les dfauts qui vont apparatre ?

Les dfauts du JPEG:


(image slide 601)

Artefacts: Si on passe directement dun niveau un autre, c estune haute frquence.


Le JPEG va rduire les hautes frquences. En Jpeg, la courbe monte moins vite. Au lieu
davoir un contour net, on aura un contour fou. Le contour prend plus de place. Il y a un
double contour. Il y a un Blur (contour flou) et un Ringing
(double contour)
Il y a des efets de bord dans un dgrad. Cest le Blocking.
On voit des blocs de compression.

Pour rduire lefet de blocking, on va ajouter un lment la chane de compression. On


va isoler le coefcient le plus faible. Cest le coefcient DC (basse frquence). Les autres
sont les coefcients AC (haute frquence). Le DC reprsente la valeur moyenne de la
luminance du bloc. On va lier le bloc DC au bloc prcdent. On compare 2 bloc successifs
et transmettre la diffrence entre les deux composantes DC1 et DC2. Si cette
difrence
est faible, cest la ou va apparatre le blocking. On va pouvoir transmettre le DC
correctement.

587.
ABCDEF
B.
C. l clairement on commence voir des seconds contours, comme autour de la charette de
foin, si on regarde au bord des plaques en bois on peut aussi voir un ddoublement.
601.
zone central : variation plus lente du niveau et donc effet ? Flou
overshoot : en dessous ou au dessus de la norme.
Effet (?) partie centrale : blur (flou) et les contours : ringing (voir plusieurs fois les contours)
ringing : double, triple etc.. les contours (pour les HF)
604.
On prend deux blocs de 4x4 avec un dgrad ?
605.
On augmente les tables de quantification
aprs dcompression un bloc ressemblera au bloc d'origine (
8
9
10
11
puis
7
9
11
13)
le pbm ? Ils sont l'uns ct de l'autre, on s'attend qqchose de graduel du coup mais l on a une
progression jusqu' 13 puis chute 11 donc dans le dgrade on a une inversion de deux valeurs, ce
qui veut dire que dans les barres grises ce sera marque dans l'image, bloc dans l'image, ce qui
apparat c'est le pourtour des blocs qu'on encode.
606. (mal suivi)
Image complte
en dessous : blocking, on voit des images apparatre pour des dbits plus faibles encore.
607. Effet sur l'image.
608.
(...)
les valeurs dc sont proches l'uns de l'autres
on obtient au terme d'une diffrence de trs petites valeurs du coup
genre 1 ou 2, ce qui donne un petit dbit ?

DEMANDER AU PROF DE RE EXPLIQUER LE SLIDE 608 !


traiter les cofficient dc en les comparant aux coefficients dc prcdent pour rduire l'effet de
blocking.
QUESTION DE REFLEXION ?
Le risque en compressant et en dcompressant c'est qu'on quantifie les coefficients donc reduit
qualit image, risque ? En cascandant des compress decompress, on perd en qualit
typiquement dans une chaine de prod classique (6,7 comp/decomp au total)
la question ?
Que devrait-t-on faire, quel condition on devrait imposer au mjpeg pour que la qualit ne se dgrade
pas de gnration en gnration ?
Quels sont les conditions pour que la seconde paire gnration ne dgrade pas plus le signal ?

Au niveau des noms


Jpeg: algorithme de compression image fixe
Mjpeg (moving)

TIV 7
cours du 14/11
rappel
encodage jpeg : objectif : encoder l'image p/r elle mme, tenir compte de la redondance de
l'image.
Dct : nabme pas l'image (IL traduit l'image de base en 64 coefficients frquentiels)
Quantification (tape suivante) : dtruit l'image, cre des erreurs (moins bien traduire les hautes
frquences (objectif de la quantification).
Par exemple, tu as 25 dans les HF, ensuite via ta table de quantification tu divises par 10 = 2,5 donc
arrondis = 3 puis il faudra refaire x10 = 30 dans les hautes frquences (erreur) (on ne supprime pas
les hautes frquences, on crer des erreurs dans les HF)
Prpare la compression mais ne compresse pas encore.
Puis l'encodeur anthropique qui traduit a et qui va mettre, crire l'image de manire intelligente.
Grce ce qui prcde, compresse intelligemment l'image
Etape Zig zag : les 64 coef. D'un bloc on a intrt les classer par ordre de contenu en frquence
croissant.
RS : classer les coef. Non nuls dans des catgories de manire ce qu'on puisse adapter le nbr de
bits par coefs non nuls
les coef faibles ont moins de bits que les coefs levs.
Si le coef a 2 3 -2 -3 = 4 bits
plus le coef a une amplitude grande plus il aura besoin de bits pour l'encoder.
Huffman : encoder ces pairs qui sont 0/2 0/5 0/0 etc.. on va faire en sorte que le code gnr soit
d'autant plus court que la pair est frquente, 0/2 apparat deux fois par exemple. C'est la table slide
572. Donne un quivalent binaire.
585.
La plupart des codecs sont dbit constants.
Si on veut un dbit constant il faut faire qqchose car la sortie d'un encodage jpeg dpends de l'image
et de la tb de quantification (ne permet pas seul de dfinir le dbit, c'est la combinaison image, table
de quantification).
Le cbr par contre, dbit constant, insrer (pe 20 mbit/s en permanence) vu qu' priori on ne sait pas
ce qu'une table de quantification nous donne, puis on a une mmoire tampon pour corriger le tir, si
la mmoire tampon se remplit plus vite qu'elle se vide alors l'encodeur jpeg a un dbit sur estim..
[..] si on ne fait rien un moment la mmoire tampon va dborder, en observant le remplissage de la
mmoire tampon on sait qu'il faut mnt faire qqchose dans ce cas l on modifie la table de
quantification, on augmente les coef. De la table de quantification, si on l'augmente assez, le dbit
va chuter et vice vers a.
Mmoire tampon : donne le temps de raction, on peut plus lisser les dfauts. Si on veut une qualit
constante on a intrt avoir une mmoire tampon qualitative.

CBR : modifier la table de quantification en cours de traitement.


(analogie la baignoire, tu fermes le robinet = tu changes la table de quantification)
Que passa quand on cascade plusieurs encodeurs dcodeurs ?
Camra : premier codage : encoder flux uit 709 puis on revient la session de travail le dcoder et
le r encoder, et en diffusion pareil, un mdia subit 6 compressions 6 dcompressions de la capture
jusqu' la diffusion.
Dbut du cours.
613.
2 images HD
l'une en progressive l'autre en entrelac
2 compressions
mme table de quantifcation
pourquoi la i prend plus de place, pq elle se compresse moins bien ?
En 20 ms, les gens bougent, les 2 trames sont dcals et a cre des hautes frquences dans l'image.
Comment faire pour rgler l'entrelacement ? Pour que la compression soit plus efficace ?
On inverse une des deux trames. (Dsentrelac) = 220 ko
= plus de hautes frquences la rupture
on obtient un taux prt du progressif.
a reste un peu plus lev que les 206 car les frquences verticales sont un peu plus levs, quand
on crase on augmente la frquence, quand on tend on diminue la frquence.
614.
on a parl que de la composante y jusque l or les images sont en couleur
CR CB, on va appliquer le mme traitement (encodage entropique etc..) mais on va lier les lments
ensemble.
L'architecture que l'on prend est celle du slide 614. les blocs de 8 sur 8 se regroupe dans un macro
bloc, c'est l'unit de base de l'encodage. En gnral c'est 4 blocs de Y et si on fait du 4 :2 :2, le
macro bloc reprendra l'ensemble des 3 composantes.
Y

vert : CB
orange : CR
le macro bloc c'est l'unit de base d'encodage
dans lequel on regroupe le bloc de chacuns des composantes : 4 (Y) 2 (CR) 2 (CB)
(On va regrouper un Macroblock pour le 4:2:2 (36 chantillons = 16 +
8 + 8)
On regroupe les blocs par blocs de 4. 4 blocs de 8 sur 8 pixels. On va
ajouter un bloc de 8 x 8 de Cr et de Cb.
Sur un Macroblock, on transmet un DC et les autres DC sont
dpendants de celui ci).

Quand on change de table de quantification on change de slice


pour tous les blocs d'une mme composante, l'intrieur d'une slice ont la mme table de
quantification
la plus petite slice c'est un macro bloc
la plus grande c'est une image
dans un slice il y a 1 ou plusieurs macro blocs et un macro blocs de 4 blocs de Y, 2 de CR, 2 de
Structure dans le flux
Comment organiser les luminances et les chrominances? (446)

GOP: Group of picture.


Dans une image, on va dcomposer
limage en tranches. Ce sont des blocs
dans lordre du balayage. Cest un
ensemble de blocs qui ont les mmes
paramtres. Le slice le plus petit, cest le
Macroblock, le slice le plus grand, cest
limage. Plus les slices sont petite, plus
grande est la qualit de limage.
Les slices sont composes de
Macroblocks.
Nomenclature = slide 614
CBR : constant bit rate (dbit) = qualit pas constante, mais dbit constant car on change tout le
temps la table de quantification de sorte garder un dbit constant.
VBR : variation du dbit = qualit constante mais pas dbit constant car la table de quantification ne
varie pas.

SYNTHESE

622.
on va mnt tenir compte d'un autre lment que la ressemblance des pixels entre eux, en gnral les
images qui se succdent se ressemble. Si on fait la diffrence pixel pixel entre les images, il n'y a
pas beaucoup d'informations, un autre axe va nous permettre de plus compresser.
On va plus loin, il faut tenir compte de plusieurs paramtres du coup ;

on va mnt s'intresser aux algorithmes inter images.


623 624 625
tout ce qui est gris, pur gris ne change pas

627.
image test.
628.
imaginons qu'on fasse un algorithlme ou on calcule la diffrence entre 2 images,
on va encoder la diffrence par rapport l'image qui prcde
on a besoin d'une mmoire image
on reconnais le parcours (codec mjpeg)
premire image rentre : rien n'est stock (mmoire image) on entre l'image, comme rien n'est stock
= - 0 diffrence, donc on encode en jpeg la premire image, on doit bien commencer par le dbut.
On encode l'image par elle mme et en mme temps on en profite pour stocker cette image dans la
mmoire d'image.
Ensuite l'image part en jpeg

SECONDE IMAGE De la srie, cette fois-ci, elle ressemble la premire, il faut calculer p pixels,
une nouvelle image qui est la diffrence entre les 2. I2 I1 ce qui nous donne une nouvelle image,
quand c'est gris = 0, blanc = positif, noir = ngatif. Image avec beaucoup de gris + un peu de dtails,
comme il faut bien la transporter, on va l'encoder en jpeg et donc on parle plus de i2 complte mais
de i2 bis (la grise) car il y a pleins d'aplats dedans, on l'encode en jpeg comme d'hab et puis on
stocke l'image deux dans la mmoire etc.. etc..
629
Que se passe-t-il au dcodeur ? I1 encod en jpeg avec une qualit un peu moindre, en sortie du
dcodeur, on l'enregistre aussi dans la mmoire image puis on reoit l'image i2 i1 = i2 bis

630
ENCODEUR ET DECODEUR
pbm ; si on fait a (633), au dcodeur, les images qui vont sortir (i1 2 3 4) se dgradent, le dfaut
sur l'image i3 est bcp plus grand que sur l'image i1
pourquoi en faisant cette comparaison entre 2 images successives ?
l'encodage l'image n'est pas dgrads mais au dcodage, si.

630
I = image d'origine
I' = aprs quantification
erreur =
P = diffrence entre 2 images
i'1 = i1 + 1
P2 = i2 - i1
P'2 = P2 + 2
A la sortie : i'1 + P'2
= i'2
i'2 = i'1 + P'2 = i1 + 1 + P2 + 2
= i1 + P2 (=i2) + 1 + 2
P3 = i3 i2
P'3 = P3 + 3
i'3 = p'3 + i'2 = P3 + 3 + I'2 + 1 + 2
= i3 + 3 + 2 + 1
Les erreurs s'accumulent en fait, au lieu d'tre limit l'image en question, au dpart on a une
erreur, puis on rajoute un deuxime taux d'erreur, l'image subit des compressions multiples.
Comment rgler ce pbm ? la mmoire image l'encodeur et au dcodeur on a deux images
diffrentes c'est ce qui provoque le dfaut.
La comparaison entre l'encodeur et le dcodeur devrait se faire par rapport la mme image.
Donc avoir dans la mmoire image I'1 et I'2 la place de i1 et i2.

L'image i1 aura 1 et l'image 2 2 plutt que 1 2 3


i'1 = i1 + 1
P2 = i2 - i'1
P'2 = P2 + 2
i'2

= p'2 + i'1
=P2 + 2 + i'1
= i2 + 2

635.
Dans le MPEG 2, on va tenir compte du fait, qui les images se suivent dans une
vido.
Par ex. dans un JT, entre 2 images successive, il ne se passe pas beaucoup. Il y a juste la
bouche de la prsentatrice qui bouge.
Il y a donc un moyen de rduire le dbit en tenant compte de ce fait. C est le MPEG 2.
On insre dans l'encodeur un dcodeur + stockage d'un i'
+, I DCT, I Q
l'encodage entropique rduit le dbit, mais ne cre pas d'erreurs, l'erreur est cre par la
quantification, ce pourquoi la slide 635, l'encodeur entropique n'est plus utile.
Cette opration encodage entro dcodage entro est purement symtrique a ne sert rien, on a la
mme qualit, ici on parle de qualit (l'erreur est cre par la quantification).

La premire image, il faut lencoder (comme dans le JPEG). En mme temps quon
lencode, on la stocke dans une mmoire pixel par pixel. Quand la seconde image arrive,
on relit la premire image trame par trame et on va soustraire pixel par pixel la premire
image de la deuxime. On obtient donc une image ou on voit la difrence des deux
images. On encode donc cette image avec les difrences. Elle sera plus simple encoder
et moins lourde transmettre. Em mme temps quon encode la deuxime image, cette
deuxime image va tre stock dans la mmoire.
Le dcodeur est linverse de lencodeur. Quand la premire image arrive, on la stocke
dans la mmoire. Quand la deuxime image grise arrive, on va l ajouter la premire
image. On obtient la deuxime image.
Mais vu que la table de quantification transforme l image, on a une petite difrence entre
limage encoder et limage que reoit le dcodeur. On va donc envoyer lerreur de
compression . Comme a, on peut reconstruire correctement l image.
Quand on encode plusieurs images la suite, lerreur de compression va venir de plus en
plus grand (ils sajoutent). Cest pour a, quon envoie dans un certain rythme (12-15
images) des images entires (types i), sinon, l image sera trop fautif.
636.
Si on compare deux images qui se suivent, a marche plutt bien dans un cas et pas dans l'autre.
Dans le premier a marche bien
Dans l'autre pas (il y a du contenus, mmes des hautes frquences), dans la 2me image il y a un
mouvement latral, tout bouge. Tout a fait que quand on compare deux images qui se suivent, elles
ont pas mal volus, dans le premier cas (jt rtl tvi), bon encodage, trs peu de contenus
dans le second cas, compression va bien moins marcher.
640.
On regarde cmt les macros blocs de l'image 1 se sont dplacs pour former l'image 2, on va
dcomposer l'image en macro bloc.
On veut compresser une image qui bouge
P2 = i2 - i'1

On remplace i'1 par une autre image i'2 (projet, construite)


on cre une image 2 projet avec une technique et l'objectif ? Cette image projet doit tre la plus
proche possible de l'image relle.
640. nouveau
l'image 2 on va la dcomposer en macro bloc. Et on va chercher la position des macros blocs qu'il
avait dans l'image 1.
exemple : 641.
Le carr bleu se dplace,
642.
dcomposer l'image 2 en macros blocs et pour savoir d'ou viennent chaque macros blocs, il faut
trouver la traabilit
il faut trouver d'ou vient chacuns des macros blocs.
643.
position d'origine.
Vecteurs de mouvement : dplacement des macros blocs
ll ny a pas la mme image de rfrence. On va donc prendre limage
compress comme
image de rfrence. Avec a, on casse la cascade derreurs pendant la compression.
On va ajouter une rtroaction: on va ajouter avant l encodage entropique un dcodeur qui
va envoy limage compress dcod (I1) dans la mmoire image de lencodeur. a va se
poursuivre comme le principe de base. On vite donc la cascade d erreurs parce qu on a
la mme image de rfrence dans lencodeur et le dcodeur.
On va essayer lencodeur danalyser la relation entre I 1 et I2. Sil y a des mouvements
entre les 2 images. On va essayer de voir comment cet objet se dplace. Le MPEG 2 va
essayer danalyser le dplacement de chaque macroblock (16x16) dans l image. On par
par exemple limage 2 est obtenu par le dplacement de ces 4 macroblocks. Ce sont
des vecteurs de mouvement.

informations transports = dplacement de autant de pixels = pour connatre la position d'origine


des macros blocs.
644.
superposition des carrs aprs dplacements.
646
on s'intresse qu' ces 7 macros blocs l.
Pour 6 des macros blocs c'est vident.
Le dernier est une composition, est-ce que on a deux macros blocs qui ressemblent ? Les 2
incombls, ok le macro bloc il vient d'un ct ou de l'autre, il faut choisir une origine, comment
choisir son origine ? Celui auquel il ressemble le plus. We have to choose one.
Le macro bloc du haut ou du bas ?
On va trouver un oprateur, on va crer qqchose qui va crer cette comparaison
Sil y a des superpositions dans des macroblock, a devient plus difcile. De quel
macroblock vient ceci?

On mets en place un premier outils: le MAD (Mean Absolute Diference). On va analyser


ce macroblock.
MAD: On fait la difrence entre les pixels des 2 macroblocs. On compare la premire
possibilit et puis la deuxime possibilit. Plus la MAD est faible, plus le macrobloc est la
meilleure possibilit

647.
outil qui montre l'erreur d'cart entre les 2 macros blocs.
Le MAD = DESSIN
MEAD ABSOLUTE DIFFERENCE
00000000
00000000
00000000
13 13 0 0 0 0 0 0
13 13 0 0 0 0 0 0
13 13 0 0 0 0 0 0
13 13 13 13 13 0 0 0
13 13 13 13 13 0 0 0
0 0 11 11 11 11 11 11
etc...

Puis tu additionnes les 13 = 208 = MAD1


Mad 2 = 315
Le mad le plus faible l'emporte.
LE MAD EST UNE COMPARAISON ENTRE 2 CHOSES, UN BLOC N'A PAS UN MAD, UN
MAD EST UNE COMPARAISON ENTRE 2 IMAGES, POUR SAVOIR SI LES IMAGES SE
RESSEMBLE OU PAS.
CALCUL PAR COMPARAISON ENTRE 2 BLOCS, LA PAIR DE BLOC POUR LAQUELLE LE
MAD EST LE PLUS FAIBLE INDIQUE UNE PLUS GRANDE RESSEMBLANCE, UN BLOC
N'A PAS UN MAD, DEUX BLOCS ONT UN MAD.
On choisit donc le orange.
On a donc nos 7 macros blocs d'origine.
648.
L'image2 projet sera celle-ci.

649.
L'image P2 = image rsiduelle.
On transporte l'erreur
ce qu'on va encod en jpeg
On voit que la prdiction par vecteur de mouvement a des failles, si on avait pu la rduire aux objets
a aurait t plus facile[...]

651.
Image 1
652.
Image 2
653.
Erreurs dans la balle par exemple, parce qu'elle roule logiquement, la partie mal faites, on a prit le
macro bloc de drrire.
Les petits traits indiquent les vecteurs de mouvements
654.
Lger zoom
pano vers la gauche
dcouverte de nouveau pixels sur la gauche
bruit dans l'image = zoom, les macros blocs grossissent.

655.
Pour chacuns des macros bloc de l'image 2, on va calculer ou il trouve sa position originelle dans
l'image
on va donc comparer la position du macro bloc 2 toutes les positions dans l'image du macro bloc1
cmt retrouver le bon macro bloc
on va chercher dans toutes les positions possibles de l'image 1, le macro bloc et calculer le mad
(somme des valeurs absolus des diffrences) 16 macros blocs donc 16x16 (pour calculer 1 mad) (il
y a 16x16 sommes)
le premier macro bloc de l'image 2, tout en haut gauche, on va donc le comparer tous les macros
blocs possible de l'image 1 (calculer le mad)
16x16 car 16 pixels en hauteur et longueur dans le carr dlimit en noir slide 655.
pour une image en sd : 720 x 576
on va finir par trouver un macro bloc pour lequel le mad est le plus faible
cb de comparaison va ton devoir faire ? En horizontal il y a 720 positions 16
en vertical il y a 576 -16 positions possibles
a reprsente le nbr de macro bloc possible dans l'image 1.
a un certain moment on se rend compte que c'est celui l le mieux (dlimit en rouge dans le slide)
ensuite on rpte l'opration pour tous les macros blocs de l'image 2 pour que chaque macro bloc 2
ait son origine dans l'image 1.

(16x16) (720-16) (576-16) x (720/16 x 576/16)


(nombre d'oprations faire pour trouver tous
les macros blocs d'origine dans l'image 2 pour l'image 1)
= 4,08 x 10^12 oprations/s
= 4 Tera oprations/s (pas raliste, c'est trop)
on peut le faire mais pas en temps rel (en image vido pour un live)
LE BLOCK MATCHING (mthode qui consiste chercher la positions de chaque bloc)
ne marche pas car trop d'oprations raliser
a ne marche pas, donc ? Solution ? Solution intermdiaire qui permettrait d'avoir un peu
d'intelligence, l elle est systmatique la recherche.
Si quelqu'un s'est noy, on va pas checker toute la mer, on va dfinir une zone de recherche
intelligente.
DONC,
recherche 2 niveaux (hirarchique)
au lieu de balayer l'image 1 avec tous les macros blocs possibles, (pixel par pixel)
on va balayer tous les macros blocs, sauf ceux qui se superposent, ce qui laisse 35 macros blocs
(5x7)
une fois qu'on trouve la zone du macro bloc dans la recherche, on tend la zone 32x32 et l on
check tous les macros blocs qui se superposent. Ce qui change c'est que le nbr d'oprations
beaucoup diminuer
(16x16) (720/16 x 576/16)+ (16x16) (16x16)
=19 x 10^9 = 19 Giga
(plus rduit)
Pas la meilleur non plus, plus simple.
L'intelligence de la norme mpeg 2

Il y a donc une erreur dans limage prdite. Est-ce que c est gnant? On va calculer
lerreur entre limage prdite et limage relle. Si l erreur est trop grand, il va falloir
encoder
ce macrobloc en jpeg pour ne pas avoir derreur fagrant.
Ce quon transmet au rcepteur, ce sont donc 2 informations: les vecteurs de
mouvement dans limage et limage rsiduelle (une image de difrence qui est
obtenu
par la difrence entre limage obtenu par le mouvement des vecteurs et l image relle.
Une rotation dun macrobloc nest pas possible avec le MPEG 2.
On va essayer de retrouver le macrobloc suivant en balayant le macrobloc prcdent pixel
par pixel dans la premire image pour que le MAD est le plus faible. Mais il peut y avoir
des erreurs. Pour faire a, on doit faire 4 Terra-oprations par seconde, ce n est pas
possible.
Lide cest de faire 2 recherches, une plus grossire et une plus prcise, on les combine.
On peut aussi prendre juste une zone de l image possible pour le dplacement.
Quand on a trouv un macrobloc probable, on fa commencer la recherche plus fine: on

dplace 8 pixels dans chaque dimension (haut, droite, bas, gauche). a limite les
oprations 3 Giga-opration par seconde.
Il y a encore dautres mthodes.
Three Step search. On va dabord dplacer par 4, puis 2, puis 1 pixel. Elle marche bien
sil
y a des mouvements lents.

657
Autre type de recherche
en 3 tapes
On calcule le mad sur les 9 macros blocs qu'il y a autour du macro bloc d'origine (image 2) et on
prend le MB qui correspond dans l'image 1 et on fait une recherche quadrill dans tous les sens ds
qu'on trouve le bon sens, pareil on quadrille nouveau, a limite le champ d'action
658
Logarithmic search
(il y a des dizaines de mthodes)

660.
GOP (I et P):
On commence toujours par une image entire (I) et puis des difrences (p). On limite le
nombre dimage qui vont dpendre les un par rapport aux autres. a s appelle un GOP
(group of pictures).
Limiter la porte des encodages diffrentiels dans le fichier, limiter un gop
un ensemble d'images successives qui commence par une image de jpeg pur, d'habord il y a l'image
de type 1 puis des p calculs par vecteur de mouvement.
Un gop est un groupe d'image qui commence par une image de type i, il y en a qu'une de type 1

p = image encod de manire prdictive.


Le gop va se rpter
la structure du gop est variable
au plus le gop est petit, plus le fichier sera lourd.
Au plus le gop est grand, plus la compression sera efficace.
Si on regarde le schma de l'encodeur mpeg 2 slide 661.
Modifi
mmoire d'image remplac par le systme qui permet de construire l'image de prdiction (+
animation)
L'image 1 qui rentre dans le systme va tre encod en jpeg et en mme temps stock, encod
dcod pour avoir l'erreur de compression + stock dans la mmoire image, une fois stock, la
deuxime image va rentrer.
-I1 encod en jpeg
-i'1 (erreur de compression)
-donc on sort i'1
-ensuite la seconde image, i2 rentre et cette fois ci l'objectif est de comparer i 2 une projection de i
2 et cmt ? On compare i'1 i2, cmt ? De i2 pour chacuns de ces macros blocs, on recherche la
position des mb de i2 dans i'1 et on en dduit pour chacuns des mb de i2 ou il se trouvait dans i'1
donc on en dduit les vecteurs de mouvements, quand on applique les vecteurs de mvt au bon mb de
l'image de i'1 on cre l'image de i2 projete, l'image i2 projete on la compare i2, si la projection
est parfaite, les 2 images sont identiques, si pas, il y a une image rsiduelle P p2 qui est i2 i2p
(projete)
on compresse p2 on a donc p'2, cette image on la dcompresse, on ajoute p'2 i2p et donc on
retrouve l'image i2 avec l'erreur de compression i'2
on continue
on a dans la mmoire i'2 on fait rentrer i'3, on compare i'3 (chacuns de ces mb, on cherche le
correspondant dans i'2) on va donc dterminer que pour ces mb spcifiques on va trouver les
vecteurs de mouvements dplac pour l'image final. On a donc les vecteurs de mouvements
appliqus l'image 2 pour trouver l'image 3.
donc on va trouver l'image i3 projete que l'on va comparer l'image i3
on va la compresser on aura donc p'3, dcompression = i'3
MULTIPLEXAGE = GOP
a pue la question d'examen !!!! Savoir r expliquer !!!!
Donc ce qu'on va ajouter (multiplexer), dans le flux, VM1 et VM2 (donnes : chemins de
dplacements des mb qu'on a trouv).
Motion estimation : recherche cmt on bouge le mb 1 pour trouver le mb2
Motion prediction : xcute le mouvement.
Mux : donne l'information au dcodeur pour qu'il reproduise l'image projete.

662. Le dcodeur
il reoit quoi comme premire image (dans le flux, quel info arrive)
l'image i
ou i'1
PUIS
p'2 et vm1(vecteur de mouvement)
vm1 (extrait, sert crer l'image de prdiction)
i2 avec la comp/dcomp : stock en mmoire
suite
(mme chose)
package deuxime image vm2 et p'3
vm2 (vecteur de mvt qui transforme i'2 en i3p)
p'3 : on dcode
p'3 + i3p = i'3
entre l'encodeur et le dcodeur ? Que remarque-t-on ?
Dans le dcodeur il n'y a pas la recherche de mouvements (celle qui recherche le dplacement)
n'existe pas dans le dcodeur (pas de motion estimation) or c'est celle l qui est complexe, ou y a de
l'intelligence et de l'argent

en mpeg2 l'encodeur et le dcodeur n'ont pas la mme complexit, l'encodeur a une recherche du
mouvement = coteux.
663.
Dans l'encodage, il y a des infos qui manque souvent, (exemple de la balle, ce qui est cach
drrire, des infos manquantes etc..)
on prend l'image du slide 663, de cette image on va aller vers le carr mauve, on va faire apparaitre
un objet, cmt peut on faire pour que la prdiction de l'image 2 fonctionne,
664.
On va imaginer un truc tordu, on va imaginer qu'il y a des images de types b, qui vont chercher des
vecteurs dans plusieurs zones, on prend l'image qui prcde et aussi celle qui suivent, on va
chercher dans les images passes et futures. On va crer des images de types b qui vont augmenter
la zone de recherche dans le futur,
665.
Image 2, on peut prdire l'image 3 car le carr mauve existe dj, si on veut prdire le carr mauve
de l'image 1 l'image 2 c'est pa spossible car le carr mauve n'existe pas encore.

668.
mmoires images : parking images auxquelles on aura pas accs directement
je prends 3 images
i1 type i
i2 type b bidirectionnel
i3 type p fait rfrence l'image de type i qui prcde
DONC, i1 entre, on l'encode, donc on va l'encoder et rien dans les mmoires, on l'encode et en
sortie, on a i'1, image qui sert de rf aux autres donc on la stocke dans une des 2 mmoires images.
La type b arrive, image 2, comme elle dpend de l'image 1 et 3, comme on a pas la 3, on la parke
dans la mmoire d'image l'entre (pendant 1 image on fait rien) I B P (GOP particulier)
On attends, ensuite rien ne se passe, rien n'est transmis (info au dcodeur)
ensuite on reoit l'image de type p (3), l'image 3 fait rfrence l'image i qui prcde donc 1, donc
l'image 3 on peut calculer l'image 3 prdite au dpart de l'image i'1 et de l'image i3.
On a les vecteurs de mouvement pour i3p, cette diffrence, delta, on va l'encoder en jpeg, donc delta
'3 et le dcodeur saura mnt la diffrence entre l'image projete 3 et l'image relle.
Alors l on a encod l'image 1 et l'image 3, on encode l'image 2 mnt, d'habord il faut stocker l'image
3 qui est dcoder, l'ajouter l'image rel (-), i'3
on a mnt dans la mmoire i'1 et i'3

on rcupre mnt i2 dans la mmoire tampon,


c'est p/r cet i2 qu'on va rechercher les vecteurs de mvt, en regardant dans les deux images
voisines.
On va comparer i2 par rapport i'1 et i'3 (deux fois plus de calculs)
c'est deux images qui servent de rfrence du coup.
Une fois fait, on calcule les vecteurs de mvt pour l'image 2 appliqu l'image i'1 et i'3, donne
l'image 2 prdite, on calcule la diffrence entre i2b et i2 = delta = image prdite en mode
bidirectionnel de l'image(?) = Delta 2.
On a tendu 2 images donc on a plus de chances de trouver le bon mb
MB = macro bloc.
Plus il y a d'images de type b entre i et p, moins bonne sera la prdiction sauf si les mvts sont lents
ou qu'il n'y en a pas.
Si il y a bcp de b et peu de p c'est idal.
Delta = P (diffrence entre l'image prdite et rel).

(page 668 - 672 donc dernire tape du schma)


673. Le dcodeur
(?)
Encodeur encode l'image 3, recoit p3 et les vm pour l'image 3, on rcup vm3 qu'on applique
l'image i'1 et donc on trouve I3p qui est l'image 3 prdite au dpart de l'image i'1, l'erreur de cette
prdiction c'est delta'3, ajout l'image i3p a donne i'3 et donc on a i'3, cette image I'3 on la stocke
dans la mmoire d'image, l'encodeur gre ensuite l'image 2, il fournit delta'2 et vm2, delta'2 qu'on
retrouve prt du (+) et le vm2, vm2 ce sont les vecteurs de mouvements appliqus i'1 et i'3 donne
I2 partir de la prdiction bidirectionnel de i1 et i3. (je crois)

Mmoire d'image remet les images dans l'ordre, transforme a et remet la squence avec un dlai de
2 images, sort i'1 i'2 et i'3.

(dernire tape du schma nouveau (slide 673 - 677)


678.
Un gop peut prendre n'importe quelle config (avec des i b p)
une image de type p ne fera jamais rfrence une image de type b
p : toujours par rapport une image passe
les images de types b prennent rfrence des images i et/ou p qui encadre.
Le gop se caractrise par la structure d'encodage et dcodage, s'applique de manire rcurrente
l'ensemble des images de la squences, quand on a dpass les 8 images du gop, on r applique la
structure encore et encore, objectif : faire en sorte qu'il y a le moins d'images de types i car elle pse
mais elle permettent de commencer le dcodage ou la lecture. Si on devait commencer lire le flux
entre 2 b on pourrait pas. Le gop est fortement intriqus, quant au poids, (680)
Une image b : bidirectionnel qui va donc tre prdite par r/p un vecteur de mvt de l'image i qui
prcde ou p qui suit.
On a donc intrt augmenter le nbr d'images b, (plus il y en a moins elles seront efficaces par
contre) car elle pse quedalle. Plus la squence de b est longue plus la squence va tre diffrente.
Si on a 200 images b (8 secondes) en 8 secondes on a toutes les chances d'avoir un changement de
plan. Donc les proportions sont vraies dans une certaines mesures (entre 15 et 20 le nbr d'images
dans le gop).

681.
gop ferm (le gop du bas)
le gop ouvert (celui du haut) quand la dernire image est de type b (celle du gop)
Quand on coupe la fin du gop il faut que le gop soit colmplet alors que dans l'ouvert il faut
prendre le i en plus pour dcomposer le gop.
LE B NE PEUT PAS PRENDRE REFERENCE A LUI MEME !
1 b = efficacit le choix des p et b ne dpends pas du contenu de l'image
full b comme si tu fesais full jump cut dans ton montage, plus chaud compresser = perte de
qualit.
Mjpeg 682 (du bas)
MOTION JPEG (mouvement) (super lourd)

6.2. MPEG 2 (moving picture expert group)


Dans le JPEG ou MJPEG, on va juste tenir compte dimages unique. Chaque image pour
soi. Dans le MPEG 2, on va tenir compte du fait, qui les images se suivent dans une vido.
Par ex. dans un JT, entre 2 images successive, il ne se passe pas beaucoup. Il y a juste la
bouche de la prsentatrice qui bouge.
Il y a donc un moyen de rduire le dbit en tenant compte de ce fait. C est le MPEG 2.
683
686
C'est l'ordre d'encodage qu'on voit sur le slide mais en ralit a donne :
I B B P B B P B B P structure globale du gop
DESSIN 2

699.
Comparer fficacit entre le mjpeg et ?
701.
702.
Typiquement dfauts qu'on verrait pas car dfauts dans les HF, l c'est mga zoom donc on le voit
8MB/s (diffusion) 40 MB/s (post prod)
706
Comparaison.
Mjpeg 2 (blocking)
pour un dbit identique on a une meilleure qualit
Mpeg 2 8 MB/s, quel dbit faudrait il mettre le Mjpeg pour avoir la mme qualit ?
21,3 Mb/s
quel est le gop le plus efficace ?
IBBPBBP
IBB

1 + 1/4 + 1/4 + 1/2 + 1/4 + 1/4 + 1/2 = 3 (donc le premier)


1 + 1/4 + 1/4 = 3/6
1 + 1/4 + 1/4 + 1/4 = 1,75/4
vido coupe du monde
les paillettes font du blocking, car y a trop de hautes frquences dans l'image.
Les coef de hautes frquences sont rduits, le second pbm c'est que tout a c'est ds macros bloc dont
il faut trouver l'origine, imagine l'encodeur qui doit trouver la position du macro bloc prcdent etc..
a rend tout faux, le dbit augmente = si on veut le garder constant on est oblig de perdre en
qualit. Si on veut filmer les confettis on augmente le dbit.

712
dlai entre la rponse du pre (bonjour)
transmission, ce genre de duplex sont fait par sattelite
sng (sattelite news gathering) envoi un faisceau vido et audio vers le car (voiture rtbf) le sons va
vers le sattelite et ensuite descend vers la voiture.
Soucis ? Distance 36 km x2 = 72 000 km, le simple fait de monter et descendre = 144 000 km peu
prt, la vitesse de la lumire. (300 000 km) = 1/2 seconde pour la transmission (300 000 / 144
000) ( peu prt).
Le reste, c'est le dlai d'encodage mpeg 2, pour le calculer, prenons un gop plus simple
I B B P B B B P (pour calculer son dlai)
715.
I on peut l'encoder
B on peut pas sans p
P dpends de P donc on peut l'encoder, quand on reoit I 5 on peut encoder i 2 i 3.
Il faut I8 pour encoder I5 I6 et I7 (on peut stocker I5 6 7 temporairement en attendant I8)
dcoder des images mpeg 2
on peut tout dcoder car ils sont dans l'ordre de dcodage
mnt il faut les remettre dans l'ordre
on rajoute un dlai supplmentaire

SEANCE DE QUESTION REPONSE.


Facteur de Kell.
En sd
Le facteur de kell est un lment qu'on utilise lorsqu'on calcule la bp analogique du signal vido.
Cmt la calculer ? On part du nbr de lignes (585 lignes que l'on affiche dans l'image, (ce qu'on voit
l'cran) et comme l'oeil est isotrope, on va se dire, on va reprndre la rsolution qu'on a verticalement
et on va la mettre horizontalement.
Calculer le nbr de lignes verticales qu'on peut avoir au maximum.
Les variations que l'on tudie sur le signal analogique ce sont des variations lignes aprs lignes,
aucuns signals analyse verticalement.
On part de ce qu'on connait, on sait qu'on a un nbr de lignes dfinis, affichable sur l'cran.
Et on en est 585 lignes Horiz. (affichable) ce qui nous intresse c'est le nbr d'oscillations, donc la
rsolution, on doit la calculer en cycle. Si on a 585 lignes, on a 585 demis cycles par image.
[Priode : moment ou on reprend les mmes valeurs (au bout d'un cycle) 585 demi cycles par
hauteur d'image, (slide 94)]
principe bp : slide 92, ligne de y, nbr max d'oscillations qu'on peut avoir, nbr d'alternance n/b sur
l'image (freq max)
min : quand toute l'image est uniforme (frquence nulle).

(slide 95)
sauf que entre les deux il y a un syst. De capt. D'image (camra + ccd) et que fait-il ? Il va via
l'optique envoy les rayons lumineux qui correspondent lumires blanches (?)
(gros plan du ccd sur le slide 95) (affiche les 7 premires lignes de l'image)
ccd : mesure le niv. De lumire (luminance) si la lumire qu'il capture est du blanc, il va sortir 700
mv si c'est noir il va sortir du 0mv.
Sauf que (le facteur de kell intervient) si on dcale un peu l'image verticalement (pique la cam) les
lignes blanches et noirs vont pas tre superposs au capteur. Dans ce cas l comme le capteur sort
qu'une valeur, il est limin en partie par du noir et en partie par du blanc. Dans ce cas l les
capteurs mesurent du gris et l'image est totalement grise. On a donc dans les 2 cas, la mme image
film par la mme cam et le rsultat est diffrent. Pour viter ce cas l on dit que 585 demi cucles
par hauteur d'image c'est trop lev, on est pas sur de le garantir dans tous les cas, pour tre sur on
va rduire cette rsolution maximum, et de combien ? Par le facteur de kell (outil qu'on applique
la reso maximale pour rduire, on arrive 200 cycles par hauteur d'image).
(slide 96).
Je renverse l'image, pivote de 90 degr, en gardant la mme rsolution, si on a 585/2 x0,7 = on en a
un peu plus car l'poque on tait en 4/3 donc elle devient 1/3 plus large qu'elle n'est haute. Donc
maintenant on peut compter horiz 585/2 x 0,7 x4/3 alternance N/b sur une ligne de l'image.
On a 272 cycles par largeur d'image, ce qu'on veut c'est avoir le nbr de cycles par secondes, or on
sait que a c'est 52 ms par ligne, donc si on a 292 cycles par 52 ms, on pt calculer le nbr de cycles
qu'on a par secondes. 292/52 ms = 5 millions de cycles par secondes = 5 Mga Hertz
5Mhz reprsente le nbr de variations max que le signal de Y peut avoir.
Slide 608
Une variation du codec jpeg, qui permet d'amliorer, de repousser l'aparition du blocking
slide 606
le blocking c'est en fait li au pbm que 2 blocs compress en jpeg, sont cods de manire
indpendante.
Quand on met 2 blocs ct l'un de l'autre, le premier suit la dct codage entropique etc..
quand on est dans des t de compression acceptable, tout va bien. Car on va d'hab commencer par
couper les HF, quand on augmente la compression, un moment les blocs vont tre compress
indpendamment l'un de l'autre, risque ? Aprs compression/dcompression, les 2 blocs se
ressemblent sauf qu'ils sont pas identiquement gaux l'origine, le risque c'est que quand on met 2
blocs voisins,on introduit une erreur de bord, car 8 9 10 11, 7 9 11 13, quand on les met l'un ct
de l'autre on obtient 11 13 11, le dgrad a un pbm car il y a un marquage supplmentaire, erreur de
bordure, qui va marquer les blocs qui sont cods indpendamment (c'est le blocking)
on voit des lignes verticales apparaitre dans l'image d'en dessous (slide 606)
slide 607
pq on voit apparaitre cette erreur ? on la voit apparaitre dans des zones ou le niveau est plutt
uniforme, on voit que le vert sur certain blocs est plus fonc, pq ? Car on a tellement compress, on
divise les coef de HF = ringing blur (pas trop visible) puis on va diviser un certain moment de la
compresser le coef de BF, du coup quand on dcompresse l'image on obtient un rsultat diffrent
pour 2 blocs de l'image

comment prserver le bloc de BF = schma pg 608. Schma classique DCT Q ZIG ZAG RLC RS
ENCODEUR HUFFMAN, simplement pour le coef dc (bf de l'image) ac ( tous les autres)
pour le dc, ce qu'on va faire c'est que plutt de l'encoder tout seul on va l'encoder (logiquement le
niv dc varie peu sur l'image) d'ailleurs dans le verdatre, le niv dc est constant (niv de lumire) ce
qu'on va fr c'est que plutot de l'encoder en valeur le coef, on va l'encoder par diffrence, si pe il vaut
34 pour le premier coef, 32 pour le suivant, h bien plutt que de l'encoder 34 et 32, on va encoder
34 32 = 2, le dpcm c'est la diffrence entre la valeur dc du bloc en cours et du bloc juste avant et
donc du coup la valeur dc au lieu de valoir 32 elle vaut plus que 2 et par l'encodage entropique et
par la classe rs on va l'encoder sous moins de bit (on garde la prcision dans chacuns des blocs)
pour viter le blocking.
LE GOP
plus il y aura d'images de types b qui senchane dans le gop, les images de type b ont le plus haut
taux de compression. Si je prend un gop ici,
IBBBPBBBP
dans ce bloc-ci, les images de types B dpendent des images i et p qui les encadrent, si on prend
celle ci (la 4eme B) (dpend : image de ref. On va la construire par vecteur de mvt..(?)
entre l'image b et image i, il y a 3 images (120 ms d'cart), si mnt on a une squence ou il y a bcp
d'images B
genre : I B B B B B B B B B B B B B B B B B B B B B B P
on prend le 10e B, dpendra de l'image I au dbut et de P la fin et donc l'image quand on va
calculr, essayer de trouver le MB d'origine, il s'est pass 400 ms avant et (disons) 350 ms (au
hasard) aprs, donc l'image du B(10e) ne ressemble plus du tout au l'image I au dbut ou P la fin
donc compromis, a rduit le dbit mais ce n'est vrai que si le nbr d'image B et donc plutot que
d'avoir a il vaut mieux avoir une structure avec un long Gop avec des images de types I puis genre
4 B puis un P, le gop peut tre long, a n'influencera pas la qualit.
Gop ouvert : se termine d'offices par un b
Gop ferm : se termine par un P
juste un I = gop ferm.
Il y a toujours qu'un I par gop (image qui commence le gop)
MULTIPLEXAGE
slide 249
on prend 3 chant pour le premier pixel, un chant pour le 2e, 3 pour le 3e (4:2:2)
il faudrait (comme en analogique) 3 tuyaux
comment mettre les 3 en 1 tuyau, on alterne les chantillons, on les mets les uns drrires les autres,
on a qu'un signal.
SDI : comment on les met en srie
slide 300
les 10 bits de chaque chantillons, on va les multiplexer dans le temps, dans le temps d'un
chantillon, on va faire varier les 10 bits (dbut du sdi) (conversion parallle vers srie)
Slide 85, exercice 1
(circuit) on revient au schma lectrique, on connecte a 1 point du moniteur, on dit que on y met du
gris 50% (350 mv l'entre du moniteur) puis aprs que fait-t-on ? On ajoute un second moniteur,
qui ont tout deux 75 ohms d'impdance d'entre.

(Comment constater si c'est en srie ou parallle, en tl c'est en srie, toujours)


la chute de tension l'entre du moniteur est provoque par un courant plus faible que tout l'heure,
le niveau va alors changer. (PRINCIPE)
c'est un pont diviseur de tension (norton, tevenin)

TIV 8
(20/11)
708
squence slide 716, quand on zap une chane sur une distribution numrique.
Quand on regarde les squences les unes par rapport aux autres, les diffrents flux, ils ne sont pas
synchro entre eux, les gop ne sont pas synchro.
Slide 717.
du haut I B B P B B P (premire squence) si on la prend et on dcide l de zapper, que doit-on
faire ? Si on est en plein milieu de la 2e squence, il faut terminer le gop correctement, s'arrter au
prochain p qui suit, (p dpend de ce qui est pass) si on termine le gop, alors a se passe
correctement (dans le cas d'un gop ouvert) si c'est un ferm il faut prendre le i en plus !
Delta T = temps d'attente pour le dmarrage de la chaine suivante, nbr d'image qu'il y a avant
un I (si il y en a 7, a fait 7x40 ms = 280 ms).
Globalement le gop est un lment qui aide rduire le dbit mais gros pbm, ct non scable
d'un gop, on ne peut pas couper dedans.
Slide 718
Si on prend 2 squences (MONTAGE) et qu'on veut couper entre, c'est clair que a va tre plus
complexe, on ne monte pas au gop prt, 8,10 images prts, on monte l'image prt, il faut que ce
soit, on doit intervenir dans le gop, l'ouvrir, le charcuter.
On garde la structure du gop du premier fichier, au moment du cut, on doit alors recalculer les
images, les r encoder avec la nouvelle structure du gop, on doit tout re calculer, c'est embtant pcq
le fait de le faire fait que d'une part c'est couteux en temps et on compresse/dcompresse (perte en
qualit) le second fichier sera de moins bonne qualit (ce mode de fonctionnement est viter, on le
fesait au dbut car les players ne pouvait pas avoir des gop diffrents). PREMIER MODE :
MODE ANCESTRALE.
DEUXIEME MODE
il y a 2 choses : premirement on use la mme struct de gop que la mme sq d'ou elle vient et
deuximement, on dit que on a 2 seq, chaque un gop particulier, on applique chaque gop jsuqu' la
cassure, on reprend le gop 1, la cassure les gop ont changs, on doit dcoder rencoder car les
image de ref n'existent plus, l'image b fait rfrence un p qui n'existe plus et pareil pour le 2,
DONC ON DOIT RE ENCODER, (les 4 images grises sur le slide)
Autre mode : calquer le gop sur le fichier que l'on r utilise, et donc jusqu' la cassure, on a une
cassure qui est celle du fichier A et puis (?) celle du fichier ?
Lorsqu'on a un I dans le second fichier (?)
Donc il faut s'attendre avoir une augmentation de dbit localement car les b ne sont plus vrmt des
b mais plutot des p et a risque d'augmenter le dbit ou de diminuer la qualit.
L'encodage d'un type p peut mal se comporter car il peut s'identifier un I prcdent qui ne
correspond pas la bonne image (perte de qualit : blur ringing blocking etc..)

l'image p (dpend du i ou du p ? qui prcde)


3eme mode : SMART RENDERING
de modifier, de passer, d'utiliser, de se rapprocher du second mode.
on va d'une part faire en sorte d'viter le pbm du 2eme mode, on va modifier le gop qui termine la
premire seq, on va faire en sorte de fermer le gop, on transforme en type p la dernire image qui
serait de type b. Donc la dpendance entre les images cohrentes entre elles, s'arrtent la cassure,
et on recommence le gop suivant sur base d'un nouveau gop avec une image de type I.
Augmente un peu le dbit localement, pour arriver attnuer ce pbm, on modifie, on tend le gop,
on fait pas I P I, on transforme ce b en p et on obtient qqchose de facile, les 2 gops seraient
cohrents, et a fonctionnait, or ce qu'on a fait, on a modifi une srie d'images pour lisser le dbit
et pour r tendre l'augmentation de dbit sur plus d'images, on recrer des gop, rpartition sur plus
d'images. En gros c'est r encoder les images qu'il faut rellement r encoder et fr en sorte que au
moment ou on coupe, colle 2 fichiers, que la qualit et le dbit soit prserver, on fait pour a en
sorte de fermer les gop de par et d'autres de la cassure, que cela ne dpendent que des images qui se
ressemblent et le second gop on l'tale pour viter que l'augmentation de dbit soit trop concentr.

Slide 719
inter-oprabilit ?
Les niveaux : li au dbit, en sortie d'encodeur, dbit impacte la taille de la mmoire tampon, la
puissance de calcul, la puissance de feu du dcodeur encodeur, plus le dbit est lev plus a coute
cher. En fonction de la rsolution, on a des niveaux diffrents, en Sd il faut moins de calcul qu'en
HD videmment. On a dfini 4 niveaux.

les profils : type d'encodage que l'on va raliser : on utilise deux types de fonctionnement (les
macros blocs et le type d'image qu'on met dans le bloc) Donc un axe d'application, c'est le type
d'encodage de la couleur et c'est le type, de quoi sera compos le gop, cas simple : on rduit
l'encodage de la couleur ( - qualit) si on fait du 4 2 0 avec des images I et P, on a vu que la seconde
mmoire pour les images de types B donc le schma encodeur dcodeur sera plus simple (MODE
SIMPLE)
MODE CLASSIQUE : mme mode mais on traite les images de types B, on a que un bloc de CR
CB pour 4 blocs de Y
MODE HAUT : Fonctionnement complet, schma bloc qu'on a vu, en 4 2 0 (le high)
MODE PARTICULIER POUR LA TV : High 4 2 2, mode profile, mode en 4 2 2, avec les images I
BP
Dbit maximum qu'on peut traiter, pe : 4 pour le low, 15 pour le main sd etc..
422P@HL : peut tout dcoder, dcodeur les plus puissants
ce type de dcodeur peut dcoder tout le tableau.
Autre exemple le 422P@ML peut quant lui dcoder tout ce qui est sa droite et en bas de lui.

SYNTHESE

Squences vidos.

CEGAFDB
Plus le dbit est haut, plus il est dure classer de manire croissant ou dcroissant.
MPEG 4 ET H264
pour faire du mpeg 2 on tait partis sur un compromis, pour crer l'image de
comparaison (projete) on se base sur des macros blocs et on essaye de trouver leur
dplacement, l'idal eu t de prdre des objets pour voir cmt il se dplace (au dpart le mpeg 4
c'est a) comment dtourer et extraire les objets de l'image et construire une image de
projection sur base des (?)
on dcompose l'image en objet et on regarde d'ou viennent les objets de rfrence.
729.
certaines images sont facilement encodables en mpeg 4 : (par exemple) en info graphie (image de
synthse) on doit pas les extraire de l'image, ils sont par essence dans l'image, on peut chopper leur
trajectoire etc.. le mpeg 4 marche bien pour a.
Comme on voulait une amlioration du mpeg 2 on a imagin un standard intermdiaire, une sous
partie du mpeg 4 = H264 (3 noms rfrence un mme codec qui est une sous partie du mpeg4)
Comment faire pour amliorer le mpeg2 ?
1)-La taille des blocs (les rduire pour qu'il soit plus petit)
2)-Augmenter le nombre d'images de rfrences
3)-Cue point
4)-I
5)-adapter les gop en fonction des squences
6)-utiliser les b comme rfrence.
7)-(des vecteurs rotatifs, pour la balle par exemple)
8)-overscan
9)-vm (vecteur de mouvements) 1/4 prof. Pour si jamais en arrire plan il y a un nuage qui se
dplace, c'est tellement lent qu'il est alors intressant, d'avoir 1/4 de pixels pour tablir prcisment
les mouvements de ces objets lents.
10)-encodeur entropique plus efficace (tape zig zag rs rlc huffman : effectue la compression de
l'image, rduit le dbit), on va donc en mettre un autre.
11)-On peut imaginer un filtrage qui efface le blocking (Si on a une image + blocking + logiciel de
painting : tu prends un pinceau blur et tu passes sur les bords et tu enlves le blocking, on efface
une structure).
Ces 10 points sont appliqus dans le codage H264
slide 732
H264 : addition de recettes que l'on ajoute au mpeg 2 pour le rendre plus efficace.
Recette 4 : plus de dbit gagner, sur l'image de type I, trouver un moyen ? De rduire son dbit ?

Slide 733
on prend un bout de la norme, de l'image, le bord du casque et qu'on prend le macro bloc du bord du

casque a donne l'image en bas gauche. On constate qu'il y a une certaine symtrie dans cette
image. Donc l'ide c'est de se dire que cette image n'est pas alatoire, on peut la construire au dpart
de ce qu'on connait de l'image, on connait les macro blocs qu'on a dj balay.
Bloc jaune, on pourrait le calculer au dpart des blocs avoisinants (animation slide)
je vais utiliser les blocs qui entourent et au dpart de ces blocs connus, je vais essayer d'en dduire
le comportement du bloc.
L'ide : connatre le bloc jaune au dpart des voisins
comme pour les images en mpeg 2 de p et b, on va essayer de projeter une image I, (?)

on va se limiter, on va prendre des blocs plus simples (petit) de 4x4, on va essayer de dfinir le
jaune au dpart de 13 pixels, ces 13 pixels vont servir de base pour la prdiction des 16 pixels
encadrs en jaune. On va imaginer plusieurs modes de symtrie dans l'image, celle-ci a une mode
de symtrie en diagonale, on remarque que cette symtrie fait que en recopiant les pixels, on cre
une image qui se rapproche de la ralit, prendre les pixels avoisinants, et faire des symtries sur
ces pixels.
9cas : (mode d'interpolation)
1. symtrie verticale : colonnes, comme une cloture, on va reporter les valeurs des pixels,
verticalement (736)
2. symtrie horizontale (737)
3. symtrie (pour les grands aplats, dans la tte de cheval bleu par exemple) moyenne, faire
une moyenne que l'on reporte sur l'ensemble du bloc (738)
4. symtrie en diagonale 1. (739)
5. symtrie en diagonale 2. (740)
6. etc... (741)
7. etc... (742)
8. etc... (743)
9. etc... (744)

745.
comment choisir le mode de prdiction, pour le bloc jaune par exemple.
Le MAD, outil mathmatique qui comparent la diffrence entre 2 choses.
On compare les 9 projections (pixels du haut)

747.
Sur base du mad, choisir unes des 9 projections
la projection pour le mode verticale on reprend la valeur A et on la reporte
puis le MAD = somme des valeurs absolues des diffrences
ce qui nous donne pour le premier :
Pourquoi ? 10-12 = -2 en valeur absolue = 2
1.
2
3
2
1
4
4
1
2
4
3
1
1
4
3
1
1
=37
2.
2
2
0
1
=39

5
4
1
2

6
3
1
2

5
2
1
2

3. (moyenne)
12 + 10 + 8 + 6 + 12 + 10 + 8 + 9 = 9,4
(75/8)
9
9
9
9

9
9
9
9

MAD = 29.
4. = (mad) = 8

9
9
9
9

9
9
9
9

5.
6.
7.
8.
9.

= 59
=55
= 55
=9
= 33

le 4 est gagnant, pour le bloc de rfrence, on va transporter le numro de prdiction, la 4eme, + une
image qui composera l'image rsiduel.
Donc tu compares 4 et celui de rfrences
donc
10-10
7-8
6-6
7-7
on va transporter une image donc rsiduel : diffrence entre une image relle et une image prdite
(construire en appliquant les prdictions sur chacuns des blocs de l'image)

749.
plus la prdiction est bonne, plus faible sera le contenu de l'image rsiduel (image gris avec
les tches)
positif = vers le blanc
ngatif = vers le noir
0 = gris
750.
encoder l'image rsiduel la plus faible possible, l'image i interpol, prdite par rapport elle mme,
objectif atteint, partir du moment ou l'image qu'on a construite avec le mode de prdiction se
rapproche de l'image rel.
Slide 668
Prdiction : doit se rapprocher de la ralit
Mux = vm = vecteurs de mouvements
on va comparer l'image p/r elle mme,
prdiction intra : recherche des modes de prdictions et les modes sont appliqus une image, ils
permettent de reconstruire et de prdire et l on calcule l'image et on va le comparer (a) l'image
relle.
Principe DE BASE encodeur mjpeg 2 et h264, on encode TOUJOURS une image rsiduel
(diffrence image rel et sa prdiction)
le dans le schma = Delta (on encode une image rsiduelle)
le dcodeur de l'image prdite doit faire le mme trvle la rcpetion,il faut lui donner les outils,pour
les I = mode de prdictions (permettent de crer une image par rapport elle mme, sans aucunes
rfrences)

p et b = vecteurs de mouvements
750.
Amlioration principal de l'h264
751.
Premier amlioraton que l'on fait l'encodeur mpeg 2, image de type I, aprs il y a une dizaine
d'amliorations que l'on fait qui sont des points que l'on va amliorer qui sont soit optionnelle soit
obligatoire.
1. variable des macros blocs (on revient sur les 10 amliorations cits en classe)
1. les macros blocs sont figs dans l'image et leurs structures ne colle pas aux objets de
l'image
1. adapter la taille des macros blocs la zone de l'image (aux frontires des objets) par
contre au milieu d'un objet on peut augmenter la taille d'un macro bloc.
752. adaptation de la taille des macros blocs : l ou il y a du dtails, les macros blocs sont plus petits
alors que ceux qui ont moins de contenus en haute frquence restent avec la taille d'origine.
Pour faciliter la recherche des vecteurs de mouvements.
La tte du canard pe : 8 macros blocs au lieu d'un seul, dans les 8 il y en a peut tre 4 lis au
dplacement de la tte du canard et 4 lis l'eau.
754.
Un macrobloc pour du 4 2 2 ou 4 2 0 : taille 16x16
on aura des mb de 8x16 8x16 (verticalement ou horizontalement)
8x8 8x8
8x8 8x8
le plus petit mb qui existe c'est celui de 4x4 et le plus grand 16x16 (quand on est au milieu d'un
objet dans un aplat alors qu'aux frontires on aura des mb de 4x4).
L'objectif est que on limite le nbr de macro blocs et la taille des mb qui portent plus d'un objet. (?)

756.
on peut pas mettre du 4x4 partout, car sinon il faudra chercher plus de combinaisons = plus de
calculs = consomme bcp de puissance de calculs = quilibre entre la ralit et la faisabilit et

l'efficacit en terme de compression.


758.
flou = gros macro bloc
759.
les mvts sont lents et les objets se dplacent trs peu : plutot que d'avoir, de dfinir un vm, on va
essayer de dplacer des objets l'intrieur des pixels. (8eme points/10)
dplacer au 1/4 pixels, il faut donc connaitre les pixels qui manquent, on va les crer, cmt ? Avec un
algorithmes qui va calculer les pixels au dpart des autres (avec des lois).
Interpolation des valeurs des pixels entre eux. Il y a au dpart de 4 pixels on va crer par exemple
16 valeurs de pixels manquants. (slide 761)
a va augmenter fort le nbr de calculs car on interpole les images de rf. Par /r une position d'un
mb d'une image qu'on veut prdire on va chercher toutes les positions possibles au 1/4 de pixels
prt, nbr de calculs x16 en gros, on tait 4 tera et l on sera 24 tera.
Donc l'image projete sera tellement raliste que l'image rsiduelle sera super moche, il faut avoir
une image rsiduelle la plus moche possible pour avoir une image projete qui se rapproche le plus
possible de l'image relle.
762.
En principe, si on utilise l'image qui prcde comme rfrence ? What's up ? On se rend compte que
les ailes du canard la 8eme trame par exemple sont en l'air et en remontant on se rend compte que
c'est la premire trame que le canard a les ailes vers le haut donc on tend la zone de recherche
des mb possibles car l il fallait remonter de 8 trames pour rechoppr la mme image. Donc l'ide ici
est que pour une image, on ait plusieurs images de rfrences.
763.
en h264 on utilise plusieurs images de rfrences pour amliorer, que la taille de l'image rsiduelle
soit plus faible.

769.
si on permet que nimp quel image b servent de rfrence nimp quel b a va tourner en rond, donc
du coup on peut pas avoir de cycle, et pour viter, on utilise une structure hirarchique pour les
images de type b, si on prend exemple sur le gop du dessous, on prend le b4 comme sous rfrence
b2 b3 ..etc..
aucunes image b sert de rfrence or ici on permet certaines images b de servir de rfrence et cmt
choisir ? On la prend par hirarchie comme celle-ci
structure hirarchique des gop.

770.
les images I sont encodes par rapport elle meme en mpeg 2
les p par rapport i ou p qui prcde
et b par rapport i et p qui encadre
771.
on voit la main droite, elle se transforme, elle est ferm puis s'ouvre. Aucuns points communs entre
la premire main et la 4eme, on trouvera pas de rfrence entre celle qui prcde car cette forme
n'est pas l dans la prcdente, donc si cette image (quatrime).. on va chercher une image ou le
mad est le plus faible comme rfrence. Alors que on a mis en place un mode d'interpolation intra
qui pourrait tre plus efficace car il se base sur une forme d'interpolation dans l'image en temps que
telle. Signifie que parfois le mode de type d'image associe une image n'est pas forcment le mode
le plus adquat, l'ide ? Permettre que alors qu'on a dcid que l'image tait de type b ou p, de
choisir un mode d'interpolation qui soit diffrent. Ces images, (les quadrilles) les bleues et vertes,
correspondent des blocs de type b, simplement, un moment on se rend compte que la main qui

se dforme ne trouve aucuns correspondants des images qui servent de rfrence et en h264 on
permet que ces mb pour lesquel on ne trouve pas de correspondance donc on trouve un autre mode,
le mode I, le mode intra. Et donc on le voit toute la main est en rouge, et donc qu'on aurait du
chercher des correspondances dans les images de types b ou p qui prcdent dans certains cas a ne
donne rien, ce sera le cas d'un changement de plan, si l'image est de type p (rf image passe qui n'a
rien avoir)

772.
dans une image de type p, on accepte que certains blocs deviennent des blocs de type I et dans des
types b, peuvent devenir i ou p, permet d'apporter denouveau une image rsiduelle au contenu
faible.
type par slice. (H264)
774.
points rouge : de type I (mb cod en intra)
bleu : image de type p (que dans l'image qui prcde)
vert : image de type b (bidirectionnel)
pareil pour les blocs, quand ils sont bleus = type p etc..
dans cette premire image, de type I, tous les blocs sont en mode I, rouge
points jaune : quatrime type de bloc

782.
points jaunes : skip (mode), dire on remplace le mb par le mme mb de l'image qui prcde,
identiquement gal, on change rien en gros.
775.
l'ide c'est que mnt on peut imaginer que des zones de l'image ait un comportement prdfini, on
filme par exemple une interview, dedans il y a la personne de dvt qui bouge et l'arrire plan bouge
pas c'est une zone de l'cran laquelle on applique un codage i b p skip, ide ? Arriver dcouper
image par image, mais on peut aussi donner un type d'image par morceau d'image. On perd la
notion de gop, elle s'applique des groupes of slices, on applique un type de codage slice par slice.
Gos de type i b p
un gos de type b peut avoir des macros blocs de type i ou p
la dcomposition elle est structurelle, elle est pas dynamique
on peut remplacer un type de macro bloc par un autre moins efficace.
Slice de type b b ou i ou p
i que du i
p p ou i
Les slices = succession de mb les uns aprs les autres, des mb qui partageait la mme table de
quantification.

776.
les slices c'est soit des mb qui sont contigus dans l'ordre du balayage
(4slices diffrents dans une mme image)
en h264 on peut modifier l'ordre des slices
778.
crer des slices qui ont des formes alatoires, dcider que au milieu de l'image on a une slice, par
exemple pour laquelle on a peu de dtails, on sait alors que la quantification sera alors faible, par
contre une autre zone qui serait le visage, pour laquelle la quantification sera leve, on peut dfinir
des zones qui regroupe, forme des slices pour lesquels on applique les mmes paramtres de
compression.
Les modes de panoramique : couper l'image en 1/3 2/3 car on sait par exemple que le ciel = 1/3 pas
de dtails, 2/3 en bas = full dtails (deux niveaux de compression diffrents entre les deux zones).
783.
toujours li au vm, que se passe-t-il quand il y a un pano dans l'image et qu'on dcouvre des
choses... tendre l'image, l'overscan, avoir une image plus grande, cmt fait-on pour avoir une plus
grande image
784.
Une image rentre, on a pas tout le cercle orange, on cre une image du coup plus grande (overscan)
mais comme on connait pas le contenu on l'imagine, on la recopie sur la taille d'un macro bloc
(16 pixels), on recopie les mmes pixels que ceux en bordures (784 animation). C'est meilleur que
pire, si on fait rien on aura un mauvais rsultat.
Les cue points, ce sont les key frames.
Quand il y a que des macro blocs rouge, dans ce cas l a devient une image, on la transforme en
image purement i, alors que c'tait une image p ou b, image KEY FRAME, pour faire une dcoupe,
key frame = utile pour le codage.
Un des moyens pour rduire le nbr de calculs, commencer par appliquer pour un mb, le mme
codage que pour le mb qui tait ct, pour un mode intra, mb type i, on va commencer par
calculer le mad pour la mme interpolation, a va donner un certain mad et si le mad est du mme

ordre de grandeur, on va pas plus loin (?)


si par contre on a un mad = 8 (pe) si pour le mb d' ct on applique l'interpolation 4, on obtient 10
alors on dit que c'est le mme ordre de grandeur, l'interpolation 4 si on obtient 5 c'est pas bon.

785.
comment on avait rgler le pbm de l'entrelacement du mjpeg ?
Mvt dans l'image compression apparition hf (rappel)
on avait inverser les trames.
Ce mode de fonctionnement on peut l'appliquer en h264, on regroupe l'image en 2 trames, trame 1
au dessus, trame 2 en dessous.
Mais on peut tre plus efficace encore, dans ce cas l on peut appliquer a mb par mb.
790.
a permet de le faire zone par zone dans l'image, dans ce cas l il est adaptatif. Le mb s'adapte, dans
l'autre cas c'est au niv de l'image qu'on adapte.
792.
quand on a du blocking, de filtrer le blocking
en haut gauche : compression, droite : augmenter le dbit
en bas droite : elle est en perte de dtails car filtr, l'image de rfrence peut tre filtr comme
ceci, filtre anti blocking.

793. modification de l'encodeur entropique.


On a utilis cette table de huffman
encodage entropique rlc rs zig zag identiquement
comment traduire les pair rs en bit ? On utilisait avant la table huffman pour le faire
pour chaque pair rs on utilise le code binaire

cette table a t calcul pour que les pairs frquentes ait des codes courts et les pairs peu frquentes
ait des codes longs
(rappel)
0/1 0/4 etc...
y a pas les dct quantifie (pas indiqus)
0/1 = 00
0/4 = 1011
en additionnant pour ces 10 pairs l a reprsente 31 bits : codage VLC et on l'utilise, la table de
huffman dans la norme, cette table est calcule une fois pour toute sur base d'une rptition d'image.
Ce qu'on peut faire c'est rendre ce codage adaptatif, on peut calculer un code de huffman pour
l'image en question, on regarde les 10 pairs et on voit que chacuns des pairs a un taux de proba
diffrents, la 0/1 apparait 4x = 4/10 (probabilit d'apparition) par exemple, on va MAINTENANT
CONSTRUIRE UN CODE DE HUFFMAN BASE SUR CETTE TABLE DE PROBABILITE
ide : crer un arbre qui reprsente les diffrentes pairs rs qui existent (794) partir des pairs rs les
moins frquentes, 0/0 ou 0/3, toutes les deux ont 0,1 de proba d'appa, on les reprsente en bas, en
les groupant, on cre un nouvel tat, l'tat A = proba d'appa 0,1 + 0,1 et cette pa (proba d'appa) elle
est du mme ordre que 1/1 ou que 0/4 du coup on reprsente 1/1 ou 0/4 ayant chacuns 0,2 de pa, on
les regroupe ensemble pour faire un seul code, le code de B, 0/4 ou 1/1 pa = 0,4, on les groupe le
groupe B et A = pa = 0,6, c'est mnt suprieur au code 0/1, 0/1 a comme pa 0,4 (...?)
la pa d'apparition de nimp quel code est de 1.
Donc on va accorder un seul bit la branche 0/1 car il doit faire qu'une seule branche pour arriver
1.
On dcide de plus, comme de chaque tat il y a 2 branches qui part. On dcide une fois pour toute
que tout ce qui est droite c'est 0 et gauche c'est 1, du coup on reprsente en fait un tat par
branche de l'abre et donc un code : juxtaposition des diffrentes branches qu'il faut pour arriver au
code, si pe on prend la branche 0/0, pour arriver 0/0 il faut avoir suivi 0 0 0 donc le code est 0 0 0.
si on applique mnt ce codage ci on arrive 22 bits (795) on est 1/3 plus efficace.
On a deux modes de fonctionnement, le classique avec table de huffman : VLC
le mode de huffman adaptatif (calcule image par image ou gop par gop ou sq par seq)
et puis le dernier c'est CAVLC (ca = code adaptatif)

796.
Dernier mode CABAC
ide : on va mnt non plus trouver un code par pair RS mais on va encoder globalement les 10 pairs
rs.
Avant on avait une table de correspondance, ici les 10 pairs rs donnent un code bien spcifique.
Comment a marche ?
On va reprsenter un segment d'une longueur unitaire qui reprsente la probabilit unitaire donc
100% on va reprsenter chaque code, chaque pair rs par un segment qui est, d'autant plus long que
sa probabilit, la pair 0/0 a comme pa 1/10 donc elle occupe 1/10 du segment, la pair 1/1 apparait
2/10 donc on prend un segment qui fait 0,2 donc de 0,1 0,3 ! (pig)
la premire pair qu'on va encoder c'est 0/1, on va reprsenter la suite des dix pairs rs, sous forme
d'un segment de plus en plus petit, si la premire pair rs est le code 0/1, celui ci apparait 4x sur 10,
donc on prend le segment 0/1 et ce segment je sais que la valeur qui va reprsenter la suite des
codes rs sera compris quelque part entre 0,3 et 0,7, on va alors r clater cette zone-ci, on
dcompose en segment proportionnel la pa. Il va donc de 0,3 0,34 etc... (slide 796)
le second code encod va tre 0/4, la suite des codes 0/1 0/4 sera entre 0,58 et 0,66.
et puis denouveau on clate, on reprend ce segment, on le redivise en segment dont les longueurs
sont proportionnel la longueur de chacuns des codes.
0/1 reprsent entre 0,604 et 0,636 et denouveau on le r tend
on les prend 1 par 1. etc...
intrt : quand on a encod les 10 codes, (barre orange) on sait mnt que le code qui reprsente la
suite des dix pairs rs est compris qlq part entre 0,60780073 et 0,607801139 et l on va prendre la
valeur qui en binaire occupe le moins de bits, si pe on avait 0,5, 0,5 en 3 bits on peut la transporter,
ici on a un sale chiffre donc on prend la valeur la plus efficace = 0,607801, on transporte la valeur
derrire la virgule et 607801 donne 1001 0100 0110 0011 1001 (20 bits) (on gagne encore des bits!)
0/1 premire valeur transmettre car 0,607801 est entre 0,3 et 0,7 (premier code)
second code = 0/4 car 0,607801 est entre 0,58 et 0,66
etc...

(slide 797) (ANIMATION MANQUANTE)


pq est-ce qu'on doit pas transmettre d'infos au rcepteur : c'est un code adaptatif qui volue avec le
temps et on commence par transmettre un premier code, une premire table avec tous les codes qui
sont qui probables, ils ont tous des segments de mme taille, puis on change la taille des segments
l'encodeur et va induire des valeurs modifi au dcodeur, avantage ? En permanence on peut
changer la taille des segment l'encodeur et au dcodeur.
La taille des segments, se construit proportionnellement dans le temps. Il faut que l'encodeur
connaissent la mme rgle.
Ce codage est le codage CABAC, (codage entropique le plus efficace aujourd'hui) trs utilis dans
des algorithmes de cryptage etc.. demande bcp de calculs pour tre ralis.
Le schma bloc (798), de la norme...
on y retrouve comme dans le mpeg 2, l'encodage de l'image diffrentiel (-) dct, etc.. encodage
entropique (CABAC OU VLC ETC..) estimation de mouvement, cration de l'image de rfrence
etc.. (MC) et le nombre d'image de rfrence peut varier (F n-1), mode inter ou intra (choix de type
intra) prdiction intra, image prdite ainsi est compare l'image relle et l'image rsiduelle est
transfre, les images que l'on va stock comme rf on les fait passer par le filtre de blocking pour
les adoucir et c'est dans l'image de rfrence qu'on supprime le blocking.
Il reprend pas les 10 modes de fonctionnements.

800. les profils : 3 profils principaux : le base line (ce qu'on trouve dans tous les codages) le
principal et l'tendu (qui est extented) et donc en fct du type de profils on va appliquer ou pas
certaines recettes qu'on a vu ojrd
801COMPATIBILITE AU NIVEAU DES PROFILS le fait d'avoir que des slices ou des images i et
p, des rfrences multiples (plusieurs images dans le pass)
etc...
plus on choisit d'lment = plus de performances (meilleure compression ou qualit)
inconvnients h264 : trs couteux en calcul
et rend difficile le fait de couper dans le flux, souvent les codecs utiliss dans le broadcast, utilise
peu d'artifice, pas bcp d'lments lis au vm.
Tableau des niveaux, comme le mpeg 2, 5 niveaux principaux puis sous niveaux, on prsente la
taille de l'image qui correspond au niveau en question, nbr de pixel en horizontal, nbr de lignes puis
la frquence 320x240 @ 36.0 (7)
le niveau minimum qui permet de faire de la sd, c'est le niveau 3.
suivant le type de profil qu'on aura choisit on aura un dbit max qu'on peut lui accorder (entre 10 et
40 mbit?) le h264 peut pas monter au dessus de 40 mbit pour de la sd par exemple.

Slide 803 rsum

TIV 9 (28/11)
partie sur la 3d, convergence, distance oculaire, rapprocher les cams en
dessous de 7,5 cm qu'est ce que a change
la partie sur les fondus avec les titres
Conversion 4/3 16/9
Traitement de l'image
anamorphique : pour avoir une vraie image 16/9 en partant du 4/3 en ayant 720 p on aura 960,
augmenter la fe et donc le dbit, qqchose de faisable mais pas pratique surtout l'poque, on se
basait sur des installations prvues pour le 4/3 etc...
moyen qui vite de payer de nouvelles install.
On capte les image avec une lentille ou un capteur 16 9 et on fait un traitement pour que le
16/9 (allong) soit en fait cras horizontalement, on passe de 960 pixels 720 en horizontal.
( ne pas confondre avec les croc marks au cinosh, qui permettent d'adapter un format)
upscale : convertir sd en hd
downscale : convertir hd en sd
CONVERSION 4/3 16/9
partir d'une image 16/9 et en faire une image 4/3 anamorphos
slide 436
l'cras horizontalement, l'image prend moins de place, l'image anamorphos est intressante en
production : meilleur compromis pour garder de la qualit, mais pas exploitable en diffusion sauf si

les crans au bout de la chaine de diffusion sont adquats.


Le seul moyen pour ces tlviseurs de recevoir une image 16/9 compatible avec du 4/3 c'est le letter
box :
craser l'image horizontalement (960 a 720 pixels)
craser l'image verticalement (passer de 576 432 lignes)
respect du rapport largeur hauteur.
Comment y arriver ? (passer de 960 720 pixels)
deux mthodes :
-A la hache, la dcimation : on retire des pixels
slide 437 (signal de Y)
on va retirer un pixel tous les 4 pixels.
Si on veut rduire le nbr de pixels, en supprimer certains, pas au dbut ni la fin sinon l'image est
plus petite, mais on supprime un rythme rgulier (si on supprime 1/4, on a le rapport)
on retire 1/4.
si on les supprime : les 2 chantillons l'un ct de l'autre vont alors se rapprocher, pcq on aura vir
un chantillon,= animation slide 437, ils sont alors r crass pour garder le mme rythme
DECIMATION.

Slide 438, on l'applique cette image 16/9 et on va voir ce qui se passe, au centre, que vont devenir
les lignes
1. horizontalement on va supprimer 1/4 chantillons
slide 439
rsultat.
On peut voir des accidents dans le zoom (animation) du la dcimation.
L'objectif : arriver du 16/9 letterbox, donc faudra faire le mme processus verticalement, mme
ide, on supprime 1/4 lignes, on voit que les 2 lignes qui taient bien propres, par la dcimation,
mnt possdent pas mal d'accidents. On voit que la ligne n'est plus aussi claire, l'image ici est simple
dans le slide 440.

441.
COMPARAISON.
ORIGINE DECIMATION HORIZONTAL DECIMATION VERTICALE.
perte de qualit assez importante en gros.

442. Affichage letter box


On remet l'image 16/9 plein cran. (rezoomer dans l'image)
dans ce cas l on aura le processus inverse, il faudra recrer des lignes.
(animation zoom) : rintroduction des pixels manquants, qu'on peut rintroduire qu'en les
dupliquant. On voit que ce processus est donc destructeur et qu'il entrane des artefacts dans l'image.

444.
Autre mthode: interpolation linaire : de non pas supprimer 1/4 mais de recalculer les
chantillons, pour qu'il soit rparti.
tient compte de la forme de la courbe, de la faon dont la luminance volue sur la ligne
la position des chantillons par/r l'image d'origine est affecte dans la premire mthode, on
essaye ici de conserver la position des chantillons, mais leurs positions doit changer vu qu'on passe
de 960 720.
on sait que 1/4 supprimer mais plutt que d'en supprimer un, on va les recalculer, pour qu'il occupe
un espace qui distant les uns par rapport aux autres.
Comment ?
On ne connait pas les valeurs des chantillons qui vont remplacer les autres, on va les interpoler,
calculer une valeur en fonction de la faon dont les chantillons voluent, dans le cas trs simple du
slide 444 (volution linaire) calculer le poids d'un chantillon, en tenant compte de la valeur des
chantillons voisins, en sachant si l'un est plus prt de l'un ou de l'autre (1/3 X 2/3)
Y1
Y2
Y3 (3 chantillons)
on cre Ya (DESSIN 1), Y1 est plus prt de Ya que Y2, il est 1/3 distance de Ya donc vu que le
facteur de pondration est la proximit, a donne Ya = 2/3 Y1 + 1/3 Y2
Plus tu es carts du nouvel chantillon moins ton poids sera grand en gros.
Moyenne pondre, combinaison linaire.
Marche parfaitement bien ici, car la variation est linaire donc la courbe est purement linaire, si ce
n'est pas le cas, a marche moins biens mais il existe des dizaines de modes d'interpolations
(objectif : calculer la valeur d'un chantillon en tenant compte de son contexte).

445.
On part de l'image 16/9, on effectue ici la compression horizontale, on applique cette fois-ci une
interpolation linaire (animation zoom) on voit que le rsultat est plus doux.
446.

Mme compression vertical, compression linaire nouveau, moins d'accidents


447.
Rezoom plein cadre
448. Comparaison des deux cas.
Celle de gauche : artefacts
Celle de droite : moins d'artefacts

449.
Dcimation : on peut remarquer des que des trucs bizarres se situe au niveau des tuiles.
450.
Interpolation.
451.
Upscaling :
deux types de convertions : upscaling normal (rajouter des pixels)
et passer d'entrelac progressif (rajouter des images horizontalement)
foot
upscaling sur un signal qui n'est pas le bon, on a upscal l'image entrelanc et non l'image d
entrelac.
454.
comment faire ? Passer de l'un l'autre ?
720 1920
576 1080
rapport image sd = pixel non carr
HD = pixel carr
PAR = pixel aspect ratio = 1 en HD et 1,09 en SD
L'image du haut = anamorphos.

455.
Une premire tape : transformer l'image en 16/9 (d amorphoser) tirer horizontalement
augmenter l'image en horizontal en doublant l'image horizontale (on part de 720, on fait x4/3, on
rajoute un chantillon tous les 3 et ce moment l on a 960 chantillons et on double chaque
chantillons)

Verticalement c'est plus complexe, on peut pas juste faire x2 car sinon on obtient pas 1080 mais on
dpasse les 1080, on va donc faire x2 l'image d'origine, doubler le nbr de lignes puis on va retirer
72 lignes. (576 x 2 - 72)
720 par 4/3
le PAR ne vaut pas 1, mais 1,09
1920/1080 = 16/9
PAR 16/9 = 1 donc pixel carr
Retirer les 72 lignes : soit on double l'image et on retire des lignes au dessus et en dessous (36)
meilleure qualit mais image croppe (perte d'une partie de l'image)
soit on double les pixels (le nbr de lignes) et une ligne sur 7, on ne met qu'une seule ligne.
Si le contenu de l'image a beaucoup de HF, plutt intrt simplement doubler la rsolution
verticale et supprimer 72 lignes, si on les supprime rgulirement on risque d'avoir des accidents
verticaux
en croppant inconvnients non respect de la gomtrie de l'image.

456. comment rajouter des chantillons ? Quand on double le nbr de ligne (pe en horizontal)
soit je prends 2 chantillons (DESSIN 2), on duplique l'chantillon, on a alors 2x plus d'chantillons
qu'avant, on a doubl le nbr d'chantillons en repliquant la mme valeur. Rajouter les chantillons
qui manque
Ou
interpolation : trouver une fonction qui permet de rajouter un chantillon entre les 2. Calculer
l'chantillon qu'on rajoute on le calcule au dpart de son environnement.
Modes d'interpolations
doublement des pixels en horizontal et doublement des lignes en verticales, quand on a l'image
16/9.
upscaling : on cre de l'info donc pour la crer il faut une rgle (moral), faire comme si mais pas
tout fait en gros.
(?)
On a 2 possibilits
On applique le doublement sur l'image entrelac (557) on cre une image en rcuprant les 2 trames
donc on aura 576 lignes et 720 pixels actifs et partir de ce moment l on applique le doublement
vertical et horizontal, mais pbm ? Slide 558 : le contenu a t doubl et a se voit, pbm gnr,
grand que le simple pbm du doublement, accentue le fait que les deux trames ont t enregistrs
des moments diffrents, on peut pas simplement pour les vidos, se baser sur les 2 trames que l'on

regroupe et auxquelles on applique le upscaling. a marche bien quand l'image est arrte par
contre, a va accentuer l'effet d'entrelacement dans le cas prsent.
459.
Upscaling, on va traiter sparment les 2 trames de l'image, un moyen ? Reconstitu une image
composite au dpart des deux trames, on compacte les 2 trames. Condense verticalement, pour
occuper toutes les lignes de la premire et deuxime trames. Ensuite on applique l'upscaling
l'image (de droite).

461.
On voit que la bordure est plus proche de la bordure d'origine.
462.
Dernier lment dans la conversion
entre entrelac et progressif
upscaling
2 mthodes :
-1 sur la gomtrie de l'image (on a 50 trames et sur l'autre 50 ips et on veut 50 ips)
moyen li la trame, on va upscaler chaque trames, si on double chaque ligne ou on interpole
chaque ligne on aura le bon rsultat, 1080. (spatial)
-1 ou on regroupe 2 trames qui se suivent pour ne faire qu'une image, interpolation selon l'axe du
temps (temporel)

463.
Interpolation temporelle : mlanger 2 trames qui se suivent dans le temps pour qu'elles ne fassent
qu'une.
a donne ceci : slide 464.

le tramage est marqu car les objets se dplacent.


On cre chaque fois une image par pair de trame et on obtient 50 pair de trames
autre mthode
doublement de ligne : slide 465
on affiche deux fois la mme ligne dans l'image,on peut imaginer que les lignes sont interpoles
Slide 466 = 540 lignes rpliqus chaque fois, mme valeur appliques verticalement et dans ce casl, on a cette image avec moins de rsolutions verticales.

467
On prend la moyenne entre 2 lignes qui se suivent pour crer une ligne intermdiaire
(interpolation verticale)
Objectif :
verticalement une trame avec 540 lignes utiles et on vient recrer des lignes intermdiaires au mme

instant, et chaque chantillon de cette ligne intermdiaire est..(?)

469.
Faire les deux
combiner le temporel et le spatial
dans quel type d'image la spatial fonctionne le mieux ?
-mouvante.
dans quel type d'image le temporel fonctionne le mieux ?
-fixe ou peu de mouvements.

471. LES EFFETS EN MONTAGE, SUR LE SIGNAL VIDEO


473.
474.
On prend l'exemple d'une commutation entre deux sources, un mlangeur vido simplifi et on
applique la sortie du mlangeur, on voit que les signaux priori des diffrentes camras ne sont pas
synchroniss entre eux (dcalage temporel entre eux) si on reprsente ce qui se passe la sortie du
mlangeur, la ligne qui en rsulte, elle va tre plus courte pcq on va balayer ce moment orange sur
le slide 574 (animation) elle va tre balay avec une partie en moins, la rception on ne reoit pas
tous les chantillons (wtf, pas important je pense)
575.
on met une horloge central (SPG) pour rgler le pbm.
Synchronisation pulse generator
on le connecte aux diffrents quipements, aux diffrentes camras par exemple et cette horloge
organise le balayage de la cam mais on ne tient pas compte du fait que les cams n'ont peut tre pas
la mme longueur de cble entre les diffrentes cams, important pour le dlai de transfert, il faut
que les horloges soit synchrones et que le signal arrive synchrone la sortie du mlangeur.
On connecte donc les cams au spg (signal noir en fait) et sur chaque cams on peut faire un rglage,
ide ? Rglage local qui permet de dcaler, de s'adapter par rapport la rfrence qu'on reoit dans
la cam pour que tout soit synchrone, on dit qu'on va gen lock la cam.

Chaque cam a un rglage de synchro et on aligne tout sur le gnrateur de synchronisation.


On retard en gros, les diffrents signaux pour qu'il soit synchrone avec le signal.
(essentiel pour du vido en temps rel : signaux synchrones)

477.
On va tre amen mlanger des images,le mlange se fait souvent en se basant sur deux plans de
travail, le fil,le remplissage, l'image et le key : l'image qui sert donner un ordre de dcoupage.
Key : image qui dfinit ce qu'on fait de l'image
fil : remplissage
mlange entre deux sources, un fondu enchain, le mix se fait par un gnrateur de key interne dans
le mlangeur et celui-ci va gnrer un signal blanc associ la premire image diffuse et un noir
l'image non diffuse, niv de luminance du signal de key dfinit la transparence de l'image.
On va donc utiliser (deux signaux) et on les mlange par leur key (cl de dcoupe).
479
noir : image passe pas
blanc: image passe

481
le niv de blanc donne le niv de dcoupe, si on remplace du blanc par du gris : on voit que l'image
laisse passer l'image de fond 50% a se voit dans le TITRE de l'image du bas, dans la fin du mot
TITRE.

Synthse

485 vido
487
fore ground : hors fond vert.
back ground : fond vert.
Cyclo : studio avec un infini, un mur peint (cyclorama) arrondi pour ne pas voir les angles, on a
l'impression que le mur est infini.
Chroma key : avoir une couleur en arrire plan fort diffrente de celle de l'avant plan
pas le rouge, car fort prsent dans la couleur de peau.
Le bleu pose problme car souvent il y a des jeans
Pbm du vert, si c'est mal dcoup on a un fond blafard.
Le principe, slide 490, on a l'avant plan, source vido, et sur base de CR CB et des Y, on va
dterminer si on prend l'avant plan ou l'arrire plan, pour chaque pixel on tudie la couleur.

Quand on fait a, slide 491 a marche mal, la dcoupe est hach, c'est pas propre, donc le switching
chroma key : qui passe d'une source l'autre, n'est plus utilis, car la dcoupe est mauvaise et aussi
pleins d'objets sont mal apparents aussi en fore ground (avant plan).
Si on prend aussi des fins dtails, des cheveux friss par exemple, dcoupe compliqu...
donc c'est pareil pour la fume aussi, ou un verre, tout ce qui est transparent, pbm avec chroma key,
on a invent d'autres chroma key, plus efficace, pe l'ultimate (sous licence, algorithme inconnu)
principe du chroma key slide 492

on dfinit dans le vecteur scope une couleur de dcoupe, ici on prend le bleu, on se base sur le bleu
et on doit faire un premier rglage, le choix de la teinte car on filme un cyclo en bleu (peinture
spcial)
clairage : uniforme sinon il y a des tches avec une variation dans la saturation et a pose pbm.
Donc 1. rglage 1, de l'angle teta, qui dfinit la couleur de dcoupe
494
signal noir et blanc, qui dtoure l'avant de l'arrire, bas sur la couleur, on prend une zone du
vecteur scope, (graphique, angle alpha, angle d'ouverture) on modifie les couleurs de l'avant plan et
d'autres part on l'utilise pour le signal de dcoupe. On doit modifier l'avant plan car le bleu va tre
prsent dans l'image, dans les cheveux (gris donc bleu partiellement), il faut donc filtrer l'avant plan
pour expurger le bleu. Et dfinir une image de dcoupe (nb) qui dtoure.
1.Modifier la couleur du signal de l'avant plan
2.Crer le signal de dcoupe
donc, point 1) Supposons qu'on ait une couleur l'ext. De l'angle alpha : rien ne se passe, la couleur
reste telle quelle, la couleur du visage ou le noir du polo etc.. par contre si on se trouve l'int. De
l'angle d'ouverture alpha, on va modifier la couleur en s'cartant au mieux du bleu, retirer la
composante bleu de la couleur qui rentre dans l'angle cmt ? on dcale cette composante, en
amenant la couleur sur le bord de la zone, // l'axe de la couleur et on amne cette couleur au bord
(ps : angle alpha sur le slide 494 : les deux quadrilatres quelconques qui ressemble des triangles)
donc, point 2) utiliser cette zone des couleurs, l'angle alpha, on estime qu'il y a un peu de bleu
dedans qui sert la dcoupe, le bleu au travers de la fume ou d'un verre d'eau, la couleur bleu du

cyclo sera transform, l'eau n'est pas 100% transparente donc va modifier la couleur du bleu, en tout
cas elle sera dans l'angle d'ouverture, puisque cette couleur on doit s'en sparer, on va utiliser des
zones qui vont dterminer le key du fore ground, une image noire qui va dtourer le sujet, cmt ?
Quand on a la valeur 1 = laisse passer l'arrire plan, 0 = sur l'avant plan. Par contre si on est proche
du bleu, on augmente la prsence du key. Le niveau de gris dpend de la proximit avec le bleu, sur
le bord le key vaut 0 dans l'angle alpha et plus on se rapproche de la couleur de dcoupe plus le key
augmente. Donc en fct du contenu de bleu de l'image, on va gnrer avec cette image, cette image
sera le moyen de filtrer cette image l'avat plan.
DERNIERE IMAGE EN BAS A DROITE : application du cache, du filtre (expurger le bleu et on
est prt appliquer le cache cette image-ci)
on a donc fait 2 choses :
crer le masque de dcoupe
et supprimer le bleu de l'image

496
y a encore du bleu, sur le bord du prompteur par exemple + reflets sur lui.
Que fait-on ? On rajoute un degr de rglage, l'angle beta (slide 496)
l'angle de suppression.
Quand la couleur est l'intrieur de l'angle de suppression on remplace cette couleur par du noir. a
donne un angle, une protection dfinitive par/r l'apparition de bleu dans l'image.
1.Avec l'angle alpha : premier nettoyage et gnration du signal de dcoupe

2. avec le beta : suppression du bleu en trop dans l'image

498.
on garde la mme ouverture mais on rduit la zone en dplacant l'angle par la droite, donc un tas de
couleurs ne gnreront plus de signal de dcoupe pour l'arrire plan et donc avec ces deux signaux
de dcoupe, le key du BG ralise un trou dans l'image d'arrire plan tout comme le key du FG avait
gnr une dcoupe, extraite de l'avant plan et remplac le reste par du noir, donc mnt faut
superposer les deux.
BG = Back ground
FG = Fore ground

500. D'un point de vue schma bloc


501. on retrouve les diffrents signaux, l'avant plan avec gnrateur de dcoupe (choix de couleur,
application angle alpha beta), de ce sdd on dfinit plusieurs choses : le key du FG (l ou la dcoupe
est) et un signal (suppresseur FG) suppression de l'avant plan.
Quand on fait du CK (chroma key), le petit bout du prompteur pe, on utilise un masque qui va
remplacer ceci par du blanc, le masque permet de masquer des objets, de limiter l'extension du CK,
le background il est dfinit par les mmes angles et au dpart de l'image d'origine, et on obtient
l'image dtoure.

502.
synchroniser le dcor sur les camras (cyclo vert sur l'image) on a des cams qui sont tracks,
systme qui permet de reprer leur position dans l'espace.
On est en 3D, XYZ, et on essaye de trouver la position horizontal verticalement de la camra.
Couronne au dessus de la cam, qui ont des metteurs infra rouges en forme de pastille allum en
permanence + grap de camra infra rouge au plafond qui filme les diffrentes positions du studios,
ide : chaque camras doit tre visible par trois camras infra rouges, la cam infra rouge (slide 506)
recoit des tches en fonction de la position de la cam, tches des couronnes et le logiciel permet de
capturer la position exact de la cam dans l'espace.
Slide 507, vido.
510
la dcoupe ici est parfaitement 4 4 4(?)
420
l ou y a que les pts gris : que luminances
cercle rouge et bleu : y a galement la couleur
pour les pts gris : la couleur est dtermine par rapport au pixel juste avant, la dcoupe sera base

sur une mauvaise info de couleur, pas top en gros.


SYNTHESE

838.
EVOLUTIONS TECHNOLOGIQUES
STEREOSCOPIES 3D
comment amliorer encore l'image, la vido.
Quels sont les axes qui le permettent : profondeur, contraste, 3D, rsolution, frquence image,
espace.
Transporter la notion de profondeur : donne la perspective et la profondeur de l'image. On va
regarder les diffrents lments.
840 perspective = profondeur (point de fuite)
841 taille donne l'impression de profondeur.
842 dformation (indice de profondeur)
843 l'avant plan. (occlusion)
844 la couleur (l'atmosphre dsature la couleur)
845 l'ombre
847.
les plans bougent des vitesses rotatives diffrentes, plus on s'carte de l'observateur plus les
mouvements sont faibles.
La vitesse relative des objets donnent un indice d'cart de profondeur dans l'image.

849.

851.
852.
un moment les deux signaux sont multiplexs (mme tuyau pour les deux signaux)
lunettes anaglyphes

860
861
en cartant les cams on augmente l'effet 3d et l'inverse ... l'cart donne l'effet 3d, on peut pas allr
au dl de 7,5 cm on dpasse la distance inter oculaire et si la distance projete sur l'cran dpasse
7,5 cm on a un pbm ? On n'arrive plus regarder \
/

862
une autre possibilit : la convergence des cams
si on veut dplacer des objets, les faire avancer ou reculer dans l'cran on doit modifier le pts de
convergence (endroit de la paralaxe nul : points pour lequel l'image se trouve dans le plan de
l'cran)
converger fait reculer les objets, diverger fait avancer les objets car le plan de l'cran est plus petit.
Paralaxe nul : le tableau.

La convergence des camras fait reculer les objets


867

869

872 SOUS TITRAGE


transition entre 2 plans, avec des convergences diffrentes pour l'objet au mme endroit : l'oeil doit
s'habituer
si un fondu : l a ne marche pas, faut passer par la 2d
paralaxe positif : drrire l'cran, transition, on veut avoir un fondu, fondu en 2d, puis l'autre objet
on l'obtient alors devt l'cran.

873.
double image : double camra, placs sur un rig, (systme mcanique)
876.
877.
HD, 2x un signal HD = 3GObit
un objet bord cadre en 3d ne fonctionne pas pe, car sa deuxime image est hors cadre
878
anaglyphe : deux filtres colors qui donne chaque oeil une image diffrentes, on perd la couleur et
c'est peu confortable.
880.
882.
dcale la couleur, la lo des couleurs transmises, sur l'cran on voit les 2 images avec une couleur
bizarre, les 2 verres ont pour objectif de ramener le spectre des couleurs la normal dans l'oeil
gauche et droit.

884
3D sans lunettes
on alterne un pixel pour l'oeil gauche et un pixel pour l'oeil droit, on place une barrire devant
(occlusion) qui masque l'cran et qui fait que le regard se pose sur un pixel ou sur l'autre selon le
regard qu'on a, l'inconvnient de la barrire paralaxe c'est qu'elle ne marche que pour une distance
prcise p/r l'cran. Permet de discerner ce qui va l'oeil gauche ou droit. On utilise une barrire
lenticulaire pour rgler ce pbm.

885.
Amliorations de la hd
886
diffrents axes d'amliorations
augmenter les couleurs reproductibles sur l'cran c'est aussi qqchose qui va permettre d'amliorer la
ralit.
8 10 bits, on peut augmenter encore pour viter les pbms de contours dans l'image
la frquence d'affichage, on peut passer en progressif etc..
l'lment de la dynamique : gamme des niveaux que la camra et le moniteur sont capables de
reproduire. Si on prend l'axe de la rsolution.

887
si on part de la rsolution, voici l'image sd tel qu'on la connait puis la hd, puis on peut doubler la
rsolution 3840 x 2160 (la 4k) c'est de l'uhd,
NE PAS DIRE 4K

887.
4K = 4096 x 2160
8K = 8192 x 4320
mme rsolution vertical pour UHD et 4K etc..
24Gbit/s pour l'UHD 2
UHD 1 = 6 Gbit/s
progressif = a x2
l'intrt de la HD c'tait d'avoir une image rsolue pour la vision humaine, c'est normalement
suffisant, avec a autant qu'on regarde l'image a une distance raisonnable

889
893
augmenter la rsolution : augmente pas le dbit, change l'quation de cr et cb.
Augmenter les ips : augmente le dbit.
901
cd/m = unit luminance
la dynamique de la luminance de la UHD est plus large dans les grandes lumires et le sombre.
(range 10^14) (on aura plus besoin de faire de diaph, la cam pourra capter toutes la range de la
vision humaine) (pour la luminosit)
905.
906.
907.
908.
pour couvrir au niveau sonore cet cran on fait du 32.3, 3 niveaux sonores spatiaux, on arrive

isoler les sons la fois H et V.


909.
910.

Les dbit sont normes, 50Gbits/s


Depuis 2 ans : H265 existe ou HEVC, comme le H264, on prend ce qui est pas aboutis dans le H264
et on l'amliore, gain de 50%
910.