Académique Documents
Professionnel Documents
Culture Documents
DESSIN 1
1 volt = puissance faible
faire en sorte que le couple transporte un maximum d'nergie de l'un l'autre, et que a s'affaiblisse
le moins possible, condition ? RS = RI les deux rsistances gales entre elles. (premire condition
pour que la P transmise soit la plus forte), deuxime condition, les frquences transmises sont
leves, pour cette raison l on doit adapter l'impdance au niveau de la transmission donc on prend
l'impdance du cble qui vaut 75 Ohms, des systmes avec imp. De sortie et d'entre = 75 Ohm
Ce qui nous intresse finalement c'est de voir ce qui se passe au niveau de la tension V.
Dans ce circuit, que va-t-il se passer ? Rsistance et gnrateurs ensemble, quand on a une tension
qu'on applique une circuit avec deux rsistances ? Qu passa ? Il y a un courant qui va passer du
gnrateur et qui va boucler par la terre, le courant il est quoi dans les deux rsistances ? Le mme.
Le courant est unique.
Le gnrateur de tension va gnrer un courant dans le circuit, loi d'ohm (V = R/I)
e=(Rs+Ri).I
v= (tension l'entre du moniteur) Ri. I
Le courant on le connait pas et il n'est pas utile donc on va l'extraire
I = V/Ri
donc,
e = (Rs + Ri) . V /Ri
v = e . Ri/Ri+Rs
Ri et Rs valent tous les deux 75 Ohms
Donc v = e/2 (75/150 = 1/2)
Si on est 700 mv au niveau du v sur le schma, au niveau du gnrateur de tension on est 1,4 v
(le double de 700)
Le gnrateur parfait de la cam fournit 1,4 v pour le blanc.
On fournit l'extrieur 700 mv pour le blanc, si on est au niveau du noir 0 mv, 2x0 = 0
DESSIN 2
(donc tout ceci concerne toujours l'anecdote et c'est la situation normale pour le calibrage cam
moniteur)
(Mnt on rajoute un second moniteur, on le connecte la suite du premier moniteur, donc c'est une
seconde rsistance)
Quand on connecte, on partage le courant, quel courant ? Celui de 1,4 V
1,4 V = blanc
-600 mv = synchro
0 V = Noir
700 mv = gris moyen
Qu'est ce qui change dans l'quilibre ? Le courant il se divise en deux, et comme les deux
rsistances sont les mmes, la moiti du courant passe dans Ri et la moiti du courant qui passe
dans l'autre moniteur. Ce qui veut dire que la premire quation n'est plus juste, on peut toujours
dire que e= R totale x le courant (I)
et que
La tension v = Ri.I (sauf qu'il n'est plus le mme) il vaut mnt I/2
Le gnrateur E induit une tension qui gnre un courant qui passe dans RS et une seconde perte de
tension dans la rsistance du premier moniteur qui est Ri x I/2
e=I. R + R. I/2
e= R.V/R.2 + R. V/R. 2/2 = 2V + V
e= 3V
V= 1/3.e
DESSIN 3
On peut pas empiler nimp quel quipements, les quipements sont connects par des signaux qui
sont du courant et des tensions, la loi d'ohm s'applique, le pbm arrive ici en connectant ce deuxime
moniteur, l'image devient plus grise, les blancs deviennent gris et donc tous les niv. Sont crass et
la bonne raction est de modifier le circuit lectrique et non ce qu'on voit sur le moniteur, car on
corrige sur la cam en montant le diaph et donc la tension va monter et dpasser 1,4 V donc
l'enregistreur va chopper ce niveau l, une image qui alors devient satur.
Il fallait garder 1,4 V la crte.
Solution ?
Distribuer correctement en mettant un amplificateur, regnre la cam sur plusieurs sorties
Ou
Un petit commutateur analogique pour les moniteurs, change l'impdance d'entre du moniteur et la
rendre infinie, si on change l'impdance d'entre (qui l vaut 75 ohms), si on la rend infini
(signifie ? Cb y a t'il de courant qui passe dans une rsistance infini ? Aucuns, donc la situation
donne un courant qui vaut 0 dans la deuxime entit et donc on retrouve 700 mv pour le blanc dans
la premire entit, mais alors on a pas de courant dans le deuxime moniteur ? Si si, on fait en sorte
que les circuits lectroniques de la cam soit gales l'infini, le moniteur mesure, la luminance est
proportionnelle la tension.
Un court circuit, appliquer la mme tension aux deux endroits. Impdance d'entre infinie, le
courant est alors nulle mais l'impdance est quand mme l .
ANALOGIE, la tension et l'eau, si on prend de l'eau, un barrage c'est une tension, si on prend le
niveau de l'eau en amont et en surface, c'est peut-tre 100 m, si on ouvre une vanne, l'eau coule et
quand l'eau coule, c'est l'quivalent du courant, elle change le niveau des deux cts et la tension
change. Si on fait pas couler d'eau, le courant change pas. (trolololol)
Pas de courant circule mais mme tension donc du coup on garde un moniteur avec une image
correcte.
Si on connecte rien la camra ?
Pas d'quipements, de moniteurs
que vaut la tension la sortie de la cam ? 1,4 V
Les signaux vidos c'est de l'lectricit, quand on change un circuit, on change les signaux, en
analogique p.e y a une liaison directe entre les niveaux qu'on vhicule et ceux qu'on affiche.
PICTURE LINE UP GENERATOR EQUIPMENT (PLUGE)
Permet de rgler le moniteur en noir/blanc
Mire compose de deux parties : une premire invisible, qui est la zone de noire gauche des 4
blocs. Si tu augmentes la luminosit tu peux les voir apparatre, dans les 3 barres (invisibles) les
niveaux sont diffrents.
Waveform : reprsente les niveaux de tension de l'image, on envoi ligne par ligne
on regarde ligne par ligne ( EXERCICE 1 )
Ici on regarde toute l'image, on superpose tous les waveform des lignes de l'image.
En gros tu repasses chaque fois par la mme ligne, on les mets l'uns sur l'autre. Sinon faudrait
reprsenter 625 lignes, l c'est en mode image en gros !
On filme une scne + cble qui relie cam et moniteur, tout est adapt
On allonge le cble mnt, une bobine de 200m et l'image devient floue.
Le fait d'ajouter ce cble floute l'image, on perturbe le circuit lectrique de nouveau.
Changement de tension, frquence leve, en analogique plus le cble est long moins bien c'est.
Tous les phnomnes physiques sont passe bas, donc les cbles sont passe bas.
La caractristique du cble en temps que passe bas influence et rduit le signal ?
Quelle est la gamme de freq qu'on utilise alors ? Pour de la vido par exemple 20 Khz c'est
beaucoup.
On sait pour l'instant que le signal est dcompose en image et l'image en ligne.
Sur base de cette info, calculons les plus hautes freq que l'on doit transporter dans le signal !
Bande passante : variations du signal
Essayons de calculer la plus grande bande passante, variation possible (maximum minimum
maximum minimum ou variation noir blanc noir blanc, cherchons donc la plus forte variation!)
Plus la frquence est leve plus les barres de l'image se rapproche
L'oeil est isotrope, il a les mmes proprits quel que soit l'angle de vue.
Que sait-on de l'image ? Elle est limite par des lignes, si on prend la frq. Verticale de l'image.
Si on sait qu'il y a 575,585 images, donc on a dfini que l'acuit visuelle pour la SD c'est 1 ligne
blanche, une ligne noire etc.. donc si on veut que la tl ait les mmes proprits verticalement que
horizontalement..(?)
donc sur le moniteur on va compter le nombre de lignes que l'on peut afficher verticalement et
horizontalement. Donc combien de cycles dans l'image ( N/b = 575/2)
sur l'cran, des 585 lignes par hauteur d'image, il y a 585/2 cycles cycles par image (cy/H)
mais si on filme une mire sur une camra, si on dplace verticalement la mire, d'une demi hauteur
de ligne, qu passa ?
Les capteurs ccd vont alors moiti fournir le blanc et moiti fournir le noir donc on obtient du
50%, du gris.
Donc mal cadr une mire a des rpercussions norme.
Solution ? Moins de lignes dans l'image, de plus grosses lignes par exemple.
Le nombre de lignes est dfini par le facteur de KELL (1 sur racine de 2 = 0,7, on ne prend que
70% la dfinition optimale de l'image)
On prend donc 30% en moins de lignes.
585/2 x 0,7 (cy/H)
On rduit la rsolution maximum de l'image avec le facteur de KELL.
L ce qu'on vient de faire c'est du verticalement
HORIZONTALEMENT
On pivote la mire de test de 90
Combien de lignes a-t-on mnt horizontalement ? a dpends du format, prennons le 4/3 tl donc
585/2 x 0x7 x 4/3 (Cy/L) on peut donc compter 33% en plus de lignes.
Comment traduire ces variations en Frquence ?
Passer de Cy/L (Cycle par largeur d'image) en Hertz (1 cycle par seconde = 1 hertz)
Diviser le nbr de variations par la dure de la ligne
25 variations sur 1 seconde = 25 Hz par exemple
la partie visible de la ligne dure 52 ms et 64 le tout.
(585/2x0,7x4/3)/52 ms = 5MHZ (5 millions de variations sur 1 seconde)
Le waveform de ceci nous donne un truc super frquentiel.
Le cble devra donc passer 5 Mhz, au maximum, le minimum c'est 0 (1 image qui est blanche, du
continu). VALEUR FONDAMENTAL. (dfinir la bande passante de la couloir, comment on
numrise l'image etc...)
(DESSIN 6)
2. (couleur bordeau) Dsatur (plus de blanc ou de gris) (entre 0,2 et 0,4 Y) Ceci permet en
reprsentant les points qu'on a un axe d'cart par rapport au centre qui donne la saturation de
la couleur, plus elle est vers le centre plus elle sera proche du gris, dsatur.
3. 3.1 (Orange) en interprtant la position dans l'espace, l'cart par rapport au centre et l'angle
on peut interprter la couleur et la saturation.
4. Si on change la luminance, on obtient diffrentes valeurs de couleurs (dpends de 3
paramtres, Y RY BY)
Slide diagramme spectrale
Tonalit = angle.(ou teinte)
On retrouve les 3 conditions pour une couleur selon grassman mais de manire diffrentes, plus R
RY BY mais l'angle pour la teinte, la saturation,
Quand on fait le calcul de la bande passante, on a 1,25 1,25 ,125 Mhz par couleurs et 3,75 Mhz de
luminance (car 3x 1,25)
BANDE PASSANTE DE LA COULEUR = 7,5 Mhz
TIV 3
SYNTHESE
Cours 3, dbut.
200
201
Schma fiff pour une webcam live
par exemple : (Camra stream live internet)
Camra connect un encodeur qui va vers le web
rgie (local)
mlangeur (outil)
Habillage
Sortie du mlangeur, on part vers du stream
ENG : nom utilis pour les camras seules qui vont filmer des sujets. (electronic news gathering)
Play out : sujet pr mont, diffusion du sujet, insr dans le flux gnral.
PGM : signal final de la rgie (Programme) (signal avec le composite et tout dedans)
202
En amont pour alimenter le serveur avec les squences diffuser on a la chaine de post prod, station
d'ingest, du montage, etc. + stockage online + archivage
Broadcasting : diffusion
Feed : dans des missions on rajoute des images en live qui viennent de l'extrieur. Camra sur
place avec transmission satellite.
Schma : 3 catgories de signaux (3 couleurs), la partie centrale, toutes les flches oranges =
signaux en temps rel, la camra envoi son image en temps rel au mlangeur, le serveur envoi tout
en temps rel au mlangeur, les signaux temps rels. Quand on regarde la partie post prod, ce qu'on
n'change ce sont des fichiers, pas des signaux, (un blu ray, une carte mmoire : on peut pas mettre
un waveform pour voir l'intrieur ce qui se passe) on change donc entre les diffrents lments
des fichiers qui sont stock pour tre soit diffus aprs soit diffus en live donc on utilise des
serveurs qui vont stocker les fichiers (archivage ventuels)
Le temps rel (Live)
Les signaux dans le schma live, on a une contrainte de dimension pas trs grande, on doit
transporter les fichiers live une certaine distance, les camras sont rarement 3km de la rgie. La
distance ne sera pas 200 km sauf si c'est un feed quoi avec dportation de moyen sur place et les
transmettre par un canal de transmission qui a des contraintes contrairement au moyen via cble
vido car on maitrise l'environnement. A Longue distance on ne maitrise pas l'environnement, les
chanes tl n'ont pas de satellites, elles doivent louer des canaux de transmission.
Quand on loue un canal satellite, on paye au Mbit qu'on utilise. (Feeds : contribution)
Broadcasting, transmission, diffusion, full contraintes aussi pcq on doit atteindre beaucoup de gens,
pour faire en sorte que bcp de gens regardent, donc contrainte sur le dbit qu'on va envoyer car la
connection internet des gens est faible dbit, pareil pour la tl.
4 types de signaux diffrents au total, ceux sans contrainte, ceux temps rel mais qui ont la
contrainte de devoir passer par un petit tuyau + problme de dbit, signaux temps rel mais il faut
l'envoyer beaucoup d'endroit donc on rduit le dbit encore plus, + les signaux qui sont des
fichiers en ralit.
(Non HD)
Feeds : de l'ordre de 20 30 Mbit par seconde
205
Comment faire ? Donc, pour avoir de l'analogique on a fait deux sgmentations, une lie au temps,
25 images par seconde, 50 demi images par seconde qui s'enchane dans le temps donc on ne tient
pas le compte de ce qui se passe pendant 2 instants d'chantillonnages (?) puis on a dcompos
l'image en ligne et dans ces lignes la luminance B-Y il y avaient des variations(?) de luminance(?)
maintenant on va donc ajouter un troisime niveau d'chantillonnage et dcompose ces lignes en
pixels et donc on a une variation sgmente, donc la valeur ne varie plus progressivement d'un point
l'autre de la ligne mais par secteur.
(205) image mal dfinie gauche : analogique, image mal dfinie droite : numrique
La version analogique : signal reprsent par une tension variant dans le temps
La version numrique :signal reprsent par deux niveaux (0 et 1)
(Faon de transporter le signal)
NUMERISATION
1.ECHANTILLONNAGE : prendre un chantillon un certain moment)
2.QUANTIFICATION ; Une fois qu'on a fait le 1. On va mesurer le signal, la mesure est encore
analogique, (niveaux de tensions) c'est de l'analogique mais chantillonn, avec les pixels tu as des
valeurs RVB donc a change chaque pixel contrairement l'analogique ou les valeurs varient tout
le temps. Puis on va faire la quantification(transformer l'cart de 0 1 en 0 256 par exemple)
(donner une chelle de rfrence et convertir les valeurs quantifie telle que 0,45 dans 206. en
411 ) (classement des chantillons par taille puis on leur donne la bonne valeur en gros)
3.CODAGE (transformer ces valeurs en binaire)
208.
La bande passante dfinit le nombre de pixels. Reprsente le nombre de lignes verticales qu'on peut
mettre sur l'cran.
Le nombre d'chantillons (220.) au min. Un pour un pixel blanc, un pour un pixel noir, un pour un
pixel blanc etc... (une valeur prise pour chaque ligne verticale)
Si on prend un pixel pour chaque ligne verticale, on a combien d'chantillons par seconde ? On aura
alors 10 millions de cycles d'chantillons. 5MgaHertz = 5 millions de cycles par secondes.
Car 1 hertz c'est un cycle.
Si on a 5 millions d'alternances, 1 alternance =
Bulle 1 = mesure du noire p.e
Bulle 2 = mesure du blanc p.e
2mesures par cycles minimum donc 10 millions
d'chantillons par cycle
Donc freq d'chantillonnage : au minimum 10 MgaHertz
Thorme de Shannon, Nyquist : freq d'chantillonnage au minimum gale 2x la freq minimum
du signal
216 - 220
*
Les chantillons sont pas forcment les uns au dessus des autres, cmt faire en sorte qu'ils soient bien
aligns verticalement ? Il faut que sur une largeur de l'image on ait un nombre entier
d'chantillonnage (x).
la freq d'chantillon est un multiple entier de la freq. De ligne
Conditions :
1. la freq. d'chantillon est suprieur ou gale 2x la freq max
2. la freq. d'chantillon est suprieur au USA qu'en Europe.
3. la freq. d'chantillon est un multiple entier de la freq. De ligne
Bande passante = BP !
Frquence d'chantillonnnage = FE !
La FE est un multiple entier de la freq de ligne.
Freq. De ligne Europe = 15625 Hz,
Freq. De ligne USA = 15734 Hz
On veut que les deux FE soient les mmes. On va donc leur chercher un nombre commun, on fait
x144 pour l'europe et 143 pour les USA = 2,25 MHz
MAIS LA CONDITION 1 n'est pas respect ! Il faut dpasser 10 MHZ, donc on fait x6
= 13,5 Mhz. (FE Y)
L'lment principal de la fe ? La bande passante, 1,25
Freq. Maximale de Y = 5 Mhz
de R-y et B-y = 1,25 Mhz
228
8Niveaux (toujours pas suffisant)
229
16Niveaux (idem)
230
32 Niveaux (au niveau des visages a devient correct, on voit encore quelques dfauts dans les
visages)
231
64 Niveaux
232
128 Niveaux
233
256 Niveaux (l'oeil a besoin de 256 niveaux diffrents pour mesurer la luminance)
Si on regarde la luminance, mesur entre 0 et 1 ou entre 0 mv et 700 mv en analogique, en
numrique on va utiliser 256 niveaux, degr sur l'chelle* pour arriver ce que l'oeil ne peroivent
pas de diffrences.
Erreur de quantification moindre au plus on monte dans les niveaux.
L'encodage, conversion en binaire, on va aller plus loin que 8 bits, la limite minimum est 8 bits, on
va souvent au dessus car on ne se contente pas que de l'afficher, on fait des calculs dessus aussi.
10 bits (1024 niveaux), norme trs rpandues.
Si on fait du traitement sur chacuns des pixels en 10 bits, l'erreur va tre masque dans ce que l'oeil
ne verra pas, on aura 4 x plus de niveaux qu'en 8 bits (256) on a donc suffisamment de dtails avant
que l'erreur ne devienne visible, si on fait du traitement c'est en 10 bits
On peut faire le mme calcul pour la couleur, l'oeil a besoin de la mme quantification pour CR et
CB.
235.
236.
Exercice
Valeur de CR CB et Y en numrique.
(Le blanc et le jaune avec le prof)
(FEUILLE EXERCICE)
242
249
si on regarde une ligne, c'est du 4 2 2
premier pixel y cr cb
le deuxime que y
comment a se prsente ?
(animation)
donc au bout du compte on a port 1440 chantillons (360 CB 360 CR 720 Y)
V=0?
H=1
F = sait pas si c'est la trame 1 ou 2
Puis on a une srie d'chantillon qui peuvent prendre n'importe quelle valeur
Ces donnes suppose inutile vont tre utilises pour des donnes auxiliaires, des tltextes, de
l'audio, on appelle a les ANCILARY DATA (dans le blanking horizontal)
H ANC pour ANCILARY DATE horizontal.
250
DERNIER BLOC DE SYNCHRO = 3FF 3FF 000 XYZ V=1
blanking vertical cache des donnes
ensemble de donnes non utilises car elles n'ont pas d'chantillons utiles, utilises pour des
donnes auxiliaires.
2fois 3FF car dernier bloc de synchro.
TIV 4
Rappel du dernier cours
paramtre chantillonnage (tape 1)
Dfinis par sa frquence.
Bande passante = analogique
Quantification (tape 2)
paramtre ? Cod en 1024 niveaux, 10 bits au lieu de 8 pour pouvoir aller un
peu plus haut que 100% et un peu en dessous.
Prambule : 1023 0 0 (3 premires valeurs interdites)
F trame
V le banking vertical ou horizontal
H en dbut ou en fin de ligne
P1 P2 P3 P0 Protge contre les erreurs de quantification.
Slide 250
facile, le spectateur sait discerner diffrentes images les unes des autres alors
que l'audio c'est plus compliqu, il y a eu un pbm la rtb, or on a pas eu le bon
commentateur, ils ont pris un commentateur allemand, l'oprateur rtb devait pas
tre trs attentif. a a commut pendant le signal ? Le commentateur belge a en
clair, parl pour rien.
Solution : utiliser l'espace laiss libre dans le signal, H ANC, V ANC ? Mettre
l'audio dans la vido, et d'utiliser cet espace l pour transporter ce dbit
disponibles, ces donnes audio, donc l'audio sera accroch auto la vido.
Puis il faut sparer l'audio et la vido bien sur. On embede la vido (terme).
253.
EXERCICE
AES/EBU
FE = 48 Khz
Codage : 32 bits (ensemble pour un chantillon + codage) n = 32
L + R (Canal gauche et droit) (il faut 2 canaux)
Combien de pair stro on peut transporter dans le signal vido ?
(Moi)
864
720
=
144
625
576
=
49
720L
49 H
=35280
calculer le dbit zone verte et rose
combien de bits par seconde y a de donnes dispo dans ces zones (pr info)
pair stro 48 32 = 2 chantillons, divise l'un par l'autre et on a le nbr de canaux
dispos. Calculer le nbr de pixels puis chantillon puis bit
8 chantillons (synchro)
4 chantillons avant le signal vido utile et aprs pour chaque ligne (prambule
0 0 XYZ donc 4 chantillons)
40 bits sav
40 bits eav
80 bits par ligne
synchro est dans la zone H ANC (dbit total le dbit de la synchro le dbit
utile)
H ANC-40 bits
Bit par ligne x le nbrs de lignes x le nombre d'images.
(la synchro retire)
87500+ 35280
(total de pixels)
x2 245 560
(nombre d'chantillons)
x10 2 452 600
(nombre de bits par image)
x25 (nbrs de bits par seconde) 6 139 0000
(dbit par bit par seconde)
divise dbit audio par dbit vido
61 390 000 (vido)
48000x64
3 072 000 (audio)
=19,98
V ANC : 720x49 = 35 280
H ANC:625 x144 = 87500
1,
correction prof : (autre manire)
Dbit total = 270 Mbit/second
slide 254.
UIT 601, 4 2 2 (rapport luminance chrominance)
mais les pixels sur l'cran c'est du rvb, par contre le transport se fait par cellule,
en CB Y CR, CB Y CR etc..
On va dduire des valeurs de Y CR CB qu'on aura transmis et comme on
transmet Y CR CB 1pixel sur 2, l'autre on transporte Y, donc il faut que les
valeurs de RVB soit tous en couleur, on va tendre la valeur de CB et CR sur les
deux pixels, on va doubler cette valeur. (x)
On voulait que la bande passante de la chrominance soit 2x moins leves que
celle de la luminance pour cette raison ? (wtf)
Slide 255
Slide 256
Slide 257
Slide 284
problme sur les lignes horizontales
dans la vraie vie on verrait une image uniforme, on verrait pas les lignes.
Exemple des chemises, avec des raies verticales.
Alliasing
on cre des Freq. Au dl de ce qu'on peut afficher.
UIT 601 mga zoom, slide 287, assez de pixels pour tenir compte des
variations de l'image mnt si on rduit la taille de l'image, on a encore ici assez
de pixel (288) sur un cycle bleu blanc on a 3 pixels, donc on a encore de la
marche, la marche c'est 2 pixels, si on rduit encore la taille de l'image, les raies
vont se rapprocher et cette fois-ci on atteint la limite de la rsolution (289) on
est limite de la rsolution, (290) cette fois ci on a dpass car on a 2 raies et 2
pixels, on a dpass la rsolution, on a l'impression que les freq. Se rduisent et
que les raies vont se r-carter. Cette fois-ci on a plus assez de pixels pour
reprsenter les lignes verticales.
293 synthse
300
Le cble agis comme un filtre passe-bas. On perd les hautes frquences (haute
frquence : quand a varie beaucoup), un signal carr c'est une somme de
sinusodes (fourier : fondamental + harmonique) on aur alors de moins en
moins d'harmoniques (315 avec 3 harmoniques) les signaux sont toujours
identifies 0 et 1, c'est discernable, le signal lectrique s'est un peu affaiblie
mais en numrique a ne change pas beaucoup l'image, en analogique on verrait
dj la diffrence. Si le cble s'allonge encore, on perd des harmoniques
nouveau et il nous restera que la fondamental (slide 315.1) mais la
discrimination entre 0 et 1 est toujours possible mme si le signal s'est abm !
Si on continue allonger le cble (baisse la bande passante), on peut toujours
dire que c'est 0 et 1, donc les chantillons sont toujours correct, l'image n'est pas
affecte ! On peut aller infiniment dans la rduction, jusqu' la confusion entre
le 0 et 1, cette config. Marche bien.
316, on a les 3 harmoniques, il faut que ce soit en dessous de 0,5 pour tre pris
comme 0.
316
317
Slide 320
Pour valider les donnes, il faut un signale d'horloge qui va valider les donnes
un moment prcis. Ce qui compte c'est que un moment prcis elles prennent
une certaine valeur. On va regarder ces valeurs des moments prcis indiqu
sur le slide 320 par les flches du dessous. L'horloge donne le rythme
d'chantillonnage du signal.
Comment faire pour avoir le signal d'horloge l'encodeur et au dcodeur
on pourrait imaginer avoir une horloge des deux cts.
-Cas ou on a deux horloges diffrentes, on les synchronise.
Mais une montre finit toujours par prend du retard ou de l'avance, on ne sait pas
parfaitement synchroniser deux horloges et qu'elle le reste.
Ou alors on synchronise deux horloges avec une troisime horloge matre pour
s'assurer que tout soit identique mais mme dans ce cas a ne fonctionne pas.
Vitesse lumire
On a un dlai, T = L/V = 1/3x10^(-6) = 330 nano seconde
(graphique slide 320)
=3,4 ns
longueur de cble = 100 m entre l'encodeur et le dcodeur
Envoyer deux cble a ne marche pas pcq il faut qu'il ait la mme longueur, a
cote deux fois plus cher et c'tait pas l'ide, on parlait d'y arriver avec un seul
cble.
Si on prend un cas particulier comme un signal, qui a pour forme une onde
carr (donc 0 1 0 1 0 1 0 1), quelle frquence il a ce signal ? 270 Mbit/seconde
pour combien de cycle ? 2 donc 270/2 = 135 Mhz.
Il existe des composants lec. Sur base d'une frquence d'en re-synthtiser une
autre. On serait alors capable dans le dcodeur avec la frquence 0 1 0 1 0 1 de
135 MHz, de recrer la frquence de l'horloge qui a 270 Mhz en frquence.
Si on envoi 0 1 0 1 0 1 01 en permanence, le signal subit le dlai et arrive de
l'autre ct avec le bon dcalage il y a donc moyen partir de l'onde particulire
de 135 Mhz(...x) (repet) on est capable d'envoyer 135 000 000 de cycles 0 1 0 1
0 1 dans le cble.
Rajout d'un 3eme encodage, l'encodeur NRZI (none return to zero inverted ..)
encodeur qui se base sur les tats (0 1), c'est une bote qui entre un signal et le
sort par aprs. On cre un signal de sortie qui dpend de cette valeur.
(Dessin 2)
exemple de la porte (change de 2 tats)
si la lumire est allum, on change l'tat de la porte, elle s'ouvre et se ferme
toutes les 5 secondes par exemple.
(s'ouvre, se ferme)
si la lumire est teinte, la porte ne change pas d'tat toutes les 5 secondes.
1 = change d'tat
0 = maintient l'tat chang
1 nouveau = changement d'tat
Le symtrique, l'encodeur
1.EQ (galise)
2. Dcodage nzri (permet de retrouver les signaux tel qu'on les avaient
l'entre ?
3. Opration inverse
4. Quand on a une longue srie de 0 et de 1, comme au slide 314 (des 0 et 1
qui sortent du systme) il faut retrouver ou sont les chantillons, un
chantillon c'est 10 bits. (rcupration du flux srie?)
5. on regarde les donnes pour regarde quel moment on retrouve le
prambule pour se faire on stocke les 0 et 1 dans un registre qui fait 30
bits, et quand on se rend compte que les 30 bits forment le pr ambule,
partir de l on sait qu'on est synchronis avec un chantillon que 10 bits
337.
L'objectif est de regarder les niveaux que prennent les bits.
Il faut regarder l'enchainement des 0.
-Est ce que le niveau 1 et 0 sont diffrents
-Est ce que la variation est franche
338, on voit que la variation n'est pas super raide cause de la bande passante
du faible, les niveaux sont un peu plus flous la variation.
Diagramme de l'oeil, a ressemble un oeil et plus l'oeil est ouvert plus c'est
parfait. (permet de voir la tension et de voir si on se rapproche de l'effet de
falaise, il dpend des donnes).
342. on sait plus retrouver le signal 0 et 1 donc l il y aura des erreurs.
Au dl de 300 mtres ce qu'on va faire c'est qu'on va dcoder le signal sdi, puis
mettre un encodeur et ce sra bon, la technique pour une distance infini c'est de
mettre en place un systme de dcodeur, encodeur.
L'image la plus complique encoder (343) magenta + gris (mire de test) quand
on la branche l'encodeur sdi, quelle que soit l'image qu'on utilisera aprs, a
passera. Quand on la traduit en 0 et 1 elle est complique encoder car quand
on regarde la succession des chantillons qui sont utilises, on a pour la partie
du haut 18 0 qui suivent 2 1 puis 18 0 en permanence, et c'est complexe car il
n'y a pas autant de 0 que de 1, donc si l'encodeur marche mal il va avoir du mal
sortie la valeur correcte, pour le gris, on a l'inverse autant de 1 que de 0 sur
de longues priodes, donc a pose problme car si l'encodeur pseudo alatoire
et le nrzi pareil on va avoir un cas compliqu pour crer un signal 0 1 0 1 0 1.
Donc si cette image l fonctionne toutes les images fonctionneront.
348 (schma exploiter)
l'ide c'est de faire un calcul au sdi sur l'image les chantillons, une fois par
ligne, de transporter le rsultat du calcul dans les donnes auxiliaires et de faire
le mme calcul au bout de la ligne de transmission.
Permet de mesurer les erreurs en exploitation pendant la transmission dans le
cble, le calcul qui est fait au dbut du schma avant le transmission path
doit avoir le mme rsultat aprs la transmission sinon il y a une erreur dans la
ligne de transmission. C'est l'EDH !
349.
Comparaison analogique(cble PAL) numrique (du SDI)
TIV 24/10
Cours 5
Rappel
Encodage SDI : de transporter les chantillons, les bits, qui sont dfinis l'uit 601 (la norme sd) sous
forme srie, dans un seul cas
objectif : srialiser les diffrents chantillons, registre dcallage : charger chantillons par
chantillons les donnes dans 10 registres (10 bits) et chaque coup d'horloge, on sort un bit
dcalage et on dcale ce qui reste et on parvient transformer en srie ce qu'on avait en parallle.
10 bits : 270 Mhz
Si on connecte ces 0 et 1 sur un cble, un cble relativement long, quelques mtres de la rgie, on
va donc voir ce qui se passe quand on envoi des 0 et 1 dans un cble.
Quand on envoi un signal de luminance dans un cble, si le cble est long, le signal n'est pas le
mme.
On a des 0 et des 1 (pg 314) on regarde des portions du signal, 3 tats 1 et 1 tat 0 par exemple
ou 2 1 suivi de 2 0.
On applique la mme thorie que pour l'analogique sauf que ici ce sont des signaux carrs,
pour le signal 2 1 et 2 0, si on retire des HF, le signal devient plus inclin, et au fur et mesure de
ces pertes de HF, le signal se dforme pour arriver un signal, mais l'intrt c'est que on distingue
toujours 0 et 1 avec ce signal, et puis au fur et mesure qu'il s'allonge on distingue tjrs 0 et 1,
regardons mnt pour le signal de gauche 3 tat 1 et 1 0, le cble s'allonge et on remarque que force
de rduire un certain moment, la bande passante faible, on distingue plus le 0 des 1.
Quand on compare le niveau de discrimination la valeur moyenne du signal, donc quand on rduit
les HF, ce qu'il reste du signal se centre autour de la valeur moyenne, on voit qu' un moment on
retrouve plus les 0 et 1, on voit 4 1 et 0 0. POUR CONTOURNER CE PROBLEME ?
Condition ? Pour qu'on ait la valeur moyenne centr sur la valeur centrale qui distingue le 0 et 1 ?
comment ? Avoir autant de 0 et de 1.
Pour arriver ce qu'il y ait autant de 0 que de 1 on utilise un quipement, L'ENCODEUR
PSEUDO ALEATOIRE (slide 319) (case 2) qui a un rgle qui fait que priori c'est alatoire, le
phnomne alatoire, l'ide c'est qu'on transcode avec une rgle que l'on connat et donc on fait en
sorte qu'il y ait globalement autant de 0 que de 1 en sortie de cette partie l.
APRES, problme ? On a des zones d'incertitudes aprs la premire rallonge du signal 3 1 et 1 0,
qui sont au dessus de 0,5, donc on va regarder le signal des moments bien prcis (ces moments
prcis c'est l'horloge : un signal carr qui varie entre 0 et 1 et quand il passe de l'un l'autre c'est le
moment ou il valide les donnes) ici on regarde (slide 320).
On doit adjoindre au signal de donnes, une horloge, qui permet de squencer et de regarder les
donnes des moments prcis
cela doit se passer l'encodeur et au dcodeur (une horloge) et que cette horloge soit en phase avec
les donnes, un gnrateur d'horloge l'encodeur et au dcodeur donc, donc 2 horloges le pbm ?
Elles ne restent jamais synchrone.
Elle finiront tjrs par avoir des rythmes diffrents.
Quand on augmente la longueur d'un cble, les donnes mettent plus longtemps, donc on va avoir
un retard et il se peut que pour contrer ce retard on regarde les donnes, le signal un peu plus tt et
on risque alors d'analyser le signal dans une zone d'incertitude qui allait passer en dessous de 0,5
mais qui est toujours au dessus de 0,5 (= 1 au lieu de 0)
Moyen ? RECONSTRUIRE L'HORLOGE AU RECEPTEUR
On va donc transporter dans le cble un signal qui ressemble l'horloge, on remet jour l'horloge et
on recommence. On transporter l'horloge, on synchronise au rcepteur, a reste valable un moment
puis on recommence.
On doit le faire souvent sinon elles vont driver.
Le signal le plus proche de l'horloge c'est celui ou on a (slide 324) (dure d'un bit : cycle de 0 1)
on peut transporter un signal qui a une frquence de 135 MHZ (que le 0 ou le 1), on fait en sorte
que dans le signal numrique on ait suffisamment de signal 1 0 1 0 1 0 1 0 1 0
Encodeur NRZI : dont le rle est de remplacer des niveaux par des variations, quand on a un 1
l'entre on inverse, si on avait 0 on restait au mme niveau, pour s'assurer que qd on a full 1, genre 4
1, on remplace cette srie par des 0 1 0 1 0 1 0 1 0 1.
on en a pas plus de 0 1 0 1 0 1 mais en tout cas on s'assure d'en avoir pleins de variations.
L'objectif c'est qu'on ait un code modifi.
[On fait une traduction du signal en numrique srie, proprit : autant de 0 et de 1 et suffisamment
de variations 0 1]
On recre l'horloge, on la recre rgulirement, on le fait chaque fois qu'on retrouve des 0 1 0 1 on
remet l'horloge jour.
Principe du pdalier, pour relancer le vlo. faire suffisamment frquemment pour ne pas que
l'horloge dcale
faire tous les 3,4 chantillons et a suffit.
326.
Les donnes passent par 10 cases mmoires et on fait des relations (x)
pour le cryptage d'un signal, comme le home banking, code, crypt nos donnes. La loi n'est connu
que par nous et notre banque.
327.
L'horloge des signaux, quand elle reoit les chantillons, elle est 27 Mhz (10x moins rapide)
PLL : outil qui permet de calculer une horloge, de la modifier, on augmente la freq par 10, 270
Mhz, a va cadencer les diffrentes tapes au dessus dans le graphique, 1 bit passe de l l (aux
diffrentes tapes)
Pour le signal sdi on met un amplificateur pour qu'il pilote le cble, que le courant soit assez lev
(driver) pour piloter le cble.
328.
Dcodeur
(Opration symtrique)
rcuprer le signal, on sait que au bout d'un cble on aura perdu les HF, donc il faut que les niveaux
qui sont proches de la moiti de 0,5, il faut donc les rhausser aux valeurs maximums, 0,6 faut le
mettre 1 et 0,4 0. (EQUALISATION)
ENSUITE
On recre l'horloge avec les 0 et 1 dans le signal, il y en a assez, on cre un oscillateur qu'on va
synchroniser avec les freq 0 1 0 1 (horloge interne, elle travaille pas toute seule, elle travaille avec
les variations 0 1 dans le cble)
a permet de synchroniser le fonctionnnement des diffrentes tapes (nrzi, registre de dcalage,
dcodeur pseudo alatoire)
Les donnes 0 et 1 faut les remettre en chantillons pour rcuprer les chantillons de 10 bits, on
prend 10 bits puis on les monte etc.. mais c'est plus lent mais priori on ne sait pas ou sont les 10
bons bits, car dans le flux 0 1 rien n'indique voil le dbut de l'chantillon, le seul moyen c'est de
retrouver dans le flux les 2 bons moments particuliers : le SAV (3 chantillons : le prambule : 1 ou
tous les bits valent 1 et 2 chantillons ou les bits valent 0) et le EAV
Dans 30 bits (10 bits 1 , 20 bits 0) ce coup d'horloge l on a le pr ambule donc 10 coups
d'horloge plus loin on aura le XYZ, puis 10 coups suivant on aura le premier chantillons de la ligne
(CB) puis 10 coups (Y) puis 10 coups (CR) etc..
Donc on sait dcouper correctement 10 bits par 10 bits, quand on peut les dcouper, toutes les 37
nano secondes, tous les 10 coups (x)
on a fait une transformation qui permet au dpart des chantillons de l'unit uit 601, de les encoder
pour que a passe sur un seul cble, on met tous les bits l'uns drrire l'autre puis on fait l'opration
inverse et on rcupre au bout du cble nos chantillons.
334. quand on allonge trop le cble, le clif effect : on commence confondre les 0 et 1, la distance
laquelle a apparat : + /- 280 m.
343.
Tous les 0 et 1, d'un encodeur SDI, dpendent d'un signal d'entre et c'est l'image, et parfois l'image
amne un moins bon signal SDI ou l'on a moins facilement des 0 que des 1 par exemple, le signal
qui se met dans le pire cas c'est cette image-l, pour le magenta et pour le gris, l'un stresse la partie
NRZI, l'autre l'encodeur pseudo alatoire.
Si cette image fonctionne correctement alors n'importe quel image fonctionnera correctement.
Faudra pas que lorsqu'on met les barres couleurs a se passe bien puis quand on fou le signal vido
live a foire.
348. LE DH
Autre moyen de contrler une ligne
compter les erreurs dans la ligne
l'ide : on va faire un calcul sur l'image, on va le faire sur la dure d'une ligne, sur le contenu, le
rsultat on le met dans le H ANC, et puis au bout du cble on refait le mme calcul et logiquement
en transportant le rsultat du calcul l'entre on s'attend avoir le mme rsultat sinon a veut dire
que en chemin il y a des erreurs.
CRC : valeur qu'on insre
PAL (analogique) vs SDI (numrique)
perte de frquence dans l'image si on rallonge le cble, l'image devient de plus en plus floue
(analogique)
etc.
SYNTHESE
Page 353.
EXERCICE
Signaux binaires, dans le cbles, ceux qui prsentent les caractristiques d'un signal SDI
Le premier a pas mal de variations 0 et 1 donc pas mal, le premier est le meilleur.
Le deuxime n'a pas de variations 0 et 1 donc on ne sait pas synchroniser l'horloge
EXERCICE 2
270 Mbit par seconde = 4/3, l on demande pour du 16/9
le temps qui spare entre deux variations d'tats.
360 Mbit/s = dbit car si 4/3 = 270 alors 16/9 = 360 Mbit/s donc T = 1/360 000 000
slide 354.
EXERCICE 3
Diagramme de l'oeil A et B sont le signal la fin du cble, on demande de dire quel diagramme
correspond au cble le plus court et le plus long.
Plus l'cart est grand plus le signal est propre
plus on s'carte plus on perd les HF donc plus les niveaux se raproches, gauche les niveaux sont
moins rapproches, DONC CELUI A DROITE EST PLUS COURT, moins de HF transport
gauche donc plus long.
Car le diagramme de l'oeil permet de voir l'tat du signal dans le cble, si on distingue bien 0 et 1 ,
ici droite on voit bien que le 0 et 1 est bien faite mais moins bonne gauche car les niveaux se
rapprochent, on perd des HF = long cble donc gauche = long cble.
EXERCICE 4
Un systme EDH, on additionne les niveaux, on prend les chantillons Y CR CB et on fait une
somme, on prend une ligne, CRC (calcul dbut de ligne), recalcul aprs transmission pour une
image noir, rponse = 414 700, ce qu'on peut en dduire ?
Calculer la valeur au dbut de la ligne ? (on connait l'image, elle est noire, on sait que les
chantillons de Y pour le noir = (en numrique) 64) (64 = noir, 940 = blanc)
CR = 512
CB = 512
en analogique
Pour le noir,
Ry=0
By=0
et on les a mis 512 en numrique
ce qu'on dis c'est que le CRC (correcteur d'erreur)
4:2:2 combien d'chantillons d'une ligne pour Y = 720 chantillons de Y
CR = 360 qui vaut 512
CB = 360 qui vaut 512
donc 720 x 64 + 360 x 512 + 360 x 512 = 414 720 (pas gal 414 700)
Il y a une erreur, il est dans les alentours de 280 m.
EXERCICE 5
Les 30 bits, les 10 bits 1 et les 20 bits 0, permettent de retrouver le pr ambule (les 30 bits, 1023
(les 10 1) 0 0)
le premier ou le dernier chantillon de Y
on voit que ce qui suit c'est la synchro avec les 10 0 donc on en dduit que c'est les 30 bits du
dernier chantillons
F
V
H = 0 donc c'est le SAV
P3
P2
P1
P0
0
0
Cb ce sont les 10 bits suivants (0 1 0 0 1 1 1 0 0 1)
y ce sont les 10 bits suivants (0 1 1 1 0 0 0 1 1 0)
ce qu'il y a avant c'est le H ANC, de l'audio ou le CRC etc...
HD
Norme HD : quivalent : Paramtre HDTV : UIT709
Plus de pixels mais d'autres choses aussi
JUSTIFICATION DE LA HD
Pour la sd, on a considr comme acquis 625 lignes et 5(xx) affiches, on a calcules la bande
passante, on s'est pas demand si 625 lignes c'tait suffisant, on va calculer la valeur relle
ncessaire pour la vision humaine
-la rsolution (on va chercher un angle, l'angle le plus faible que l'oeil est capable de percevoir)
on peut regarder cmt l'oeil fonctionne (oeil, nerf optique, le cerveau)
pour y arriver, mesure, mesure sur une mire, compose de lignes noires et blanches, on va regarder
quel est l'angle le plus faible, on parle d'angle pas d'cart entre les lignes.
Dans quel groupe tu sais distinguer les noirs des blanche
MESURE ?
L'oeil est capable de voir 1 minute d'arc : c'est une mesure d'angle () 1/60 = minute
1/60 d'un degr
D = 2' (' = arc) (2 minutes d'arc) (2/60)
C = 1'
B = 45'' (45/3600)
A = 30'' (30/3600)
1 seconde d'arc = le cercle de 360 divis par 3600 (je crois)
1/3600 = 1'/60 = 1''
Dfinir l'angle de vision ?
Le point central
l'oeil n'a pas la mme densit dans tous les axes, en fixant le point central on ne sait pas compter
facilement les lignes sur le ct, les cellules ne sont pas rpartis uniformment sur la rtine
cne concentr sur l'axe optique (fova)
plus on s'carte moins il y a de cellules
En fixant la croix sur la gauche..
dans le champ visuel on n'a pas la mme comprhension de l'espace partout. On va jusqu' 220
comment on compense ce qu'on voit pas ? Ce qui arrive dans notre dos, on l'entend, l'audio est plus
distinctif drrire que devant. Devant c'est le visuel qui prime
On a 2 Devant nous qui nous permettent d'analyser correctement.
On a 20 Vision des mots, arriver dcrypter un mot complet.
On a 40 Vision des symboles (exercice de la croix a gauche, on voit un O un S, on fouille dans
notre rpertoire et on balance un mot)
On a 120 Vision des couleurs, d'ouverture ou l'on voit les couleurs correctement. (augmentation
btonnets, la nuit on voit mieux sur les cts que devant)
Si tu veux lire un mot la nuit tu le mets lgrement sur le ct dans ta vision et tu le liras plus
facilement.
[1 sec d'arc = 1/3600]
Pour la tlvision au dbut, pour la sd, on a retenu 14 d'ouverture, on a un cne ouvert de 14 et on
fait en sorte que l'cran soit dedans.
14
De sorte que chaque fois qu'on dplace le regard on trouve l'information directement.
SD = 4x la diagonale pour avoir les 14
672 lignes (dimension)
SD sous dimensionn, car sur l'cran on en a que 576, donc il nous manque une centaine de lignes
en SD pour avoir la bonne rsolution donc c'est logique qu'en sd il manque qqchose, ce qqchose est
accentu par deux phnomnes, le fait que les crans n'ont pas cess d'augmenter de taille, les
premiers crans fesait 12'' (pouces) il tait donc facile d'avoir une image dfinie avec cette taille
d'cran, plus on s'loigne d'un cran plus la rsolution maximum de l'oeil est content.
La distance moyenne entre l'cran et un fauteuil est peu prt 2,20 m, ce qui veut dire que lorsqu'on
augmente la taille de l'cran, la taille des pixels augmentent aussi sauf si on change le standard et
donc on finit par dpasser la taille du pixel qui correspond au 45 secondes d'arc.
Les meubles IKEA, ils sont prvus pour contenir des tlviseurs de 47'' maximum.
Le problme du 16/9, on a dans les annes fin 90 on est pass au 16/9 et il fallait garder la
compatibilit et avec le letter box on pert 140 lignes qui sont devenues noires et donc a veut dire
que l'image verticale a perdu en rsolution, on garde pas la mme taille de l'cran mais on tend les
lignes pour couvrir tout l'cran.
Ce qui veut dire que le contenu de 432 lignes, la rsolution est encore amoindries
ET PUIS, le pbm de l'informatique qui amne des crans proches avec dfinition trs grandes,
montrer ces photos de vac sur un cran SD = flou !
(3 PBM Vs SD)
Donc on a essay de calculer rellement les choses :
1. on va augmenter la taille de l'cran donc l'immersion, les 14 d'ouverture donne une immersion
faible, plus l'angle est grand plus on est dans l'image, l'ide c'est de passer au minimum 20
d'ouverture pour la HD. 20 min dans la diagonale donc !
On a 20, correspond si on prend les 45'' secondes d'arcs
20 x 60 x 60/45 = 1600
Si on calcul les pixels en diagonales, on doit avoir 1600 pixels en diagonale
Mais on calcul en longueur et largeur logiquement
on sait qu'il y a 1600 pixels en diagonale et on veut savoir la verticale
on prend comme rapport 16/9
donc 16/9 de H pour la largeur
donc on a
Hauteur
Diagonales
et 16/9 de H
Diagonale = H + (16/9).H
Diagonale = H x (1+(16/9))
[(racine carr)525 x 625] x 2 = 1145 mais on n'a mit 1125, a permet d'embarquer le 1080 sr les
deux standards.
Les 784 lignes c'tait le minimum lgal pour la compatibilit avec la vision humaine. Donc la HD
va au dl de la vision humaine, donc on peut s'approcher plus proche de l'cran, dpasser les 20,
jusqu' 30 apparemment.
1920 pixels largeur
1080 pixels hauteur
1125 lignes
nombre de lignes pour 1920 pixels en largeur
Trouver la FE ! (pour la sd cmt avait-t-on fait?)
comment ?
-2x suprieur (Nyquist, shannon)
-mme Fe USA EU
-les chantillons soit align verticalement
rapport 4/3, 16/9, on trouve 9 Mhz
13,5 Mhz = sd (frquence maximum de 5 Mhz, mais on a prit un peu plus)
si on calcule la Fe pour du 16/9 en Sd on a vu que c'tait 18 Mhz
L'image est 16/9 mais 4x plus de pixels
Donc la Fmini E est 4x18 Mhz = 72 Mhz
(1) La fe doit au moins tre suprieur 72 Mhz (condition Nyquist)
(2) deuxime condition, tout comme pour la sd, need lien entre Fligne sd et Fligne USA EU,
quel soit un multiple entier de ces lignes --> n x 2,25 Mhz (pour relier frequence de ligne
USA EU)
(3) Combien de lignes en europe en HD, 25 x 1125 et pour les amricains, 30 x 1125
on prend un multiple entier de ces 2 calculs. DONC k x 25 x 1125 x 30 et on obtient 74,25
Mhz (plus petit multiple entier de frquence(x))
4:2:2
FE de CR : moiti de 74,25 Mhz
= 37,125 Mhz
pareil pour CB
Au total on a 150,5 Gbit/s
Combien de pixels par lignes du coup ?
74,25 millions d'chantillons de Y par seconde
et y a 1125 lignes par image et 25 images par seconde
74,25 x 10^6
/1125 x 25 = 2680 (Nombre de pixel par lignes)
pour les amricains = 2200 (car x30)
On connat la FE signaux HD Amricains et Europenne
Un des pbm hrit de la sd, c'est le mode de balayage, en sd on pouvait pas stock l'info localement,
il fallait adopter un systeme de balayage donc l'arrive de l'hd on a rflchi ce mode de balayage,
pourquoi pas passer en progressif ?
Pbm engendr par l'entrelacement.
(image canard)
380.
2 modes de balayages.
Si on veut viter que l'image scintille, on doit avoir 50 images par seconde car la raison de
l'entrelacement c'est d'avoir 50 informations par seconde sur l'cran
si on fait 25 images par seconde on aurait l'impression que l'image disparait puis revient.
La FE de 74,25 Mhz va donc passer au double 148,5 Mhz pour Y, on va donc doubler les FE en 50
images progressives.
L'avantage c'est que l'image est plus nette.
1080 i = interlast = entrelac
1080 p = progressif
si on rsum
25 i ou 50 i
une trame sur 2
toutes les 20 ms
50x par seconde
On a 50 p
diffusion comme le 50 i
les lignes vont deux fois plus vite
FE deux fois plus vite
FL aussi
Toutes les 20 ms on rebalaye total l'image
2x plus d'informations
Dure d'une image 20 ms alors qu'avant c'tait 40 ms
Standard de diffusion
25 p = capture 25 images par secondes mais on peut pas afficher que 25 images secondes
on doit convertir
donne un effet un peu cinma car proche du 24 p
toutes les 40 ms on capture une image mais on peut pas l'afficher comme a sinon l'oeil peroit un
manque
25 psf capture les images en 25 p et les affiche en 50 i
une image complte toutes les 40 ms
on les affiche en 2 trames (cre artificiellement)
en dcalant les lignes 1/2 de 20 ms.
Mme effet qu'au cinma (mouvements saccads)
mais pas d'effet de scintillement
pas comme du 50 p(vision humaine)
donne des mouvements comme au cinma car chantillonn 24 i/s mais qu'on diffuse en 2x
a donne a 383.
Quand on cre un ralenti = cohrent mais dans le flux temps rel : un peu bizarre.
Progressive segmented frame (psf)
on prend l'image on la segmente en 2 frames.
Il nous reste savoir, le nombre de niv. De quantification, et cmt coder
quantification, on change pas, on reste sur 10 bits (majoritaire)
1024 niveaux
rpartition comme en sd (94 et 940 en nominal) etc..
pour le codage, petite diffrence mais quasi pareil
synchro de dbut et fin de ligne,
quel est le dbit ?
Dbit = n. FE = 10 x 74,25 x 10^6
2^n
Dbit Cr = 10 x 74,25 x 10^6/2
Dbit CB = 10x 74,25 x 10^6/2
=
1,485 Gbits/s
pour 1080 i
pour 1080 p ? 2x a
= 2,97 Gbits/s
Invention du standard intermdiaire
720p
c'est de dire on garde le mme dbit que l'entrelac mais on y fait du progressif
on rduit la rsolution de l'image mais en augmentant la frquence de l'image, image plus
nombreuses mais plus petites
le dbit reste constant on peut dire qu'il est li la taille de l'image. C'est proportionnel la largeur
x la hauteur, or on veut du progressif
progressif = double les images par secondes
on doit rduire la largeur et la hauteur de l'image
L/(racine carr de 2)
H/(racine carr de 2)
on double le nombre d'image
on garde le mme dbit
mais on aura du progressif.
Plus d'image donc moins de pixels.
1920/(racine carr de 2) = 1280
1080/(racine carr de 2) = 720
D proportionnel L x H x I
Pq racine carr de 2, si la surface veut tre divis par 2, on divise par racine carr de 2.
L x H/2 x 2I (image)
donc, L/(racine carr de 2) x H/(racine carr de 2) x 2I (image)
Partie visible de l'image : 1280 x 720
FE : 74,25 Mhz
on prend un chiffre suprieur 720 lignes
on prend 750
donc 1280 sur 720 (partie visible)
au total on a 750 lignes
combien de pixels par lignes au total il y a ?
750
720 ( l'intrieur)
1280
?
74,25 x10^6 / 750 x 50 = 1980
387.
On a rduit la taille de l'image pour garder un standard progressif et afficher plus d'images, plus
petites.
720 pas HD car en dessous des 784 lignes
intrt : avoir une image progressive.
390.
On change le triangle, pcq entre le moment ou l'on dtermin les paramtre de l'uit 601 et la hd, il
s'coule quelques annes, la hd se formalise dbut anne 2000, la techno volue et on peut revoir les
paramtres.
Les points dans le diagramme colorimtrique ne sont plus au mme endroit
nouvelle quations : Y = 0,2126 R + 0,7152 V = 0,0722 B
de Sd a HD il faut non seulement changer le nbr de pixel voir mme image par seconde mais en
plus on doit recalculer tous les pixels.
L'chelle intrinsque n'est plus la mme, l'quation de passage de l'un l'autre change.
C'tait une question d'examen l'an pass.
395.
Une mire de test.
709 601 (colonne)
on va faire en sorte de reprsenter 3 couleurs avec le mme d de luminance.
Si on met l'image en noir et blanc on peut voir si l'affichage se met en 601 ou 709 (slide 396)
si on voit une variation c'est pas le bon standard 396 = 709, pas 601
on ne peut pas convertir une image de sd en hd et inversment en ajoutant des pixels, il faut changer
la valeur des chantillons en gros.
400.
une autre diffrence en hd, en sd on avait en 4 2 2 d'aligns les chantillons et pour 1 pixel on avait
3 chantillons puis 1 CR 1 CB etc..
en HD --> 401.
Ordre (2 chantillons par pixel)
1 pixel qui porte Y cB
1 pixel qui porte Y cR [...]
Y cB
Y Cr
402.
En hd on ajoute 4 chantillons,
un premier qui nous dit quel ligne on est (un compteur, la fin de la ligne, le LN, line number,
comme il faut monter jusqu' 1080 mme 1125 (ligne pas visible) il faut qu'on dpasse 10 bit
('1024) donc on va jusqu' 11 bits.
2 chantillons 10 bit on a le compteur de ligne
puis 2 chantillons de CRC (dans chaque ligne on ajoute un calcul, qu'on stocke dans 2 chantillon)
le SAV est identique
au lieu d'avoir 8 chantillons utilis pour la synchro on en a 12 et en plus on les double pour le 1080
p car en 1080 p on a ojrd pas moyen de le transporter sur du cble, dbit trop lev. (sur de lafibre
optique oui mais pas le co axiale normal) si on sait pas transporter l'info sur un cble, on le fait sur 1
cble, on utilise 2 voies, deux cbles, un qui porte tous les chantillons de chrominance mais du
coup on met la synchronisation complte et un 1 de luminance et la synchro complte aussi, c'est
comme du 1080i sauf que il porte que la chrominance d'un ct et la luminance d'un autre, les 2
signaux portent au total 12 chantillons pour la synchro et au total 24 chantillons pour la
synchronisation.
410.
SYNTHESE
416.
gain : rendre plus sombre ou clair en ouvrant la dynamique, en multipliant le niveau.
La gamme des niveaux
le seul outil que l'on regarde ici c'est le waveform
l on ne touche pas la couleur
417 barres couleurs
424.
427.
On peut mesurer le fait que l'on quitte ou pas ces couleurs -> on utilise le diamond, diagramme en
diamant, pr qu'une couleur soit lgale, elle doit tre l'intrieur du cube.
On va projet le cube selon l'axe b et l'axe r !
on sait toujours pas si la couleur est devant le cube ou drrire
mais si on ajoute la seconde projection, celle selon l'axe R selon l'axe VB donc, on voit si
l'ensemble des points de l'image sont dans dans le cube. Si une des deux projections pour une des
couleurs de l'image est en dehors d'unes des projections alors on a une couleur illgale.
429.
L'ensemble des couleurs doivent se retrouver dans le graphique noire, et pas ailleurs, dans les
losanges.
Blancs : aux deux extrmits suprieur et infrieur (les deux extrmits, pas une la fois, les deux)
Noir : aucunes reprsentations
Si on a un mlange, le jaune (rouge et du vert)
jaune = tout en bas
gris 50% = au centre
DESSIN 3
431 : illgale.
Synthse
traitement d'image basique pour l'tallonnage
Diagramme diamond : permet de passer les valeurs en RVB.
TIV 6
compression d'image.
SD : Le sdi, c'est 270 Mbit/seconde
HD SDI : 1,5Gbit/seconde
algorithmes de compression
Le Jpeg
MPEG et H264 (driv du jpeg)
On a vu que si on prend un flux non compress, de l'uit 601, la sd par exemple, que le dbit de la sd
quand il est complet, on est 270 Mbit/seconde, qu'est ce qu'on peut faire pour rduire ce dbit ?
Enregistrer en 8 bits
Rduire l'chantillonnage
Rduire la couleur
Un nouveau format avec un minimum de mtadonnes. (il y a des chantillons vide dont on peut se
passer pour de la place), rduire ce qu'on va rellement stocker, a nous donnera le minimum de
dbit. (blanking) (pas la synchro, faut bien la mettre qqlque part)
270 Mbits/seconde
->207,36 Mbit en 4:2:2 c'est ce qu'il y a rellement dans l'image
rduire l'chantillonnage de la couleur
-> 155,52 Mbits/seconde
en 4:1:0 (standard couleur le plus faible en terme de dbit et toujours valide pour la vision humaine)
-> 116,64 Mbits/seconde
cette faon de rduire, est couteux, le 4:1:0 est d'une qualit moindre mme si il est toujours valide,
craint pour la traitement.
8 bits 4 :2 :2
-> 165,89 Mbits/seconde
4 : 1 : 0 en 8 bits = dbit le plus faible (post prod possible)
-> 93,31 Mbits/seconde (aucune marge de manuvre pour du traitement) (post prod impossible)
tallonnage ? Non, grosse plaque de couleur.
Juste enregistrer et diffuser mais pas plus
on rduisant le stockage des donnes utiles et en se mettant aux limites de la vision humaine on
divise presque par 3 le dbit.
Ca ce n'est pas de la compression.
Si on rduit la rsolution a se verra l'oeil, p.e 93 Mbits/seconde c'st le dbit non compress
minimum pour ne pas que a soit visible l'oeil humain.
536.
Algorithme de compression
JPEG (invent la base pour la compression d'image photo, l'ide tant de transporter des images
par les voies tlphoniques l'poque)
Le JPEG a t dvelopp pour les images fixes, il existe une variante MJPEG pour des
vidos.
On va essayer de changer le monde. On est dans le monde spatial, on dfinit pour
chaque pixel les paramtres. On va passer dans le monde frquentiel. L oeil est sensible
des basses frquences mais pas trs sensible sur les hautes frquences. La
consquence: si on fait une erreur sur les basses frquences, on le voit. Si on fait une
erreur dans les hautes frquences, on ne le voit pas.
On va essayer de transformer le monde spatial en monde frquentiel.
On peut dcomposer limage en pixels. On va prendre un petit rectangle de 4 pixels
(2x2).
Cet rectangle peut tre dcompos en rectangles avec juste 1 vrai pixel, les autres sont
teints. Si on Dit que sauf 1 pixels est blanc 100% et les autres noir. On multiplie ce
rectangle par la luminance du pixel. On le fait avec tout les 4. Ce rectangle est la somme
des 4 rectangles en N&B pondres par leur luminance. Mais comme a, on ne peut pas
encore rduire le dbit. Chaque pixel est aussi important que lautre.
(SCHEMA pg 32 TIV ALEX)
devant -2 ; 1/-2). Pour la fin, on va dire 0/0, a veut dire des 0 jusqu la fin. Ca rduit le
nombre
dinformations quon doit transmettre.
Cest RLC. On dveloppe un petit arbre pour savoir combien de bits il faut pour
transmettre les coefcients (409). En fonction des coefcients, on va choisir dans quelle
catgorie on est. C'est l'tape RS.
Sil y a une valeur (genre 0/2) apparait trs frquemment, on va utiliser un code
binaire
trs court pour rduire le dbit. Si une valeur n apparait juste 1 fois, on va pouvoir utiliser
un nombre de bits plus lev (// code morse).
On va utiliser le code Huffman (encodeur Huffman, voir p. 411) Il na jamais
de codes
courts qui sont compris dans des codes plus longs. Tout les codes sont uniques.
Le dcodage se fait de le mme manire. Le dcodage et le codage sont parfaitement
symtriques.
Le END of BLOCK (Juste des 0 la fin) est 1010.
En plus du code, il faut la table Huffman (pas toujours la mme) et la table
de
quantification. La quantification rend la compression irrversible, tout les autres
tapes
sont compltement rversibles. Entropie = streben eines systems nach unordnung.
Pour une distribution live, si on veut utiliser par exemple le MJPEG (Motion JPEG), il
faut que la compression se fait trs vite (40ms).
Une fois quand on a dfini la table de quantification, on ne connait pas encore le dbit de
limage, parce quon ne connait pas encore l image. La compression peut varier pour
chaque image. Cest un compresseur VBR (variable bit rate).
Mais un compresseur VBR nest pas utile pour transmettre parce qu il y a toujours un
dbit
maximum quon peut transmettre. Quand on dpasse le dbit, l image n est pas transmis.
On a donc invent le CBR (constant bit rate). On va chaque fois modifier la table de
quantification pour que le dbit reste toujours le mme.
etc.
10 est la borne de compression quil faut pas dpasser en MJPEG.
539.
full redondance
si on prend juste un zoom dans l'image l'arrire plan, on voit que les pixels de l'image se
ressemble trs fort.
Or a vu que on prend chaque pixel de manire indpendante, mais donc pour chaque chantillon on
le transporte comme si le pixel tait seul or les pixels sont clairement group et leur association
forme une image donc plutt que de les transporter de manire seul on pourrait les lier, comme il se
ressemble trs fort, on pourrait dire que la Luminance du pixel d' ct est la mme avec une petit
valeur supplmentaire ou en moins, peut tre que quelques niveaux sur les 1024, donc on aurait peut
tre pas besoin de 10 bits mais voir meme 2,3 bits.
On voit donc pixel par pixel qu'il y a un peu de marge sans pour autant perdre de la qualit,
exprimer l'information autrement pour la transporter. (comment extraire la corrlation dans une
image) (comment les pixels sont lis entre eux) (exemple : quand le cerveau compresse l'info
(constant) avec quelques mots p.e, le cerveau reforme l'image (souvenir de vacance, pas besoin de
redtaill)).
Ici on va faire a de manire un peu plus basique, on va commencer par la compression image par
image.
Comment on compresse ? La vido c'est 25 ips, 25 ips souvent elles sont lies.
La corrlation spatiale
La corrlation temporelle
La corrlation spatiale
(intra image)
ou algorithme intra image
pbm ? L'image en sortie de l'encodeur, elle sera cod difframment, et au dcodage on retrouvera la
mme image, on aura subit aucunes pertes pcq l'algo est une traduction, on exprime de manire
diffrente mais on retrouve la mme image OR rduction de dbit faible.
Notre objectif c'est d'arriver rduire le nbr de bits par chantillons
dans ce modle pixel par pixel 539, comment savoir quel pixel est plus important ? Faire un
changement dans l'image pour exploiter ceci (?)
546.
Faire une erreur dans les HF, (dtails) personne constate l'erreur, le cerveau, la vision humaine est
sensible aux Basses frquences, donc une petite erreur dans les BF sera fort visible, par contre l ou
y a des HF, ce n'est pas si grave, si on fait des erreurs, h bien on voit pas de diffrences, trop
d'infos, le cerveau s'en rend pas compte,
540.
utiliser un oprateur,
541.
on parle d'un petit pav de l'image avec 4 pixels, on va s'intresser qu' la luminance, 4 images,
chaque image ou on a un pixel qui reprends la valeur du pixel de sa situation gographique,
le noir si on le met 0 a fait 0+0, imagine que y a4 projecteurs avec 4 filtres et ces 4 filtres sont les
4 qui sont l, si on projte du noir il n'y a rien qui passe.
Dcomposition en 4 images en une somme de 4 images qui ont des pixels soit noir/soit blanc
ces images de base sont pondres par une valeur, la valeur Y qui va pour chaque pixel, c'st donc la
somme pondre des images de base.
si on met des valeurs
Y0 Y1 etc..
Y0 c'est en fait la compo de 2 choses : la multiplication de Y0x (image ou le pixel est blanc 100%)
que l'on multiplie par la valeur de 0
On sait par contre toujours pas dire ou sont les HF et BF
Distinguer les HF des BF
On va donc comprendre des images avec rapport sur le contenu frquentiel
Carr avec 4 pixel blanc
Image uniforme (contenu BF car aucunes variations)
Carr avec variation verticale (Contenu en frquence plus leve, en frquence horizontal)
sur un waveforme a donnerait a
pareil (vertical)
noir blanc noir blanc
A nouveau c'est une somme pondre mais les valeurs ne sont plus les mmes (plus de Y 0 etc..)
D0 x cette fois
Calculer ?
Regarder pixel par pixel de quoi il est compos.
Si on regarde Y0, c'est la somme pondre de la tous les pixels situs en haut gauche donc Y0 =
D0 + D3
Y1 = D0 + 0xD1 + 0x2 + D3
Y2 = D0 + 0x D1 + D2 + 0x D3
Y3 = D0 + D1 + D2 + D3
D3 = Y0 D1
D1 = Y1 D0
D2 = Y2 D0
D0 = Y3 D1 D2 D3
D0 = Y3 (Y D0) (Y2 D0) (Y0 D0)
D0 = Y3 Y1 + D0 Y2 + D0 Y0 + D0
D0 = Y3 Y1 Y2 Y0 + 3D0
-2D0 = Y3 Y1 Y2 Y0
D0 = Y1 + Y2 + Y0 Y3/2
(Combinaison linaire de 4 images de base)
pondration = coficient qu'on trouve la fin (542. : 0,75 x, 0,50, ... par exemple)
542.
Y1 = 0,50
Y2 = 0,59
Y0 = 0,75
Y3 = 0,87
(Y1 + Y2 + Y0 Y3)/2 = 0,485
D1 = Y1 D0 = 0,5 0,485 = 0,015
D2 = Y2 D0 = 0,59 0,485 = 0,105
D3 = Y0 D0 = 0,75 0,485 = 0,265
On retrouve alors bien l'image d'origine.
Ce qu'on vient de montrer, la somme de tous les pixels en haut gauche de 542.
0,49
0,01
0,10
0,27
549.
On va rduire le bloc 4x4 (16 coficients contre 64 avec la table 8x8)
On reprsente les valeurs ngatives, la plus basse par le noir
les valeurs positives, la plus haute par du blanc
la valeur nulle, par du gris.
Quelles sont les images qui vont contribues ?
L'ide est de se dire je prends 8 images, de 4x4 et on veut savoir quelles sont les coef de la dct qui
vont contribuer ? Ceux qui sont pas nuls, la premire est uniforme donc tous les dct sont nuls sauf le
premier avec 1 1 1 1 , seul contenu non nul est le premier, si on multiplie le bloc par la valeur de la
luminance du pixel 4x4 blanc... (?)
Le deuxime avec une moiti horizontal noir ? Quelles sont celles surement pas utilises, les 3
dernires lignes qui implique une variation verticale (12 images de base non utilise)
comment compos cette image avec les 4 disponibles (premire ligne) la premire (valeur moyenne
de l'image), la deuxime (discrimination entre la gauche et la droite) etc..
de quel image on aura besoin ? La 1, La 2 car diffrence entre la gauche et la droite (invers)
(valeur ngative donc coef vers le bas dans le slide 552) et la 4 et pour discriminer la 2 correctement
on utilise la 4 qui nous fait obtenir le rsultat espr.
Faire les 6 derniers (exercices)
(en retirant les 2 premiers)
1) 1.1, 2.1, 4.1
2) 1.1, 2.1, 4.1
3) 1.1, 1.3, 3.1, 3.3
4) 1.1, 4.4, 2.2
5) 1.1, 3.1
6) Tous ?
7) Tous ?
560.
on va traiter diffremment chaque coefficients, on va donner plus d'importance aux coef BF, on va
ajouter une seconde tape, La quantification (Q) c'est une opration par laquelle on va rduire les
coefficients, on va les quantifier ? Comment ? En les divisant
on va les mettre sous forme d'une srie
562.
le plus important, le 1.1 (no error, un minimum en tout cas)
les autres on peut
on va appliquer une division sur chaque coefficients, une division entire. Certains coefficients, le
facteur sera d'autant plus grand que les frquences seront leves
563. 1.1 divis par 2 (mais donc on peut faire l'inverse aprs)
on va donc trouv une valeur pas entire donc on arrondit, ce qui veut dire qu'on fait une petite
erreur
le 2me, divis par 4
le 3 me, divis tellement fort qu'il ne va plus rien rest.
(ide : rduire les coef. en les quantifiant de sorte que l'erreur cre par la rduction soit d'autant plus
faible que ?)
565.
-2
-2
-2
quand on prend un bit, on peut distinguer 2 valeurs, la valeur 1 et pas 0 car pas besoin mais -1
quand on a deux bit on prendre transporter 4 valeurs (2 3, -2 -3)
quand on a trois bit on prend transporter 8 valeurs (4 5 6 7, -4 -5 -6 -7)
etc...
ce qui veut dire que en classant le coefficient dans une catgorie on dtermine le nbr de bits qui
vont le reprsenter.
10 : 1 0 1 0
-10 = (inverse les valeurs 1 et 0) donc 0 1 0 1
les coefficient sont juste numrots, on part du plus grand au plus faible.
(suite)
0/5/17
0/2/-2
0/2/-2
1/2/-2
0/0
0/5/10001
0/2/01
0/2/01
1/2/01
0/0
*****
Rduire le dbit : code frquente code binaire petit, code peu frquent code binaire grand.
Morse : poids dpends de la frquence des lettres, beaucoup de E = peu de poids transporter, on
applique un systme similaire, on utilise le code d'OEUFMAN (lololol) la pair 0/1 est remplac par
00 par exemple...
l'objectif ? Les codes qui ont peu de bits, doivent correspondre des codes frquents.
Donc ****
= 1 1 0 1 0 (0/5)
1010
10001
0 1 (0/2)
01
01
01
11011
01
-2
-2
-2
34
-8
-8
-8
donc
On remarque en regardant la dct inverse (le bloc reconstitu) il ressemble sans pour autant tre la
mme chose donc il y a des erreurs
Avec la dct inverse (quand tu as compresss, pour voir l'image il faut dcompresser, il faut repasser
des 0 et 1 encodage entropique dct inverse etc..)
0
12
11
10
11
12
11
11
10
573.
Rsum
1.(?)
2.la quantification elle privilgie les BF par rapport au HF
3.l'encodeur entropique tient compte de la post quantification et essaye d'exprimer avec le moins de
bits possible l'info venant de la quantification
4. (?)en 4 tapes (zig zag) + RLC (nbr de 0 prcdent), RS (classe les coef. Par catgories, nbr de
bits) Huffman (transforme les pairs RS)
576.
Fichier = code jpeg + dbit
quelle information important doit savoir l'encodeur pour lire le fichier, qu'est ce qui change ? La
quantification, elle donne le dbit, la table de quantification dtermine la qualit et le dbit. Entre
l'encodeur et le dcodeur il faut mettre la table de quantification, si on la connait pas on sait pas
dcoder.
Quelle autre information faut-il changer appart le code jpeg et la table de quantification ?
Faire varier la table huffman d'une squence une autre pour avoir un codage adapt
change entre l'encodeur et le dcodeur sinon pas moyen de dcoder? Table de quantification et
table de huffman.
EXERCICE
bloc de 4x4, dont la dct est droite.
3 tables de quantification Q1 Q2 Q3
choisir une table et effectuer,
taux de compression aprs codage jpeg
efficacit de la compression dpend de 2 facteurs :
table de quantification
des donnes (l'image)
Le problme c'est que le dbit final va dpendre des 2 facteurs,
si l'image est complexe : le dbit sera plus lev
Quand on applique le jpeg image/image, un flux vido c'est 25 ips, on peut appliquer du jpeg image
par image, si on veut garder le dbit constant, dans ce cas l on doit rguler le dbit, dpend aussi de
l'image, pour une mme table on aura un dbit qui varie.
Du VBR, variable bit rate : quand on accepte que le dbit varie
on fixe une table de quantification une fois pour toute.
CBR : dbit constant
584.
Faire en sorte que ce schma nous donne un dbit constant(?)
Compensation de ce qui peut varier
on va rajouter une mmoire tampon drrire qui va lisser les variations de dbit, le principe c'est
que quand on encode une image 25 x/s on a un flux jpeg qui rentre dans la mmoire tampon et
l'entre de la mmoire dpend du dbit qui sort de l'encodeur jpeg, si on compresse faiblement on a
un fort dbit et (inverse)
le codec fonctionne 50 mbit/s, alors on retire le tampon 50mbit x par seconde
Fonctionnement ?
Pbm ? Si on choisit mal la table, p.e dbit trop lev, dans ce cas l, la mmoire tampon va se
remplir remplir remplir et a va dborder.
Cette mmoire tampon sert aussi de rgulateur.
En fonction du remplissage on va modifier la table de quantification, si on se rend compte qu'elle se
remplit plus vite qu'elle ne se vide = dbordement = mettre des coef plus lourd dans la table de
quantification, et dans le cas contraire si on compresse trop que la mmoire se vide on peut
l'inverse mettre des coefficient plus faibles pour compresser moins.
585.
Q1 remplit, progressivement jusqu' 75% (max!) (min : 25%) si on continue c'est que la sortie n'est
pas assez rapide et la mmoire tampon va finir par atteindre une valeur excdente, alors ce
moment l on se rend compte qu'on remplit trop vite la mmoire tampon et par rtroaction on va
modifier la table de quantification, on augmente les diviseurs de la table pour rduire le dbit, si on
est fort dans le changement en suffisance, le dbit va chuter (Q2), la mmoire tampon se remplit
moins vite qu'elle se vide.
Le tampon lisse le dbit.
Dbit = image + table de quantif
dbit rentre dans la mmoire tampon un certain dbit
si il est trop fort on modifier la table de quantif. (comme si on fermait le robinet de la baignoire...
lawl)
Q3
La pente de remplissage est plus raide, elle se remplit plus vide,
on peut rguler le dbit pour faire en sorte d'avoir en sortie tjrs le mme dbit en gros
Table plus svre (gros chiffres, division donnera des chiffres plus faibles = rduire le dbit)
Table moins svre (petit chiffres, division donnera des chiffres plus hauts = augmenter le dbit)
Rguler le dbit : qualit de l'image varie.
IMPACT SUR L'IMAGE ? DE LA QUALITE
Quels sont les dfauts qui vont apparatre ?
587.
ABCDEF
B.
C. l clairement on commence voir des seconds contours, comme autour de la charette de
foin, si on regarde au bord des plaques en bois on peut aussi voir un ddoublement.
601.
zone central : variation plus lente du niveau et donc effet ? Flou
overshoot : en dessous ou au dessus de la norme.
Effet (?) partie centrale : blur (flou) et les contours : ringing (voir plusieurs fois les contours)
ringing : double, triple etc.. les contours (pour les HF)
604.
On prend deux blocs de 4x4 avec un dgrad ?
605.
On augmente les tables de quantification
aprs dcompression un bloc ressemblera au bloc d'origine (
8
9
10
11
puis
7
9
11
13)
le pbm ? Ils sont l'uns ct de l'autre, on s'attend qqchose de graduel du coup mais l on a une
progression jusqu' 13 puis chute 11 donc dans le dgrade on a une inversion de deux valeurs, ce
qui veut dire que dans les barres grises ce sera marque dans l'image, bloc dans l'image, ce qui
apparat c'est le pourtour des blocs qu'on encode.
606. (mal suivi)
Image complte
en dessous : blocking, on voit des images apparatre pour des dbits plus faibles encore.
607. Effet sur l'image.
608.
(...)
les valeurs dc sont proches l'uns de l'autres
on obtient au terme d'une diffrence de trs petites valeurs du coup
genre 1 ou 2, ce qui donne un petit dbit ?
TIV 7
cours du 14/11
rappel
encodage jpeg : objectif : encoder l'image p/r elle mme, tenir compte de la redondance de
l'image.
Dct : nabme pas l'image (IL traduit l'image de base en 64 coefficients frquentiels)
Quantification (tape suivante) : dtruit l'image, cre des erreurs (moins bien traduire les hautes
frquences (objectif de la quantification).
Par exemple, tu as 25 dans les HF, ensuite via ta table de quantification tu divises par 10 = 2,5 donc
arrondis = 3 puis il faudra refaire x10 = 30 dans les hautes frquences (erreur) (on ne supprime pas
les hautes frquences, on crer des erreurs dans les HF)
Prpare la compression mais ne compresse pas encore.
Puis l'encodeur anthropique qui traduit a et qui va mettre, crire l'image de manire intelligente.
Grce ce qui prcde, compresse intelligemment l'image
Etape Zig zag : les 64 coef. D'un bloc on a intrt les classer par ordre de contenu en frquence
croissant.
RS : classer les coef. Non nuls dans des catgories de manire ce qu'on puisse adapter le nbr de
bits par coefs non nuls
les coef faibles ont moins de bits que les coefs levs.
Si le coef a 2 3 -2 -3 = 4 bits
plus le coef a une amplitude grande plus il aura besoin de bits pour l'encoder.
Huffman : encoder ces pairs qui sont 0/2 0/5 0/0 etc.. on va faire en sorte que le code gnr soit
d'autant plus court que la pair est frquente, 0/2 apparat deux fois par exemple. C'est la table slide
572. Donne un quivalent binaire.
585.
La plupart des codecs sont dbit constants.
Si on veut un dbit constant il faut faire qqchose car la sortie d'un encodage jpeg dpends de l'image
et de la tb de quantification (ne permet pas seul de dfinir le dbit, c'est la combinaison image, table
de quantification).
Le cbr par contre, dbit constant, insrer (pe 20 mbit/s en permanence) vu qu' priori on ne sait pas
ce qu'une table de quantification nous donne, puis on a une mmoire tampon pour corriger le tir, si
la mmoire tampon se remplit plus vite qu'elle se vide alors l'encodeur jpeg a un dbit sur estim..
[..] si on ne fait rien un moment la mmoire tampon va dborder, en observant le remplissage de la
mmoire tampon on sait qu'il faut mnt faire qqchose dans ce cas l on modifie la table de
quantification, on augmente les coef. De la table de quantification, si on l'augmente assez, le dbit
va chuter et vice vers a.
Mmoire tampon : donne le temps de raction, on peut plus lisser les dfauts. Si on veut une qualit
constante on a intrt avoir une mmoire tampon qualitative.
vert : CB
orange : CR
le macro bloc c'est l'unit de base d'encodage
dans lequel on regroupe le bloc de chacuns des composantes : 4 (Y) 2 (CR) 2 (CB)
(On va regrouper un Macroblock pour le 4:2:2 (36 chantillons = 16 +
8 + 8)
On regroupe les blocs par blocs de 4. 4 blocs de 8 sur 8 pixels. On va
ajouter un bloc de 8 x 8 de Cr et de Cb.
Sur un Macroblock, on transmet un DC et les autres DC sont
dpendants de celui ci).
SYNTHESE
622.
on va mnt tenir compte d'un autre lment que la ressemblance des pixels entre eux, en gnral les
images qui se succdent se ressemble. Si on fait la diffrence pixel pixel entre les images, il n'y a
pas beaucoup d'informations, un autre axe va nous permettre de plus compresser.
On va plus loin, il faut tenir compte de plusieurs paramtres du coup ;
627.
image test.
628.
imaginons qu'on fasse un algorithlme ou on calcule la diffrence entre 2 images,
on va encoder la diffrence par rapport l'image qui prcde
on a besoin d'une mmoire image
on reconnais le parcours (codec mjpeg)
premire image rentre : rien n'est stock (mmoire image) on entre l'image, comme rien n'est stock
= - 0 diffrence, donc on encode en jpeg la premire image, on doit bien commencer par le dbut.
On encode l'image par elle mme et en mme temps on en profite pour stocker cette image dans la
mmoire d'image.
Ensuite l'image part en jpeg
SECONDE IMAGE De la srie, cette fois-ci, elle ressemble la premire, il faut calculer p pixels,
une nouvelle image qui est la diffrence entre les 2. I2 I1 ce qui nous donne une nouvelle image,
quand c'est gris = 0, blanc = positif, noir = ngatif. Image avec beaucoup de gris + un peu de dtails,
comme il faut bien la transporter, on va l'encoder en jpeg et donc on parle plus de i2 complte mais
de i2 bis (la grise) car il y a pleins d'aplats dedans, on l'encode en jpeg comme d'hab et puis on
stocke l'image deux dans la mmoire etc.. etc..
629
Que se passe-t-il au dcodeur ? I1 encod en jpeg avec une qualit un peu moindre, en sortie du
dcodeur, on l'enregistre aussi dans la mmoire image puis on reoit l'image i2 i1 = i2 bis
630
ENCODEUR ET DECODEUR
pbm ; si on fait a (633), au dcodeur, les images qui vont sortir (i1 2 3 4) se dgradent, le dfaut
sur l'image i3 est bcp plus grand que sur l'image i1
pourquoi en faisant cette comparaison entre 2 images successives ?
l'encodage l'image n'est pas dgrads mais au dcodage, si.
630
I = image d'origine
I' = aprs quantification
erreur =
P = diffrence entre 2 images
i'1 = i1 + 1
P2 = i2 - i1
P'2 = P2 + 2
A la sortie : i'1 + P'2
= i'2
i'2 = i'1 + P'2 = i1 + 1 + P2 + 2
= i1 + P2 (=i2) + 1 + 2
P3 = i3 i2
P'3 = P3 + 3
i'3 = p'3 + i'2 = P3 + 3 + I'2 + 1 + 2
= i3 + 3 + 2 + 1
Les erreurs s'accumulent en fait, au lieu d'tre limit l'image en question, au dpart on a une
erreur, puis on rajoute un deuxime taux d'erreur, l'image subit des compressions multiples.
Comment rgler ce pbm ? la mmoire image l'encodeur et au dcodeur on a deux images
diffrentes c'est ce qui provoque le dfaut.
La comparaison entre l'encodeur et le dcodeur devrait se faire par rapport la mme image.
Donc avoir dans la mmoire image I'1 et I'2 la place de i1 et i2.
= p'2 + i'1
=P2 + 2 + i'1
= i2 + 2
635.
Dans le MPEG 2, on va tenir compte du fait, qui les images se suivent dans une
vido.
Par ex. dans un JT, entre 2 images successive, il ne se passe pas beaucoup. Il y a juste la
bouche de la prsentatrice qui bouge.
Il y a donc un moyen de rduire le dbit en tenant compte de ce fait. C est le MPEG 2.
On insre dans l'encodeur un dcodeur + stockage d'un i'
+, I DCT, I Q
l'encodage entropique rduit le dbit, mais ne cre pas d'erreurs, l'erreur est cre par la
quantification, ce pourquoi la slide 635, l'encodeur entropique n'est plus utile.
Cette opration encodage entro dcodage entro est purement symtrique a ne sert rien, on a la
mme qualit, ici on parle de qualit (l'erreur est cre par la quantification).
La premire image, il faut lencoder (comme dans le JPEG). En mme temps quon
lencode, on la stocke dans une mmoire pixel par pixel. Quand la seconde image arrive,
on relit la premire image trame par trame et on va soustraire pixel par pixel la premire
image de la deuxime. On obtient donc une image ou on voit la difrence des deux
images. On encode donc cette image avec les difrences. Elle sera plus simple encoder
et moins lourde transmettre. Em mme temps quon encode la deuxime image, cette
deuxime image va tre stock dans la mmoire.
Le dcodeur est linverse de lencodeur. Quand la premire image arrive, on la stocke
dans la mmoire. Quand la deuxime image grise arrive, on va l ajouter la premire
image. On obtient la deuxime image.
Mais vu que la table de quantification transforme l image, on a une petite difrence entre
limage encoder et limage que reoit le dcodeur. On va donc envoyer lerreur de
compression . Comme a, on peut reconstruire correctement l image.
Quand on encode plusieurs images la suite, lerreur de compression va venir de plus en
plus grand (ils sajoutent). Cest pour a, quon envoie dans un certain rythme (12-15
images) des images entires (types i), sinon, l image sera trop fautif.
636.
Si on compare deux images qui se suivent, a marche plutt bien dans un cas et pas dans l'autre.
Dans le premier a marche bien
Dans l'autre pas (il y a du contenus, mmes des hautes frquences), dans la 2me image il y a un
mouvement latral, tout bouge. Tout a fait que quand on compare deux images qui se suivent, elles
ont pas mal volus, dans le premier cas (jt rtl tvi), bon encodage, trs peu de contenus
dans le second cas, compression va bien moins marcher.
640.
On regarde cmt les macros blocs de l'image 1 se sont dplacs pour former l'image 2, on va
dcomposer l'image en macro bloc.
On veut compresser une image qui bouge
P2 = i2 - i'1
647.
outil qui montre l'erreur d'cart entre les 2 macros blocs.
Le MAD = DESSIN
MEAD ABSOLUTE DIFFERENCE
00000000
00000000
00000000
13 13 0 0 0 0 0 0
13 13 0 0 0 0 0 0
13 13 0 0 0 0 0 0
13 13 13 13 13 0 0 0
13 13 13 13 13 0 0 0
0 0 11 11 11 11 11 11
etc...
649.
L'image P2 = image rsiduelle.
On transporte l'erreur
ce qu'on va encod en jpeg
On voit que la prdiction par vecteur de mouvement a des failles, si on avait pu la rduire aux objets
a aurait t plus facile[...]
651.
Image 1
652.
Image 2
653.
Erreurs dans la balle par exemple, parce qu'elle roule logiquement, la partie mal faites, on a prit le
macro bloc de drrire.
Les petits traits indiquent les vecteurs de mouvements
654.
Lger zoom
pano vers la gauche
dcouverte de nouveau pixels sur la gauche
bruit dans l'image = zoom, les macros blocs grossissent.
655.
Pour chacuns des macros bloc de l'image 2, on va calculer ou il trouve sa position originelle dans
l'image
on va donc comparer la position du macro bloc 2 toutes les positions dans l'image du macro bloc1
cmt retrouver le bon macro bloc
on va chercher dans toutes les positions possibles de l'image 1, le macro bloc et calculer le mad
(somme des valeurs absolus des diffrences) 16 macros blocs donc 16x16 (pour calculer 1 mad) (il
y a 16x16 sommes)
le premier macro bloc de l'image 2, tout en haut gauche, on va donc le comparer tous les macros
blocs possible de l'image 1 (calculer le mad)
16x16 car 16 pixels en hauteur et longueur dans le carr dlimit en noir slide 655.
pour une image en sd : 720 x 576
on va finir par trouver un macro bloc pour lequel le mad est le plus faible
cb de comparaison va ton devoir faire ? En horizontal il y a 720 positions 16
en vertical il y a 576 -16 positions possibles
a reprsente le nbr de macro bloc possible dans l'image 1.
a un certain moment on se rend compte que c'est celui l le mieux (dlimit en rouge dans le slide)
ensuite on rpte l'opration pour tous les macros blocs de l'image 2 pour que chaque macro bloc 2
ait son origine dans l'image 1.
Il y a donc une erreur dans limage prdite. Est-ce que c est gnant? On va calculer
lerreur entre limage prdite et limage relle. Si l erreur est trop grand, il va falloir
encoder
ce macrobloc en jpeg pour ne pas avoir derreur fagrant.
Ce quon transmet au rcepteur, ce sont donc 2 informations: les vecteurs de
mouvement dans limage et limage rsiduelle (une image de difrence qui est
obtenu
par la difrence entre limage obtenu par le mouvement des vecteurs et l image relle.
Une rotation dun macrobloc nest pas possible avec le MPEG 2.
On va essayer de retrouver le macrobloc suivant en balayant le macrobloc prcdent pixel
par pixel dans la premire image pour que le MAD est le plus faible. Mais il peut y avoir
des erreurs. Pour faire a, on doit faire 4 Terra-oprations par seconde, ce n est pas
possible.
Lide cest de faire 2 recherches, une plus grossire et une plus prcise, on les combine.
On peut aussi prendre juste une zone de l image possible pour le dplacement.
Quand on a trouv un macrobloc probable, on fa commencer la recherche plus fine: on
dplace 8 pixels dans chaque dimension (haut, droite, bas, gauche). a limite les
oprations 3 Giga-opration par seconde.
Il y a encore dautres mthodes.
Three Step search. On va dabord dplacer par 4, puis 2, puis 1 pixel. Elle marche bien
sil
y a des mouvements lents.
657
Autre type de recherche
en 3 tapes
On calcule le mad sur les 9 macros blocs qu'il y a autour du macro bloc d'origine (image 2) et on
prend le MB qui correspond dans l'image 1 et on fait une recherche quadrill dans tous les sens ds
qu'on trouve le bon sens, pareil on quadrille nouveau, a limite le champ d'action
658
Logarithmic search
(il y a des dizaines de mthodes)
660.
GOP (I et P):
On commence toujours par une image entire (I) et puis des difrences (p). On limite le
nombre dimage qui vont dpendre les un par rapport aux autres. a s appelle un GOP
(group of pictures).
Limiter la porte des encodages diffrentiels dans le fichier, limiter un gop
un ensemble d'images successives qui commence par une image de jpeg pur, d'habord il y a l'image
de type 1 puis des p calculs par vecteur de mouvement.
Un gop est un groupe d'image qui commence par une image de type i, il y en a qu'une de type 1
662. Le dcodeur
il reoit quoi comme premire image (dans le flux, quel info arrive)
l'image i
ou i'1
PUIS
p'2 et vm1(vecteur de mouvement)
vm1 (extrait, sert crer l'image de prdiction)
i2 avec la comp/dcomp : stock en mmoire
suite
(mme chose)
package deuxime image vm2 et p'3
vm2 (vecteur de mvt qui transforme i'2 en i3p)
p'3 : on dcode
p'3 + i3p = i'3
entre l'encodeur et le dcodeur ? Que remarque-t-on ?
Dans le dcodeur il n'y a pas la recherche de mouvements (celle qui recherche le dplacement)
n'existe pas dans le dcodeur (pas de motion estimation) or c'est celle l qui est complexe, ou y a de
l'intelligence et de l'argent
en mpeg2 l'encodeur et le dcodeur n'ont pas la mme complexit, l'encodeur a une recherche du
mouvement = coteux.
663.
Dans l'encodage, il y a des infos qui manque souvent, (exemple de la balle, ce qui est cach
drrire, des infos manquantes etc..)
on prend l'image du slide 663, de cette image on va aller vers le carr mauve, on va faire apparaitre
un objet, cmt peut on faire pour que la prdiction de l'image 2 fonctionne,
664.
On va imaginer un truc tordu, on va imaginer qu'il y a des images de types b, qui vont chercher des
vecteurs dans plusieurs zones, on prend l'image qui prcde et aussi celle qui suivent, on va
chercher dans les images passes et futures. On va crer des images de types b qui vont augmenter
la zone de recherche dans le futur,
665.
Image 2, on peut prdire l'image 3 car le carr mauve existe dj, si on veut prdire le carr mauve
de l'image 1 l'image 2 c'est pa spossible car le carr mauve n'existe pas encore.
668.
mmoires images : parking images auxquelles on aura pas accs directement
je prends 3 images
i1 type i
i2 type b bidirectionnel
i3 type p fait rfrence l'image de type i qui prcde
DONC, i1 entre, on l'encode, donc on va l'encoder et rien dans les mmoires, on l'encode et en
sortie, on a i'1, image qui sert de rf aux autres donc on la stocke dans une des 2 mmoires images.
La type b arrive, image 2, comme elle dpend de l'image 1 et 3, comme on a pas la 3, on la parke
dans la mmoire d'image l'entre (pendant 1 image on fait rien) I B P (GOP particulier)
On attends, ensuite rien ne se passe, rien n'est transmis (info au dcodeur)
ensuite on reoit l'image de type p (3), l'image 3 fait rfrence l'image i qui prcde donc 1, donc
l'image 3 on peut calculer l'image 3 prdite au dpart de l'image i'1 et de l'image i3.
On a les vecteurs de mouvement pour i3p, cette diffrence, delta, on va l'encoder en jpeg, donc delta
'3 et le dcodeur saura mnt la diffrence entre l'image projete 3 et l'image relle.
Alors l on a encod l'image 1 et l'image 3, on encode l'image 2 mnt, d'habord il faut stocker l'image
3 qui est dcoder, l'ajouter l'image rel (-), i'3
on a mnt dans la mmoire i'1 et i'3
Mmoire d'image remet les images dans l'ordre, transforme a et remet la squence avec un dlai de
2 images, sort i'1 i'2 et i'3.
681.
gop ferm (le gop du bas)
le gop ouvert (celui du haut) quand la dernire image est de type b (celle du gop)
Quand on coupe la fin du gop il faut que le gop soit colmplet alors que dans l'ouvert il faut
prendre le i en plus pour dcomposer le gop.
LE B NE PEUT PAS PRENDRE REFERENCE A LUI MEME !
1 b = efficacit le choix des p et b ne dpends pas du contenu de l'image
full b comme si tu fesais full jump cut dans ton montage, plus chaud compresser = perte de
qualit.
Mjpeg 682 (du bas)
MOTION JPEG (mouvement) (super lourd)
699.
Comparer fficacit entre le mjpeg et ?
701.
702.
Typiquement dfauts qu'on verrait pas car dfauts dans les HF, l c'est mga zoom donc on le voit
8MB/s (diffusion) 40 MB/s (post prod)
706
Comparaison.
Mjpeg 2 (blocking)
pour un dbit identique on a une meilleure qualit
Mpeg 2 8 MB/s, quel dbit faudrait il mettre le Mjpeg pour avoir la mme qualit ?
21,3 Mb/s
quel est le gop le plus efficace ?
IBBPBBP
IBB
712
dlai entre la rponse du pre (bonjour)
transmission, ce genre de duplex sont fait par sattelite
sng (sattelite news gathering) envoi un faisceau vido et audio vers le car (voiture rtbf) le sons va
vers le sattelite et ensuite descend vers la voiture.
Soucis ? Distance 36 km x2 = 72 000 km, le simple fait de monter et descendre = 144 000 km peu
prt, la vitesse de la lumire. (300 000 km) = 1/2 seconde pour la transmission (300 000 / 144
000) ( peu prt).
Le reste, c'est le dlai d'encodage mpeg 2, pour le calculer, prenons un gop plus simple
I B B P B B B P (pour calculer son dlai)
715.
I on peut l'encoder
B on peut pas sans p
P dpends de P donc on peut l'encoder, quand on reoit I 5 on peut encoder i 2 i 3.
Il faut I8 pour encoder I5 I6 et I7 (on peut stocker I5 6 7 temporairement en attendant I8)
dcoder des images mpeg 2
on peut tout dcoder car ils sont dans l'ordre de dcodage
mnt il faut les remettre dans l'ordre
on rajoute un dlai supplmentaire
(slide 95)
sauf que entre les deux il y a un syst. De capt. D'image (camra + ccd) et que fait-il ? Il va via
l'optique envoy les rayons lumineux qui correspondent lumires blanches (?)
(gros plan du ccd sur le slide 95) (affiche les 7 premires lignes de l'image)
ccd : mesure le niv. De lumire (luminance) si la lumire qu'il capture est du blanc, il va sortir 700
mv si c'est noir il va sortir du 0mv.
Sauf que (le facteur de kell intervient) si on dcale un peu l'image verticalement (pique la cam) les
lignes blanches et noirs vont pas tre superposs au capteur. Dans ce cas l comme le capteur sort
qu'une valeur, il est limin en partie par du noir et en partie par du blanc. Dans ce cas l les
capteurs mesurent du gris et l'image est totalement grise. On a donc dans les 2 cas, la mme image
film par la mme cam et le rsultat est diffrent. Pour viter ce cas l on dit que 585 demi cucles
par hauteur d'image c'est trop lev, on est pas sur de le garantir dans tous les cas, pour tre sur on
va rduire cette rsolution maximum, et de combien ? Par le facteur de kell (outil qu'on applique
la reso maximale pour rduire, on arrive 200 cycles par hauteur d'image).
(slide 96).
Je renverse l'image, pivote de 90 degr, en gardant la mme rsolution, si on a 585/2 x0,7 = on en a
un peu plus car l'poque on tait en 4/3 donc elle devient 1/3 plus large qu'elle n'est haute. Donc
maintenant on peut compter horiz 585/2 x 0,7 x4/3 alternance N/b sur une ligne de l'image.
On a 272 cycles par largeur d'image, ce qu'on veut c'est avoir le nbr de cycles par secondes, or on
sait que a c'est 52 ms par ligne, donc si on a 292 cycles par 52 ms, on pt calculer le nbr de cycles
qu'on a par secondes. 292/52 ms = 5 millions de cycles par secondes = 5 Mga Hertz
5Mhz reprsente le nbr de variations max que le signal de Y peut avoir.
Slide 608
Une variation du codec jpeg, qui permet d'amliorer, de repousser l'aparition du blocking
slide 606
le blocking c'est en fait li au pbm que 2 blocs compress en jpeg, sont cods de manire
indpendante.
Quand on met 2 blocs ct l'un de l'autre, le premier suit la dct codage entropique etc..
quand on est dans des t de compression acceptable, tout va bien. Car on va d'hab commencer par
couper les HF, quand on augmente la compression, un moment les blocs vont tre compress
indpendamment l'un de l'autre, risque ? Aprs compression/dcompression, les 2 blocs se
ressemblent sauf qu'ils sont pas identiquement gaux l'origine, le risque c'est que quand on met 2
blocs voisins,on introduit une erreur de bord, car 8 9 10 11, 7 9 11 13, quand on les met l'un ct
de l'autre on obtient 11 13 11, le dgrad a un pbm car il y a un marquage supplmentaire, erreur de
bordure, qui va marquer les blocs qui sont cods indpendamment (c'est le blocking)
on voit des lignes verticales apparaitre dans l'image d'en dessous (slide 606)
slide 607
pq on voit apparaitre cette erreur ? on la voit apparaitre dans des zones ou le niveau est plutt
uniforme, on voit que le vert sur certain blocs est plus fonc, pq ? Car on a tellement compress, on
divise les coef de HF = ringing blur (pas trop visible) puis on va diviser un certain moment de la
compresser le coef de BF, du coup quand on dcompresse l'image on obtient un rsultat diffrent
pour 2 blocs de l'image
comment prserver le bloc de BF = schma pg 608. Schma classique DCT Q ZIG ZAG RLC RS
ENCODEUR HUFFMAN, simplement pour le coef dc (bf de l'image) ac ( tous les autres)
pour le dc, ce qu'on va faire c'est que plutt de l'encoder tout seul on va l'encoder (logiquement le
niv dc varie peu sur l'image) d'ailleurs dans le verdatre, le niv dc est constant (niv de lumire) ce
qu'on va fr c'est que plutot de l'encoder en valeur le coef, on va l'encoder par diffrence, si pe il vaut
34 pour le premier coef, 32 pour le suivant, h bien plutt que de l'encoder 34 et 32, on va encoder
34 32 = 2, le dpcm c'est la diffrence entre la valeur dc du bloc en cours et du bloc juste avant et
donc du coup la valeur dc au lieu de valoir 32 elle vaut plus que 2 et par l'encodage entropique et
par la classe rs on va l'encoder sous moins de bit (on garde la prcision dans chacuns des blocs)
pour viter le blocking.
LE GOP
plus il y aura d'images de types b qui senchane dans le gop, les images de type b ont le plus haut
taux de compression. Si je prend un gop ici,
IBBBPBBBP
dans ce bloc-ci, les images de types B dpendent des images i et p qui les encadrent, si on prend
celle ci (la 4eme B) (dpend : image de ref. On va la construire par vecteur de mvt..(?)
entre l'image b et image i, il y a 3 images (120 ms d'cart), si mnt on a une squence ou il y a bcp
d'images B
genre : I B B B B B B B B B B B B B B B B B B B B B B P
on prend le 10e B, dpendra de l'image I au dbut et de P la fin et donc l'image quand on va
calculr, essayer de trouver le MB d'origine, il s'est pass 400 ms avant et (disons) 350 ms (au
hasard) aprs, donc l'image du B(10e) ne ressemble plus du tout au l'image I au dbut ou P la fin
donc compromis, a rduit le dbit mais ce n'est vrai que si le nbr d'image B et donc plutot que
d'avoir a il vaut mieux avoir une structure avec un long Gop avec des images de types I puis genre
4 B puis un P, le gop peut tre long, a n'influencera pas la qualit.
Gop ouvert : se termine d'offices par un b
Gop ferm : se termine par un P
juste un I = gop ferm.
Il y a toujours qu'un I par gop (image qui commence le gop)
MULTIPLEXAGE
slide 249
on prend 3 chant pour le premier pixel, un chant pour le 2e, 3 pour le 3e (4:2:2)
il faudrait (comme en analogique) 3 tuyaux
comment mettre les 3 en 1 tuyau, on alterne les chantillons, on les mets les uns drrires les autres,
on a qu'un signal.
SDI : comment on les met en srie
slide 300
les 10 bits de chaque chantillons, on va les multiplexer dans le temps, dans le temps d'un
chantillon, on va faire varier les 10 bits (dbut du sdi) (conversion parallle vers srie)
Slide 85, exercice 1
(circuit) on revient au schma lectrique, on connecte a 1 point du moniteur, on dit que on y met du
gris 50% (350 mv l'entre du moniteur) puis aprs que fait-t-on ? On ajoute un second moniteur,
qui ont tout deux 75 ohms d'impdance d'entre.
TIV 8
(20/11)
708
squence slide 716, quand on zap une chane sur une distribution numrique.
Quand on regarde les squences les unes par rapport aux autres, les diffrents flux, ils ne sont pas
synchro entre eux, les gop ne sont pas synchro.
Slide 717.
du haut I B B P B B P (premire squence) si on la prend et on dcide l de zapper, que doit-on
faire ? Si on est en plein milieu de la 2e squence, il faut terminer le gop correctement, s'arrter au
prochain p qui suit, (p dpend de ce qui est pass) si on termine le gop, alors a se passe
correctement (dans le cas d'un gop ouvert) si c'est un ferm il faut prendre le i en plus !
Delta T = temps d'attente pour le dmarrage de la chaine suivante, nbr d'image qu'il y a avant
un I (si il y en a 7, a fait 7x40 ms = 280 ms).
Globalement le gop est un lment qui aide rduire le dbit mais gros pbm, ct non scable
d'un gop, on ne peut pas couper dedans.
Slide 718
Si on prend 2 squences (MONTAGE) et qu'on veut couper entre, c'est clair que a va tre plus
complexe, on ne monte pas au gop prt, 8,10 images prts, on monte l'image prt, il faut que ce
soit, on doit intervenir dans le gop, l'ouvrir, le charcuter.
On garde la structure du gop du premier fichier, au moment du cut, on doit alors recalculer les
images, les r encoder avec la nouvelle structure du gop, on doit tout re calculer, c'est embtant pcq
le fait de le faire fait que d'une part c'est couteux en temps et on compresse/dcompresse (perte en
qualit) le second fichier sera de moins bonne qualit (ce mode de fonctionnement est viter, on le
fesait au dbut car les players ne pouvait pas avoir des gop diffrents). PREMIER MODE :
MODE ANCESTRALE.
DEUXIEME MODE
il y a 2 choses : premirement on use la mme struct de gop que la mme sq d'ou elle vient et
deuximement, on dit que on a 2 seq, chaque un gop particulier, on applique chaque gop jsuqu' la
cassure, on reprend le gop 1, la cassure les gop ont changs, on doit dcoder rencoder car les
image de ref n'existent plus, l'image b fait rfrence un p qui n'existe plus et pareil pour le 2,
DONC ON DOIT RE ENCODER, (les 4 images grises sur le slide)
Autre mode : calquer le gop sur le fichier que l'on r utilise, et donc jusqu' la cassure, on a une
cassure qui est celle du fichier A et puis (?) celle du fichier ?
Lorsqu'on a un I dans le second fichier (?)
Donc il faut s'attendre avoir une augmentation de dbit localement car les b ne sont plus vrmt des
b mais plutot des p et a risque d'augmenter le dbit ou de diminuer la qualit.
L'encodage d'un type p peut mal se comporter car il peut s'identifier un I prcdent qui ne
correspond pas la bonne image (perte de qualit : blur ringing blocking etc..)
Slide 719
inter-oprabilit ?
Les niveaux : li au dbit, en sortie d'encodeur, dbit impacte la taille de la mmoire tampon, la
puissance de calcul, la puissance de feu du dcodeur encodeur, plus le dbit est lev plus a coute
cher. En fonction de la rsolution, on a des niveaux diffrents, en Sd il faut moins de calcul qu'en
HD videmment. On a dfini 4 niveaux.
les profils : type d'encodage que l'on va raliser : on utilise deux types de fonctionnement (les
macros blocs et le type d'image qu'on met dans le bloc) Donc un axe d'application, c'est le type
d'encodage de la couleur et c'est le type, de quoi sera compos le gop, cas simple : on rduit
l'encodage de la couleur ( - qualit) si on fait du 4 2 0 avec des images I et P, on a vu que la seconde
mmoire pour les images de types B donc le schma encodeur dcodeur sera plus simple (MODE
SIMPLE)
MODE CLASSIQUE : mme mode mais on traite les images de types B, on a que un bloc de CR
CB pour 4 blocs de Y
MODE HAUT : Fonctionnement complet, schma bloc qu'on a vu, en 4 2 0 (le high)
MODE PARTICULIER POUR LA TV : High 4 2 2, mode profile, mode en 4 2 2, avec les images I
BP
Dbit maximum qu'on peut traiter, pe : 4 pour le low, 15 pour le main sd etc..
422P@HL : peut tout dcoder, dcodeur les plus puissants
ce type de dcodeur peut dcoder tout le tableau.
Autre exemple le 422P@ML peut quant lui dcoder tout ce qui est sa droite et en bas de lui.
SYNTHESE
Squences vidos.
CEGAFDB
Plus le dbit est haut, plus il est dure classer de manire croissant ou dcroissant.
MPEG 4 ET H264
pour faire du mpeg 2 on tait partis sur un compromis, pour crer l'image de
comparaison (projete) on se base sur des macros blocs et on essaye de trouver leur
dplacement, l'idal eu t de prdre des objets pour voir cmt il se dplace (au dpart le mpeg 4
c'est a) comment dtourer et extraire les objets de l'image et construire une image de
projection sur base des (?)
on dcompose l'image en objet et on regarde d'ou viennent les objets de rfrence.
729.
certaines images sont facilement encodables en mpeg 4 : (par exemple) en info graphie (image de
synthse) on doit pas les extraire de l'image, ils sont par essence dans l'image, on peut chopper leur
trajectoire etc.. le mpeg 4 marche bien pour a.
Comme on voulait une amlioration du mpeg 2 on a imagin un standard intermdiaire, une sous
partie du mpeg 4 = H264 (3 noms rfrence un mme codec qui est une sous partie du mpeg4)
Comment faire pour amliorer le mpeg2 ?
1)-La taille des blocs (les rduire pour qu'il soit plus petit)
2)-Augmenter le nombre d'images de rfrences
3)-Cue point
4)-I
5)-adapter les gop en fonction des squences
6)-utiliser les b comme rfrence.
7)-(des vecteurs rotatifs, pour la balle par exemple)
8)-overscan
9)-vm (vecteur de mouvements) 1/4 prof. Pour si jamais en arrire plan il y a un nuage qui se
dplace, c'est tellement lent qu'il est alors intressant, d'avoir 1/4 de pixels pour tablir prcisment
les mouvements de ces objets lents.
10)-encodeur entropique plus efficace (tape zig zag rs rlc huffman : effectue la compression de
l'image, rduit le dbit), on va donc en mettre un autre.
11)-On peut imaginer un filtrage qui efface le blocking (Si on a une image + blocking + logiciel de
painting : tu prends un pinceau blur et tu passes sur les bords et tu enlves le blocking, on efface
une structure).
Ces 10 points sont appliqus dans le codage H264
slide 732
H264 : addition de recettes que l'on ajoute au mpeg 2 pour le rendre plus efficace.
Recette 4 : plus de dbit gagner, sur l'image de type I, trouver un moyen ? De rduire son dbit ?
Slide 733
on prend un bout de la norme, de l'image, le bord du casque et qu'on prend le macro bloc du bord du
casque a donne l'image en bas gauche. On constate qu'il y a une certaine symtrie dans cette
image. Donc l'ide c'est de se dire que cette image n'est pas alatoire, on peut la construire au dpart
de ce qu'on connait de l'image, on connait les macro blocs qu'on a dj balay.
Bloc jaune, on pourrait le calculer au dpart des blocs avoisinants (animation slide)
je vais utiliser les blocs qui entourent et au dpart de ces blocs connus, je vais essayer d'en dduire
le comportement du bloc.
L'ide : connatre le bloc jaune au dpart des voisins
comme pour les images en mpeg 2 de p et b, on va essayer de projeter une image I, (?)
on va se limiter, on va prendre des blocs plus simples (petit) de 4x4, on va essayer de dfinir le
jaune au dpart de 13 pixels, ces 13 pixels vont servir de base pour la prdiction des 16 pixels
encadrs en jaune. On va imaginer plusieurs modes de symtrie dans l'image, celle-ci a une mode
de symtrie en diagonale, on remarque que cette symtrie fait que en recopiant les pixels, on cre
une image qui se rapproche de la ralit, prendre les pixels avoisinants, et faire des symtries sur
ces pixels.
9cas : (mode d'interpolation)
1. symtrie verticale : colonnes, comme une cloture, on va reporter les valeurs des pixels,
verticalement (736)
2. symtrie horizontale (737)
3. symtrie (pour les grands aplats, dans la tte de cheval bleu par exemple) moyenne, faire
une moyenne que l'on reporte sur l'ensemble du bloc (738)
4. symtrie en diagonale 1. (739)
5. symtrie en diagonale 2. (740)
6. etc... (741)
7. etc... (742)
8. etc... (743)
9. etc... (744)
745.
comment choisir le mode de prdiction, pour le bloc jaune par exemple.
Le MAD, outil mathmatique qui comparent la diffrence entre 2 choses.
On compare les 9 projections (pixels du haut)
747.
Sur base du mad, choisir unes des 9 projections
la projection pour le mode verticale on reprend la valeur A et on la reporte
puis le MAD = somme des valeurs absolues des diffrences
ce qui nous donne pour le premier :
Pourquoi ? 10-12 = -2 en valeur absolue = 2
1.
2
3
2
1
4
4
1
2
4
3
1
1
4
3
1
1
=37
2.
2
2
0
1
=39
5
4
1
2
6
3
1
2
5
2
1
2
3. (moyenne)
12 + 10 + 8 + 6 + 12 + 10 + 8 + 9 = 9,4
(75/8)
9
9
9
9
9
9
9
9
MAD = 29.
4. = (mad) = 8
9
9
9
9
9
9
9
9
5.
6.
7.
8.
9.
= 59
=55
= 55
=9
= 33
le 4 est gagnant, pour le bloc de rfrence, on va transporter le numro de prdiction, la 4eme, + une
image qui composera l'image rsiduel.
Donc tu compares 4 et celui de rfrences
donc
10-10
7-8
6-6
7-7
on va transporter une image donc rsiduel : diffrence entre une image relle et une image prdite
(construire en appliquant les prdictions sur chacuns des blocs de l'image)
749.
plus la prdiction est bonne, plus faible sera le contenu de l'image rsiduel (image gris avec
les tches)
positif = vers le blanc
ngatif = vers le noir
0 = gris
750.
encoder l'image rsiduel la plus faible possible, l'image i interpol, prdite par rapport elle mme,
objectif atteint, partir du moment ou l'image qu'on a construite avec le mode de prdiction se
rapproche de l'image rel.
Slide 668
Prdiction : doit se rapprocher de la ralit
Mux = vm = vecteurs de mouvements
on va comparer l'image p/r elle mme,
prdiction intra : recherche des modes de prdictions et les modes sont appliqus une image, ils
permettent de reconstruire et de prdire et l on calcule l'image et on va le comparer (a) l'image
relle.
Principe DE BASE encodeur mjpeg 2 et h264, on encode TOUJOURS une image rsiduel
(diffrence image rel et sa prdiction)
le dans le schma = Delta (on encode une image rsiduelle)
le dcodeur de l'image prdite doit faire le mme trvle la rcpetion,il faut lui donner les outils,pour
les I = mode de prdictions (permettent de crer une image par rapport elle mme, sans aucunes
rfrences)
p et b = vecteurs de mouvements
750.
Amlioration principal de l'h264
751.
Premier amlioraton que l'on fait l'encodeur mpeg 2, image de type I, aprs il y a une dizaine
d'amliorations que l'on fait qui sont des points que l'on va amliorer qui sont soit optionnelle soit
obligatoire.
1. variable des macros blocs (on revient sur les 10 amliorations cits en classe)
1. les macros blocs sont figs dans l'image et leurs structures ne colle pas aux objets de
l'image
1. adapter la taille des macros blocs la zone de l'image (aux frontires des objets) par
contre au milieu d'un objet on peut augmenter la taille d'un macro bloc.
752. adaptation de la taille des macros blocs : l ou il y a du dtails, les macros blocs sont plus petits
alors que ceux qui ont moins de contenus en haute frquence restent avec la taille d'origine.
Pour faciliter la recherche des vecteurs de mouvements.
La tte du canard pe : 8 macros blocs au lieu d'un seul, dans les 8 il y en a peut tre 4 lis au
dplacement de la tte du canard et 4 lis l'eau.
754.
Un macrobloc pour du 4 2 2 ou 4 2 0 : taille 16x16
on aura des mb de 8x16 8x16 (verticalement ou horizontalement)
8x8 8x8
8x8 8x8
le plus petit mb qui existe c'est celui de 4x4 et le plus grand 16x16 (quand on est au milieu d'un
objet dans un aplat alors qu'aux frontires on aura des mb de 4x4).
L'objectif est que on limite le nbr de macro blocs et la taille des mb qui portent plus d'un objet. (?)
756.
on peut pas mettre du 4x4 partout, car sinon il faudra chercher plus de combinaisons = plus de
calculs = consomme bcp de puissance de calculs = quilibre entre la ralit et la faisabilit et
769.
si on permet que nimp quel image b servent de rfrence nimp quel b a va tourner en rond, donc
du coup on peut pas avoir de cycle, et pour viter, on utilise une structure hirarchique pour les
images de type b, si on prend exemple sur le gop du dessous, on prend le b4 comme sous rfrence
b2 b3 ..etc..
aucunes image b sert de rfrence or ici on permet certaines images b de servir de rfrence et cmt
choisir ? On la prend par hirarchie comme celle-ci
structure hirarchique des gop.
770.
les images I sont encodes par rapport elle meme en mpeg 2
les p par rapport i ou p qui prcde
et b par rapport i et p qui encadre
771.
on voit la main droite, elle se transforme, elle est ferm puis s'ouvre. Aucuns points communs entre
la premire main et la 4eme, on trouvera pas de rfrence entre celle qui prcde car cette forme
n'est pas l dans la prcdente, donc si cette image (quatrime).. on va chercher une image ou le
mad est le plus faible comme rfrence. Alors que on a mis en place un mode d'interpolation intra
qui pourrait tre plus efficace car il se base sur une forme d'interpolation dans l'image en temps que
telle. Signifie que parfois le mode de type d'image associe une image n'est pas forcment le mode
le plus adquat, l'ide ? Permettre que alors qu'on a dcid que l'image tait de type b ou p, de
choisir un mode d'interpolation qui soit diffrent. Ces images, (les quadrilles) les bleues et vertes,
correspondent des blocs de type b, simplement, un moment on se rend compte que la main qui
se dforme ne trouve aucuns correspondants des images qui servent de rfrence et en h264 on
permet que ces mb pour lesquel on ne trouve pas de correspondance donc on trouve un autre mode,
le mode I, le mode intra. Et donc on le voit toute la main est en rouge, et donc qu'on aurait du
chercher des correspondances dans les images de types b ou p qui prcdent dans certains cas a ne
donne rien, ce sera le cas d'un changement de plan, si l'image est de type p (rf image passe qui n'a
rien avoir)
772.
dans une image de type p, on accepte que certains blocs deviennent des blocs de type I et dans des
types b, peuvent devenir i ou p, permet d'apporter denouveau une image rsiduelle au contenu
faible.
type par slice. (H264)
774.
points rouge : de type I (mb cod en intra)
bleu : image de type p (que dans l'image qui prcde)
vert : image de type b (bidirectionnel)
pareil pour les blocs, quand ils sont bleus = type p etc..
dans cette premire image, de type I, tous les blocs sont en mode I, rouge
points jaune : quatrime type de bloc
782.
points jaunes : skip (mode), dire on remplace le mb par le mme mb de l'image qui prcde,
identiquement gal, on change rien en gros.
775.
l'ide c'est que mnt on peut imaginer que des zones de l'image ait un comportement prdfini, on
filme par exemple une interview, dedans il y a la personne de dvt qui bouge et l'arrire plan bouge
pas c'est une zone de l'cran laquelle on applique un codage i b p skip, ide ? Arriver dcouper
image par image, mais on peut aussi donner un type d'image par morceau d'image. On perd la
notion de gop, elle s'applique des groupes of slices, on applique un type de codage slice par slice.
Gos de type i b p
un gos de type b peut avoir des macros blocs de type i ou p
la dcomposition elle est structurelle, elle est pas dynamique
on peut remplacer un type de macro bloc par un autre moins efficace.
Slice de type b b ou i ou p
i que du i
p p ou i
Les slices = succession de mb les uns aprs les autres, des mb qui partageait la mme table de
quantification.
776.
les slices c'est soit des mb qui sont contigus dans l'ordre du balayage
(4slices diffrents dans une mme image)
en h264 on peut modifier l'ordre des slices
778.
crer des slices qui ont des formes alatoires, dcider que au milieu de l'image on a une slice, par
exemple pour laquelle on a peu de dtails, on sait alors que la quantification sera alors faible, par
contre une autre zone qui serait le visage, pour laquelle la quantification sera leve, on peut dfinir
des zones qui regroupe, forme des slices pour lesquels on applique les mmes paramtres de
compression.
Les modes de panoramique : couper l'image en 1/3 2/3 car on sait par exemple que le ciel = 1/3 pas
de dtails, 2/3 en bas = full dtails (deux niveaux de compression diffrents entre les deux zones).
783.
toujours li au vm, que se passe-t-il quand il y a un pano dans l'image et qu'on dcouvre des
choses... tendre l'image, l'overscan, avoir une image plus grande, cmt fait-on pour avoir une plus
grande image
784.
Une image rentre, on a pas tout le cercle orange, on cre une image du coup plus grande (overscan)
mais comme on connait pas le contenu on l'imagine, on la recopie sur la taille d'un macro bloc
(16 pixels), on recopie les mmes pixels que ceux en bordures (784 animation). C'est meilleur que
pire, si on fait rien on aura un mauvais rsultat.
Les cue points, ce sont les key frames.
Quand il y a que des macro blocs rouge, dans ce cas l a devient une image, on la transforme en
image purement i, alors que c'tait une image p ou b, image KEY FRAME, pour faire une dcoupe,
key frame = utile pour le codage.
Un des moyens pour rduire le nbr de calculs, commencer par appliquer pour un mb, le mme
codage que pour le mb qui tait ct, pour un mode intra, mb type i, on va commencer par
calculer le mad pour la mme interpolation, a va donner un certain mad et si le mad est du mme
785.
comment on avait rgler le pbm de l'entrelacement du mjpeg ?
Mvt dans l'image compression apparition hf (rappel)
on avait inverser les trames.
Ce mode de fonctionnement on peut l'appliquer en h264, on regroupe l'image en 2 trames, trame 1
au dessus, trame 2 en dessous.
Mais on peut tre plus efficace encore, dans ce cas l on peut appliquer a mb par mb.
790.
a permet de le faire zone par zone dans l'image, dans ce cas l il est adaptatif. Le mb s'adapte, dans
l'autre cas c'est au niv de l'image qu'on adapte.
792.
quand on a du blocking, de filtrer le blocking
en haut gauche : compression, droite : augmenter le dbit
en bas droite : elle est en perte de dtails car filtr, l'image de rfrence peut tre filtr comme
ceci, filtre anti blocking.
cette table a t calcul pour que les pairs frquentes ait des codes courts et les pairs peu frquentes
ait des codes longs
(rappel)
0/1 0/4 etc...
y a pas les dct quantifie (pas indiqus)
0/1 = 00
0/4 = 1011
en additionnant pour ces 10 pairs l a reprsente 31 bits : codage VLC et on l'utilise, la table de
huffman dans la norme, cette table est calcule une fois pour toute sur base d'une rptition d'image.
Ce qu'on peut faire c'est rendre ce codage adaptatif, on peut calculer un code de huffman pour
l'image en question, on regarde les 10 pairs et on voit que chacuns des pairs a un taux de proba
diffrents, la 0/1 apparait 4x = 4/10 (probabilit d'apparition) par exemple, on va MAINTENANT
CONSTRUIRE UN CODE DE HUFFMAN BASE SUR CETTE TABLE DE PROBABILITE
ide : crer un arbre qui reprsente les diffrentes pairs rs qui existent (794) partir des pairs rs les
moins frquentes, 0/0 ou 0/3, toutes les deux ont 0,1 de proba d'appa, on les reprsente en bas, en
les groupant, on cre un nouvel tat, l'tat A = proba d'appa 0,1 + 0,1 et cette pa (proba d'appa) elle
est du mme ordre que 1/1 ou que 0/4 du coup on reprsente 1/1 ou 0/4 ayant chacuns 0,2 de pa, on
les regroupe ensemble pour faire un seul code, le code de B, 0/4 ou 1/1 pa = 0,4, on les groupe le
groupe B et A = pa = 0,6, c'est mnt suprieur au code 0/1, 0/1 a comme pa 0,4 (...?)
la pa d'apparition de nimp quel code est de 1.
Donc on va accorder un seul bit la branche 0/1 car il doit faire qu'une seule branche pour arriver
1.
On dcide de plus, comme de chaque tat il y a 2 branches qui part. On dcide une fois pour toute
que tout ce qui est droite c'est 0 et gauche c'est 1, du coup on reprsente en fait un tat par
branche de l'abre et donc un code : juxtaposition des diffrentes branches qu'il faut pour arriver au
code, si pe on prend la branche 0/0, pour arriver 0/0 il faut avoir suivi 0 0 0 donc le code est 0 0 0.
si on applique mnt ce codage ci on arrive 22 bits (795) on est 1/3 plus efficace.
On a deux modes de fonctionnement, le classique avec table de huffman : VLC
le mode de huffman adaptatif (calcule image par image ou gop par gop ou sq par seq)
et puis le dernier c'est CAVLC (ca = code adaptatif)
796.
Dernier mode CABAC
ide : on va mnt non plus trouver un code par pair RS mais on va encoder globalement les 10 pairs
rs.
Avant on avait une table de correspondance, ici les 10 pairs rs donnent un code bien spcifique.
Comment a marche ?
On va reprsenter un segment d'une longueur unitaire qui reprsente la probabilit unitaire donc
100% on va reprsenter chaque code, chaque pair rs par un segment qui est, d'autant plus long que
sa probabilit, la pair 0/0 a comme pa 1/10 donc elle occupe 1/10 du segment, la pair 1/1 apparait
2/10 donc on prend un segment qui fait 0,2 donc de 0,1 0,3 ! (pig)
la premire pair qu'on va encoder c'est 0/1, on va reprsenter la suite des dix pairs rs, sous forme
d'un segment de plus en plus petit, si la premire pair rs est le code 0/1, celui ci apparait 4x sur 10,
donc on prend le segment 0/1 et ce segment je sais que la valeur qui va reprsenter la suite des
codes rs sera compris quelque part entre 0,3 et 0,7, on va alors r clater cette zone-ci, on
dcompose en segment proportionnel la pa. Il va donc de 0,3 0,34 etc... (slide 796)
le second code encod va tre 0/4, la suite des codes 0/1 0/4 sera entre 0,58 et 0,66.
et puis denouveau on clate, on reprend ce segment, on le redivise en segment dont les longueurs
sont proportionnel la longueur de chacuns des codes.
0/1 reprsent entre 0,604 et 0,636 et denouveau on le r tend
on les prend 1 par 1. etc...
intrt : quand on a encod les 10 codes, (barre orange) on sait mnt que le code qui reprsente la
suite des dix pairs rs est compris qlq part entre 0,60780073 et 0,607801139 et l on va prendre la
valeur qui en binaire occupe le moins de bits, si pe on avait 0,5, 0,5 en 3 bits on peut la transporter,
ici on a un sale chiffre donc on prend la valeur la plus efficace = 0,607801, on transporte la valeur
derrire la virgule et 607801 donne 1001 0100 0110 0011 1001 (20 bits) (on gagne encore des bits!)
0/1 premire valeur transmettre car 0,607801 est entre 0,3 et 0,7 (premier code)
second code = 0/4 car 0,607801 est entre 0,58 et 0,66
etc...
800. les profils : 3 profils principaux : le base line (ce qu'on trouve dans tous les codages) le
principal et l'tendu (qui est extented) et donc en fct du type de profils on va appliquer ou pas
certaines recettes qu'on a vu ojrd
801COMPATIBILITE AU NIVEAU DES PROFILS le fait d'avoir que des slices ou des images i et
p, des rfrences multiples (plusieurs images dans le pass)
etc...
plus on choisit d'lment = plus de performances (meilleure compression ou qualit)
inconvnients h264 : trs couteux en calcul
et rend difficile le fait de couper dans le flux, souvent les codecs utiliss dans le broadcast, utilise
peu d'artifice, pas bcp d'lments lis au vm.
Tableau des niveaux, comme le mpeg 2, 5 niveaux principaux puis sous niveaux, on prsente la
taille de l'image qui correspond au niveau en question, nbr de pixel en horizontal, nbr de lignes puis
la frquence 320x240 @ 36.0 (7)
le niveau minimum qui permet de faire de la sd, c'est le niveau 3.
suivant le type de profil qu'on aura choisit on aura un dbit max qu'on peut lui accorder (entre 10 et
40 mbit?) le h264 peut pas monter au dessus de 40 mbit pour de la sd par exemple.
TIV 9 (28/11)
partie sur la 3d, convergence, distance oculaire, rapprocher les cams en
dessous de 7,5 cm qu'est ce que a change
la partie sur les fondus avec les titres
Conversion 4/3 16/9
Traitement de l'image
anamorphique : pour avoir une vraie image 16/9 en partant du 4/3 en ayant 720 p on aura 960,
augmenter la fe et donc le dbit, qqchose de faisable mais pas pratique surtout l'poque, on se
basait sur des installations prvues pour le 4/3 etc...
moyen qui vite de payer de nouvelles install.
On capte les image avec une lentille ou un capteur 16 9 et on fait un traitement pour que le
16/9 (allong) soit en fait cras horizontalement, on passe de 960 pixels 720 en horizontal.
( ne pas confondre avec les croc marks au cinosh, qui permettent d'adapter un format)
upscale : convertir sd en hd
downscale : convertir hd en sd
CONVERSION 4/3 16/9
partir d'une image 16/9 et en faire une image 4/3 anamorphos
slide 436
l'cras horizontalement, l'image prend moins de place, l'image anamorphos est intressante en
production : meilleur compromis pour garder de la qualit, mais pas exploitable en diffusion sauf si
Slide 438, on l'applique cette image 16/9 et on va voir ce qui se passe, au centre, que vont devenir
les lignes
1. horizontalement on va supprimer 1/4 chantillons
slide 439
rsultat.
On peut voir des accidents dans le zoom (animation) du la dcimation.
L'objectif : arriver du 16/9 letterbox, donc faudra faire le mme processus verticalement, mme
ide, on supprime 1/4 lignes, on voit que les 2 lignes qui taient bien propres, par la dcimation,
mnt possdent pas mal d'accidents. On voit que la ligne n'est plus aussi claire, l'image ici est simple
dans le slide 440.
441.
COMPARAISON.
ORIGINE DECIMATION HORIZONTAL DECIMATION VERTICALE.
perte de qualit assez importante en gros.
444.
Autre mthode: interpolation linaire : de non pas supprimer 1/4 mais de recalculer les
chantillons, pour qu'il soit rparti.
tient compte de la forme de la courbe, de la faon dont la luminance volue sur la ligne
la position des chantillons par/r l'image d'origine est affecte dans la premire mthode, on
essaye ici de conserver la position des chantillons, mais leurs positions doit changer vu qu'on passe
de 960 720.
on sait que 1/4 supprimer mais plutt que d'en supprimer un, on va les recalculer, pour qu'il occupe
un espace qui distant les uns par rapport aux autres.
Comment ?
On ne connait pas les valeurs des chantillons qui vont remplacer les autres, on va les interpoler,
calculer une valeur en fonction de la faon dont les chantillons voluent, dans le cas trs simple du
slide 444 (volution linaire) calculer le poids d'un chantillon, en tenant compte de la valeur des
chantillons voisins, en sachant si l'un est plus prt de l'un ou de l'autre (1/3 X 2/3)
Y1
Y2
Y3 (3 chantillons)
on cre Ya (DESSIN 1), Y1 est plus prt de Ya que Y2, il est 1/3 distance de Ya donc vu que le
facteur de pondration est la proximit, a donne Ya = 2/3 Y1 + 1/3 Y2
Plus tu es carts du nouvel chantillon moins ton poids sera grand en gros.
Moyenne pondre, combinaison linaire.
Marche parfaitement bien ici, car la variation est linaire donc la courbe est purement linaire, si ce
n'est pas le cas, a marche moins biens mais il existe des dizaines de modes d'interpolations
(objectif : calculer la valeur d'un chantillon en tenant compte de son contexte).
445.
On part de l'image 16/9, on effectue ici la compression horizontale, on applique cette fois-ci une
interpolation linaire (animation zoom) on voit que le rsultat est plus doux.
446.
449.
Dcimation : on peut remarquer des que des trucs bizarres se situe au niveau des tuiles.
450.
Interpolation.
451.
Upscaling :
deux types de convertions : upscaling normal (rajouter des pixels)
et passer d'entrelac progressif (rajouter des images horizontalement)
foot
upscaling sur un signal qui n'est pas le bon, on a upscal l'image entrelanc et non l'image d
entrelac.
454.
comment faire ? Passer de l'un l'autre ?
720 1920
576 1080
rapport image sd = pixel non carr
HD = pixel carr
PAR = pixel aspect ratio = 1 en HD et 1,09 en SD
L'image du haut = anamorphos.
455.
Une premire tape : transformer l'image en 16/9 (d amorphoser) tirer horizontalement
augmenter l'image en horizontal en doublant l'image horizontale (on part de 720, on fait x4/3, on
rajoute un chantillon tous les 3 et ce moment l on a 960 chantillons et on double chaque
chantillons)
Verticalement c'est plus complexe, on peut pas juste faire x2 car sinon on obtient pas 1080 mais on
dpasse les 1080, on va donc faire x2 l'image d'origine, doubler le nbr de lignes puis on va retirer
72 lignes. (576 x 2 - 72)
720 par 4/3
le PAR ne vaut pas 1, mais 1,09
1920/1080 = 16/9
PAR 16/9 = 1 donc pixel carr
Retirer les 72 lignes : soit on double l'image et on retire des lignes au dessus et en dessous (36)
meilleure qualit mais image croppe (perte d'une partie de l'image)
soit on double les pixels (le nbr de lignes) et une ligne sur 7, on ne met qu'une seule ligne.
Si le contenu de l'image a beaucoup de HF, plutt intrt simplement doubler la rsolution
verticale et supprimer 72 lignes, si on les supprime rgulirement on risque d'avoir des accidents
verticaux
en croppant inconvnients non respect de la gomtrie de l'image.
456. comment rajouter des chantillons ? Quand on double le nbr de ligne (pe en horizontal)
soit je prends 2 chantillons (DESSIN 2), on duplique l'chantillon, on a alors 2x plus d'chantillons
qu'avant, on a doubl le nbr d'chantillons en repliquant la mme valeur. Rajouter les chantillons
qui manque
Ou
interpolation : trouver une fonction qui permet de rajouter un chantillon entre les 2. Calculer
l'chantillon qu'on rajoute on le calcule au dpart de son environnement.
Modes d'interpolations
doublement des pixels en horizontal et doublement des lignes en verticales, quand on a l'image
16/9.
upscaling : on cre de l'info donc pour la crer il faut une rgle (moral), faire comme si mais pas
tout fait en gros.
(?)
On a 2 possibilits
On applique le doublement sur l'image entrelac (557) on cre une image en rcuprant les 2 trames
donc on aura 576 lignes et 720 pixels actifs et partir de ce moment l on applique le doublement
vertical et horizontal, mais pbm ? Slide 558 : le contenu a t doubl et a se voit, pbm gnr,
grand que le simple pbm du doublement, accentue le fait que les deux trames ont t enregistrs
des moments diffrents, on peut pas simplement pour les vidos, se baser sur les 2 trames que l'on
regroupe et auxquelles on applique le upscaling. a marche bien quand l'image est arrte par
contre, a va accentuer l'effet d'entrelacement dans le cas prsent.
459.
Upscaling, on va traiter sparment les 2 trames de l'image, un moyen ? Reconstitu une image
composite au dpart des deux trames, on compacte les 2 trames. Condense verticalement, pour
occuper toutes les lignes de la premire et deuxime trames. Ensuite on applique l'upscaling
l'image (de droite).
461.
On voit que la bordure est plus proche de la bordure d'origine.
462.
Dernier lment dans la conversion
entre entrelac et progressif
upscaling
2 mthodes :
-1 sur la gomtrie de l'image (on a 50 trames et sur l'autre 50 ips et on veut 50 ips)
moyen li la trame, on va upscaler chaque trames, si on double chaque ligne ou on interpole
chaque ligne on aura le bon rsultat, 1080. (spatial)
-1 ou on regroupe 2 trames qui se suivent pour ne faire qu'une image, interpolation selon l'axe du
temps (temporel)
463.
Interpolation temporelle : mlanger 2 trames qui se suivent dans le temps pour qu'elles ne fassent
qu'une.
a donne ceci : slide 464.
467
On prend la moyenne entre 2 lignes qui se suivent pour crer une ligne intermdiaire
(interpolation verticale)
Objectif :
verticalement une trame avec 540 lignes utiles et on vient recrer des lignes intermdiaires au mme
469.
Faire les deux
combiner le temporel et le spatial
dans quel type d'image la spatial fonctionne le mieux ?
-mouvante.
dans quel type d'image le temporel fonctionne le mieux ?
-fixe ou peu de mouvements.
477.
On va tre amen mlanger des images,le mlange se fait souvent en se basant sur deux plans de
travail, le fil,le remplissage, l'image et le key : l'image qui sert donner un ordre de dcoupage.
Key : image qui dfinit ce qu'on fait de l'image
fil : remplissage
mlange entre deux sources, un fondu enchain, le mix se fait par un gnrateur de key interne dans
le mlangeur et celui-ci va gnrer un signal blanc associ la premire image diffuse et un noir
l'image non diffuse, niv de luminance du signal de key dfinit la transparence de l'image.
On va donc utiliser (deux signaux) et on les mlange par leur key (cl de dcoupe).
479
noir : image passe pas
blanc: image passe
481
le niv de blanc donne le niv de dcoupe, si on remplace du blanc par du gris : on voit que l'image
laisse passer l'image de fond 50% a se voit dans le TITRE de l'image du bas, dans la fin du mot
TITRE.
Synthse
485 vido
487
fore ground : hors fond vert.
back ground : fond vert.
Cyclo : studio avec un infini, un mur peint (cyclorama) arrondi pour ne pas voir les angles, on a
l'impression que le mur est infini.
Chroma key : avoir une couleur en arrire plan fort diffrente de celle de l'avant plan
pas le rouge, car fort prsent dans la couleur de peau.
Le bleu pose problme car souvent il y a des jeans
Pbm du vert, si c'est mal dcoup on a un fond blafard.
Le principe, slide 490, on a l'avant plan, source vido, et sur base de CR CB et des Y, on va
dterminer si on prend l'avant plan ou l'arrire plan, pour chaque pixel on tudie la couleur.
Quand on fait a, slide 491 a marche mal, la dcoupe est hach, c'est pas propre, donc le switching
chroma key : qui passe d'une source l'autre, n'est plus utilis, car la dcoupe est mauvaise et aussi
pleins d'objets sont mal apparents aussi en fore ground (avant plan).
Si on prend aussi des fins dtails, des cheveux friss par exemple, dcoupe compliqu...
donc c'est pareil pour la fume aussi, ou un verre, tout ce qui est transparent, pbm avec chroma key,
on a invent d'autres chroma key, plus efficace, pe l'ultimate (sous licence, algorithme inconnu)
principe du chroma key slide 492
on dfinit dans le vecteur scope une couleur de dcoupe, ici on prend le bleu, on se base sur le bleu
et on doit faire un premier rglage, le choix de la teinte car on filme un cyclo en bleu (peinture
spcial)
clairage : uniforme sinon il y a des tches avec une variation dans la saturation et a pose pbm.
Donc 1. rglage 1, de l'angle teta, qui dfinit la couleur de dcoupe
494
signal noir et blanc, qui dtoure l'avant de l'arrire, bas sur la couleur, on prend une zone du
vecteur scope, (graphique, angle alpha, angle d'ouverture) on modifie les couleurs de l'avant plan et
d'autres part on l'utilise pour le signal de dcoupe. On doit modifier l'avant plan car le bleu va tre
prsent dans l'image, dans les cheveux (gris donc bleu partiellement), il faut donc filtrer l'avant plan
pour expurger le bleu. Et dfinir une image de dcoupe (nb) qui dtoure.
1.Modifier la couleur du signal de l'avant plan
2.Crer le signal de dcoupe
donc, point 1) Supposons qu'on ait une couleur l'ext. De l'angle alpha : rien ne se passe, la couleur
reste telle quelle, la couleur du visage ou le noir du polo etc.. par contre si on se trouve l'int. De
l'angle d'ouverture alpha, on va modifier la couleur en s'cartant au mieux du bleu, retirer la
composante bleu de la couleur qui rentre dans l'angle cmt ? on dcale cette composante, en
amenant la couleur sur le bord de la zone, // l'axe de la couleur et on amne cette couleur au bord
(ps : angle alpha sur le slide 494 : les deux quadrilatres quelconques qui ressemble des triangles)
donc, point 2) utiliser cette zone des couleurs, l'angle alpha, on estime qu'il y a un peu de bleu
dedans qui sert la dcoupe, le bleu au travers de la fume ou d'un verre d'eau, la couleur bleu du
cyclo sera transform, l'eau n'est pas 100% transparente donc va modifier la couleur du bleu, en tout
cas elle sera dans l'angle d'ouverture, puisque cette couleur on doit s'en sparer, on va utiliser des
zones qui vont dterminer le key du fore ground, une image noire qui va dtourer le sujet, cmt ?
Quand on a la valeur 1 = laisse passer l'arrire plan, 0 = sur l'avant plan. Par contre si on est proche
du bleu, on augmente la prsence du key. Le niveau de gris dpend de la proximit avec le bleu, sur
le bord le key vaut 0 dans l'angle alpha et plus on se rapproche de la couleur de dcoupe plus le key
augmente. Donc en fct du contenu de bleu de l'image, on va gnrer avec cette image, cette image
sera le moyen de filtrer cette image l'avat plan.
DERNIERE IMAGE EN BAS A DROITE : application du cache, du filtre (expurger le bleu et on
est prt appliquer le cache cette image-ci)
on a donc fait 2 choses :
crer le masque de dcoupe
et supprimer le bleu de l'image
496
y a encore du bleu, sur le bord du prompteur par exemple + reflets sur lui.
Que fait-on ? On rajoute un degr de rglage, l'angle beta (slide 496)
l'angle de suppression.
Quand la couleur est l'intrieur de l'angle de suppression on remplace cette couleur par du noir. a
donne un angle, une protection dfinitive par/r l'apparition de bleu dans l'image.
1.Avec l'angle alpha : premier nettoyage et gnration du signal de dcoupe
498.
on garde la mme ouverture mais on rduit la zone en dplacant l'angle par la droite, donc un tas de
couleurs ne gnreront plus de signal de dcoupe pour l'arrire plan et donc avec ces deux signaux
de dcoupe, le key du BG ralise un trou dans l'image d'arrire plan tout comme le key du FG avait
gnr une dcoupe, extraite de l'avant plan et remplac le reste par du noir, donc mnt faut
superposer les deux.
BG = Back ground
FG = Fore ground
502.
synchroniser le dcor sur les camras (cyclo vert sur l'image) on a des cams qui sont tracks,
systme qui permet de reprer leur position dans l'espace.
On est en 3D, XYZ, et on essaye de trouver la position horizontal verticalement de la camra.
Couronne au dessus de la cam, qui ont des metteurs infra rouges en forme de pastille allum en
permanence + grap de camra infra rouge au plafond qui filme les diffrentes positions du studios,
ide : chaque camras doit tre visible par trois camras infra rouges, la cam infra rouge (slide 506)
recoit des tches en fonction de la position de la cam, tches des couronnes et le logiciel permet de
capturer la position exact de la cam dans l'espace.
Slide 507, vido.
510
la dcoupe ici est parfaitement 4 4 4(?)
420
l ou y a que les pts gris : que luminances
cercle rouge et bleu : y a galement la couleur
pour les pts gris : la couleur est dtermine par rapport au pixel juste avant, la dcoupe sera base
838.
EVOLUTIONS TECHNOLOGIQUES
STEREOSCOPIES 3D
comment amliorer encore l'image, la vido.
Quels sont les axes qui le permettent : profondeur, contraste, 3D, rsolution, frquence image,
espace.
Transporter la notion de profondeur : donne la perspective et la profondeur de l'image. On va
regarder les diffrents lments.
840 perspective = profondeur (point de fuite)
841 taille donne l'impression de profondeur.
842 dformation (indice de profondeur)
843 l'avant plan. (occlusion)
844 la couleur (l'atmosphre dsature la couleur)
845 l'ombre
847.
les plans bougent des vitesses rotatives diffrentes, plus on s'carte de l'observateur plus les
mouvements sont faibles.
La vitesse relative des objets donnent un indice d'cart de profondeur dans l'image.
849.
851.
852.
un moment les deux signaux sont multiplexs (mme tuyau pour les deux signaux)
lunettes anaglyphes
860
861
en cartant les cams on augmente l'effet 3d et l'inverse ... l'cart donne l'effet 3d, on peut pas allr
au dl de 7,5 cm on dpasse la distance inter oculaire et si la distance projete sur l'cran dpasse
7,5 cm on a un pbm ? On n'arrive plus regarder \
/
862
une autre possibilit : la convergence des cams
si on veut dplacer des objets, les faire avancer ou reculer dans l'cran on doit modifier le pts de
convergence (endroit de la paralaxe nul : points pour lequel l'image se trouve dans le plan de
l'cran)
converger fait reculer les objets, diverger fait avancer les objets car le plan de l'cran est plus petit.
Paralaxe nul : le tableau.
869
873.
double image : double camra, placs sur un rig, (systme mcanique)
876.
877.
HD, 2x un signal HD = 3GObit
un objet bord cadre en 3d ne fonctionne pas pe, car sa deuxime image est hors cadre
878
anaglyphe : deux filtres colors qui donne chaque oeil une image diffrentes, on perd la couleur et
c'est peu confortable.
880.
882.
dcale la couleur, la lo des couleurs transmises, sur l'cran on voit les 2 images avec une couleur
bizarre, les 2 verres ont pour objectif de ramener le spectre des couleurs la normal dans l'oeil
gauche et droit.
884
3D sans lunettes
on alterne un pixel pour l'oeil gauche et un pixel pour l'oeil droit, on place une barrire devant
(occlusion) qui masque l'cran et qui fait que le regard se pose sur un pixel ou sur l'autre selon le
regard qu'on a, l'inconvnient de la barrire paralaxe c'est qu'elle ne marche que pour une distance
prcise p/r l'cran. Permet de discerner ce qui va l'oeil gauche ou droit. On utilise une barrire
lenticulaire pour rgler ce pbm.
885.
Amliorations de la hd
886
diffrents axes d'amliorations
augmenter les couleurs reproductibles sur l'cran c'est aussi qqchose qui va permettre d'amliorer la
ralit.
8 10 bits, on peut augmenter encore pour viter les pbms de contours dans l'image
la frquence d'affichage, on peut passer en progressif etc..
l'lment de la dynamique : gamme des niveaux que la camra et le moniteur sont capables de
reproduire. Si on prend l'axe de la rsolution.
887
si on part de la rsolution, voici l'image sd tel qu'on la connait puis la hd, puis on peut doubler la
rsolution 3840 x 2160 (la 4k) c'est de l'uhd,
NE PAS DIRE 4K
887.
4K = 4096 x 2160
8K = 8192 x 4320
mme rsolution vertical pour UHD et 4K etc..
24Gbit/s pour l'UHD 2
UHD 1 = 6 Gbit/s
progressif = a x2
l'intrt de la HD c'tait d'avoir une image rsolue pour la vision humaine, c'est normalement
suffisant, avec a autant qu'on regarde l'image a une distance raisonnable
889
893
augmenter la rsolution : augmente pas le dbit, change l'quation de cr et cb.
Augmenter les ips : augmente le dbit.
901
cd/m = unit luminance
la dynamique de la luminance de la UHD est plus large dans les grandes lumires et le sombre.
(range 10^14) (on aura plus besoin de faire de diaph, la cam pourra capter toutes la range de la
vision humaine) (pour la luminosit)
905.
906.
907.
908.
pour couvrir au niveau sonore cet cran on fait du 32.3, 3 niveaux sonores spatiaux, on arrive