Mémoire de Stage de Fin D'etudes

Rpublique tunisienne Ministre de lenseignement suprieur, de la recherche scien que
Universit de Tunis el Manar Facult des sciences mathmaques, physiques et naturelles de Tunis
Mmoire de Stage de Fin dEtudes

Prsente en vue de lobtention de
La Licence Applique en Sciences et Technologie de lInformation et des Communications

Par
Oumayma Khedher
valuation de qualit dune squence vido 3D convertie par rapport la mme squence filme en 3D native
Soutenu le 31/05/2013 devant la commission d'examen compose de :
Prsident : M. Mohammed BEN NASSER Encadrant : Mme. Imen CHERIF Membre : M. Salem GAHGOUH
Anne universitaire : 2012-2013
A mon pre Mohamed A ma mre Najiba A ma grand-mre Essya A toute ma famille A mes amis A M. Jed Khalfa A tous ceux qui me tiennent au Cur
Oumayma
Remerciement
Ce travail, ralis en collaboration avec la socit ONT, sinscrit dans le cadre dun projet de fin dtudes en Sciences et Technologies de lInformation et de la Communications la Facult des Sciences de Tunis, FST.
Au terme de ce travail, je veux adresser mes vifs remerciements toutes les personnes qui ont contribu de prs ou de loin au bon droulement de ce projet et qui mont soutenu lachever dans les meilleures conditions.
Je remercie spcialement mon encadreur Mme. Imen CHERIF pour ses directives prcieuses, ses remarques fructueuses et ses critiques pour amliorer ce travail.
Je tiens prsenter galement ma vive gratitude mon encadreur M. Mohamed Sofian JLILI, ingnieur lONT, pour la qualit de son
encadrement, son aide, sa disponibilit, ses prcieux conseils et aussi pour ses grandes qualits humaines.
Jadresse mes remerciements M. Mohamed BEN
NASSER, pour
lhonneur quil ma fait en acceptant de prsider la soutenance de ce projet.
Je remercie vivement M. Salem GAHGOUH pour lintrt quil a apport ce travail en acceptant dexaminer et juger ce rapport.
Glossaire
2D: 3D: AAC: AC3: AIFF: AVC: AVCHD: AVI: CAVLC: CD: DD+: DTHD: DTHD: DTS HD: DTS HD: DVD: DVI: EDTV: FLAC: Two Dimensional Three-dimensional Advenced Audio Coding iPod. Audio Compression_3 Audio Interchange File Format Advanced Video Coding Advanced Video Codec High Definition Audio Video Interleave Context-Adaptive Variable Length Coding Compact Disc Dolby Digital Plus Dolby True HD Dolby True HD Digital Theater System HD Master Audio Digital Theater System HD Master Audio Digital Video Disc Digital Visual Interface Enhanced-definition television Free Lossless Audio Codec
GIF anim: Graphics Interchange Format HD: HDMI: HDTV: High Definition High-Definition Multimedia Interface High Definition Television
HDV: HE-AAC: LCD: LPCM: M2TS: Mka: MKV: MOV: MP3: MP4: MPEG: NTSC: OLED: PAL: SDTV: SECAM : TNT: UHD: VCD: VLC: VOB: WAV: WMA:
High Definition Video High Efficiency Advanced Audio Coding Liquid Crystal Display Linear Pulse Code Modulation MPEG 2 Transport Stream Matroska Audio Matroska Video Movie MPEG 1/2 Audio Layer 3 MPEG Layer-4 Audio Moving Picture Expert Group National Television System Committee Organic Light-Emitting Diode Phase Alternate Line Tlvision Dfinition Standard Squentiel Couleur Mmoire Tlvision Numrique Terrestre Ultra High Definition Video CD Variable-Length Code Video OBject file WAVe Windows Media Audio
Sommaire
Introduction gnrale .. Chapitre I 1. Introduction ... 2. Conteneurs et codecs .
2.1 Fichiers conteneurs ... 2.2 Les formats . 2.2.1 Les formats Vido . 2.2.2 Les formats audio ..
01
04 04 04 07 07 08 09 09 10 11 11 11 11 12 12 12 12 13 13
3. Lvolution de la tlvision ...

3.1 Tlvision analogique 3.1.1 Vido analogique ... 3.1.2 Inconvnients du signal analogique .. 3.1.3 Conversion Analogique-Numrique 3.1.3.1 Principe dchantillonnage 3.1.3.2 Principe de la quantification . 3.2 Tlvision Numrique Terrestre TNT . 3.2.1 Dfinition 3.2.2 La frquence daffichage ... 3.2.3 Le balayage . 3.2.4 Les ratios dimage .. 3.3 Tlvision dfinition standard SDTV ...
3.4 Enhanced Definition Television EDTV ... 3.5 High Definition Television HDTV ... 4. Les normes d'cran ... 4.1 HD Ready ... 4.2 FULL HD ... 4.3 4K UHD .. 4.4 8K UHD ..
14 14 15 15 15 16 16 17
5. Conclusion ..
Chapitre II :
1. Introduction ... 2. La vision stroscopique ...

2.1 Dfinition 2.2 Physiologie de la vision stroscopique ... 2.3 La vision stroscopique naturelle ... 2.4 La vision stroscopique artificielle .
19 19 19 19 20 20 21 21 21 21 22 22 23 23
3. Les principes de la perception de la profondeur 3.1 Les indicateurs physiologiques .

3.1.1 Accommodation .. 3.1.2 Convergence .. 3.1.3 Disparit binoculaire 3.1.4 Parallaxe du mouvement ..
3.2 Les indicateurs psychologiques

3.2.1 Taille de l'image rtinienne ..
3.2.2 Perspective linaire .. 3.2.3 Perspective de surface .. 3.2.4 Recouvrement ... 3.2.5 Nuances et ombres 3.2.6 Perspective de texture .. 4. Les techniques de la vision stroscopique . 4.1 Stroscopie par vision croise . 4.2 Stroscopie par vision parallle .. 5. Cinma en relief . 6. Conclusion .. Chapitre III :
23 23 23 23 23 24 24 25 26 27
1. Introduction 2. Les langages de programmation ...

2.1Initiation sur linterfaage par MATLAB ... 2.2 Le langage Java sous ECLIPSE ...
29 29 29 31 32 36 37 42 46 50 51 59
3. Interfaces graphiques 4. Les analyses

4.1 analyses quantitatives ... 4.2 Analyses spectrales 4.3 Seuillage par Hystrsis 4.4 Solutions proposes ... 4.5 Efficacit des solutions proposes 4.6 Conclusion ..
Conclusion gnrale ..
60
Liste des figures

Figure I.1. : Lintrieur du conteneur, des flux . 05 Figure I.2. : Principe de fonctionnement dun conteneur AVI .
05
Figure I.3. : Principe de lencodage laide du format MKV .. 06 Figure I.4. : Chane de traitement de la tlvision . 09 Figure I.5. : De la SD au 8K . 17 Figure II.1. : Convergence et angles douverture 22 Figure II.2. : Principe de disparit binoculaire
22
Figure III.1.: Des interfaces graphiques interactives 30 Figure III.2. : Fentre de garde de lapplication Figure III.3.: Deuxime interface graphiques interactives
33 33
Figure III.4. : Chargement de la source de donnes avant la lecture 34 Figure III.5. : Fentre de lecture dune squence vido .. 34 Figure III.6. : Rsultats de lanalyse dune squence vido 35 Figure III.7. : Les oprations appliquer sur les diffrentes images 36 Figure III.8. : Scne capte par une camra stroscopique grce deux objectifs 37 loigns lun de lautre de 0.65 cm .. Figure III.9. : Histogrammes superposs des composantes rouge, verte et bleu de 38 limage gauche capte par lobjectif gauche de la camra stroscopique . Figure III.10. : Histogramme des couleurs de limage gauche capte par une camra 38 stroscopique Figure III.11. : Nuage des couleurs de limage gauche capte par une camra 39 stroscopique Figure III.12 : histogrammes de la composante rouge, verte et bleu . 39
Figure III.13. : Histogrammes superposs des composantes rouge, verte et bleu de 40 limage gauche capte par une camra full HD Figure III.14. : Histogramme des couleurs de limage gauche capte par une camra 41 full HD .. Figure III.15. : Nuage des couleurs de limage gauche capte par une camra full HD
41
Figure III.16. : Histogrammes de la composante rouge, verte et bleu... 42 Figure III.17. : Image source 43 Figure III.18. : Image filtre, en utilisant la TFD . 43 Figure III.19. : Spectre de limage gauche capte par une camra stroscopique, 44 lchelle logarithmique . Figure III.20. : Spectre de limage gauche capte par une camra full HD, lchelle 44 logarithmique . Figure III.21 : Spectre de limage gauche capte par une camra stroscopique, filtre 45 lchelle logarithmique Figure III.22. : Spectre de limage gauche capte par une camra full HD, filtre 45 lchelle logarithmique Figure III.23. : Seuillage par Hystrsis appliqu sur limage slectionne ... 47 Figure III.24. : Seuillage par Hystrsis de limage 2D/HD convertie, en niveau de gris 49 Figure III.25. : Seuillage par Hystrsis de limage 3D, en niveau de gris 49 Figure III.26. : Image source 54 Figure III.27. : Image traite 55 Figure III.28. : Histogramme des couleurs de limage traite 55 Figure III.29. : Histogrammes des couleurs de limage en trois dimensions . 56 Figure III.30. : Histogrammes des couleurs de limage Full HD . 56 Figure III.31. : Spectre de limage traite lchelle logarithmique . 57 Figure III.32. : Spectre de limage capte par une camra stroscopique 57 Figure III.33. : Spectre de limage Full HD 58
ii
iii
Liste des tableaux
Tableau III.1. : Mesures de qualit dimages 59
Introduction gnrale
Introduction gnrale
Depuis des millnaires, l'homme a cherch reproduire ce qu'il voyait. Ce phnomne est partie des hommes prhistoriques qui peignaient sur de la roche ; puis suivirent de nombreuses civilisations qui avaient aussi d'autres moyens de "capture d'image ". Puis, au XXme sicle, l'homme inventa les crans, qui taient la base trs simples et assez pauvres en termes de couleurs et de rsolution. Ceux-ci furent donc perfectionns, donnant naissance aux tubes cathodiques. Mais alors que ceux-ci tant assez imposants, les ingnieurs ont donc invents toutes sortes d'crans plus " fins " : vint alors le LCD, le Plasma et lOLED. Mais les images en 2 dimensions taient assez pauvres en relief, ainsi des chercheurs ont trouv le moyen d'afficher sur un plan 2D une image qui sera peru par le cerveau comme une image en 3 dimensions, en reconstruisant la sensation de relief, par diffrentes mthodes. Nanmoins, la question du cot trs lev de la captation et de la diffusion stait rapidement pose. Chacune de ces tapes ncessite des savoir-faire et surtout des quipements particuliers qui commencent tout juste tre dploys aujourdhui. Dans le but de mieux rpondre cette question, ce projet de fin dtude consiste traiter cette problmatique en valuant une squence vido filme laide dune camra 3D par rapport la mme squence en 2D/HD convertie en 3D, afin de dterminer clairement les diffrences entre ces deux formats. Ceci a comme but linnovation dun systme adaptatif fond sur les tches quon peut amliorer non seulement pour obtenir une vido ayant une qualit plus proche de celle dune vido 3D native, mais galement avec un cot trs rduit. Avant dentamer ce projet, on propose de prsenter lenvironnement dans lequel il a t ralis. Cette introduction consiste donc situer le projet dans son cadre gnral et ceci en prsentant, dabord, lorganisme daccueil, lONT pour Office National de la Tldiffusion, qui a t cr en vertu de la loi n93-8 du 1er fvrier 1993. Cest un tablissement public caractre industriel et commercial dot de la personnalit civile et de lautonomie financire. LONT a comme mission la diffusion des programmes radiophoniques et tlvisuels. Pour le faire, il assure dune part la cration, lexploitation, lentretien et lextension des rseaux de diffusion des programmes radiophoniques et tlviss. Dautre part, il permet de contrler la
Facult des sciences de Tunis, 2012-2013 1
Introduction gnrale
qualit de la rception de ces programmes fin de protger les auditeurs et les tlspectateurs contre les brouillages extrieurs et dassurer une qualit de service conforme aux normes internationales. De plus, il assure la conduite des tudes et recherches portant sur le matriel et les techniques de radiodiffusion et de tldiffusion ainsi que la participation la mise au point des normes y affrentes. Ce rapport est organis en trois chapitres : Le premier chapitre consiste prsenter quelques notions thoriques prliminaires concernant essentiellement les conteneurs et les codecs, ainsi que le dveloppement de la tlvision numrique. Un deuxime chapitre a t ddi lexplication du principe de la vision stroscopique afin dextraire les informations ncessaires pour la dfinir. La prsentation dtaille du projet dvelopp sera introduite lors du troisime chapitre, prsentant ainsi les fonctions adoptes, permettant la ralisation de lapplication. En fin, ce rapport sera achev par une conclusion gnrale et des perspectives.
Facult des sciences de Tunis, 2012-2013
Notions thoriques
Chapitre I :
Notion thorique
Notions thoriques
1. Introduction
Avant de prsenter le travail associ lvaluation de la qualit dune vido 3D native avec une vido 2D/HD convertie en 3D, on va tout dabord, prsenter le contexte de ltude. La premire partie de ce chapitre consiste introduire quelques notions relatives la squence vido, ceci en mettant en relief les diffrents formats et standards lis ce domaine. On va ensuite dfinir.
2. Conteneurs et codecs
Tout dabord, une vido est constitue d'un fichier vido et d'un fichier audio. Chacun de ces fichiers est un ensemble de donnes qui sont encodes. L'encodage consiste plus ou moins compresser les donnes sans nuire la qualit. L'outil qui sert l'encodage est un codec et selon le type d'encodage utilis on obtient un format spcifique : format vido et format audio. Afin de permettre la lecture simultane de l'image et du son (formats audio/vido), de la transmission, ces flux sont encapsuls dans un fichier conteneur. Ceci implique qu'un logiciel tant capable de reconnatre et d'ouvrir un conteneur pourra accder aux flux mais ne pourra pas les dcoder s'il ne dispose pas du codec adquat. Le conteneur peut donc tre vu comme une bote le contenant , et les flux comme ce que l'on met l'intrieur de la bote le contenu . 2.1. Fichiers conteneurs
Les vidos numriques, depuis qu'elles sont manipules par des ordinateurs, sont contenues dans des conteneurs. Ils sont identifiables par un nom dont l'extension (aprs le point) permet souvent de dterminer le type. Il sagit ainsi dun format de fichier pouvant contenir divers types de donnes. Les spcifications du format conteneur dcrivent la faon dont sont organises les donnes l'intrieur du fichier. Les conteneurs sont beaucoup utiliss dans le domaine du multimdia, ils peuvent contenir des flux vido et/ou audio, en gnral compresss l'aide
de codecs normaliss. Des conteneurs plus avancs permettent galement de stocker des soustitres, des lments de chapitrage, ainsi que d'autres informations sur le mdia appeles mtadonnes ou tags.
Notions thoriques
Flux vido
En-tte information sur le fichier
Flux audio 1 Flux audio 2 Autres flux (sous-titres,..)
Marque de fin
Figure I.1. : l'intrieur du conteneur, des flux
On peut distinguer plusieurs types de fichiers conteneurs, mais on concentrera dans ce qui suit sur les conteneurs privilgis pour la vido haute dfinition : AVI (audio video interleave) (.avi) Format de fichier danimations mis au point par Microsoft. Avec ce format, chaque composante audio ou vido peut tre compresse par nimporte quel codec. Mais le plus souvent, pour la vido, cest le format codec DivX qui est utilis, et pour laudio, le mp3. LAVI permet de runir en un seul fichier une piste vido et 99 pistes audio, ce qui permet davoir le choix entre plusieurs langues pour le mme film. Dans ce format, la compression est toujours effectue image par image (12 Go pour 10 mn de vido).
Figure I.2. : Principe de fonctionnement dun conteneur AVI
Il sagit dun enchainement de bloc audio-vido, cela veut dire que l'ordinateur code ou dcode partir de ces fichiers une petite partie d'audio, puis de vido, mais pas les deux la fois. C'est une action extrmement rapide car il y a un trs grand nombre d'enchainement audiovido. MKV (matroska) (.mkv, .mka, .mks) : MKV est un format de fichier vido ouvert et polyvalent qui s'est rapidement impos en tant que format de rfrence pour la vido haute dfinition sur Internet. Le conteneur MKV peut accueillir des donnes vido, audio et des fonctionnalits
Notions thoriques
comme des pistes audio complmentaires, des pistes de sous-titres multilingues et des repres de chapitres, ainsi que des mtadonnes multimdias comme des affiches, notes, et des descriptions. Le format MKV offre une exprience multimdia plus riche que les autres formats actuellement disponibles. Pour pouvoir lire ce format, les filtres ou codecs ncessaires doivent tre installs pour lire les diffrents fichiers contenus dans le MKV, ainsi quun filtre de type Splitter qui va sparer les fichiers pendant la lecture pour les dcoder ensuite grce leur codec respectif.
Figure I.3. : Principe de lencodage laide du format MKV
MPEG (.mpg) : contient exclusivement des flux vido et audio formats MPEG. MOV (movie) (.mov) contient diffrents formats dont Mpeg2, Mpeg4. MP4 (.mp4) : fichier standard audio et vido pour le MPEG4 partie 14. M2TS (.mts) : fichier standard pour le MPEG4 AVC/H264. Ogg (.ogg) fichier libre et Open source contenant Vorbis (audio) et Thora (vido). OGM ou Ogg Media (.ogm) : fichier pouvant contenir les formats DivX, Xvid et en audio le format ogg Vorbis. VOB (.vob) : pour DVD, contient gnralement Mpeg2 (vido) et AC3 ou DTS (audio).
Notions thoriques
2.2.
Les formats
Le format des donnes est la reprsentation informatique (sous forme de nombres binaires) des donnes (texte, image, vido, audio, archivage et cryptage, excutable) en vue de les stocker, de les traiter, de les manipuler. Les flux en question sont compresss laide dalgorithmes de compression dcompression, les fameux co-decs : COmpression-DECompression. Leur objet principal est de rduire la taille des donnes. Pour lire un fichier vido, il faut donc disposer sur son ordinateur : du lecteur capable de lire le conteneur Le format de fichier est le type de codage utilis pour coder les donnes contenues dans un fichier. Il est identifi par l'extension qui suit le nom du fichier. du codec vido capable de dcoder le flux vido du codec audio capable de dcoder le flux audio.
2.2.1.
Les formats Vido
AVCHD (Advanced Video Codec High Definition): un format d'enregistrement et stockage numrique vido haute dfinition, Ce format permet de rduire la taille des fichiers HD, tout en prservant un certain niveau de qualit de l'image restitue. DivX : bas sur le Mpeg4, DivX est un format de compression vido qui ne cesse d'voluer pour nous proposer une qualit vido suprieure capable notamment de tirer profit des tlvisions nouvelle gnration HDTV. Il permet de compresser fortement sans perte notable de qualit. Par exemple un de DVD (4,7 Go) compress en DivX pourra contenir sur un CD (700Mo). Plus adapt pour sauvegarder ou stocker sur DVD. DV (DV-AVI) : norme de la vido numrise faiblement compresse et sans perte de qualit. C'est le standard idal pour le montage virtuel. Une exportation en DV-AVI est utile pour retravailler une vido. GIF anim (Graphics Interchange Format) : animation partir dune succession dimages au format GIF. Le GIF anim est adapt aux animations graphiques de couleur unie et de petite taille, par exemple un logo. Il convient mieux aux images de synthse qu la vido classique.
Notions thoriques
HDV (High Definition Video) : cest le premier format vido haut dfinition pour camscopes grand public, et qui adopte une rsolution de 1440x1080 avec un rapport de 1,77 (16/9). Xvid : Format de compression vido numrique bas sur DivX (MPEG-4). Cest un logiciel libre pour la sauvegarde de fichiers vido, de meilleure qualit que son principal concurrent le DivX.
2.2.2.
Les formats audio
AAC (Advenced Audio Coding) : format utilis principalement sur les iPod. AC3 (audio compression_3) : format Dolby Digital dont le standard de codage numrique est le 5.1. AIFF (Audio Interchange File Format) : un format de fichier non compress conu pour stocker des donnes audio. Il a t dvelopp par Apple. DD+ (Dolby Digital Plus) : format audio haute rsolution dont la compression est avec perte. DTHD (Dolby True HD) : format audio multicanal haute dfinition, dont la compression est sans perte, offrant une richesse acoustique allant jusqu'au 7.1. DTS HD (Digital Theater System HD Master Audio) : format audio de haute rsolution concurrent et quivalent du DTHD. Ce format n'est pas dcod ou support par tous les lecteurs de Blu-Ray Disc. FLAC (Free Lossless Audio Codec) : format audio libre et de compression sans perte. LPCM (Linear pulse code modulation) : format audio multicanal haute dfinition, non compress, norme de la plus haute qualit. Il peut contenir jusqu' 8 canaux. OGG Vorbis : technologie d'encodage, de lecture et de diffusion de donnes audio (Open source) avec une qualit suprieure au MP3. MP3 : (MPEG 1/2 Audio Layer 3) : format de compression avec perte dvelopp par ISO. Il permet de compresser au taux de 1:12 les formats habituels. WAV (WAVE) : format audio sans compression mis au point par Microsoft et IBM.
Notions thoriques
WMA : format de compression de donnes audio avec perte, dvelopp par Microsoft. Il permet en outre de protger l'encodage contre les copies illgales
3. Lvolution de la tlvision
Pour faire face la demande accrue des tlspectateurs en matire de diversit et de qualits lies limage et au son, le monde de laudiovisuel sest dvelopp et a explor toutes les techniques de production, de distribution et de diffusion des programmes tv. La recherche dans ce domaine a permis lexploitation du systme noire et blanc puis les systmes couleurs et toutes les possibilits de perfection relatives aux diffrents dfinitions et formats dun tlviseur. Cest ce qui nous mne dfinir : Tlvision analogique : La tlvision consiste en une chane de traitement qui est compose de 2 parties : l'analyse et la synthse ; l'analyse transfert l'espace objet (3D+t : tridimensionnel et mobile) sur un plan deux dimensions spatiales et une dimension temporelle (2D+t). Le signal (lectronique) rsultant de l'analyse est alors transmis via un support qui peut tre matriel (cble) ou non (faisceaux hertziens ou hyperfrquences). Le rle de la synthse est de restituer sur un plan des images (2D+t) reproduisant aussi fidlement que possible le plan d'analyse ; la fidlit de la restitution est alors apprcie par l'observateur, lequel possde des caractristiques de perception subjectives ; la synthse est donc le traitement dual de l'analyse.
Figure I.4. : Chane de traitement de la tlvision
Notions thoriques
4.1.1. Vido analogique Le principe de la vido, diffremment de celui du cinma, repose sur sa capacit transmettre des images animes distance. Les phnomnes du monde rel que nous percevons (notamment, le mouvement et le son) sont quasiment tous continus, c'est--dire que lorsque ces phnomnes sont quantifiables, ils passent d'une valeur une autre sans discontinuit. Une grandeur analogique varie ainsi en continu dans une plage donne. L'information analogique peut prendre une infinit de valeurs et tre reprsente par une courbe (fonction du temps) traduisant le phnomne peru. Le principe de la vido analogique consiste donc capturer le signal analogique audio (vibration acoustique) ou vido (ondes lectromagntiques) et le transformer en un signal analogique lectrique qui offre l'avantage de pouvoir tre facilement stock (enregistr sur bande magntique), trait et restitu. La vido analogique reprsente l'information comme un flux continu de donnes analogiques, destin tre affiches sur un cran de tlvision. Il existe plusieurs normes pour la vido analogique. Les trois principales sont : NTSC (National Television Systems Committee): Format amricain, aussi appel ironiquement Never Twice the Same Color (jamais deux fois la mme couleur), pour sa versatilit. Compatible avec le format amricain Noir et blanc 60 Hertz (soit 30 images compltes en 1 seconde). Ce fut le premier standard couleur invent (1953) par les amricains pour garder la compatibilit avec les postes noir et blanc de l'poque. Dfinition de l'image : 640 pts x 475 lignes utiles (x 30 par seconde). PAL (Phase Alternate Line) : Format europen, mis en application en 1962, qui sest fortement inspir du modle amricain (NTSC) en en prenant les avantages et en essayant den gommer les dfauts. Compatible avec le format europen Noir et blanc 50 Hertz (soit 25 images compltes en 1 seconde). Dfinition de l'image : 720 pts x 576 lignes utiles (x 25 par seconde). SECAM (Squentiel mmoire) : Format franais, dvelopp concurrentiellement au systme PAL (1962), bas sur une approche fondamentalement diffrente. Il est compatible avec le format europen Noir et blanc 50 Hertz (soit 25 images compltes en 1 seconde). Dfinition de l'image : 720 pts x 576 lignes utiles (x 25 par seconde).
10
Notions thoriques
4.1.2. Inconvnients du signal analogique Le signal analogique est trs sensible son environnement. Sa dgradation est facile. Il s'affaiblit chaque maillon de la transmission. La correction de cette dgradation est difficile voire impossible. Un signal analogique qui circule dans des fils ou des ondes radio, travers le monde subit, ainsi, des dformations au cours de son voyage. De mme un signal sonore enregistr sur une bande magntique, puis copi plusieurs fois subira une perte de qualit. Des signaux parasites ou du bruit de fond peuvent galement s'ajouter au signal d'origine, etc. C'est en grande partie de l que la vido numrique tire ses avantages. 4.1.3. Conversion Analogique-Numrique La conversion dun signal analogique se droule principalement en deux temps : le premier est appel lchantillonnage : cest le fait de prendre une mesure du signal intervalle rgulier. Le deuxime temps appel quantification est le fait dattribuer une valeur numrique (0 ou 1) cette mesure suivant le codage choisit. Si le codage se fait en x bits, alors chaque mesure pourra prendre x valeurs diffrentes. Donc si le codage se fait en 4 bits, alors chaque mesure pourra prendre 4=16 valeurs diffrentes. 3.1.3.1. Principe dchantillonnage La premire phase d'une conversion analogique/numrique s'appelle l'chantillonnage. Cette phase est ralise par le convertisseur analogique/numrique. Echantillonner signifie prendre intervalle rgulier une srie de mesures de la tension du signal analogique d'origine. L'information chantillonne permet de reproduire une reprsentation plus ou moins fidle du signal analogique d'entre. Plus le nombre de mesures est lev, alors plus la dure entre deux mesures est faible donc plus d'informations seront contenues dans le signal numrique, ainsi ce signal numrique sera d'autant plus fidle au signal analogique d'origine. 3.1.3.2. Principe de la quantification Aprs avoir chantillonn un signal, nous obtenons une srie de mesures auquel le convertisseur analogique-numrique va attribuer une valeur numrique compose uniquement de 0et de 1 caractrisant l'intensit du signal analogique d'origine l'instant de l'chantillon. Ce processus s'appelle la quantification. Le principal paramtre de la quantification est le choix du codage. Un signal peut tre cod en un nombre de bits qui est une puissance de 2 (2; 4; 8; ...) et reprsente le nombre de chiffres de la valeur d'un chantillon. L'utilisateur peut donc rgler ce paramtre suivant qu'il veuille une excellente qualit ou au contraire une qualit moyenne. Chaque
11
Notions thoriques
chantillon prlev du signal d'origine est donc caractris par une valeur numrique en bits compose de 0 et de 1 plus ou moins grande suivant le codage choisi par l'utilisateur. Tlvision Numrique Terrestre TNT La Tlvision Numrique Terrestre TNT connue aussi par la DVB-T, est un mode de diffusion terrestre de tlvision dans lequel les signaux audio, vido et data sont numriss puis ordonns dans un flux unique dit multiplex avant dtre diffuss via les faisceaux hertziens. Un codage source de type MPEG est appliqu sur les diffrentes donnes audio, vido et data afin de rduire leur taille et optimiser les ressources ncessaires la transmission dun programme. La tlvision numrique permet le multiplexage de plusieurs programmes sur une mme frquence au lieu dun seul diffus dans le cas de la tlvision analogique. Dautres informations telles que les programmes locaux, les guides des programmes et les sous-titres peuvent tre insres en numrique. 4.1.4. Dfinition On ne peut pas aborder le vaste sujet de l'image vido sans comprendre ce qui constitue la dfinition. C'est un ordre de grandeur prcis qui correspond au nombre de lignes (axe horizontal) affiches par l'cran en question sur le nombre de colonnes (axe vertical) dont ce mme cran dispose. Autrement dit, cest le nombre de pixels prsents dans la hauteur de limage. 4.1.5. La frquence daffichage Appele aussi frquence de rafrachissement, dfinie par le nombre d'images s'affichant sur l'cran par seconde. Cette valeur varie gnralement entre 50 et 120 Hz. Une vido est une simple succession dimages fixes, qui projetes suffisamment vite, donnent lillusion du mouvement. Le principe est simple : partir de 10 images par seconde, intervient pour lil humain le phnomne dit de "persistance rtinienne". En clair comme cela va trs vite le cerveau ne voit plus des images spares, mais un mouvement continu. Plus le nombre dimages par secondes pour dcomposer un mouvement est important plus le mouvement sera fluide. Voil pourquoi le cinma dfile au rythme de 24 images par secondes tandis que la tl en Europe est 50 et aux tats unis, 60 images par seconde. 4.1.6. Le balayage Les centaines de milliers de points composant chaque image changent. Ils changent selon un ordre bien dfini : ligne par ligne, de gauche droite en partant du haut. Donc, Outre le nombre
Notions thoriques
de pixels d'une image et la frquence d'affichage, un troisime lment son importance, c'est le type de balayage utilis. Deux options coexistent : Le balayage entrelac, interlaced scan ou i : L'image s'affiche en deux temps : une demi-image comprenant les lignes impaires puis une autre demi-image avec les lignes paires. Ces demi-images (des trames) s'affichent une frquence de cinquante par seconde, soit vingt-cinq images compltes par seconde. Mais pas sans inconvnient, limage "scintille" lgrement, et parait donc moins naturelle. Le balayage progressif, progressive scan ou p : Limage s'affiche toujours dans son intgralit. On passe donc d'une image complte une autre image complte. Un des avantages de cette mthode est qu'elle supprime les effets de scintillement que l'on peut constater en entrelac. L'image est donc plus agrable regarder. Au final, p est suprieur i rsolution gale, mais, pour une mme quantit dinformations envoye dans un laps de temps (un mme dbit) la rsolution en p est infrieure au i . 4.1.7. Les ratios dimage On peut aussi caractriser une image par ses dimensions (sa longueur, et sa largeur). En tlvision, vido ou cinma on lindique de manire diffrente : on donne la taille de la diagonale (en cm ou en pouces) ou par le ratio largeur/hauteur : 4/3,16/9,2.35 :1 etc... Simplement pour une image au format 4/3, si la largeur de limage est de 4 units, la hauteur est de 3, cest le format de la tlvision classique. Le cinma utilise un format 2.35 pour 1 soit une image beaucoup plus large que haute : cest pour cela que vous voyez des bandes noires lorsque vous regardez un film de cinma sur votre TV 16/9 ou 4/3. Tlvision dfinition standard SDTV SDTV pour Standard Definition Television communment employ par l'acronyme SD, dsigne une srie de normes vido de rsolution image conformes aux normes NTSC (National Television System Committee), PAL (Phase Alternating Line) ou SECAM (Squentiel Couleur Mmoire). La dfinition standard SD consiste en un format digital standard de 480i/30Hz. Ce format est principalement utilis lorsque la largeur de bande passante est une proccupation importante. Elle utilise un taux de transfert d'environ 4-7Mbps, comprend 625 lignes horizontales, dont
13
Notions thoriques
seulement 576 sont visibles, les autres 94 sont ddies la synchronisation, des squences test, aux tltextes. En format 4/3, chaque ligne comprend donc en thorie 768 (4/3*576) pixels. Cette valeur est ramene en pratique 720 pixels par lignes. Une image SD au format 4/3 est donc forme de 720*576 pixels, soit un peu plus de 400000 pixels, cette dfinition correspond la qualit du DVD. En supposant que cette image soit numrise, avec un codage de chaque pixel sur 8 bits, ceci ncessiterait un dbit binaire considrable de lordre de 80 Mbits/s (25*8*400000). Cette forme de numrisation la source nest cependant pas utilise car ce type de signal numrique prte mal aux manipulations (effet vido, trucage). En format 16/9, chaque ligne comporte 1024 (16/9*576) pixels, une image SD au format 16/9 est donc forme thoriquement de 1024*576 pixels, soit prs de 600000 pixels. Enhanced Definition Television EDTV Une des volutions des crans SD fut l'apparition de tlviseurs supportant le balayage progressif. La rsolution verticale est limite 480 lignes, mais la rsolution horizontale varie de 640 704 lignes. Le standard comprend des rapports de dimension de 4:3 et 16:9 et des taux de rafrachissement de 24-30 et 60Hz, en plus de comprendre des signaux progressifs.. High Definition Television HDTV HDTV dsigne la tlvision haute dfinition. Il sagit dun signal vido numrique (DTV, Digital Television) haute rsolution, combin avec un son numrique ambiophonique (Dolby Digital Surround Sound, AC-3). Il reprsente le standard de rsolution vido numrique le plus lev prsentement sur le march. Cette combinaison cre une exprience audio-visuelle extrmement enrichissante. . La rsolution d'image est jusqu' cinq fois suprieure celle de la tlvision classique. Les tlviseurs TVHD affichent donc des images plus nettes, des couleurs plus lumineuses. En plus, il est trs important de mentionner que la bande passante disponible sur un canal TVHD permet de faire passer quatre programmes SDTV. Outre sa capacit afficher des missions et films en haute rsolution, un tlviseur haute dfinition peut galement amliorer quelque peu l'image diffuse en qualit standard. Presque tous les tlviseurs TVHD possdent un processeur qui convertit l'image standard en balayage progressif pour en amliorer la stabilit.
14
Notions thoriques
Les principaux formats susceptibles d'tre utiliss en HDTV sont : o 720p 1280 X 720 pixels progressifs o 1080i 1920 X 1080 pixels entrelacs (Interlaced) o 1080p 1920 X 1080 pixels progressifs
Cependant, le HDTV require de la part des stations de tlvision qu'ils s'quipent de tout nouveaux quipements de production et de diffusion, et les consommateurs devront faire de mme pour recevoir le signal.
4. Les normes d'cran

Il existe une multitude d'crans plats (qu'ils soient LCD, plasma...) et de vidoprojecteurs. Cependant, tous ne peuvent se targuer d'tre prts pour la rvolution HD. Afin de faire le mnage parmi tous les produits, diffrentes normes HD sont apparues sur le march. 4.1 HD Ready
La certification HD Ready est une norme, cre par l'EICTA qui est un organisme europen rassemblant les industriels des secteurs des nouvelles technologies et de l'lectronique grand public. Cest un label bien prcis qui stipule que le diffuseur doit pouvoir afficher un minimum de 720 lignes horizontales, en plus de possder la fois une entre vido YUV analogique et une entre vido numrique (HDMI ou DVI), et enfin de recevoir les signaux 1080i et 720p, puisque ces deux systmes sont utiliss en captation et diffusion d'images HD. Ils combinent chacun des paramtres diffrents pour arriver une mme densit d'informations l'cran de l'ordre de 50 millions de pixels par seconde. Le premier systme combine une trame de 720 lignes horizontales avec 1280 points/ligne et le chargement de 50 images par seconde. Le second associe 1080 lignes horizontales avec 1920 points/ligne et le chargement de 25 images par seconde. Les signaux 1080i subiront alors une sous-conversion avant d'tre affichs, tandis que les signaux 720p seront affichs en natif, c'est--dire plein pot. 4.2 FULL HD
Ce label dsigne les diffuseurs disposant d'une dfinition native de 1920x1080 permettant de restituer sans recalculer les images la norme 1080i, qui pourront cette fois-ci tre affichs plein pot (seul, un dsentrelacement sera ncessaire). A l'heure actuelle, c'est la plus haute
15
Notions thoriques
dfinition qui existe en matire de vido grand public. Le label Full HD ne veut donc pas forcment dire que lcran sera capable de rendre du 1080p. 4.3 4K UHD
Depuis l'apparition des premiers tlviseurs cran plat, que de progrs techniques accomplis. La rsolution indigente des tout premiers modles a successivement laiss place aux modles HD Ready 720p (1366 x 768 pixels, HDTV) puis Full HD 1080p (1920 x 1080 pixels, HDTV 1080p). Mais la HD telle que nous la connaissons actuellement n'est qu'une tape dans l'histoire du tlviseur et de la diffusion des images. Le prochain format d'image haute dfinition pointe dj le bout de son nez chez les plus grands fabricants : c'est le format UHD, pour Ultra Haute Dfinition qui correspond 4 fois le format HD 1080p, soit 3840 x 2160 pixels. Ce format qui a t officiellement reconnu par le CEA comme norme internationale de diffusion des uvres en Ultra Haute Dfinition ne concerne que l'usage domestique. La rsolution 4K utilise depuis quelques annes pour le tournage et la diffusion des films dans les cinmas quips tant de 4096 x 2160 pixels. Comme au cinma, elle permet de bnficier d'une trs grande taille d'image en conservant une excellente qualit, puisque la taille des pixels est suffisamment petite pour n'tre pas perceptible. En effet, sur un cran de trs grande taille, la rsolution HDTV 1080p (Full HD), avec ses 1920 x 1080 pixels montre rapidement ses limites : les pixels sont clairement visibles l'il nu lorsqu'on s'approche de l'cran. Avec une dfinition UHD, les pixels deviennent donc quasiment indiscernables, ce qui permet de profiter d'une trs grande image en limitant le recul ncessaire. On est alors carrment plong dans limage, avec une dfinition trs pousse et une profondeur de champ proche d'une vision tridimensionnelle. Enfin, l'Ultra HD va thoriquement favoriser le dveloppement des technologies 3D sans lunettes, ces dernires reposant sur le deal "perte de dfinition contre gain de points de vue". Et quoi qu'il en soit, rpandre l'Ultra HD dans les foyers entre dans une certaine logique, puisqu'aujourd'hui la plupart des productions modernes sont tournes en ce format. 4.4 8K UHD
Vritable rvolution visuelle, l'Ultra HD propose deux fois plus de lignes horizontales et verticales que la Full HD, soit quatre fois plus de pixels au total. Le 8K, deux fois plus de lignes (toujours en verticale et horizontale) que l'Ultra HD, et donc quatre fois plus de lignes que le Full HD. Soit au total quatre fois plus de pixels que l'Ultra HD, et 16 fois plus que le Full HD
16
Notions thoriques
cest--dire une image compose de 33,18 millions de pixels. On parle ici dune rsolution de 7680 4320 pixels. Proportionnellement, a donne quelque chose qui ressemble ce qui suit :
Figure I.5. : De la SD au 8K
Les crans 8K donnent une nouvelle dimension au cinma et crasent sans difficult les crans 4K et OLED et marque une nouvelle tape dans le cycle de renouvellement des crans de trs haute dfinition. Selon la plupart des experts, 2020 sera lanne au cours de laquelle le 8K commencera merger
5. Conclusion
Dans ce chapitre on a introduit quelques notions thoriques indispensables pour entamer ce projet, savoir les diffrents formats audio et vido, ainsi que les diffrentes technologies qui se livrent une vritable course la dfinition. De la dfinition standard la Full HD en passant par la 720p, se sont les 4K, Ultra HD et 8K qui pointent le bout du nez.
17
Vision stroscopique
Chapitre II :
Vision stroscopique
18
Vision stroscopique
1. Introduction
La vision stroscopique est une caractristique fondamentale de l'tre humain et de bien d'autres formes de vie sur terre. Ce chapitre vise justement amener mieux comprendre le fonctionnement sous-tendu cette facult de pouvoir valuer la profondeur des choses qui nous entourent dans notre quotidien. Historiquement, la stroscopie a jou un rle de premier plan dans l'volution de l'homme. De l'homme prhistorique, o sa survie dpendait de son aptitude percevoir la distance le sparant d'un prdateur, l'homme moderne utilisant cette proprit de son sens de la vision pour dvelopper des outils lui permettant une matrise accrue de son environnement. Nous allons dans un premier temps nous attarder sur le fonctionnement physiologique de la vision stroscopique chez l'humain. Par la suite, une analyse un peu plus mathmatique sera utilise pour approfondir les divers facteurs qui font que la vision stroscopique est viable.
2. La vision stroscopique
2.1. Dfinition La stroscopie (du grec stro : solide, scope : vision) est l'ensemble des techniques mises en uvre pour reproduire une perception du relief partir de deux images planes. 2.2. Physiologie de la vision stroscopique La vision stroscopique est due, en grande partie, aux neurones binoculaires situs dans le cortex crbral au niveau des zones spcifiques et primaires du traitement de la vision Ces neurones binoculaires sont les seuls neurones recevoir l' influx nerveux de deux neurones homonymes de la rtine via la chane neuronale. Les images gauche et droite du mme objet, captes en mme temps par les deux rtines, sont achemines au cortex visuel par les nerfs optiques qui se croisent dans le " chiasma", ce qui fait qu'elles sont prsentes dans des cellules voisines du cortex visuel. Les cellules des parties gauche et droite du cortex visuel communiquent aussi par le corps calleux, ce qui contribue au mcanisme de la fusion binoculaire. Cette double information permet par des mcanismes complexes faisant intervenir d'autres zones du cerveau la perception
19
Vision stroscopique
de l'angle entre l'information visuelle capte par des photorcepteurs d'un il et ses homologues de l'autre il permettant de percevoir les reliefs et la distance. La vision stroscopique est normalement trs prcise, de prcision inversement proportionnelle la distance, et limite en amplitude : on voit difficilement en relief un objet trs rapproch ou un objet trs loign. 2.3. La vision stroscopique naturelle Notre sensation de profondeur dcoule d'une recomposition de l'espace effectue par notre cerveau grce de nombreux indices. La perception de profondeur dcoule de la binocularit mais nanmoins les autres indices se corroborent dans le milieu naturel et ne se contredisent pas. L'tre humain dispose de deux yeux qui lui permettent de percevoir son environnement de deux points de vue lgrement diffrents. La fusion mentale de ces deux vues permet d'engendrer une image spatiale de notre environnement, un processus purement psychologique. La perception spatiale reprsente une aptitude typique d'un chasseur, d'un carnivore. Dans ce casl, le faible recouvrement des deux champs de vision ne permet gure la perception de la profondeur. On se rend facilement compte de l'importance de la vision spatiale si l'on regarde avec un seul il. Dans ce cas, verser par exemple le contenu d'une bouteille dans un verre cause des difficults relles, sauf si l'on se sert de moyens auxiliaires comme par exemple le recouvrement des objets afin d'valuer la distance entre la bouteille et le verre. La vision stroscopique est une aptitude naturelle chez l'homme. Cependant, le faible cartement des yeux ne permet une vision spatiale que pour notre environnement proche moins qu'on essaie d'agrandir cette base de manire artificielle comme pour les jumelles ou les tlescopes d'artillerie. 2.4. La vision stroscopique artificielle Une image reprsente une projection, sur une surface, du monde tridimensionnel dans lequel nous vivons. Comme cette surface ne possde que deux dimensions, des renseignements essentiels sur la structure de la scne sont perdus lors de la projection. Par exemple, deux objets paraissant cte cte sur une image peuvent en fait tre des distances trs diffrentes de la camra au moment de la capture de l'image.
Vision stroscopique
Mais certains indices visuels rvls par une image peuvent nous aider reconstituer la scne originale : nos connaissances sur la taille des objets, l'clairage, les textures sur les objets, le flou, les points de fuite, etc. La vision par ordinateur regroupe des techniques se servant, entre autres, de tous ces indices afin de reconstituer une scne en trois dimensions partir d'une ou de plusieurs images de cette scne.
3. Les principes de la perception de la profondeur :

La perception de la profondeur repose sur dix indicateurs. Ces derniers contiennent de l'information qui, s'ajoutant l'image 2D projete sur la rtine, nous permettent de voir les objets de l'image dans un espace tridimensionnel. Ces indicateurs se divisent en deux groupes: le premier, concerne quatre indicateurs physiologiques et le second, six indicateurs psychologiques.
3.1. Les indicateurs physiologiques

3.1.1. Accommodation Le cristallin (la lentille biconvexe derrire la pupille) se contracte ou s'allonge selon qu'il cherche mettre au foyer l'image sur la rtine d'un objet proche ou loign. Cette source physiologique d'information serait essentiellement exploite pour des objets perus des distances infrieures deux mtres, puisqu'au-del de cet loignement, le cristallin n'est pratiquement plus dform. 3.1.2. Convergence
Les deux yeux convergent vers le point fix par le regard. Plus les objets sont proximit, plus l'angle d'ouverture sparant les axes de vise sera prononc. En d'autres termes, les yeux sont davantage tourns vers l'intrieur si l'on fixe un objet prs de nous et ils sont plutt parallles pour les objets loigns.
21
Vision stroscopique
Figure II.1. : Convergence et angles douverture
3.1.3. Disparit binoculaire : La disparit binoculaire est l'indicateur de perception de profondeur jug le plus important pour la vision sur des distances moyennes. Chaque il dispose d'un point de vue sur la scne. tant donn le phnomne de convergence, les diffrences entre les images rtiniennes diminuent avec l'loignement. Par contre, les objets rapprochs montreront des diffrences significatives, notamment au niveau des configurations perues, du dvoilement de parties caches, de variations d'clairage sur les surfaces.
Figure II.2. : Principe de disparit binoculaire
3.1.4. Parallaxe du mouvement On tire une information des vitesses de dplacement des objets dans le champ de vision. C'est le principe de l'observateur dans le train, voyant les poteaux lectriques dfiler plus rapidement que les vaches au loin dans le champ. Ou encore, la fixit des corps clestes (la lune), laissant
Vision stroscopique
ainsi supposer d'un loignement considrable. Ce mcanisme est donc galement fonctionnel lorsque l'observateur se dplace. Selon l'objet qu'il fixe, il percevra des dvoilements en sens oppos (la parallaxe de mouvement) : une direction inverse au mouvement de l'observateur pour les objets se situant entre lui et la chose qu'il suit du regard et la mme direction pour les objets au-del.
3.2.
Les indicateurs psychologiques 3.2.1. Taille de l'image rtinienne
Lorsque des objets vus prsentent des similitudes formelles, l'observateur infre les distances en regard de leur taille relative sur l'image rtinienne. S'ils sont plus petits, ils sont plus loigns. 3.2.2. Perspective linaire La perspective rvle des convergences vers des points spcifiques du plan (les points de fuite). Ils sont principalement apparents dans les scnes comportant des objets aux artes rgulires ou partir de motifs rpts sur des axes colinaires. 3.2.3. Perspective de surface La perspective de surface se forme par l'attnuation des contrastes des objets lointains due la diffusion atmosphriques. Dans la nature, les objets loigns sont plus ou moins indistincts, et les objets rapprochs, au contraire, sont nets. Ceci donne avec le concours des phnomnes atmosphriques, une sensation de profondeur renforce. 3.2.4. Recouvrement C'est l'effet produit lorsque des contours continus semblent plus prs de l'observateur. 3.2.5. Nuances et ombres
C'est l'impression de convexit ou de concavit due au fait que la majeure partie de l'clairage provient du haut. 3.2.6. Perspective de texture C'est un type de perspective linaire qui correspond au degr de rugosit d'un objet uniforme mesure qu'il s'loigne. La rduction progressive d'une texture dans une direction provoque une perception de profondeur (la rduction progressive de l'immeuble vers l'infini).
Vision stroscopique
Les indicateurs psychologiques sont des indicateurs qui prennent de l'importance avec l'exprience. Lorsqu'ils sont combins, ces indicateurs accroissent grandement la perception de la profondeur. Pour la vision stroscopique, les principaux indicateurs de perception de profondeur sont la disparit binoculaire et l'effet des nuances et ombres. 4. Les techniques de la vision stroscopique Il existe plusieurs procds pour reconstituer une vision stroscopique. Quel que soit le procd, il faut s'arranger pour que l'il droit voie "l'image vue de droite" pendant que l'il gauche voit "l'image vue de gauche". Autrement dit soumettre chaque il une image diffrente. 4.1.Stroscopie par vision croise La technique de la "Vision croise" ncessite de "loucher" de manire ce que l'il "gauche" ne voie que l'image de "droite" et que l'il "droit" ne voie que l'image de "gauche". Dans ces conditions, on doit placer l'image de gauche droite et l'image de droite gauche. La principale difficult, c'est que pour s'entraner loucher, il faut placer un objet, un crayon, par exemple ou mme simplement un doigt, devant son nez et forcer les yeux converger. Nanmoins, un "rflexe" difficile matriser entrane aussi l'accommodation sur cet objet proche, alors que les images observer l'cran sont plus loignes. Il faut donc arriver contrarier ce "rflexe". Par contre en "Vision parallle", le "rflexe" joue dans le bon sens. Lorsqu'on regarde au loin, les axes optiques tendent devenir parallles et les yeux accommodent l'infini. La difficult, c'est alors de ne pas laisser les axes optiques converger vers l'cran. Avantage : La taille des images n'est pas limite, contrairement la technique de la "Vision parallle", o la largeur de chaque image doit tre voisine de 6,5 centimtres (en fait, si on se place assez loin de l'cran, cette limite peut tre largement dpasse.), et Il n'y a pas besoin de matriel ni de traitement sur les images. Pas de restriction de taille pour les images. Inconvnient : C'est qu'on ne peut pas imprimer directement les images affiches l'cran pour les observer ensuite l'aide d'un "stroscope" constitu de deux loupes. On ne peut que les observer "Vision croise" ou bien il faut les inverser. Et que la technique de vision croise ncessite un apprentissage.
Vision stroscopique
4.2.Stroscopie par vision parallle La technique de la "Vision parallle" est moins fatigante pour les yeux, puisqu'on ne force pas les yeux "loucher" mais au contraire se remettre en position "naturelle". Au repos, en regardant au loin, les muscles oculaires sont relchs et les axes optiques des deux yeux sont parallles. Dans ces conditions, on place l'image de gauche gauche et l'image de droite droite. Il faut que les deux images aient peu prs le mme cartement que les yeux, 6.5 centimtres environ, 7 cm au maximum. Cela entrane une limitation pour la largeur des images et favorise donc le format portrait (vertical) par rapport au format paysage (horizontal), moins d'adopter un format carr en recadrant les photos prises horizontalement. Avec un ordinateur, l'cartement des deux images dpend de leur largeur, en "pixels", de la taille de l'cran et de la rsolution de l'affichage cran choisie. Il faut regarder les images sans faire converger les axes optiques des yeux, en les conservant bien parallles. C'est le cerveau qui assure la fusion des deux images, interprte leurs diffrences en termes de distance et reconstitue le relief. Pour rduire le champ de vision, on pourrait utiliser un cache en carton muni de deux petits orifices rectangulaires ayant le mme cartement que les yeux. On peut aussi utiliser deux tubes de section circulaire ou mieux rectangulaire et dont les axes sont parallles. Vous pouvez galement imprimer les images affiches l'cran pour les observer ensuite l'aide d'un "stroscope" constitu de deux loupes. Vous pouvez enfin les observer en "Vision parallle". La largeur de chaque image doit rester voisine de 6.5 centimtres. Alors, si on a une tte avec un cerveau et deux yeux avec une vision normale, on doit arriver voir les images stro en 3D sans optique aucune. C'est une gymnastique oculaire, mais qui ne demande que de la relaxation... C'est l'image 3D qui doit vous "sauter aux yeux", sans aucun effort. On doit voir 3 images places la mme distance, celle du milieu, l'image 3D, paraissant en relief. Il faut conservez les yeux la mme hauteur, tte bien verticale, il ne faut pas la pencher vers une des paules, sauf un peu au dbut, pour trouver la meilleure position. Avantage : Il n'y a pas besoin de matriel ni de traitement sur les images.
25
Vision stroscopique
Inconvnient : La technique de vision parallle ncessite un apprentissage et est assez difficile acqurir. Les images sont de petite taille.
5. Cinma en relief
Pour obtenir une image en relief, il faut projeter deux films simultanment un film pour l'il droit et un film pour l'il gauche, il faut donc disposer d'un norme projecteur quip de deux objectifs ou bien de deux projecteurs synchroniss. Dans la salle de cinma : deux films, deux objectifs donc deux images seront projets sur l'cran mais seront dcals. Pour voir une seule image et en relief, il faut imprativement chausser des lunettes avec verre filtrant l'un des deux verres dirigeant l'une des deux images vers l'il gauche et l'autre vers l'il droit. Pour voir en relief il faut regarder avec les deux yeux en mme temps, car ils ne voient pas la mme chose et c'est le cerveau qui va faire la synthse des deux images pour recrer le relief qui existe dans la ralit. La difficult est de recrer le relief sur un cran parfaitement plat en faisant sorte que nos deux yeux ne voient pas la mme chose. Pour cela on commence par tourner deux films, un pour chaque il avec une camra qui possde deux objectifs spars de 7cm comme nos deux yeux et ensuite on projette ces deux films un pour chaque il qui fatalement vont se retrouver lgrement dcals. Evidemment, a l'il nu on ne peroit pas le relief, mais ds que les spectateurs sont quips avec des lunettes un peu spciales qui vont filtrer les images de sorte que l'il gauche ne voit que les images projetes par l'objectif de gauche et l'il droit celles projetes par l'objectif de droite. Le cerveau va faire la synthse des deux images persuads que la scne qui se droule devant lui est en relief. Les premiers films en relief date des annes 50 au dbut on utilisait des lunettes avec des filtres vert et rouge pour slectionner les images destines chaque il mais ce systme a altr les couleurs du film. Aujourd'hui pour voir en relief on utilise d'autres types de lunettes plus performantes notamment celles filtre polarisant. On met le filtre devant chaque il, un filtre droit qui va mettre l'image dans un sens pour l'il droit et un filtre gauche qui va mettre l'image gauche pour l'il gauche. a marche bien si on a la tte bien droite parce que les lunettes ne bougent
26
Vision stroscopique
pas. Si on bouge la tte, on voit l'image droite dans les deux yeux et l'image gauche aussi dans les deux yeux, donc il faut rester bien la tte droite. Actuellement, il existe des lunettes plus performantes se sont des lunettes cristaux liquides. Et donc le problme ne se pose plus, on peut bouger la tte dans tous les sens et on voit toujours l'image en relief. Le principe est simple quand l'objectif de gauche projette une image sur l'cran l'image est destine l'il gauche et l'objectif de droite lui est masqu ; cot spectateur la rgle est exactement la mme. L'il droit est masqu seul l'il gauche peut regarder l'cran. Puisque c'est l'image qui lui est destin qui est projete. l'instant suivant l'objectif de gauche est masqu, c'est dsormais l'objectif de droite qui projette une image que seul l'il droit peut voir car l'il gauche est masqu. Le cerveau n'a pas conscience de tous ces changements, grce la persistance rtinienne, en effet chaque image persiste un court instant sur chaque rtine, comme ces deux images sont lgrement diffrentes et bien le cerveau fait le mlange et reconstitue le relief.
6. Conclusion
Ainsi, nous avons vu quil existait trois grands procds qui permettaient la mise en place de la vision stroscopique sur les crans et que ceux-ci taient plus ou moins efficaces et plus ou moins coteux. On a galement prsent quelques principes de la perception de la profondeur comme les indicateurs physiologiques ainsi que les indicateurs psychologiques. Ces notions facilitent lanalyse des flux des donnes faisant lobjet du chapitre suivant.
27
Application et analyse
Chapitre III :
28
1. Introduction
Ce chapitre est consacr lexplication de la mthodologie adopte, le processus de cration adopt pour la ralisation des diffrentes tapes de lapplication, ainsi que le choix des langages de programmation.
2. Les langages de programmation

2.1. Initiation sur linterfaage par MATLAB MATLAB est un logiciel de traitement numrique prsentant de nombreux avantages pour la programmation mathmatiques, et mme la conception, de systmes de traitement numriques des signaux. Parmi ces avantages, on peut citer les suivants : La syntaxe MTLAB est trs proche du formalisme de lalgbre linaire, ce qui permet de transcrire rapidement en code des oprations comme le produit scalaire de deux vecteurs (corrlation) ou encore le produit dune matrice et dun vecteur (transforme). Toutes les variables sont par dfinition des matrices de complexes, ce qui signifie quon na pas dcaler une variable avant de lutiliser, les variables sont instancies leur premire affectation (par exemple, la ligne a=1 cre la variable a si cette variable nexiste pas dj, puis lui affecte la valeur 1). MATLAB comprend de nombreuses librairies, notamment pour le traitement numrique des signaux, ce qui permet de raliser rapidement des oprations comme le filtrage numrique et les transformes discrtes, et mme de concevoir des filtres numriques FIR et IIR (Butterworth, Tchebychev, elliptiques, etc.). MATLAB comprend galement une bonne librairie graphique, ce qui permet dobserver facilement les caractristiques des signaux et le comportement des systmes numriques (rponses en frquences, ples et zros, etc.). MATLAB permet lutilisateur de programmer des interfaces graphiques interactives afin de prsenter ses rsultats. Pour crer des interfaces graphiques utilisateur, on utilise les IHM (Interfaces Homme-Machine), appeles aussi GUI (Graphical User Interface) et qui permettent lutilisateur, grce des objets graphiques (boutons, menus, cases cocher,) dinteragir avec un programme informatique.
29
Figure III.1. : Des interfaces graphiques interactives

Pour tous ces avantages, MATLAB a quelques inconvnients. Un des plus importants est certainement le fait que MATLAB est un langage interprt et que la transcription du code se fait lexcution, par rapport des langages compils comme le c++. Ceci implique quun programme MATLAB sera plus long excuter. Malgr cet inconvnient MATLAB est un outil trs utile qui permet dexplorer rapidement des ides avant de les mettre en uvre ventuellement en c++ par exemple. 2.2. Le langage Java sous ECLIPSE Eclipse est un environnement de dveloppement intgr spcialement conu pour le langage de programmation orient objet Java qui a t invent au dbut des annes 90 et dont les droits sont dtenus par la socit Sun Microsystems. Trs vite, pendant sa conception, Java convenait aussi parfaitement la programmation multimdia, et au monde de linternet qui commenait clore et se faire connaitre du grand public. Depuis sa cration, le langage a subi de nombreuses volutions et corrections. Les mises jour rgulires ont permis au fur et mesure dinclure de nombreuses bibliothques, permettant de dvelopper plus facilement des applications complexes. Java prsente de nombreux avantages. Parmi lesquels : Java est interprt : la source est compil en pseudo code ou byte code puis excut par un interprteur Java : la Java Virtual Machine (JVM). Ce concept est la base du slogan de Sun pour Java : WORA (Write Once, Run Anywhere : crire une fois, excuter partout). En effet, le byte code, s'il ne contient pas de code spcifique une plate-forme particulire peut tre excut et obtenir quasiment les mmes rsultats sur toutes les machines disposant d'une JVM. Java est portable : il est indpendant de toute plate-forme : il n'y a pas de compilation spcifique pour chaque plateforme. Le code reste indpendant de la machine sur laquelle il s'excute. Il est possible d'excuter des programmes Java sur tous les environnements qui possdent une Java Virtual Machine. Cette indpendance est assure au niveau du code source grce Unicode et au niveau du byte code. Java est orient objet : comme la plupart des langages rcents, Java est orient objet. Chaque fichier source contient la dfinition d'une ou plusieurs classes qui sont utilises
31
les unes avec les autres pour former une application. Java n'est pas compltement objet car il dfinit des types primitifs (entier, caractre, flottant, boolen,...). Java est simple : e choix de ses auteurs a t d'abandonner des lments mal compris ou mal exploits des autres langages tels que la notion de pointeurs (pour viter les incidents en manipulant directement la mmoire), l'hritage multiple et la surcharge des oprateurs, ... Java assure la gestion de la mmoire : l'allocation de la mmoire pour un objet est automatique sa cration et Java rcupre automatiquement la mmoire inutilise grce au garbage collector qui restitue les zones de mmoire laisses libres suite la destruction des objets. Java est conome : le pseudocode a une taille relativement petite car les bibliothques de classes requises ne sont lies qu' l'excution. Java est multitche : il permet l'utilisation de threads qui sont des units d'excutions isoles. La JVM, elle-mme, utilise plusieurs threads. Pour tous ces avantages, Java a quelques inconvnients. Parmi les plus importants est certainement le fait que la vitesse dexcution est gnralement inferieure un langage compil en natif (tel que c++), en plus des difficults daccs aux ressources matrielles.
3. Interfaces graphiques
Pour simplifier lacquisition et le traitement des donnes, on a dvelopp des interfaces graphiques sous Eclipse afin dassurer le dialogue entre les utilisateurs et lapplication. Linterface daccueil est la premire apparaitre, elle nous donne une description gnrale sur notre projet.
32
Figure III.2. : Fentre de garde de lapplication
Lappui sur le bouton poursuivre permet le passage direct linterface suivante, une deuxime fentre saffiche.
Figure III.3. : Deuxime interface graphique
33
Cette fentre comporte trois boutons : Lire la vido : permet de lire la squence vido slectionne et enregistre lavance sous MATLAB.
Figure III.4. : Chargement de la source de donnes avant la lecture
Figure III.5. : Fentre de lecture dune squence vido
Analyser la vido : permet laffichage des informations de notre squence comme le nom du fichier, son chemin, sa dure, type de commande utilise pour
34
la lecture, ainsi que des informations spcifiques de laudio et du vido indpendamment lune de lautre.
Figure III.6. : Rsultats de lanalyse dune squence vido
Analyse dimages : ce bouton permet laffichage dune troisime interface contenant les diffrentes oprations appliquer, choisies selon les besoins ainsi que le choix de lutilisateur.
35
Figure III.7. : Les oprations appliquer sur les diffrentes images
4. Les analyses
Pour commencer, il faut rappeler que cette application est ddie lvaluation dune squence vido 2D/HD convertie en 3D par rapport la mme squence en 3D native. Cette valuation sera base sur lanalyse dimage indpendamment de la notion de relief. Et pour simplifier lextrme, on note que la structure de limage peut tre tudie sous 2 aspects, la morphomtrie et la sotriologie. La morphologie est une analyse quantitative de limage, dun objet ou dune structure, on prend lexemple dhistogramme qui fournit une description robuste et quantitative de limage, et quon lavait choisi comme une fonction danalyse, parmi plusieurs, pour cette application. La figure ci-dessus est une reprsentation de deux images, prises par une camra stroscopique qui rassemble deux objectifs en un seul boitier. Ces deux objectifs sont placs comme deux yeux cest--dire 65 mm lune de lautre. Dans ce cas on dispose de deux images, une pour chaque il.
36
Figure III.8. : Scne capte par une camra stroscopique grce deux objectifs loigns lun de lautre de 0.65 cm
Lanalyse sera effectue sur le roche gauche capt par lobjectif gauche, indpendamment du roche droite capt par lobjectif droite, et inversement. Une fois la conversion de la squence 2D/HD est effectue, le mme principe danalyse appliqu sur limage filme en 3D sera identiquement appliqu sur limage 2D convertie. 4.1. Analyses quantitatives On imagerie numrique, lhistogramme reprsente la distribution des intensits (ou des couleurs) de limage. Il comprend diffrentes zones qui donnent des informations complmentaires : Zone de gauche : il sagit des tons sombres prsents dans limage Zone de droite : il sagit des tons clairs prsents dans limage Ecrtage : lcrtage se produit lorsque les valeurs de niveaux de lhistogramme viennent buter sur une des deux limites, droite ou gauche, ou dpassent lintensit maximale en hauteur
37
Figure III.9. : Histogrammes superposs des composantes rouge, verte et bleu de limage gauche capte par lobjectif gauche de la camra stroscopique
Figure III.10. : Histogramme des couleurs de limage gauche capte par une camra stroscopique
38
Figure III.11. : Nuage des couleurs de limage gauche capte par une camra stroscopique
Interprtation : Daprs lhistogramme RVB, on constate quil illustre une image peu contrast (pixels dintensit proches). Nous pouvons galement voir que limage comportera des zones inexploitables vue que lhistogramme touche des valeurs trs sombre voir noir bouchs. Puisque si la courbe est colle dun ct ou de lautre dune des deux limites, alors on perd de linformation, des dtails dans limage. Les variations dintensit des couleurs ne sont pas importantes part quelques exceptions (les pics dun certain nombre de pixels moyens ainsi quun pic important lextrmit gauche pour chaque composante). Un histogramme comme celui-ci indique une sous-exposition.
Figure III.12 : histogrammes de la composante rouge, verte et bleu
39
La sparation des histogrammes de chaque composante permet de visualiser comment se distribuent les tons clairs et foncs dans notre image. Plus simplement, gauche de lhistogramme sont reprsents les pixels sombres, et droite les pixels clairs. Plus il y a de pixels pour telle tonalit (trs sombre, moyen, trs clair, et tous les intermdiaires), plus le pic sera lev. Dans notre cas, on constate que les tons sombres des composantes rouge, verte et bleu sont dominants. Ce rsultat est mme plus vident sur la deuxime et la troisime figure, histogramme des couleurs et le nuage des couleurs qui illustrent par le langage visuel de couleur que le pic noir est le trs important et que limage est trs loin dtre enlumin. Le mme type danalyse sera maintenant appliqu sur notre deuxime image, identique sa prsidente, capt par une camra full HD.
Figure III.13. : Histogrammes superposs des composantes rouge, verte et bleu de limage gauche capte par une camra full HD
40
Figure III.14. : Histogramme des couleurs de limage gauche capte par une camra full HD
Figure III.15. : Nuage des couleurs de limage gauche capte par une camra full HD
41
Interprtation : En analysant les trois figures, on remarque que cette image est plus dense, plus riche en couleurs, la prsence des trois composantes est aussi plus importante. Les valeurs dintensit des pixels sont trs variables, et loin lune de lautre. Limage possde donc un histogramme trs nettement diffrent de limage prcdente.
Figure III.16. : Histogrammes de la composante rouge, verte et bleu
De plus, les composantes rouge et verte prsentent des histogrammes standards, toutes les parties centrales possdent pas mal de pixels, avec quelques pics vers le milieu, mais o lextrmit droite contient peu. Il sagit aussi dune image sous expose vue que lhistogramme RVB touche des valeurs trs sombre, et permet notamment de savoir trs rapidement la prsence dune perte dinformations. 4.2. Analyses spectrales Cette tape consiste liminer les effets indsirables de limage afin de pouvoir effectuer une analyse spectrale pour une exploitation efficace des donnes. Elle est base sur lapplication dun module dvelopp sous MATLAB.
42
Rsultat obtenu :
. . Figure III.17. : Image source Figure III.18. : Image filtre, en utilisant la TFD
Pour justifier le choix de la Transforme Discrte de Fourrier pour cette tape, il faut dabord comprendre quune image relle est transforme en une image numrique par diffrents outil de transformation, dans notre cas loutil est une camra. Cette image est constitue de pixels contenant chacun diffrentes informations (intensit lumineuse, couleur...) et ces informations seront codes dans une grille chelonne (le niveau de gris, de 0 63par exemple). Donc, limage obtenue aprs acquisition contient un nombre trs lev dinformations. Ces informations sont de plus imparfaites, car les conditions dacquisition ne sont jamais idales (dfocalisation de la surface, dfaut de symtrie dclairement, contraste insuffisant) De plus, la richesse des informations est nfaste, car souvent les informations apportes ne sont pas pertinentes : de nombreux dtails de limage concernent des objets que lon ne veut pas prendre en considration. Il faudra donc simplifier limage pour essayer de ne garder que les informations utiles lanalyse. Donc, lutilisation de la Transforme Discrte de Fourrier permet dliminer les effets indsirables et de purifier limage. Et comme point de dpart, il faut dabord savoir que les spectres ci-dessus dcrivent le degr de luminance, qui dsigne le signal dterminant les valeurs de contraste d'une image, du noir le plus profond jusqu'au blanc le plus pur, cest--dire la diffrence entre la densit la plus forte et la plus faible d'une image.
43
Figure III.19. : Spectre de limage gauche capte par une camra stroscopique, lchelle logarithmique
Figure III.20. : Spectre de limage gauche capte par une camra full HD, lchelle logarithmique
44
Figure III.21 : Spectre de limage gauche capte par une camra stroscopique, filtre lchelle logarithmique
Figure III.22. : Spectre de limage gauche capte par une camra full HD, filtre lchelle logarithmique
45
Le premier spectre est une reprsentation graphique de limage gauche capte par une camra stroscopique, transforme ensuite en une image en niveau de gris. Le second, est aussi une reprsentation graphique de limage gauche mais capte par une camra full HD. La diffrence est vidente en ce qui concerne lintensit lumineuse : limage en haute dfinition possde une valeur de luminance plus importante que celle prise par lobjectif gauche de la camra stroscopique. Cette dissemblance est mieux observe sur les lignes axiales qui atteignent le centre du spectre, et surtout aux niveaux des extrmits extrieures dont les grains de luminance semblent parpills, cest--dire, la variation lumineuse est assez notable. Mme aprs avoir filtr nos deux images, pour se dbarrasser des effets indsirables qui concernent des dtails que lon ne veut pas prendre en considration, les deux spectres de nos diffrentes images ont conserv presque le mme rsultat fourni par les spectres des deux images sources. Cest--dire notre deuxime image est le sige dune forte intensit lumineuse par rapport la premire. 4.3. Seuillage par Hystrsis Lanalyse de limage est un domaine qui permet de soustraire de linformation partir des caractristiques de limage. De Nombreux problmes dapplication ncessitent un traitement pralable afin den dtecter les contours. Dans cette tape, notre analyse se repose sur le principe de seuillage par Hystrsis, nous allons donc cette fois ci, en se basant sur le calcul du gradient de nos images, dtecter des contours en appliquant un seuillage par hystrsis. Au lieu de prendre un seuil, ce qui pouvait amener de faux contours ou du bruit le seuillage par Hystrsis quon a adopt introduit deux seuils : un seuil haut et un seuil bas, dans notre cas le seuil haut est gale 150 et seuil bas est gale 50.
Si la norme du gradient est suprieure au seuil haut (150), c'est un point de contour sr (constant), qu'on code par 1.
Si la norme du gradient est infrieure au seuil bas (50), alors ce n'est pas un point de contour, qu'on code par 0.
Si la norme du gradient est entre les deux, alors ces contours sont transforms en contours srs s'ils sont adjacents un contour cod 1.
46
Le but est d'afficher une image choisie par l'utilisateur. Ensuite, l'utilisateur a la possibilit de raliser un seuillage par hystrsis. L'utilisateur a la possibilit de choisir un seuil bas et un seuil haut grce des champs texte. L'interface graphique de cette application comporte : Une fentre d'affichage de l'image Une fentre d'affichage de l'image aprs excution du seuillage par hystrsis Un bouton qui permet d'ouvrir une boite de dialogue pour slectionner une image Un bouton qui permet d'afficher une image Un bouton qui permet de raliser un seuillage par hystrsis Des champs texte qui permettent de donner des valeurs de seuil
Voici l'interface obtenue :
Figure III.23. : Seuillage par Hystrsis appliqu sur limage slectionne
Afin de permettre l'utilisateur de choisir une image, on doit afficher une boite de dialogue dans lequel il peut parcourir l'ensemble de son disque dur la recherche de l'image voulue. Pour raliser ceci, on utilise la fonction uigetfile(() de Matlab et qui va renvoyer le nom du chemin ainsi que le nom du fichier.
La syntaxe de cette fonction dans notre cas est : [nomfichier, chemin] = uigetfile(filtre,'Select the image',chemin de dpart')
O filtre correspond l'extension des fichiers que l'on peut slectionner et 'chemin de dpart' correspond au chemin o l'on est l'ouverture de la boite de dialogue.Lorsque le fichier est slectionn, on affiche son chemin dans un champ texte. Si l'utilisateur souhaite afficher l'image en cliquant sur le bouton 'afficher l'image', on lit l'image avec la fonction imread() et ensuite affiche l'image en niveau de gris grce aux fonctions rgb2gray() ainsi que imshow(). Tout d'abord, on va calculer le nombre de lignes ainsi que de colonnes de l'image.On doit galement crer deux nouvelles images dont l'une (Sh) servira pour rcuprer les pixels suprieurs au seuil haut et l'autre qui sera l'image finale obtenue. Il faut ensuite dfinir un masque, raliser la convolution entre ce masque et l'image et mettre le rsultat dans une nouvelle image.
Le masque de convolution utilis est : 1 1 1 8 1 1 1 1 1
Une fois la nouvelle image obtenue, on parcourt une premire fois l'image et pour les pixels dont la valeur est suprieure au seuil haut dfini, on met la valeur du pixel 255 dans l'image (Sb). Lorsque l'image a t parcourue entirement, on effectue un deuxime parcours de l'image qui va mettre les pixels formant les contours, trouv lors du premier passage, dans l'image finale et galement de slectionner les pixels dont la valeur est comprise entre le seuil bas et le seuil haut et voisin des pixels suprieurs au seuil haut. Lorsque l'on rencontre un pixel qui correspond ces critres on met la valeur du pixel 255 dans l'image finale. A la fin de ce deuxime parcours, on renvoi l'image finale et on l'affiche. Les deux figures ci-dessous sont le rsultat de notre analyse :
48
Figure III.24. : Seuillage par Hystrsis de limage 2D/HD convertie, en niveau de gris
Figure III.25. : Seuillage par Hystrsis de limage 3D, en niveau de gris
Interprtation : Il est nettement clair que les squelettes de nos deux images sont totalement diffrents. On rappelle que le but de la dtection de contours est de reprer les points de notre image numrique qui correspondent un changement brutal de l'intensit lumineuse. On constate donc, que la dtection des contours de ces deux images rduit de manire significative la quantit de donnes et limine les informations qu'on peut juger moins pertinentes, tout en prservant les proprits structurelles importantes de l'image. Dans notre cas, ces proprits diffrent de la premire image la deuxime. Limage capte par lobjectif gauche de notre camra 3D semble tre trs riche, puisque linformation est souvent dans les lments de contours. Donc en toute logique, il est vident que les points de contour sr sont trs levs, cest--dire, la plupart des normes de gradient sont suprieur au seuil haut choisi (150). Ce qui nest pas le cas de notre deuxime image en haute dfinition, qui contrairement sa prcdente prsente un faible taux dinformation, tel que la plupart des normes de gradient sont infrieurs au seuil bas (50).
Une forte variation de niveau de gris est uniquement constate dans le cas de limage capt par une camra 3D. Les diffrences de proprits entre ces deux images peuvent tre dues des discontinuits dans la profondeur, dans l'orientation d'une surface, dans les proprits d'un matriau et dans l'clairage d'une scne 4.4. Solutions proposes Tout dabord les histogrammes de notre analyse indiquent diffrentes informations relatives aux valeurs des pixels de limage : niveau concern, nombre de pixels de mme valeur, rpartition des niveaux, crtage. Dans le cas de limage 2D/HD convertie, on constate que lhistogramme est resserr gauche, alors on a probablement sous-expos limage, cest ce qui explique sa densit leve. On propose ainsi comme solution, refaire la photo en ouvrant le diaphragme ou en diminuant la vitesse pour laisser rentrer plus de lumire. Notre but est davoir une exposition idale et au mme temps une image plus proche celle de limage 3D. Donc la rpartition de ces niveaux doit tre la plus homogne possible sur lhistogramme. Pas dcrtage gauche ni droite, une distribution bien rpartie entre un noir absolu et un blanc pur. Donc lgalisation dhistogramme est une solution fortement probable afin dharmoniser la rpartition des niveaux de luminosit de limage de telle manire tendre vers un mme nombre de pixel pour chacun des niveaux de lhistogramme. Une autre solution consiste utiliser au mieux lchelle de niveaux de gris disponible. Cest ltirement. On va donc chercher tendre lhistogramme afin que la valeur de pixel la plus faible soit zro et que la valeur la plus haute soit la valeur 255. Cela permettra une meilleure rpartition des valeurs, daugmenter le contraste dune image. Le filtrage est notamment une des solutions privilgies pour obtenir une meilleure qualit dimage. Dans notre cas, on a nettement constat partir des rsultats de lhistogramme des couleurs que limage full HD amliorer est le sige dune forte variation des valeurs des pixels. Plus prcisment, les filtres non linaires seront trs convenables comme une solution pour attnuer le bruit impulsionnel, ainsi que le rehaussement des discontinuits.
Dautres solutions peuvent tre galement trs utiles pour notre cas, on cite, le contrle de la teinte, saturation, amlioration du contraste, oprations arithmtiques... 4.5. Efficacit des solutions proposes
Pour vrifier la certitude de nos solutions proposes, on a dvelopp sous MATLAB, une fonction ddie la vrification des rsultats obtenus, dune manire objective. On parle ainsi, des mesures de qualit dimage. Dabord lvaluation de la qualit dune image revient estimer le changement de certaines caractristiques de cette image. Ltape dextraction des caractristiques constitue donc ltape la plus importante dans l'tablissement dune mesure de qualit d'images. Actuellement la plupart des valuations de la qualit dimage sont raliss base des mesures robustes afin d'avoir une comparaison objective. Parmi ces mesures on trouve : MSE_ Mean Square Error
Bout de code :
function MSE = MeanSquareError(origImg, distImg)
origImg = double(origImg); distImg = double(distImg);
[M N] = size(origImg); error = origImg - distImg; MSE = sum(sum(error .* error)) / (M * N);
51
PSNR _ Peak Signal to Noise Ratio
Bout de code :
function PSNR = PeakSignaltoNoiseRatio(origImg, distImg)
[M N] = size(origImg); error = origImg - distImg; MSE = sum(sum(error .* error)) / (M * N);
if(MSE > 0) PSNR = 10*log(255*255/MSE) / log(10); else PSNR = 99; end
Diffrence maximale
Bout de code :
function MD = MaximumDifference(origImg, distImg)
error = origImg - distImg;
SSIM_Structural SIMilarity
Bout de code :
function SC = StructuralContent(origImg, distImg)
SC = sum(sum(origImg .* origImg)) / sum(sum(distImg .* distImg));
52
Vrification : Une premire tape consiste alors comparer les valeurs de pixel de notre image capte par lobjectif gauche dune camra stroscopique notre image 2D/HD convertie. Le MSE par exemple reprsentera la moyenne des carrs des erreurs entre nos deux images. L'erreur est la valeur qui diffre limage originale par l'image convertie. Le PSNR est utile pour mesurer la proximit dune image par rapport un autre au niveau du signal, il prend donc en compte la qualit visuelle de reconstruction et peut tre considr comme une mesure objective de la qualit visuelle d'une image. La diffrence maximale est aussi une fonction qui permet de dterminer objectivement la valeur de l'erreur maximale entre deux images distinctes. Et finalement, le SSIM pour Structural SIMilarity, une mesure de similarit entre deux images numriques. Elle a t dveloppe pour mesurer la qualit visuelle d'une image compresse, par rapport l'image originale. L'ide de SSIM est de mesurer la similarit de structure entre les deux images, plutt qu'une diffrence pixel pixel comme le fait par exemple le PSNR. Pour commencer, on a choisi dappliquer quelques modifications sur limage convertie, puis calculer les valeurs des MSE, PSNR, SSIM et finalement la diffrence maximale entre cette image et sa prcdente en 3D. Ltape suivante consiste donc faire une comparaison entre les mesures de qualit de limage convertie et de limage source par rapport notre image en trois dimensions. Si limage convertie prsente plus de similarit avec limage en 3D, alors nos interprtations et surtout les solutions proposes peuvent tre srieusement considres comme des moyens trs efficaces pour : Amliorer considrablement lexprience du client. Eviter la jeunesse de la technologie 3D, le manque de contenu en diffusion comme en vido. Remplacer les produits chers, pas forcment accessibles au plus grand nombre, et surtout, le catalogue de contenus propos entre les chanes de TV et les supports DVD qui reste trs mince. Trouver des solutions pour les nouvelles fonctionnalits aussi fumeuses que prometteuses.
53
Les figures ci-dessous sont le rsultat de plusieurs changements effectus au niveau de lintensit lumineuse, saturation, contraste, rpartition des pixels, affinement dhistogrammes... de limage 2D/HD convertie afin de pouvoir valoriser lefficacit de nos solutions proposes
Figure III.26. : Image source
54
Figure III.27. : Image traite
Figure III.28. : Histogramme des couleurs de limage traite
On comparant le rsultat obtenu avec lhistogramme de limage source Full HD et celui de limage capte par une camra stroscopique, on trouve quil est nettement clair que les
55
variations des intensits de couleur sont plus stables, plus proches aux variations de limage en 3 dimensions quaux celles de limage source.
Figure III.29. : Histogrammes des couleurs de limage en trois dimensions
Figure III.30. : Histogrammes des couleurs de limage Full HD
56
Lanalyse spectrale de limage traite a rvl des rsultats de forte pertinence aux besoins recherchs. Les figures ci-dessous sont le rsultat de cette analyse :
Figure III.31. : Spectre de limage traite lchelle logarithmique
Figure III.32. : Spectre de limage capte par une camra stroscopique
57
Figure III.33. : Spectre de limage Full HD
La dissemblance est observe sur les lignes axiales qui atteignent le centre du spectre, et surtout aux niveaux des extrmits extrieures dont les grains de luminance semblent moins parpills par rapport limage source, cest--dire, la variation lumineuse est moins notable. Mais la chose la plus importante est quon a obtenu deux spectres plus similaires des deux images : une Full HD traite et lautre capte par une camra stroscopique. Cest ce qui prouve de nouveau la fiabilit des solutions proposes. Pour une valuation objective de la qualit dimage, il est ncessaire de dvelopper des mesures quantitatives qui peuvent automatiquement prvoir la qualit perue de limage numrique, notant que les mthodes objectives pour valuer la qualit perceptuelle de l'image ont traditionnellement essay de mesurer la visibilit des erreurs entre une image traite et une image de rfrence.
58
Les rsultats fournis par notre fonction des mesures de qualit dimage sont dcrits ci-dessous :
Mesures de qualit dimage avant
Mesures de qualit dimage aprs traitement
Mesures quantitatives
traitement
MSE
6.2251e+003
5.5806e+003
PSNR
10.1893
10.6640
SSIM
1.0212
1.0785
Diffrence maximale
242
239
Tableau III.1. : Mesures de qualit dimages
Tout dabord, on constate que lMSE, appele aussi erreur quadratique moyenne a abaisse, elle converge vers zro. Sachant que l'erreur est la valeur qui diffre limage capte par lobjectif gauche, par l'image convertie, on assure donc, que le chemin daboutir une image plus proche en qualit celle capte par une camra 3D est plus clair et net. Cette amlioration est affirme par laugmentation de la similarit entre les deux images, explique par laccroissement dSSIM et dPSNR, et par la diminution de la valeur des diffrences maximales. 4.6. Conclusion Dans ce chapitre, nous avons dcrit les principales fonctionnalits de lapplication approuves par quelques imprimes crans afin de donner une ide meilleure sur le travail ralis. Nous avons enfin expliqu les tapes danalyse, ainsi que les solutions proposes et la vrification de leur efficacit.
59
Conclusion gnrale
Conclusion gnrale
Mon stage effectu au sein de lONT sest avr une exprience bnfique, il ma initi la vie professionnelle. Il ma permis mettre en application le savoir acquis durant mes tudes, apprendre conscience de limportance de lesprit lquipe dans une entreprise. Jai eu lopportunit dcouvrir limportance de la communication pour assurer le bon droulement dun projet. En effet, une bonne communication entraine la fois une comprhension et une maitrise rapide des problmatiques poses par le sujet. Par ailleurs, jai appris donner de limportance au moindre dtail. Jai eu lopportunit de mmerger dans la programmation de plusieurs langages, dexploiter au maximum ses bnfices, de comprendre galement les principes de la perception de la profondeur et les besoins de la technologie 3D. Lobjectif que jai fix tout au long de ce stage est de dvelopper une application nomme 3D ANALAZER pour valuer la qualit dune squence vido filmer par une camra Full HD par la mme squence filmer dans des conditions identiques mais capte par une camra stroscopique, afin dexploiter les moyens les plus efficaces et plus comptents pour avoir une qualit visuellement plus proche notre squence de rfrence. Certes, jai rencontr quelques difficults pour raliser mon projet tel que lutilisation des nouveaux outils, la familiarisation avec des nouvelles technologies et la contrainte du temps. Malgr tout a, ma prsence au sein dun groupe de travail ma permis de surmonter toutes ces difficults et de joindre laspect thorique la pratique. Je dois signaler que cette application nest quune premire version et quelle sera le sujet de nombreuses modifications et extensions. Pour cela je propose comme perspectives futures la possibilit de son extension avec les fonctionnalits suivantes : Ajouter des lments graphiques pour afficher plus dinformations afin dassurer une meilleure flexibilit lors de lutilisation. Diversifier les fonctions danalyse pour avoir des rsultats plus robustes. Utiliser des mthodes plus volues pour lexploitation efficace des squences vido.
60
Bibliographie
Philipe Bellaiche, les secret de limage vido , Eyrolles quatrime edition,2002
Netographie
www.telediffusion.net.tn www.mathworks.com www.videohelp.com www.cs.cmu.edu www.developpez.com www.siteduzero.com

Mémoire de Stage de Fin D'etudes

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Mémoire de Stage de Fin D'etudes

Transféré par

Droits d'auteur :

Formats disponibles

Rpublique tunisienne Ministre de lenseignement suprieur, de la recherche scien que

Mmoire de Stage de Fin dEtudes

La Licence Applique en Sciences et Technologie de lInformation et des Communications

Soutenu le 31/05/2013 devant la commission d'examen compose de :

Anne universitaire : 2012-2013

Jadresse mes remerciements M. Mohamed BEN

lhonneur quil ma fait en acceptant de prsider la soutenance de ce projet.

3. Lvolution de la tlvision ...

1. Introduction ... 2. La vision stroscopique ...

3. Les principes de la perception de la profondeur 3.1 Les indicateurs physiologiques .

3.2 Les indicateurs psychologiques

1. Introduction 2. Les langages de programmation ...

3. Interfaces graphiques 4. Les analyses

Liste des figures

Liste des tableaux

Tableau III.1. : Mesures de qualit dimages 59

Facult des sciences de Tunis, 2012-2013

Facult des sciences de Tunis, 2012-2013

Facult des sciences de Tunis, 2012-2013

Flux audio 1 Flux audio 2 Autres flux (sous-titres,..)

Figure I.1. : l'intrieur du conteneur, des flux

Figure I.2. : Principe de fonctionnement dun conteneur AVI

Figure I.3. : Principe de lencodage laide du format MKV

Facult des sciences de Tunis, 2012-2013

Les formats Vido

Facult des sciences de Tunis, 2012-2013

Les formats audio

Facult des sciences de Tunis, 2012-2013

Figure I.4. : Chane de traitement de la tlvision

Facult des sciences de Tunis, 2012-2013

Facult des sciences de Tunis, 2012-2013

Facult des sciences de Tunis, 2012-2013

Facult des sciences de Tunis, 2012-2013

Facult des sciences de Tunis, 2012-2013

4. Les normes d'cran

Facult des sciences de Tunis, 2012-2013

Facult des sciences de Tunis, 2012-2013

Facult des sciences de Tunis, 2012-2013

Facult des sciences de Tunis, 2012-2013

Facult des sciences de Tunis, 2012-2013

3. Les principes de la perception de la profondeur :

3.1. Les indicateurs physiologiques

Facult des sciences de Tunis, 2012-2013

Figure II.1. : Convergence et angles douverture

Figure II.2. : Principe de disparit binoculaire

Les indicateurs psychologiques 3.2.1. Taille de l'image rtinienne

Facult des sciences de Tunis, 2012-2013

Facult des sciences de Tunis, 2012-2013

Facult des sciences de Tunis, 2012-2013

Facult des sciences de Tunis, 2012-2013

2. Les langages de programmation

Facult des sciences de Tunis, 2012-2013

Figure III.1. : Des interfaces graphiques interactives

Facult des sciences de Tunis, 2012-2013

Facult des sciences de Tunis, 2012-2013

Figure III.2. : Fentre de garde de lapplication

Figure III.3. : Deuxime interface graphique

Facult des sciences de Tunis, 2012-2013

Figure III.4. : Chargement de la source de donnes avant la lecture

Figure III.5. : Fentre de lecture dune squence vido

Facult des sciences de Tunis, 2012-2013

Figure III.6. : Rsultats de lanalyse dune squence vido

Facult des sciences de Tunis, 2012-2013

if(MSE > 0) PSNR = 10log(255255/MSE) / log(10); else PSNR = 99; end