Vous êtes sur la page 1sur 24

Anne 2012-2013

Projet en Tlvision Numrique :


Spcifications MPEG2 et MPEG4

Ralis par : DIALLA Aicha Fidelia DIOUF Halima Sadya YAPELE Sosthene AFFOGNON Yanick GADJE Saleem LALEYE Romeo SORO Jeremi

Sous la direction de : Dr DIALLO

Spcificits MPEG4
INTRODUCTION

de

MPEG2

et

Le concept du multimdia est trs rcent et illustre merveille lattrait du grand public pour linformatique. Lordinateur est devenu progressivement capable de taper et dditer du texte, dafficher des images de plus en plus ralistes, de produire des sons, de parler et enfin de diffuser de la vido. Avec un tel outil, beaucoup y trouvent leur compte et linformatique prend un ct lud ique et attractif. Ces fonctions multimdias ont t rendues possibles grce cette croissance technologique. En effet la vido est un mdia trs complet car il inclut limage, le son, ventuellement du texte et une notion de synchronisation. Cette industrie a beaucoup volue en trente annes dutilisation domestique. Linvention du magntoscope et la possibilit de stocker chez soi des images quelles quelles soient et mme de crer soi mme sa propre bande vido (les supports taient alors des bandes de vinyle) ont t le dbut de lutilisation de masse des moyens de stockage de la vido. Ainsi la compression vido est un moyen doptimiser la capacit dun support quel quil soit. Le codage repose sur des principes de redondances et sur les capacits limites de lil et de loreille. Quelques astuces sont galement utilises pour rduire le dbit ncessaire pour un confort visuel lors de la visualisation dune vido. Les formats de compression et/ou de codage sont nombreux. Nous nous intresserons pour notre cas aux formats MPEG2 et MPEG4

HISTORIQUE MPEG (Moving Picture Expert Group) est le nom dun groupe de travail de lISO/IEC. Ce groupe fut cre en 1988 avec pour ambition de dfinir des normes de compression, dcompression, codage et manipulation de squences vidos. Le groupe MPEG est compos de plus de 300 experts qui prennent part aux meetings, et de nombreuses personnes supplmentaires qui travaillent effectivement sur les projets du groupe. A ce jour, deux travaux ont vu le jour, un voit sa sortie imminente et deux sont encore en attente (dont un pas encore prcisment dfini). Le premier de ces travaux est le MPEG 1 finalis en 1991. Cette version regroupe cinq recommandations, une recommandation tant un sous-ensemble de cette norme. Par exemple, la recommandation IS-11172-2 spcifie le codage de la vido proprement dite. Le projet suivant est le MPEG2 qui a t termin en 1994 regroupant 9 recommandations. Ce dernier est plus ax sur la diffusion et a t pens en tant que moyen de diffuser efficacement de la vido distance. Il est important de noter dailleurs que toutes les normes MPEG sont compatibles avec leurs prdcesseur, On peut imaginer les diffrentes normes comme des poupes russes sembotant les unes dans les autres.

I.

La norme MPEG2

MPEG2 a t dfinie partiellement en 1994 et regroupe neuf recommandations dont certaines ont t dfinies plus tard. Cette norme a une compatibilit ascendante avec MPEG1 et permet donc de lire des flux MPEG1. Elle a t cre afin de rpondre aux limitations de MPEG1 dont la qualit tait insuffisante pour certains types dapplications. La norme MPEG2 a largi les champs dapplication du MPEG1 tout en offrant des taux de compression meilleurs et des possibilits de contrle de flux. De plus, les formats dentre ont t largis pour pouvoir donner accs des qualits suprieures tout en laissant la possibilit un quipement terminal de faire le tri des informations et de prendre uniquement celles quil est capable dafficher. 1. Les formats dentre SIF (Source Input Format) est un format de vido numrique. Il dcrit la rsolution spatiale et le format dchantillonnage des couleurs. Deux formats ont t dfinis, les formats SIF NTSC et SIF PAL/SECAM (voir figure).

Ces formats sont utiliss comme format dentre pour le MPEG1. Nous remarquons que les composantes de chrominance sont sous chantillonnes par rapport la composante luminance et nous en avons dj expliqu les raisons. MPEG2 permet dutiliser comme format de couleurs en entre 4:4:4, 4:2:2 et 4:1:1 en plus du 4:2:0 du MPEG1. De plus lutilisation des formats CIF et QCIF est possible.

2. Les amliorations du codage Quelques subtilits ont t ajoutes au codage MPEG2. Elles permettent gnralement une plus grande prcision au niveau du codage :

Taille des macroblocs de 16*8 et 16*16 pixels au lieu de 16*16 uniquement La prcision des vecteurs de mouvement passe de un un demi pixel.

Des algorithmes de codage ont t galement optimiss pour pouvoir amliorer la compression :

Table de Huffman amliores Balayage alternatif des pixels des blocs pour le codage.

Dautres amliorations ont galement t apportes mais laspect le plus important du MPEG2 sont les notions de profiles et de codage hirarchique. 3. Le codage hirarchique et les profils a. Le codage hirarchique Lun des principaux problmes li la diffusion de MPEG1 est sa totale absence de contrle de flux. Cest dire quil se contente dtre mis sans se soucier des capacits de lquipement terminal. Le MPEG2 permet un contrle de flux en proposant au niveau de son codage, diffrentes couches : une couche de base avec une qualit restreinte, et une ou plusieurs couches supplmentaires damliorations. Ceci permet davoir plusieurs films vidos transmis dans les mmes trames (suite de bits envoys sur le rseau).Quatre modes de codages hirarchiques sont dfinis par MPEG2. Pour chacun deux il y a une couche de base et une ou plusieurs couches damliorations. Le codage hirarchique temporel La frquence dimage est une composante de la qualit dune vido ; plus la frquence est leve et plus la vido est fluide, stable et donc confortable. MPEG2 permet dans une couche de base de mettre des images qui permettent une frquence rduite et dans les couches damlioration de multiplexer des images supplmentaires pour atteindre une frquence dimage plus confortable. Les images ont toutes les mmes caractristiques. Le codage hirarchique spatial

Cette fois ci la taille de limage est affecte. Les couches de bases fournissent une rsolution minimale alors que dautres couches damliorations permette nt davoir une image plus grande. Le codage hirarchique avec variation du pas de quantification Nous avons vu lors de ltude du codage des blocs que la variation du pas de quantification tait inversement proportionnelle la qualit de limage. Un pas de quantification lev entrane une image de moins bonne qualit. La couche de base est constitue en envoyant les coefficients DCT cods plus grossirement. Partitionnement des donnes prioritaires Cette technique permet de coder limage en sparant les coefficients des blocs selon leur frquence. Les basses frquences font partie de la couche de base et peuvent tre envoyes sur des flux prioritaires. Les coefficients restants sont rpartis sur une ou plusieurs couches damlioration et, lors de leur transmission, peuvent tre assigns des flux non prioritaires. 4. Les profils et les niveaux MPEG2 tant une norme ciblant un large ventail dapplications comme nous le verrons plus tard la dfinition de profiles et de niveaux a permis de rduire la complexit des dcodeurs selon le type dapplication quils concernent. Un profile reprsenterait un ensemble doutils communs plusieurs applications, en fait une structure particulire de MPEG2, alors quun niveau dfinit la qualit de la vido pour chaque profile. Les profils Un profil dfinit un sous-ensemble de la norme MPEG2. En fait, un dcodeur ne peut dcoder un flux de haut profil uniquement que sil est adapt ce profil. Les paramtres variables pour chaque profil sont multiples. Citons par exemples :

Format dchantillonnage des couleurs Support des images B Support du codage hirarchique

Les diffrents profils sont : Le profil simple est destin moins encombrer le codeur et le dcodeur, au dtriment alors du taux de compression. Ici, on nutilise pas la prdiction de type B (Bidirectionnelle).

Le profil Main est un bon compromis Qualit/Taux de Compression , par utilisation des trois types dimages I, P et B. On acquiert cela au prix dun codeur et dun dcodeur plus complexes. Les profils Scalable (Codage hirarchique) sont prvus pour des utilisations ultrieures. Ils permettent de transmettre une image de base (Base Layer) en terme de rsolution spatiale (Sapatially Scalable Profile) ou en terme de quantification (SNR Scalable Profile), ainsi que des informations supplmentaires spares (Enhanced Layer) permettant damliorer les caractristiques de ladite image. Il sagit, par exemple, de la mme mission, en dfinition standard et en HD. Il peut sagir galement dun besoin de rception de qualit acceptable, dans des conditions de rception difficile. Lautre cas de figure concerne un besoin de rception de qualit optimale, au cas o les conditions du milieu sont bonnes. Cela peut concerner, titre dexemple, la Tlvision Numrique Terrestre. Le profil High : il est prvu pour des applications de tldiffusion HDTV (format 4:2:0 ou 4:2:2).

Les niveaux Les niveaux dfinissent les paramtres du flux vido. Plus un niveau est lev et plus limage sera de qualit et visera des applications complexes et exigeantes. Ces paramtres sont :

Nombre de lignes Frquence dimage Nombre de pixels par lignes

Les diffrents niveaux sont : Le niveau bas (Low) correspond la rsolution SIF utilise en MPEG-1. Le niveau principal (Main) correspond la rsolution 4:2:0 normale , (jusqu 720 pxls x 576 pxls). Le niveau haut - 1440 (High 1440) est destin la TVHD (jusqu 1440 x 1152).

Le niveau haut (High) est optimis pour la TVHD (jusqu 1920 x 1152).

5. Exemples dapplications vises par le MPEG2 Les applications vises par MPEG2 sont nombreuses et toutes requirent une qualit dimage variable. La dfinition prcdente des profiles et des niveaux a permit de cibler certains types dapplications exigeants les mmes qualits. a. Le DVD Le DVD, ou Digital Versatile Disc, est un support semblable au CD mais ayant une capacit de stockage suprieure. Ceci est rendu possible grce une gravure plus fine du CD et la prsence de multicouche et de la possibilit de graver les deux faces du disque. Un CD peut contenir 650 Mga-octets de donnes alors quun DVD varie de 4 Giga-octets (DVD couche simple et grav sur une face) 17 Giga-octets (double face, double couche).A ce jour, lindustrie du DVD ROM est encore timide bien que les lecteurs de DVD sont de plus en plus monts en standard dans les PC en remplacement du lecteur CD (la compatibilit ascendante tant assure). Par contre le DVD vido gagne de plus en plus de part de march en remplaant le CDV et les cassettes VHS. Le DVD permet laccs des menus, au choix de la langue, lactivation ventuel du sous-titrage, dautres donnes relatives au film (Bande annonce, tournage du tournage, interview des acteurs, ). De plus, la capacit du DVD est optimise par lemploi de MPEG2 comme norme de compression. b. DVB et HDTV DVB (Digital Vido Broadcasting) est lappellation gnrique des normes de transport de donnes comme la tlvision. Ces normes utilisent MPEG2 comme norme de codage. Les diffrentes normes DVB (DVB-T pour le transport terrestre, DVB-C pour le cble, DVB-S pour le satellite,) ont pour objectif principal la diffusion de vido et plus particulirement de la tlvision haute dfinition ou HDTV. Cette application ntait pas cible au dpart par MPEG2 car la norme MPEG3 ( ne pas confondre avec MP3 qui dsigne le codage audio MPEG1 layer 3) tait cense tre dfinie pour HDTV. Cette norme na pas vu le jour car MPEG2 et ses outils permettaient le transport du HDTV (MPEG3 na donc jamais t dfinie). La tlvision numrique est la tlvision analogique ce que le CD est au vinyle, une amlioration nette de la qualit de limage et un dbut de loffre de service aux abonns. La tlvision par cble, par satellite et autres bouquets numriques sont des illustrations de ces services offerts.

DVB-SI (Service Information) est un service proposant un menu qui permet lutilisateur de naviguer parmi les bouquets proposs par son provider : lEPG (Electronic Programme Guides).

II.

La norme MPEG4

MPEG4, dont la dsignation ISO/IEC sera ISO/IEC 14496, est le plus rcent travail du groupe MPEG. La version 1 a t finalise en octobre 1998 et la version 2 est en cours de compltude.

1. Description et objectifs du MPEG4 MPEG4 est plus quune simple amlioration des gnrations prcdentes, il dfinit une vritable philosophie de la vido en dpassant les concepts de codage et de compression. Le MPEG4, en effet, dfinit la fois une syntaxe du flux vido cod et un ensemble doutils permettant la diffusion de cette v ido sur des rseaux htrognes. Nous allons dcrire cette norme en parlant de ce quelle dfinit et galement de ce quelle ne dfinit pas. a. Notion dobjets mdias Laspect le plus visible du MPEG4 est lintroduction de la notion dobjets mdias. La scne vido est dcompose en objets visuels indpendants, une personne, un meuble, une carte,... et en objets audio comme la voix dune personne, le bruit de moteur dune voiture, De plus ces objets peuvent tre naturels ou synthtiques : ils peuvent provenir dune camra ou dun ordinateur. En fait un mixage est fait entre des sources relles et des sources synthtiques. Ces sources " rapportes " peuvent tre aussi bien en 2D, quen 3D. En plus de dfinir des objets, MPEG4 dfinit une arborescence structurant ces objets en les dcomposant en dautres objets. Une personne pourra tre dcompose en sa voix, son visage, ses mains, et le reste du corps. La scne vido sera donc ainsi dcompose selon une hirarchie de ces mdias objets et selon leur disposition spatiale. MPEG4 permet galement de les manipuler de diffrentes faons et ainsi de rendre interactif la scne vido transmise. On pourra par exemple :

Dmarrer une squence vido en cliquant sur le bouton dun tlviseur. Changer de place un lment. Changer son point de vue de la scne. Changer les proprits dun objet (dimension, couleur,) Etc

Les objets mdia pourront tre identifis et recevoir un code qui leur permettra de ne pas tre rutiliss outrance. On pourra ainsi protger les droits dun auteur sur son objet mdia.

Enfin, des notions de synchronisation absolue et inter objets sont dfinies et envoyes dans ce que nous dfinirons comme des bandes lmentaires de donnes. Des tiquettes temporelles seront utilises afin de crer des units daccs dans les objets. Particularits du systme de transmission Les objets mdias sont cods et transmis sous la forme de paquets de donnes. Ces paquets se situent sur un site distant (un disque, un serveur,) et sont dlivrs via un protocole de tlchargement ressemblant au protocole FTP : DMIF. MPEG4 ne dfinit pas le format sous lequel transiteront ces paquets sur le rseau. En fait, ces considrations sont hors de porte du MPEG4, ce qui fait sa force car cela permet de dfinir une interface gnrique avec le site distant sans se soucier ni du type de rseau employ (ATM, Internet,...), ni du type de format de donnes (MPEG2,). Lapplication locale a accs au site distant de faon transparente travers une interface : DAI. Ceci se fait donc sans prendre en considration le rseau de distribution ce qui permet soit lutilisateur, soit au fournisseur de service de choisir son environnement. Cette couche de paqutisation finale est baptise TransMux et nest pas dfinie par MPEG4 ; elle regroupe des spcificits lies au rseau de transmission et son implmentation est sous la juridiction des organismes grant ces diffrents protocoles. Applications vises

Contrairement au plan dtude du MPEG2, il serait plus judicieux de parler priori des applications cibles par MPEG4 et non pas posteriori. En effet cette norme tant nouvelle, il serait difficile de dcrire les applications qui lutilisent. Nous pouvons essayer de dnombrer les utilisations de MPEG4 en les sparant selon leurs spcificits. Ces spcificits ne sont pas lies la qualit de service, car celle-ci est fonction de lquipement terminal, mais plutt de lutilisation possible du flux vido. Ce flux peut tre en temps rel et ainsi convenir la diffusion dmissions tlvises. Bien sur dautres applications sont galement vises comme la vidophonie qui requiert, comme le tlphone, des notions de synchronisation et de faibles dlais de propagation, la vidoconfrence et, en gnral, tout travail effectu distance en " direct ", comme par exemple un professeur amricain qui donne des cours des lves franais. Les applications peuvent tre interactives, cest dire que lutilisateur peut intervenir dans le flux vido en modifiant les proprits de certains objets mdias ou en dclenchant des vnements en cascade. Les applications dans ce cas sont nombreuses et on peut penser Internet avec de nombreuses opportunits de pages web o au lieu de cliquer sur un lien hypertexte, on cliquerait sur un objet dans une vido pour accder, par exemple une page descriptive de lobjet slectionn. On parle alors dhypermdia. En fait, part pour certains types de transmissions (vers des portables par exemple), beaucoup des applications cibles par MPEG4 seront interactives. Enfin, les applications peuvent tre une simple diffusion de vido entre un oprateur distribuant des films et labonn, mais aussi une connexion entre deux particuliers ou deux sites qui dialoguent entre eux via MPEG4 (vidophonie, visioconfrence,). Pour rsumer, une application utilisant MPEG4 pourra tre :

Interactive (hypermdia) ou non (tlvision, transmission vers des portables,). En temps rel (transmission depuis une source dchantillonnage) ou non (transmission depuis une unit de stockage). Symtrique (Vidophonie) ou non (camra de surveillance, jeux, consultation dinformations).

2. Description dtaille du MPEG4 version 1 Nous allons maintenant tudier sparment les diffrentes parties constituant MPEG4. Nous nous intresserons au codage des informations visuelles et audio puis leur structure en arborescence dans la scne. Puis nous tudierons les

diffrentes couches de protocole de prsentation et de transmission des flux vido. Enfin nous parlerons de la gestion de l'interactivit et des vnements. Les parties suivantes du rapport seront consacre la version 2 de MPEG4 et diffrents exemples de rseaux pouvant tre utiliss pour le transfert de la vido. a. Codage des donnes Le codage est bas sur la notion trs forte dobjets. Lobje t est une volution de linformatique trs importante, en effet beaucoup daspects de linformatique reprennent ce concept :

Les langages orients objets (C++, Perl, Java, ) Les bases de donnes orients objets MPEG4 et les objets vido

Le codage des donnes en MPEG4 diffre selon le type de donnes ; ces donnes peuvent tre : Audio ou vido

Naturelles ou synthtiques Venant dun support (disque) ou dun flux (oprateur) Fixes ou variables au cours du temps 2D ou 3D Etc

Avant de parler de diffrentes techniques de codage, nous allons expliquer comment les donnes sont structures les unes entre les autres, cest dire que nous allons tudier la composition dune scne.

Description de scnes : BIFS BIFS (BInary Format for Scene) est un langage de description qui permet de composer hirarchiquement une scne avec les composants qui la constituent aussi diffrents quils soient (voir plus haut). Il dfinit donc :

Les objets composants la scne sous forme de nuds dun arbre La structure de la scne sous forme dune hirarchie

Les comportements des objets Linteractivit avec ces objets

Le groupe MPEG sest servi du langage de description VRML (Virtual Reality Modeling Language) pour crer BIFS en lui ajoutant des particularits comme la gestion de la 2D et des notions de timing. BIFS permet dobtenir des cocktails dobjets originaux. On pourrait plaquer une texture comme une image en 2D sur une forme gomtrique en 3D, ou mme insrer un objet en 3D sur une image en 2D. Un objet dans une scne a un emplacement physique et un emplacement temporel (il est cod en 4D). Chaque objet possde son propre repre local (i.e. : un repre o il est fixe et o il a les mmes proportions). Ce repre permet de manipuler cet objet dans la scne par rapport au repre dun objet parent. La description dune scne est code et encapsule dans des paquets appels Units dAccs (voir plus loin) de la mme faon que sont encap suls les objets vido et audio cods. BIFS ne contient pas les objets mais juste la description de la scne et les proprits des nuds (donc des objets mdias).

Les nuds dans larbre de description dune scne et les objets mdias finaux (ceux situs sur les feuilles) contiennent des paramtres concernant laspect de lobjet. Cela permet de modifier son comportement de plusieurs faons possibles comme de modifier lchelle dune figure gomtrique, le ton dun son ou de diminuer la qualit dun objet si un systme de codage hirarchique est utilis. Il faut imaginer que les flux contenant les donnes (audio, visuelles) et celle contenant les descripteurs dune scne (BIFS) sont des flux diffrents. Le premier contient lobjet cod et ventuellement des notions de codage hirarchique, alors que le second contient la faon dont les objets sont placs dans une scne et la faon dinteragir avec eux.

Interactions avec la scne Un des points forts de MPEG4 est la possibilit dinteragir avec la scne, toujours en utilisant cette notion dobjet. Il sera possible lutilisateur final de :

Modifier les paramtres dun objet (forme, taille, nettet,)

Dplacer un objet dans la scne Dclencher un vnement

BIFS sinspirant largement de VRML, on y retrouvera des similitudes quant la gestion des vnements. Laction de lutilisateur sur un objet (hypermdia) ou les interactions inter objets font partie de ces spcificits. Deux types dvnements peuvent survenir, chacun entranant un traitement diffrent :

Les vnements clients : qui sont traits en local par lapplication et nont pas besoin du serveur pour modifier la scne en consquence. La scne continue de se drouler en fonction de cet vnement de faon tout fait normale mis part quun vnement est survenu et que donc la scne a t modifie. Un exemple typique dvnement local serait le dplacement dun objet ou la modification dun paramtre dun objet (volume dune piste sonore, taille dun objet visuel, ). Les vnements serveur : qui ont besoin dtre rapports au serveur pour pouvoir tre prise en compte. Lvnement est captur puis code en local avant dtre envoy sur le rseau destination du serveur. Celui ci interprte la requte et excute laction correspondante. Ce type daction serait, par exemple, le dclenchement dune vido dans une tl modlise en 3D, quand on clique sur le bouton de cette tl. Codage visuel

Les objets visuels cods peuvent tre naturels ou synthtiques, en 2D ou en 3D, fixes ou mobiles. Un objet peut tre un personnage se dplaant, un objet fixe dplac un moment donn, Ces objet peuvent tre eux-mmes composs dautres objets (les membres de la personne, sa tte,) et ainsi former une structure hirarchique en arbre. MPEG4 fournit ainsi des outils permettant le codage et la manipulation des objets visuels. La compatibilit avec MPEG 1 & 2 est assure par lacceptation au niveau du codage de lutilisation des images comme unit de codage ; cest dire que le flux vido peut tre cod (et donc dcod) soit selon la mthode MPEG 1 ou 2 (gestion dimage rectangulaire, compensation de mouvement) ou utiliser la notion dobjets, donc de formes remarquables au sein de limage (contour dun personnage, dun objet,). MPEG4 apporte au codage vido des normes de gnration prcdente, des outils permettant damliorer lefficacit du codage. Ces outils dpendent du style dobjet coder et permettent damliorer, dans un flux MPEG4, lefficacit du codage et du dcodage ; un flux MPEG2 sera dcod comme un flux MPEG2 standard. Nous allons donc tudier ces outils un un. Gestion des plans fixes

A ce niveau la compensation de mouvement peut se faire de manire classique (utilisation des macroblocs 8*8 ou 16*16 pixels), et donc tre aussi efficace que MPEG2, ou utiliser des outils propres MPEG4 utilisant les objets anims. Un " sprite "(reprsentation graphique dun objet) statique se retrouvera transmis une seule fois et par la suite, des options de camra (dplacement, zoom) seront transmises pour indiquer un changement. Tout autre objet se dplaant sur ce fond sera, bien sr, cod sparment et se verra appliquer les outils de codage correspondants. Animation des visages Un visage est un lment dune scne vido ne se dplaant pas ou peu mais subissant des dformations (sourire, froncement de sourcil,). MPEG4 fournit un ensemble doutils pour pouvoir interprter un mouvement et gnrer les modifications du sprite correspondant. Il ne sera ainsi plus ncessaire de renvoyer le visage (en fait les macroblocs le composant) mais de dire quelles modifications vont survenir. Nous allons dcomposer le processus de dcodage dun mouvement sur un visage :

Les paramtres de dfinition du visage (FDP) permettent dafficher ou de garder en mmoire un visage ayant une forme gnrique (par exemple la premire expression dun visage ou un visage dit neutre). Ces FDP permettent donc dafficher tout de suite un visage ou dy appliquer immdiatement une modification. Les paramtres danimation du visage (FAP) dfinissent les mouvements survenant sur un visage. Un FAP pourrait dire dlargir le sour ire de 2 centimtres. Les FAP sont ensuite interprts par la table danimation des visages (FAT) qui traduit chaque requte dune FAP en terme de dplacements de points composants le visage. Dans le cas de FAP survenant en mme temps et dont les effets doivent tenir compte les uns des autres, des techniques dinterpolation de visage (FIT) permettent de grer ces dplacements multiples en dcodant le FAP complexe arrivant en plusieurs FAP basiques et en liant leurs effets.

La prise en compte du point de vue Cette technique permet de coder uniquement les parties dun objet 3D qui sont visibles. Ceci dpend bien sr de la gomtrie de lobjet (coordonnes, dimensions,) mais aussi du point de vue considr. En utilisant cette technique, il est possible de ne pas coder les objets qui sont dans lombre dun autre objet.

Les toiles 2D animes Une toile est une faon de grillager une surface 2D en polygones (le plus souvent des triangles). Cette technique est aussi utilise dans la 3D pour dcomposer un objet en une grille de forme gomtrique. Les jeux vidos sont trs friands de ces techniques qui permettent de rduire la complexit dun objet. Cette dcomposition permet dappliquer des modifications sur ces triangles ou sur les points les constituants :

Dplacement de points Modification de la gomtrie Plaquage dune texture

On peut considrer deux types de dcoupage en grille dun image : le dcoupage peut tre arbitraire (en fait gnrique) ou spcifique au contenu de lobjet 2D concern. Lutilisation de loutil de dcomposition en une toile anime a plus dun avantage. En effet il permet la transformation dun codage bitmap (point par point) en un codage vectoriel (selon les proprits gomtriques de lobjet) moins gourmand en place. La compensation de mouvement est galement plus efficace par la prsence de ces vecteurs de dplacement codant la modification de la gomtrie de la figure. Codage audio De manire identique au codage visuel, le codage audio permet de coder la fois des sons naturels et des sons de synthse gnrs par ordinateur. Comme prcdemment des outils de codage seront utiliser (localisation spatiale du son, effets de rverbration, ).Des notions de codage hirarchique sont ajouts au codage audio : un codage hirarchique selon le dbit et un codage hirarchique selon la bande passante. La complexit dun codeur peut ainsi gnrer diffrents flux de donnes selon le niveau de codage hirarchique utilis. Chaque codeur gnre un type de flux que seul un dcodeur de complexit au moins gale peut dcoder.

b. Les profils dans MPEG4 Pour rduire encore la quantit dinformation transitant dans les rseaux, et afin de viser des applications bien spcifiques selon leurs exigences, la notion de profils introduite par MPEG2 a t reprise (pour assurer la descendance) et

largie. Ceci permet donc de spcifier la complexit dun codeur ou dun dcodeur pour pouvoir crer des quipements conformes tel ou tel usage. Les profils dans MPEG4 sont diviss en cinq groupes :

Profils visuels : A ce niveau, cinq profils sont dfinis pour reprsenter les diffrents types dexigences concernant le codage visuel des donnes naturelles, et quatre pour celui des donnes synthtiques ou hybrides. Profils audio : Pour le codage audio, quatre profils ont t introduits, chacun se distinguant du profile infrieur par le nombre doutils implments et donc le dbit vis. Profils graphiques : Trois profils ont t crs pour pouvoir dcrire quels lments graphiques et textuels pourront tre utiliss dans une scne. Un haut profil se distinguera dun profil infrieur par le nombre de fonctionnalits supplmentaires quil supportera. Profils de descripteurs de scne : indique en quatre profils quels sont les types dinformations pouvant constituer une scne MPEG4 : du plus petit profil ne contenant que des donnes audio au plus important prenant en compte la 3D. Profils de descripteurs dobjets : regroupe en un unique profil les outils disponibles pour dcrire un objet (Descripteur dobjet, Couche de synchronisation, IPMP, Information sur le contenu des objets).

Le tableau suivant rsume tous ces profils.

3. Apports du MPEG4 version 2 MPEG 4 version 1 a t finalise en octobre 1998 avant de devenir un standard international quelques mois plus tard. En vue de complter cette norme des outils supplmentaires seront ajouts MPEG4 afin dlargir le champs de ses applications. La norme complte sera baptise MPEG4 version 2 et devrait tre finalise courant 1999. Comme la version 2 reprend toute larchitecture de la version 1 et se contente juste de ltendre en y ajoutant des outils, une compatibilit ascendante sera conserve entre les deux versions.

Nous allons tudier prsent un un tous les apports de la version 2 de MPEG4 par rapport la version 1. Amliorations du codage visuel Voici les diffrents apports de MPEG4 version 2 la version prcdente quant au codage des objets visuels. Amlioration du codage des visuels naturels Des amliorations au niveau du codage et de la rsistance aux erreurs font parties des diffrences avec la version 1. Le codage des vues multiples sera galement possible et permettra de rduire les redondances entre diffrentes vues sur une mme scne. Animation des corps Cette partie vient complter le codage des visages propos par la version 1. Le fonctionnement est similaire au codage des visages grce la dfinition doutils semblables.

Les paramtres de dfinition du corps (BDP) semblable au FDP de lanimation des visages permettent de gnrer un corps de base pour ensuite y appliquer dventuelles transformations. Les paramtres danimation du corps (BAP) semblable au FAP permet de grer les modifications intervenant sur un corps.

Ce standard est dvelopp par MPEG en partenariat avec le VRML Consortium pour pouvoir tablir des standards plus gnraux sur les travaux de VRML Consortium concernant les mouvements humanodes. Codage en maillage des objets en 3D Cet outil supplmentaire permet dtendre aux objets 3D les fonctionnalits dj prsentes pour les objets 2D. Le codage en maillage des objets 3D est ainsi assur, ainsi que de nouveaux types de codage hirarchiques :

Un codage hirarchique en fonction du niveau de dtail : permet aux quipements terminaux moins puissants dafficher une qualit en fonction de leur capacit. Un codage hirarchique spatial permet galement de rduire la qualit daffichage en diminuant la rsolution dun objet.

Amliorations audio Du ct des amliorations audio, citons-en vrac :


Lajout doutils deffets sur les proprits du son comme la spatialisation ou dautres phnomnes acoustiques. Codage audio paramtrique Amliorations de la rsistance aux erreurs Amliorations Systmes

Trois

grandes

amliorations

systmes

seront

apportes

MPEG4.

BIFS avanc BIFS (Binary Format for Scene) a t repris pour tre amlior sur ces diffrents points :

Gestion des multiutilisateurs : il sera dsormais possible plusieurs utilisateurs dinteragir avec le contenu de la mme scne. Amlioration de la gestion des effets sonores : le rendu dun objet audio sera amlior et pourra mieux tenir compte de phnomnes acoustiques comme labsorption sonore de lair, les effets dattnuation ou la localisation spatiale dun son. Animation faciale et corporelle : quelques amliorations qui permettent de dfinir et dutiliser des positions et aspects par dfaut dun corps ou dun visage. Ajout de nouvelles fonctions VRML : ceci afin damliorer la compatibilit entre BIFS et VRML.

Conclusion MPEG4 cible la vido trs faible dbit (VLBV : Very Low Bitrate Video). Pour cela, elle reprend les fonctionnalits de MPEG2 et largit son champ daction. MPEG4 peut ainsi se concevoir comme une bote outils permettant la fois de dcomposer une vido en diffrents types dobjets et de manipuler ces objets avec des outils adquats. En plus de cela, MPEG4 est une norme portable qui lui permettra de saffranchir des contraintes lies aux rseaux. Sa faon de dfinir des interfaces vers certains outils plutt que ces outils eux-mmes la rend trs mallable et nimpose pas ainsi un distributeur de services une seule faon dimplmenter un dcodeur ou un codeur. Lextension de la notion de codage hirarchique introduite par MPEG2 est aussi une rvolution en matire de flexibilit et de rduction de trafic dans les rseaux. Les apports de la version 2 par rapport la version 1 sont nombreux mais nentranent pas de modification de la structure profonde de MPEG4. Les outils ajouts et les amliorations apportes auront plusieurs objectifs :

Accentuer lefficacit du codage audio et vido Accentuer la portabilit et donc les champs daction de MPEG4 Augmenter les contrles derreurs et rduire les problmes de dsquencement Permettre dautres types dutilisation (MPEG-J) Offrir une norme trs moderne et trs puissante

En effet la norme MPEG4 du groupe MPEG (Motion Picture Expert Group) est un trs bon exemple de lavance technologique dans les domaines cits ci-dessus. Cette norme a pour double avantage dtre la fois un champ dapplications multimdias et un moyen de distribuer efficacement linformation. Les travaux du groupe MPEG ont eu des impa cts trs consquents sur lindustrie de la hi-fi et des loisirs et donc sur linformatique en gnral.

Sources : http://www.netmode.ntua.gr/courses/postgraduate/video_communications/docu ments/Profiles_MPEG-2.pdf http://pages.videotron.com/danjean/MPEG-4.html http://www.linternaute.com/hightech/maquestion/video/mpeg.shtml http://www.accessscience.com/studycenter.aspx?main=6&questionID=5218