Vous êtes sur la page 1sur 2

Dune technologie lautre plus rapidement avec le CRIM !

dveloppement

logiciel g

MPEG-7:
T

un nouveau standard pour le multimdia


lcharger des mgaoctets daudio ou de vido de lInternet, capter une foule de chanes tl et radio numriques ou archiver des centaines de photos de famille font dsormais partie de notre quotidien. lre numrique, on assiste une fulgurante prolifration de contenus multimdias, favorise par la diminution des cots darchivage et lamlioration de la vitesse de transmission dans les rseaux fixes et mobiles. Alors quhier encore, la principale proccupation tait la compression des documents audiovisuels pour en permettre le stockage et lchange, la question qui se pose aujourdhui est la suivante : comment grer toute cette information pour y accder efficacement? De plus, alors que le nombre de documents audiovisuels augmente, les nouvelles applications exigent un traitement et une interprtation de plus en plus pousss de linformation que ces contenus renferment. Lusager de demain ne se contentera plus de rechercher par mots-cls dans une banque de documents. Il voudra, par exemple, retrouver une pice dans ses archives musicales en fredonnant quelques notes du refrain. Il achtera un enregistreur vido numrique lui permettant de filtrer les reportages sportifs de son bulletin tlvis. Ou encore, il sattendra ce que son navigateur Internet bloque le tlchargement de tout document contenu offensant pour ses enfants. Ces applications ncessitent que les systmes analysent et comprennent le contenu du matriel audiovisuel pour y rechercher ou filtrer linformation pertinente.

Description du standard
Cest dans ce contexte que le Moving Picture Experts Group (MPEG) a dvelopp MPEG-7, devenu standard ISO/IEC 15398 lautomne 2001. Cette norme, formellement appele Multimedia Content Description Interface, a t labore collectivement par des centres de recherche universitaires et des joueurs majeurs de lindustrie, dont IBM, Sony et Siemens. la diffrence de ses frres MPEG-1, MPEG-2 et MPEG-4, qui standardisent lencodage mme des documents audiovisuels, MPEG-7 rgit la description de ceux-ci et non pas l'encodage. La navigation, la recherche et le filtrage peuvent donc soprer sur ces descriptions plutt que sur les fichiers sources, ce qui vite de devoir dcompresser ces derniers et de les traiter chaque requte. Une description MPEG-7 est un fichier de mtadonnes dtaillant diffrents aspects du contenu et de la gestion dun document audiovisuel. Par exemple, en ce qui concerne le contenu, on pourra retrouver, dans le fichier de description, des informations sur les caractristiques de bas niveau (couleurs, textures, mouvement, contenu frquentiel, mlodie, etc.) ou des concepts smantiques de plus haut niveau (objets, vnements, interactions entre les objets, lieux de laction, etc.). Les outils MPEG-7 permettent de dcomposer un document audiovisuel en diffrents segments spatiaux, temporels ou spatiotemporels, offrant ainsi plusieurs niveaux de description. On pourra, par exemple, diviser

Alors quhier encore, la principale proccupation tait la compression des documents audiovisuels pour en permettre le stockage et lchange, la question qui se pose aujourdhui est la suivante : comment grer toute cette information pour y accder efficacement?
Par Valrie Gouaillier Agente de recherche Vision et imagerie, R-D, CRIM

44 Dveloppement logiciel

Lusager de demain ne se contentera plus de rechercher par mots-cls dans une banque de documents. Il voudra, par exemple, retrouver une pice dans ses archives musicales en fredonnant quelques notes du refrain. Ou encore, il sattendra ce que son navigateur Internet bloque le tlchargement de tout document contenu offensant pour ses enfants.

un extrait vido en squences et associer une description chacune delles, ou encore dcrire diffrentes parties dune seule image. Les relations entre les divers segments peuvent galement tre exprimes. Linformation relative la gestion des contenus multimdias est aussi assure par un vaste ensemble doutils. Outre les renseignements pertinents aux applications darchivage, tels que les dtails de cration du document audiovisuel (titre, ralisateur, date de cration, etc.), ses paramtres dutilisation (heures de diffusion, prix, droits dauteur, etc.) et son format dencodage, MPEG-7 permet des descriptions plus spcialises. Par exemple, un contenu peut tre dcrit en diffrents niveaux hirarchiques ou squentiels, afin de crer des rsums audiovisuels plus ou moins dtaills. Grce ce type de reprsentation, un usager pourrait demander un systme de ne lui prsenter que les hauts faits dun match sportif, comme les buts marqus. Il est aussi possible de dcrire diverses variations dun document audiovisuel ou encore dlaborer des modles statistiques de linformation. De surcrot, pour permettre dadapter la diffusion aux habitudes de chaque usager, les prfrences de celui-ci et lhistorique dutilisation du contenu peuvent tre consigns dans la description. Cependant, malgr sa grande richesse, MPEG-7 ne standardise que le format de description de toutes ces informations. Il ne spcifie pas comment obtenir ces caractristiques automatiquement partir des documents multimdias, ni comment utiliser les descriptions produites. Ceci laisse pleine latitude lindustrie pour dvelopper des applications novatrices dont linteroprabilit est Exemple de description MPEG-7 (format texte) d'une image.

assure par la reprsentation standard des contenus quoffre MPEG-7.

mesur et exprim en valeurs numriques dans un format spcifi par un descripteur (Color Layout). Afin d'laborer des descriptions complexes, les descripteurs peuvent tre combins selon diffrentes structures appeles schmes de description. Ceux-ci spcifient les relations entre les diffrentes composantes dune description. Ainsi, un extrait musical pourra tre dcompos en diffrents segments temporels dont chacun sera reprsent par des descripteurs, tels que la tonalit (Harmonic Instrument Timbre), et des schmes de description, tels que lenveloppe mlodique (Melody Contour Description Scheme). MPEG-7 comprend des descripteurs et des schmes de description prdfinis. Cependant, le langage de dfinition de description permet de crer de nouveaux schmes de description et, si possible, de nouveaux descripteurs. Il sagit du langage XML Schema, dvelopp par le W3C,
@cclraTIon, no 2 - hiver 2003 45

Structure du standard
Le principal objectif de MPEG-7 est de fournir un cadre normatif de description suffisamment gnrique et flexible pour sappliquer diffrents types de mdias (images, vido, parole, musique, etc.) et convenir un large ventail dapplications. Cest pourquoi ce nouveau standard, trs modulaire, comprend une panoplie doutils lmentaires qui, agencs, permettent de dcrire les contenus diffrents niveaux dabstraction. Les principaux outils sont les descripteurs qui constituent des reprsentations de caractristiques, cest--dire dattributs distinctifs de linformation multimdia. Un descripteur dfinit la syntaxe et la smantique de la reprsentation dune caractristique. Par exemple, la rpartition des couleurs dans une image est un attribut pouvant tre

Vous aimerez peut-être aussi