Vous êtes sur la page 1sur 5

Alexis Parin LP RDBD

Francis Boulet IUT Michel de Montaigne


Isabelle Dubois 23/04/2009

Le MPEG-7

Un standard de description de contenu audiovisuel


Qu’est ce que le Mpeg-7 ?

Le Mpeg-7 est une interface de description de contenu multimédia (ou « Multimédia


Content Description Interface ») développée par le Moving Picture Experts Group et devenue
standard ISO/IEC 15398 en 2001.
Une description Mpeg-7 s’apparente à un dossier de métadonnées correspondant à des
informations précises sur le contenu et les données techniques du ficher.
On peut accéder aux informations issues du Mpeg-7 grâce à un équipement spécifique ou un
logiciel, depuis un ordinateur. Ce format utilisant le langage XML n’est donc pas dédié à une
architecture, à un média particulier, mais permet de standardiser un nouveau moyen de
recherche multimédia et ce pour un très grand nombre d’applications.
On peut établir une description Mpeg-7 d’un fichier Mpeg-2 ou Mpeg-4, mais on peut faire de
même avec un film analogique ou un journal papier. Il s’agit uniquement d’un standard de
représentation du contenu des documents. L’utilisation principale du Mpeg-7 concernera
toutefois principalement les documents multimédias (contenant à la fois de l’audio et de la
vidéo).

Quels sont les objectifs du Mpeg-7 ?

Alors que le Mpeg-2 et le Mpeg-4, des normes d’encodage, résolvaient le problème de


la compression des documents audiovisuels de façon à en permettre le stockage et l’échange,
le Mpeg-7 tente de répondre à la question de la gestion de l’information afin d’y faciliter son
accès. Le MPEG 7 est un système d’encodage de description de contenu qui permet de
décrire de l’information audiovisuelle et multimédia. C’est un standard de représentation du
contenu d’un document. Son ambition est de rendre les informations multimédias aussi faciles
à trouver que le texte l’est aujourd’hui.
En effet, la norme Mpeg-7 décrit les contenus audio et vidéo dans le but de permettre aux
utilisateurs de rechercher, trier, filtrer, parcourir et extraire le contenu de manière efficace.
Chaque description encodée est associée à un contenu précis de la totalité ou d’une partie
d’une vidéo, d’une image ou d’un son. Le Mpeg-7 vise également à établir une structure
d’indexation des documents basée sur leur contenu visuel ou sonore.
Cela permet à l’utilisateur d’accéder à la structure interne des documents audiovisuels.
Par exemple, un utilisateur pourrait demander à un système d’accéder directement aux buts
marqués quand il s’agit un match de football, à un solo de guitare dans le cas d’un morceau de
musique rock. Ainsi, le Mpeg-7 décrit les documents de façon à ce que les équipements ou
ordinateurs puissent effectuer des traitements dans les flots de données audio ou visuelles.
Interopérable avec les principaux standards de métadonnées existants (SMPTE Metadata
Dictionary, Dublin Core, EBU P/Meta…) il est conçu pour permettre l’échange de
métadonnées sur des documents audiovisuels et multimédias.

2
Quels sont les éléments du Mpeg-7 ?

Cette interface de description de contenu multimédia comprend un éventail d’outils


qui s’articulent de façon à permettre une description du contenu à plusieurs degrés et à
différents niveaux d’abstraction.
Les principaux outils sont les Descripteurs (D). Ils se combinent selon différentes
structures pour former des schèmes de description. Le langage de définition de description
XML (LDD) permet de créer de nouveaux Schèmes de description (SD).

Schéma d’organisation des éléments du Mpeg-7

Les descripteurs sont des éléments d’information sur le média (type de fichier,
caractéristiques techniques..), sur la création et production (auteurs…), sur l’usage (droits) et
le contenu visuel (mouvement, texture, forme…) et sonore (timbre, durée, profil…).
Par exemple, le descripteur Color Layout permet d’exprimer la répartition des couleurs dans
une image, mesurée et exprimée en valeurs numériques dans un format spécifié.
L’élément qui permet de repérer et identifier le descripteur est le segment, qui peut s’organiser
en schèmes de description, représentant des relations spatio-temporelles (segment audio,
région immobile 2D, 3D, segment vidéo…), et des entités sémantiques (objet, évènement,
temps, lieu…).
Ainsi, un extrait musical peut être segmenté et chacun de ces segments sera caractérisé par
des descripteurs (par exemple le descripteur Harmonic Instrument Timbre décrit la tonalité),
et par des schèmes de description (par exemple le Melody Contour Description Scheme décrit
l’enveloppe mélodique).

3
Quelles sont les informations contenues dans un document Mpeg-7 ?

Les informations qui apparaîtront dans un document Mpeg-7 seront de 5 natures


différentes, résumées dans le tableau suivant :

Ensemble des éléments Fonctionnalité


Création et production Des méta-informations qui décrivent la création et la
production du contenu, elles décrivent le titre, le créateur,
le but de la création.
Utilisation Des méta-informations reliées à l'utilisation du contenu :
Elles comportent les droits d'accès, des informations
financières, des droits de publication. Ces informations
peuvent faire l'objet de changement durant la durée de vie
du contenu audio-visuel.
Média Ces informations décrivent les caractéristiques de
stockage : Format, éléments pour identifier le média...
Aspects structurels Des descriptions d'un point de vue contenu : Ces
informations décrivent les segments qui peuvent
représenter des composantes spatiales, temporelles ou
spatio-temporelles du contenu audio-visuel. Chaque
segment peut être décrit par les caractéristiques suivantes
(la couleur, la texture, la forme, la motion, d'autres
caractéristiques audio...) et quelques informations
sémantiques élémentaires.
Aspect Conceptuels Des descriptions du contenu audio-visuel d'un point de
vue conceptuel. Ces informations ne sont pas indiquées
dans les documents techniques du standard MPEG, car
elles sont en cours de standardisation.

Quelles sont les applications du Mpeg-7 ?

Il existent trois types d’applications utilisant le standard Mpeg-7 : la consultation de


bases vidéos, les applications utilisant des systèmes de filtrage (par exemple, la télévision « à
la carte ») et les applications spécialisées : le téléachat, l'édition multimédia, etc.

Le Mpeg-7 est par exemple utilisé pour les Guides Electroniques de Programmes qui
proposent aux téléspectateurs de consulter de nombreuses informations textuelles ou
graphiques. Les abonnés peuvent naviguer dans les documents audiovisuels proposés et avoir
accès à l’information de ces documents.

Par ailleurs, l’AFNOR, lors de la journée d’information du 7 juin 2005, cite quelques
programmes et projets qui utilisent la norme de description Mpeg-7 :
•Agir (Ina, Alcatel, Inria…) : prototype d’une station de production de descriptions de
contenus multimédias
•Cuidad (IRCAM) : outils d’indexation automatique de la musique
•Presto (BBC) : plateforme technique pour la conservation des archives de radio et télévision.

4
Quelles sont les limites du Mpeg7?

Pour conclure, la norme Mpeg-7 est d’une grande richesse, mais présente des limites.
Elle ne présente que le format de description des documents mais laisse en suspend le
problème de l’obtention automatique de ces informations à partir des documents multimédias
et ne donne pas d’explication sur la façon d’utiliser les métadonnées produites.
De plus sa complexité peut représenter un obstacle à sa généralisation.