Vous êtes sur la page 1sur 24

DMAM : mdias numriques,

mtadonnes et gestion

par Jean-Nol GOUYET


Ingnieur en techniques numriques Broadcast et multimdia
Ancien charg dtudes la Direction de la Recherche de lInstitut National de lAudiovisuel

1. Objets et objectifs du DMAM............................................................... TE 5 885 2


1.1 Contenu ........................................................................................................ 2
1.2 Contenant ..................................................................................................... 3
1.3 Domaine de la gestion des mdias numriques....................................... 3
2. Mdias et numrique .............................................................................. 4
2.1 De laudio-visuel analogique au numrique et linformatique ............. 4
2.2 Mdias numriques..................................................................................... 6
3. Mtadonnes ............................................................................................. 7
3.1 Exemples de mtadonnes......................................................................... 7
3.2 Types de mtadonnes ............................................................................... 8
3.3 Vers la normalisation................................................................................... 9
4. Environnement tout-numrique & MAM ........................................... 16
4.1 Fonctions dun systme de gestion des mdias numriques.................. 16
4.2 Positionnement dun systme de DMAM .................................................. 17
4.3 Chanes tout-numrique & mtadonnes ................................................. 18
4.4 MPEG-21 ....................................................................................................... 20
5. Conclusion ................................................................................................. 23
Pour en savoir plus ........................................................................................... Doc. TE 5 885

epuis plus de cent ans, le cinma a produit et continue de produire des


D millions de kilomtres de pellicule. La tlvision, depuis la moiti du
20e sicle, gnre des centaines de milliers dheures de programmes audio-
visuels. La radio et lindustrie du disque musical sont aussi dtentrices et
productrices de fonds sonores considrables. Quant aux agences photogra-
phiques, aux muses, ils gnrent des quantits importantes de photos.
Larrive du numrique permet de stocker tous ces mdias sur des supports
informatiques. Mais il est ncessaire de pouvoir retrouver llment recherch
dans une masse de donnes numriques : cest le rle du Digital Media Asset
Management, le DMAM (ou simplement MAM, ou encore DMM), cest--dire la
gestion des mdias audio-vido-photo numriques. Pour assurer cette gestion,
le DMAM met en uvre et contrle une chane de fonctions : Acqurir Analyser
et Indexer Grer les donnes et les processus Rechercher et distribuer. Le
DMAM devient alors un enjeu stratgique pour les socits des mdias, mais
aussi pour les entreprises et les institutions.
Pour cela, des donnes complmentaires, ou mtadonnes, vont tre asso-
cies aux donnes reprsentant les sons ou images, pour les identifier et dcrire
aussi bien le contenu que le contenant (format). Les mdias numriques peuvent
alors tre grs tout au long dun chane de production-distribution numrique.

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 885 1
DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION ___________________________________________________________________________________

Les applications du Digital Media Asset Management se situent aussi bien au


niveau professionnel quinstitutionnel ou grand public :
dans le domaine de la production professionnelle : la gestion des mdias
numriques dans un studio de production audiovisuelle ; la gestion de fonds
darchives audio ou vido numriss ; la recherche dimages fixes dans de gran-
des collections photos ; ...
dans le domaine de la production grand public : la gestion dune collec-
tion personnelle de photos numriques ; la gestion de fichiers de musique MP3 ; ...
la distribution professionnelle de mdias numriques via les bouquets de
tlvision numrique, la tlvision interactive, lInternet ou un Intranet, les tl-
phones multimdias ou les PDA, le DVD, ...
la distribution grand public pour vendre et acheter de la musique en ligne
(par exemple, iTunes Music Store dApple) ; la programmation et la personna-
lisation de sa consommation de tlvision avec le Personal Video Recorder
disque magntique ; ...
Cet article est le premier dune srie de quatre. Il dfinit les objets et objectifs
du Digital Media Asset Management, prsente un panorama des mdias num-
riques, dcrit les mtadonnes associes avec la normalisation en cours, puis
situe les fonctions et le systme de DMAM dans lenvironnement dune chane
tout-numrique de production-distribution de mdias numriques.
Les trois articles suivants dtailleront chaque groupe de fonctions dun sys-
tme DMAM :
Acqurir Analyser et Indexer diter (article [TE 5 887]) ;
Stocker et servir Grer les donnes et mtadonnes Rechercher Grer
les processus (article [TE 5 889]) ;
Distribuer sur rseaux et supports numriques Grer les droits et protger
les mdias numriques Vendre (article [TE 5 891]).
La partie Pour en savoir plus [Doc. TE 5 891] offrira un panorama des produits
actuels de DMAM.
Le texte de la plupart des figures a t conserv en anglais, de manire
faciliter la lecture et lutilisation des normes et standards dont elles sont issues.
La signification des termes principaux est fournie dans le texte de larticle.
Pour le dveloppement des abrviations et acronymes cits dans cet article, le lecteur se
reportera au Pour en savoir plus [Doc. TE 5 885].

1. Objets et objectifs Les mtadonnes (metadata) sont littralement des donnes


relatives des donnes (data about data). Les donnes de mdias
du DMAM tant reprsentes de manire universelle par des 0 et des 1, elles
ne contiennent pas en elles-mmes dlments permettant de les
qualifier, de les identifier et de les reprer. Les mtadonnes ont
donc pour but didentifier, de dcrire, de localiser des documents
Le Digital Media Asset Management (DMAM) gre la fois un
ou parties de documents textuels ou multimdias auxquels elles
contenu (des donnes de mdias numriques et des mtadonnes)
se rattachent, pour permettre un utilisateur de rechercher et de
ainsi quun contenant (des formats).
retrouver ces documents, ainsi que de grer les droits dutilisation
correspondants. Une mtadonne se dfinit comme linformation
permettant de rendre les donnes utiles (information that makes
1.1 Contenu data useful). Des exemples, une typologie et les normes sont
dtaills au paragraphe 3.
Prenons le cas dun fichier informatique stock sur un ordinateur
Les donnes issues de mdias numriques (audio, vido, ima- personnel ou un serveur. Le fichier lui-mme peut contenir du texte,
ges fixes, tltexte, bandeaux de sous-titrage), ou media data, des graphismes, une photo, une squence audio ou vido, ou une
reprsentent leur essence, terme introduit par un groupe de travail combinaison de ces types de donnes. Quand un utilisateur cherche le
EBU/SMPTE [3], de lUnion Europenne de Radio-Tlvision et de la fichier dans un rpertoire, le fichier est prsent dans la liste avec des
Socit amricaine des ingnieurs de tlvision et du cinma. Ces informations telles que : un nom de fichier, sa taille, sa date de cra-
donnes peuvent tre celles dun morceau de musique, dune mis- tion, et son type identifi par lextension (.doc, .jpg, .mpg, etc.). Toutes
sion de tlvision, mais aussi dun simple clip vido, dune courte ces descriptions concernant le fichier sont des attributs, ou mta-
squence sonore, dune photo, ... Le domaine des mdias numri- donnes, requis pour rechercher et retrouver le fichier, et donc utiliser
ques est dcrit au paragraphe 2. les donnes quil contient.

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 885 2 Techniques de lIngnieur
__________________________________________________________________________________ DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION

Pour avoir toute leur utilit, les mtadonnes doivent toujours


tre associes aux donnes quelles dcrivent. Le plus simple est Wrapper
alors de les lier physiquement aux donnes en les incluant dans le
mme fichier ou format. Cest le cas des mtadonnes des pages Content Package Content Item
Web et de certains formats de fichiers multimdias (par exemple :
TIF, PNG, JPEG 2000 pour les images fixes ; MXF pour la vido et Content Item Content Item Content Element
laudio [TE 5 887, 1]). Les mtadonnes peuvent tre aussi gres Content Element Content Element
dans des bases de donnes relies aux fichiers mdias par des
index ([TE 5 889, 2]). Content Element
Quelques informations peuvent tre traites dans certaines cir- Content Element Content Element
constances, soit comme des donnes dessence, soit comme des
mtadonnes.
Content Element
Par exemple, dans un systme de digital media asset management
une squence de phrases cls peut tre utilise pour indexer et dcrire Content Element
le contenu, et devrait tre considre comme des mtadonnes. Mais,
si le mme texte est converti en sous-titres (captions) et insr dans un
Content Package
signal de tlvision pour diffusion, il peut tre considr comme des
donnes dEssence. Content Element
Content Components :
Essence Component (Video)
Le contenu (content) est le terme adopt par le mme groupe de
travail EBU/SMPTE mentionn ci-avant et qui recouvre lensemble Essence Component (Audio)
Essence + Mtadonnes. Essence Component (Other Data)
Metadata Item
Toutefois, de nombreux documents et mme de nouvelles normes
Vital Metadata (e.g. Essence Type)
utilisent pour dsigner lessence des mdias numriques soit encore
le terme contenu (content) comme les normes Dublin Core ( 3.3.2) et Association Metadata (e.g. Timecode)
MPEG-7 ( 3.3.3), soit le terme ressource (resource) comme la norme
MPEG-21 ( 4.4). Cela sera prcis en cas dambigut. Figure 1 Exemples de structure hirarchique de contenu encapsul
dans un wrapper [13]
Enfin le terme asset, contenu dans le titre de cette srie darticles,
est relatif des actifs, des avoirs, que lon peut monnayer. Dans le
contexte du DMAM, il exprime lassociation une essence de droits
dutilisation (rights), prciss par des mtadonnes. 1.3 Domaine de la gestion des mdias
numriques

1.2 Contenant Le concept de Digital Media Asset Management (DMAM), gestion


dactifs audio-visuels numriss ou de fonds multimdias, est n de
la gnralisation de systmes dans lesquels les donnes audio,
Le contenant qui enveloppe le contenu (essence + mtadonnes) vido, textes, etc., sont stockes et utilises sous forme numrique,
regroupe tous les formats informatiques et numriques qui permet- manipules et traites au travers de chanes structures autour de
tent de stocker et de transmettre ce contenu : formats de fichiers, serveurs, de systmes de stockage et de rseaux. Ces donnes
paquets, conteneurs, trames, trains de donnes, ou encore wrapper, immatrielles doivent tre organises, tries, indexes, dcrites,
terme utilis par le groupe de travail EBU/SMPTE [3]. Un contenant, retrouves, enrichies et distribues dans un environnement multi-
en plus denvelopper du contenu, en dfinit et en dcrit la structure. utilisateur.
Ainsi, la hirarchie suivante de structure du contenu, du plus simple En amont, au niveau de la production et post-production, le
au plus complexe (figure 1), a t propose pour le wrapper [13] : DMAM est une technologie dintgration visant :
une composante individuelle dessence ou de mtadonne permettre aux utilisateurs partir de leur ordinateur de stoc-
(Content Component) : par exemple, un bloc dchantillons audio ker, localiser, retrouver, diter, modifier, formater en multiples ver-
ou un mot de Time Code ( 3.1.1) ; sions pour de multiples usages, la fois des lments ou des
produits mdias complets ;
un lment de contenu (Content Element), consistant seule-
relier et harmoniser les traditionnels lots , ou quipements
ment dessence dun seul type, plus toute mtadonne directement
numriques isols, qui se sont dvelopps dans les socits de
relie seulement cette essence. Par exemple, des blocs dchan-
mdias, au lieu davoir une information fragmente et accs
tillons dun signal vido plus les mtadonnes essentielles qui
limit ;
dcrivent la structure dchantillonnage, plus les mtadonnes des-
rationaliser les activits, tout en prservant les lments origi-
criptives qui identifient lorigine du signal. Un Content Element peut
naux utiliss pour composer le produit fini.
ntre exceptionnellement compos que de mtadonnes ;
En aval, le DMAM gre les tches ncessaires la distribution du
un article de contenu (Content Item), consistant en une collec-
produit cr sur de multiples plates-formes :
tion de un ou plusieurs Content Elements, plus toute mtadonne
directement relie au Content Item lui-mme, ou ncessaire pour Internet et Intranet, Extranet ;
associer ensemble les Contents Elements, par exemple dans un clip tlvision numrique et tlvision interactive ;
vido ; DVD, CD, cartouches de jeux vido.
un paquet de contenu (Content Package), consistant en une Cette gestion doit permettre d :
collection de un ou plusieurs Content Items ou Content Elements, augmenter la productivit ;
plus toute mtadonne directement relie au Content Package lui- associer troitement les systmes techniques (serveurs, stoc-
mme ou ncessaire pour associer ensemble les Contents Items et kage, rseaux) et les systmes de gestion de donnes (SGBD) et de
Contents Elements. Par exemple, un programme compos de vido, processus (workflow) ;
plus daudio, plus de sous-titres, plus dune description. automatiser au maximum les tches de fond.

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 885 3
DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION ___________________________________________________________________________________

Digital Content Management & MAM larrive du direct-to-disk (DTD) au dbut des annes 1990 avec
Le terme de Digital Content Management (DCM) est quelquefois laccroissement des capacits de stockage, entranant la disparition
utilis [24]. Il recouvre un domaine plus vaste, incluant : progressive de lusage de la bande magntique ;
les documents papier (ditions, images, fax) ; la puissance des chips ddis DSP (Digital Signal Processing)
les documents sous forme lectronique (messagerie, permettant lamlioration de la qualit du codage audio (de 48
bureautique) ; 96 kHz, de 16 24 bits) et le son multicanal, la fois en musique
les documents publis sur le Web, sur Intranet, Extranet ou avec le SACD et le DVD-Audio, et pour les pistes son du DVD-Video
Internet (grs par le Web Content Management, WCM) ; (AC-3 5.1 7.1, DTS Half et Full Range).
les documents mdias (photos, vido, audio).
Du ct de la radio, la chane de production-distribution, depuis
En outre, il reflte la volont des entreprises de rationaliser et les solutions de reportage mobile, le montage en DTD et la gestion
doptimiser lutilisation du contenu gnr ou acquis (Enterprise de la multidiffusion confie un systme DMAM, devient intgrale-
Content Management, ECM). ment numrique et informatique.
Le terme de Digital Asset Management (DAM) est aussi utilis,
soit dans le sens large du DCM, soit dans le sens plus rduit de la La vido a bnfici des techniques numriques au milieu des
gestion des mdias numriques, DMAM [27]. annes 1970 avec lapparition des premiers quipements numri-
ques en production tlvision (DTBC, correcteur numrique de base
de temps vido ; mmoire numrique de trame ; convertisseur
numrique de standards TV). La norme CCIR 601 (devenue ITU-R
2. Mdias et numrique BT.601) dfinit en 1982 les paramtres de la vido numrique en stu-
dio de production, avec une frquence dchantillonnage leve
(13,5 MHz). Sensuit le dveloppement des magntoscopes numri-
ques professionnels. Mais les capacits de stockage et les dbits de
Ce paragraphe, aprs un bref rappel des principes de la numrisa-
transmission trs levs vont ncessiter ladoption de normes de
tion et de lvolution des mdias vers le numrique (tableau 1), ta-
rduction de dbit dans les annes 1992-1994. Ces techniques de
blit le contour du domaine des mdias numriques.
compression numrique vont permettre, dune part le dveloppe-
ment de magntoscopes numriques moins coteux pour les profes-
sionnels (Digital Betacam, puis DVCPRO ou DVCAM), linstitutionnel
2.1 De laudio-visuel analogique et le grand public (format DV), ainsi que lapparition du DVD-Video, et
dautre part la diffusion de bouquets numriques de programmes de
au numrique et linformatique tlvision ( partir de 1994), puis le streaming vido sur Internet.
loppos, la fin des annes 1990, la publication de normes a permis
le dveloppement de la tlvision haute dfinition, en particulier aux
La numrisation de mdias audio-photo-vido se traduit par une tats-Unis (voir larticle [TE 5 674], rf. [30]).
reprsentation discontinue dans le temps et code par une srie de
nombres de la grandeur physique (par exemple, lumire colore Linformatique fait modestement son apparition dans les studios
dune image capte, ou vibration acoustique dun son). Ce nombre de production vido avec le gnrateur de caractres, ou traite-
constitu de chiffres binaires 0 ou 1 est ensuite traduit en signal ment de texte adapt lcran de tlvision. Puis ce seront les
lectrique 2 niveaux bas ou haut, enregistrable sur une bande stations infographiques, et ensuite les stations de montage
magntique (magntoscope/magntophone numrique, ou enre- virtuel (non-linear editing). Le milieu des annes 1990 voit
gistreur informatique) ou sur un disque magntique ou optique (CD, linsertion progressive de serveurs vido informatiques pour la
DVD). Le numrique permet donc une mme forme de reprsenta- diffusion et la production. Enfin, des enregistreurs informatiques
tion, un codage des images, des sons ou des textes. (DLT, LTO, SDLT) permettent de stocker et darchiver des volumes
Tout processus de numrisation sapparente une mesure et importants de programmes numriss. Tout au long de la chane
comporte trois tapes : production diffusion tlvision un systme dautomatisation
1) lchantillonnage ou frquence (en kHz, ou MHz) de la informatis, et maintenant de DMAM, permet de grer les
mesure des points dimage ou des chantillons sonores ; nombreuses fonctions et processus.
2) la quantification ou comparaison de chaque chantillon
une chelle de mesure, dont on dtermine la prcision en nombre La photo et le film sont les plus anciens des mdias modernes.
de niveaux, qui se traduira par le nombre de bits (binary digits) attri- Bnficiant dune finesse de dtails incomparable (voir
bu par ltape suivante ; larticle [TE 5 674], rf. [30]), ils achvent leur rvolution num-
3) le codage ou reprsentation numrique de la valeur des rique.
chantillons.
La photo satellite a trs tt bnfici des techniques numriques
Le son est le premier mdia avoir franchi ltape du tout-num- pour tre transmise ou analyse. Puis le numrique sest dvelopp
rique, tout dabord dans le domaine du tlphone numrique au dans le domaine de limagerie scientifique et mdicale. Le dvelop-
dbut des annes 1970, puis avec la captation de musique en num- pement des scanners professionnels puis grand public a permis la
rique et sa distribution sur CD-Audio ds 1982. Les premiers ache- numrisation des diapositives et des tirages papier. Mais cest loffre
teurs de CD-Audio scrutaient alors le dos des pochettes pour y dappareils photonumriques, dont la dfinition se rapproche cha-
dcouvrir les trois lettres DDD (pour Digital recording/mixing/maste- que anne de celle de lmulsion photochimique, qui constitue une
ring) qui signifiaient que la captation, la post-production et lenre- tape dcisive dans le passage de la photo au numrique. Et linfor-
gistrement taient intgralement en numrique. Au dbut, la matique permet, avec des logiciels spcifiques, de manipuler, traiter
captation utilisait encore des magntophones multipistes bandes et cataloguer les collections de photos.
magntiques pour stocker les 0 et 1.
Cest dans ltape de la post-production que le numrique a com-
Puis les studios denregistrement et de post-production ont menc simplanter dans lindustrie du cinma pour raliser des
bnfici de : effets spciaux, le rglage des couleurs (talonnage), ... Les
stations de travail informatiques pour le traitement et le mon- premires spcifications du cinma numrique sont proposes en
tage des squences sonores (DAW, Digital Audio Workstation) ; dcembre 2003, soit plus de 20 ans aprs celles de la vido num-
consoles numriques de mlange de voies et de leur facilit rique, conditionnant lapparition de camras et de projecteurs
dautomation accrue ; appropris.

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 885 4 Techniques de lIngnieur
__________________________________________________________________________________ DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION

(0)

Tableau 1 volution des mdias : de lanalogique au numrique et linformatique [26]


Techniques, circuits
Date Audio Vido Photo Film
et systmes numriques
17e s. 1679 : conception du systme
numrique binaire
19e s. 1841 : thorme de lchan- 1826 : 1re image photochimi-
tillonnage (L. Cauchy) que (Niepce)
1854 : logique et algbre binaire 1895 : 1er film (L. & A. Lumire)
(G. Boole)
1875 : multiplex impulsions
codes, MIC (E. Baudot)
1900- 1929 : preuve math. du 1902 : 1re radiodiffusion de la 1927 : 1re transmission dima-
thorme de lchantillonnage voix par ondes hertziennes ges lectroniques TV
(H. Nyquist)
1939 : 1er circuit logique relais
1948 : Bell Labs : 1er systme de
transmission numrique PCM
(C.E. Shannon) Code dtec-
teur-correcteur derreurs
(R.W. Hamming)
1950- 1952 : 1er ordinateur mainframe
tubes IBM
1958 : 1ers ordinateurs transis-
tors
1960- 1960 : 1er mini-ordinateur 1965 : Time Code SMPTE
1962 : 1ers ordinateurs circuits
intgrs
1969 : circuits CCD
1970- 1971 : 1er micro-processeur 1970 : 1re ligne retard numri- 1972 : 1er Digital Time Base Cor- Transmission et traitement
1977 : 1er micro-ordinateur que rector numriques de photos satellites
Apple 1972 : 1er central tlphonique
numrique
1979 : 1re Digital Audio Works-
tation
1980- 1982 : Protocoles Internet TCP/ 1980 : magntophone multi- 1982 : norme CCIR 601 de pro- 1984-1987 : 1ers appareils
IP 1er circuit processeur num- piste numrique DASH duction numrique studio photo-lectroniques
rique de signal, DSP 1982 : CD-Audio 1985 : magntoscope numri-
1988 : rseau numrique RNIS que D1
1989 : Non-Linear Editing
1990- 1990 : CD-R 1994 : norme de radio numri- 1993 : magntoscope Digital 1990 : norme JPEG
1991 : le Web que DAB Betacam 1990 : Adobe Photoshop
1994 : normes de diffusion de 1991 : 1er appareil photonumri-
TV numrique DVB que professionnel
1992 : Photo-CD
1994 : format de fichier dimage
film DPX
1992 : norme MPEG-1
1994 : norme MPEG-2
1994 : 1ers serveurs de production et de diffusion
1995- 1995 : Streaming RealAudio 1998 : DVD-Audio 1995 : Format DV
1997 : MP3.com 1995-1997 : standards HD
1996 : DVD-Video
1998 : norme MPEG-4
1998-2000 : 1ers outils intgrs de Digital Media Asset Management
2000- 2000 : DVD-R/-RW 2001 : Personal Video Recorder 2000-2004 : norme JPEG 2000
2001-2002 : norme MPEG-7 norme MPEG-21
2004 : norme de format de fichier MXF 2004 : spcifications de cinma
numrique

En conclusion, lvolution des mdias de lanalogique au numri- de circuits numriques et de leur miniaturisation, dabord
que (cf. tableau 1) sest donc effectue grce au dveloppement : relais, puis tubes, transistors, et enfin base de circuits intgrs,
de microprocesseurs ou de DSP (Digital Signal Processor), en une
des techniques numriques de base (chantillonnage, codage quarantaine dannes (1939-1982) ;
numrique binaire, modulation par impulsions codes), sur plus de systmes numriques bass sur les machines informati-
dune centaine dannes (1841-1948) ! ; ques (1944-1977) ;

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 885 5
DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION ___________________________________________________________________________________

de normes : communication individuelle ou de groupe : tlphone numri-


en vido SD (Standard Definition), la norme CCIR 601 a t que fixe ou mobile, audioconfrence, ainsi que le son associ en
unificatrice au niveau production. Malheureusement ce na pas visiophonie et vidoconfrence.
t les cas au niveau des formats de magntoscopes numriques
(du D1 au D14 !),
les normes MPEG-1, MPEG-2 et MPEG-4 ont permis la distribu- 2.2.2 Images fixes numriques
tion de laudio et de la vido numriques sur rseaux ou sur sup-
ports numriques. Seul bmol, les formats propritaires de Une image , numrique ou non, un dessin, ou un graphe peut
streaming sur Internet (Microsoft Windows Media, Real Networks, provenir de diffrentes sources.
Apple QuickTime) ;
dquipements professionnels de haut niveau bnficiant des 2.2.2.1 Sources dimages fixes
derniers progrs technologiques et de lvolution des machines
informatiques ; La cartographie : outre les images de la documentation classi-
de la production industrielle dquipements et supports de que, ce sont celles fournies par les satellites dobservation, scientifi-
masse : CD-Audio, CD-R/DVD-R, STB ou Set-Top Box (rcepteur- ques ou militaires, ...
dcodeur numrique), PVR ou Personal Video Recorder, ... Le mdical : les images sont souvent spcifiques tant par la
Cette volution a contribu la gnration de nombreuses formes taille que par la rsolution, les types de supports.
de mdias numriques, dont les principales sont dcrites ci-aprs. Le prpresse : cest un des domaines o les contraintes de qua-
lit sont trs fortes, et o simultanment les quantits dimages sont
grandes.
2.2 Mdias numriques La gestion lectronique de documents : cest un domaine qui
nest pas toujours retenu comme appartenant limage, bien que la
traduction en anglais soit Document Imaging, et que les tapes de
Les mdias numriques concerns par ce document sont tous les traitement (analyse par scanner, compression), ainsi que les con-
objets scripto-audio-visuels reprsents sous forme numrique : traintes de stockage et de transmission soient similaires ;
programme entier de radio ou de tlvision, film, squence sonore exemples : documents financiers, factures, contrats dassurance.
ou visuelle, clip, image fixe ou anime. Les paragraphes suivants en La conception industrielle : images de CAO (conception assiste
dtaillent les diffrentes sources et types, leurs caractristiques par ordinateur), images Postscript.
techniques et formats tant prsents au paragraphe Acqurir de
larticle [TE 5 887]. Linfographie : images de synthse ou virtuelles .
La biomtrie (empreintes digitales, photos didentit...).
La tlsurveillance.
2.2.1 Sons numriques
2.2.2.2 Images fixes et numriques
Les sons numriques sont omniprsents dans les domaines de la
radio-tlvision et du disque, de llectronique grand public, de La premire voie de lapplication du numrique au monde de
linformatique et des tlcommunications. limage fixe a t la possibilit de numriser des images (tirages
La production broadcast et audioprofessionnelle concerne papier, ou diapositives ou ngatifs) par des scanners puis de les trai-
la fois le travail effectu en studio de radio ou de tlvision, et toute la ter par des outils informatiques.
partie cration musicale qui concerne les studios denregistrement. La deuxime voie est celle de la saisie numrique directe de sc-
Le stockage et larchivage de sons numriques : nes relles partir dappareils photonumriques, et leur enregistre-
lenregistrement professionnel sur bande magntique : ment sous forme de fichiers. Cette tape a t rendue possible par
magntophones numriques DASH (Digital Audio Stationary lapparition et lamlioration de capteurs numriques.
Head) et DAT (Digital Audio Tape), ou sur disques magntiques La troisime voie est constitue par la gnration des images de
(par exemple, dans les stations de travail ou les serveurs) ; synthse, cres au dpart sous forme de fichier : images vectoriel-
lenregistrement sur support optique pour distribution : CD- les, graphes crs par des logiciels ddis, plans de CAO, images en
Audio, DVD-Audio, SACD (Super Audio CD), pistes sons des DVD- 2D ou en 3D.
Video ;
Le monde des images fixes est donc trs divers, et cette diversit
lenregistrement grand public sur bande magntique (DCC de
va ncessairement avoir des consquences sur le traitement des
Philips, aujourdhui abandonn) ou disque optique r-
images et plus particulirement sur les techniques numriques de
enregistrable : Mini-Disc MD de Sony, CD-RW ou DVD-RW/+RW ;
codage et de compression.
le stockage numrique de masse : sur bandes ou disques
magntiques, ou disques optiques pour des banques de sons
numriques.
2.2.3 Images animes numriques
La transmission de sons numriques :
la diffusion de radio numrique : DAB (Digital Audio Broadcas-
Les images animes numriques sont omniprsentes dans les
ting) ou DRM (Digital Radio Mondiale), ainsi que les sons mono,
domaines de laudiovisuel, de llectronique grand public, de linfor-
stro ou multicanaux associs aux bouquets numriques de
matique et des tlcommunications.
tlvision DVB (Digital Video Broadcasting) ;
les liaisons de contribution numrique entre les studios avec La production broadcast et vido professionnelle concerne la
possibilit de post-traitement ultrieur (par exemple, le rseau fois le travail effectu en studio de tlvision, et toute la partie cra-
Euroradio de lUER). Les liaisons de distribution primaire entre tion multimdia.
une rgie de diffusion et une station de transmission (station Le stockage et larchivage de vidos numriques :
dmission satellite ou tte de rseau cbl ou metteur hertzien lenregistrement professionnel sur bande magntique, des
terrestre). Les liaisons finales dmission (ou distribution secon- magntoscopes numriques D1 au D15 (en Standard Definition
daire) vers lauditeur ; SD ou en High Definition HD, en format vido numrique
laudio sur Internet : programmes des radios diffuses ou en compress ou non), ou sur disques magntiques (par exemple,
archive, fichiers MP3 ; dans les stations de travail ou les serveurs).

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 885 6 Techniques de lIngnieur
__________________________________________________________________________________ DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION

lenregistrement sur support optique pour distribution : DVD- 3.1 Exemples de mtadonnes
Video.
lenregistrement grand public sur bande magntique D-VHS,
ou disque optique r-enregistrable DVD-RW/+RW, ou disque Le tableau 2 prsente la liste de mtadonnes associes un pro-
magntique de rcepteur-dcodeur-enregistreur (Tivo, Pilotime). gramme de tlvision. Quelques mtadonnes seront ensuite
le stockage numrique de masse : sur bandes ou disques dtailles : une mtadonne de reprage (le Time Code) et des
magntiques, ou disques optiques pour des banques dimages mtadonnes didentification (ISAN et UMID).
(0)

animes numriques.
La transmission de vidos numriques : Tableau 2 Exemple de mtadonnes associes
la diffusion de tlvision numrique : les bouquets numri- un programme de tlvision
ques de tlvision DVB (Digital Video Broadcasting).
Titre
les liaisons de contribution numrique entre les studios avec
possibilit de post-traitement ultrieure (par exemple, le rseau Dates (production/1re diffusion)
Eurovision de lUER). Les liaisons de distribution primaire entre No didentification
une rgie de diffusion et une station de transmission (station
dmission satellite ou tte de rseau cbl ou metteur hertzien Time Code
terrestre). Les liaisons dmission (ou distribution secondaire) Format source (cassette/fichier)
finales vers le tlspectateur.
Pistes audio (+ version langue)
la vido sur Internet : programmes des tlvisions diffuses
ou en archive, squences de banques de vidos. Dure
communication individuelle ou de groupe : visiophone et Droits dexploitation
vidoconfrence.
Description de la qualit technique des images et des sons
Le cinma numrique (D-cinema) dont les premires spcifica-
tions ont t dfinies en 2004. Description du niveau de protection des mineurs ( 10/ 12/ 16/
18 ans)
Description du contenu
2.2.4 Textes associs un mdia numrique lments secondaires (logo, sous-titre...)
lments de tournage (documents Word, Excel, tlcopies, pense-
Dans le cadre de la gestion numrique des mdias, diffrents bte...)
types de textes peuvent tre utiliss, en particulier lors de ltape
danalyse et dindexation, car ils contiennent de nombreuses infor-
mations associs aux mdias :
3.1.1 Time Code
les dossiers de production qui contiennent script, liste des con-
tributeurs (ralisateur, acteurs, ...) ; Lune des premires mtadonnes utilise dans le monde de la
les dossiers juridiques, incluant la liste des ayants droit et les vido, puis de laudio et du film, le code temporel (SMPTE 12M-1999)
contrats ; est un nombre de 90 bits (ou 80 bits) ralisant le reprage de chaque
les conducteurs dantenne, listant tout ce qui est en cours de image vido. Chaque numro comporte :
(0)

diffusion en radio ou en tlvision ;


les programmes radio ou tlvision parus dans la presse sp- Code de Heures Minutes Secondes Images
cialise ou gnraliste ; synchro./
contrle Diz. Unit. Diz. Unit. Diz. Unit. Diz. Unit.
les catalogues des expositions photographiques, des banques
dimages, des banques de sons ; Diz. : dizaine. Unit. : unit.
les articles de presse concernant les missions radio ou tlvi-
sion, les films, les expositions ou collections de photos ;
Le Time Code peut tre :
le tltexte transmis avec certains programmes de tlvision ;
insr dans le signal vido aprs chaque trame dimage, cest
les textes inscrits ou dfilant sur un bandeau au bas de certai- le VITC (Vertical Interval Time Code) ;
nes images vido. enregistr sur une piste de magntoscope paralllement cha-
Ces textes peuvent tre soit sous forme manuscrite ou dactylo- que image, cest le LTC (Longitudinal Time Code) ;
graphie lorigine puis scannriss et numriss avec des logiciels incrust dans limage.
de reconnaissance de caractres (OCR, Optical Character Recogni-
tion), soit directement sous forme de fichier de traitement de texte
ou de gnrateur de caractres vido. 3.1.2 ISAN & Co

De faon similaire au numro ISBN (International Standard Book


Number) qui se trouve inscrit au dos dun ouvrage imprim, norma-
3. Mtadonnes lis ISO 2018 et gr par lInternational Book Agency Berlin, un cer-
tain nombre didentifiants ont t dfinis pour les documents audio,
visuels et multimdias (tableau 3). (0)

titre dexemple, lISAN devrait devenir un numro de rfrence


lments cls de la gestion numrique des mdias numriques, unique pour chaque uvre audiovisuelle, permanent et reconnu
associes aux donnes des mdias (lessence) elles ont t dj lchelle internationale. Luvre audiovisuelle est dfinie comme
dfinies ( 1.1). Ce paragraphe en donne des exemples et prsente une squence dimages lies entre elles, accompagnes ou non de
les diffrentes tendances contribuant leur normalisation. son, et destine tre perue sous forme dimages animes. Les

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 885 7
DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION ___________________________________________________________________________________

Tableau 3 Identifiants duvres multimdias [26]


Identifiant Norme Gestionnaire
ISAN International Standard Audiovisual Number ISO 15706 ISAN Agency Geneva
http://www.isan.org
V-ISAN Identifier for versions of audiovisual works ISO/PWI 20925
ISRC International Standard Recording Code ISO 3901 International Federation of the Phonographic Industry
http://www.ifpi.org/isrc/
ISWC International Standard Musical Work Code ISO 15707 Confdration Internationale des Socits dAuteurs et
Compositeurs Paris
http://www.iswc.org
ISMN International Standard Music Number ISO 10957 International Published Music Agency Berlin

types duvres sont : films longs et courts mtrage, bandes annon-


ces, productions pour la tlvision ou autres modes de diffusion, Basic UMID 32 bytes
films documentaires ducatifs, publicits, enregistrements audiovi-
suels en direct de lvnement (reportages sportifs, journaux tl- Universal label L Inst. No. Material number
viss), uvres composites. Il ny aura pas de numro attribu des 12 bytes 1 byte 3 bytes 16 bytes
lments non audiovisuels : script ; vue fixe tire du film. Lidenti-
fiant V-ISAN concerne les versions dune uvre. V-ISAN peut tre
utilis par le Content Reference Identifier (CRID) du standard TV-Any- Extended UMID (total 64 bytes)
time ( 3.3.4.4).
Basic UMID (32 bytes) Source Pack (32 bytes)
LISAN est un nombre de 16 symboles hexadcimaux (0 9 et A
F) organis en 2 segments : racine de 12 chiffres suivie de 4 chiffres.
Il est inscrit sur les masters puis transfr sur toute copie. LISAN When Where Who
devra aussi tre indiqu dans toute la documentation et sur lembal- Date/Time Alt./Lat./Long. User Info.
lage. Un espace est prvu dans les trains de donnes MPEG-2 et
MPEG-4. Cest uniquement un numro didentification, qui ne four- 8 bytes 12 bytes 12 bytes
nit aucune information dcrivant luvre et nidentifie donc pas les
dtenteurs des droits. Country Org. User code
1 byte = 1 octet 4 bytes 4 bytes 4 bytes

3.1.3 UMID Figure 2 Structure de lUMID [17]

LUMID [17], ou Unique Material Identifier, identifie le matriel ,


la reprsentation physique, et ne renvoie pas son contenu ditorial
(comme le fait lISAN). LUMID est spcifi par le standard UMID
SMPTE 330M-2000. La partie de base identifie une seule unit de
matriel audio-visuel (par exemple, un vido clip), tandis que Vido pour visionnage
lextension permet didentifier chaque unit constitutive, par exem- (communiquent)
ple une image vido ou une trame AES/EBU (2 chantillons audio).
Cameraman Journaliste
Les deux parties (figure 2) comportent sur 64 octets (dont la combi-
naison ne peut tre rpte pour un autre segment du programme) :
un numro de rfrence, suivi dinformations sur la date, lheure,
lemplacement et dautres donnes sur la cration (nom du crateur, (associs par lUMID)
naturellement). Les 10 premiers octets de ltiquette universelle
(Universal Label) sont administrs par la SMPTE [39]. La srie Mtadonnes
Mdia
doctets comprenant le numro de rfrence et les mtadonnes
essentielles reste inchange tout au long de la chane, alors que les
Figure 3 Exemple dutilisation de lUMID [17]
autres mtadonnes concernant le traitement ou la modification des
segments sont ajoutes lors des tapes correspondantes
(SMPTE RP205-2000). Dans les nouveaux quipements de produc-
tion, ces mtadonnes seront gnres automatiquement. 3.2 Types de mtadonnes
Dans la figure 3, un cameraman enregistre une scne, accompagn
dun journaliste quip dun ordinateur portable pouvant communiquer
avec le camescope, qui lui transfre lUMID. Lordinateur portable est Les mtadonnes associes des donnes de mdias peuvent
non seulement utilis pour crer de mtadonnes durant le tournage, tre extrmement diverses, dpendant du domaine dapplication.
mais aussi pour associer la squence vido avec des informations four- Aussi, pour faciliter un travail de normalisation, un groupe de travail
nies pralablement telles que le script ou le plan de travail. Le cames- EBU/SMPTE a propos une classification des mtadonnes en plu-
cope peut aussi transfrer une version bas dbit de dfinition rduite sieurs catgories (tableau 4).
de la squence vido enregistre sur la cassette, pour que le journa- Les mtadonnes pouvant tre alors regroupes en ensembles
liste puisse la visionner et ajouter aux images et/ou aux sons des mta- (sets) de types particuliers, de telle sorte que toute une catgorie de
donnes (annotations textuelles). Bien que la squence vido soit mtadonnes peut tre retrouve avec une seule instruction.
enregistre sur la cassette, et que les mtadonnes soient situes
dans lordinateur portable, ces deux entits sont troitement relies Chacun des types de mtadonnes, dcrit ci-avant, a une ou plu-
par lUMID. sieurs caractristiques (tableau 5).

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 885 8 Techniques de lIngnieur
__________________________________________________________________________________ DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION

(0)

Tableau 4 Catgories EBU/SMPTE de mtadonnes [3]


Catgorie de
Description
mtadonne
Toute information ncessaire pour dcoder lessence.
Essentielle Exemples : identificateur de matriel unique UMID ( 3.1.3), formats vido, formats audio, nombre de canaux audio.

Accs Information pour permettre et contrler laccs lessence.


Exemples : information de copyright ou droit dauteur, information sur les droits daccs.
Information dfinissant des paramtres dtaills de lessence.
Paramtrique Exemples : rglages camra, cadrage et panoramique, colorimtrie.
Information ncessaire pour combiner plusieurs composantes (ex. : clips vido) en une squence ou une structure de
contenant (Content Element, Content Item ou Content Package, figure 1). Ce peut tre aussi une information rensei-
Composition gnant sur lorigine ou la transformation du Contenu.
Exemples : liste de montage (EDL), titre, position de lobjectif camra focale variable ou zoom (pour utilisation en stu-
dio virtuel), listes de transfert, paramtres de correction colorimtrique.
Toute information ncessaire synchroniser et entrelacer diffrentes composantes du Contenu.
Relationnelle Exemples : Time Code ( 3.1.1), Informations Systme (SI) du train de donnes MPEG.
Gospatiale Information concernant la position de la source.

Descriptive Toute information utilise pour le catalogage, la recherche, laccs et ladministration du Contenu.
Exemples : tiquettes, auteur, localisation, date et heure, version, etc.
Autres Exemples : scripts, dfinitions des noms et des formats dautres mtadonnes, mtadonnes propres lutilisateur.

(0)

Tableau 5 Caractristiques des mtadonnes [3]


Caractristique
de la Description
mtadonne
Mtadonne absolument ncessaire au fonctionnement du systme. Le jeu de mtadonnes vitales peut varier avec
Vitale lapplication, mais inclut toujours au moins les mtadonnes essentielles (par exemple, UMID, type dessence de base)
et quelques mtadonnes relationnelles.
Statique Mtadonne relie tout un sous-ensemble du contenu (par exemple, Content Item ou Content Package).
Mtadonne relie une partie du contenu (par exemple, un seul Content Component, un Content Element, ou une
Variable image, ou une scne). La variation sera frquemment lie au timing du contenu, mais peut ltre aussi son indexation.
Mtadonne ncessitant une rptition priodique. Par exemple, pendant un transfert en streaming, permet lutilisa-
Rpte
teur dentrer de faon asynchrone dans le flux et, dans un priode de temps donn, de rcuprer la mtadonne.
Temporaire Quelques types de mtadonnes peuvent tre intentionnellement dtruites aprs usage. Par exemple : contrle de qua-
(transient) lit de service, contrle dquipement, gestion derreurs et contrle de codage.
Permanente Par exemple, des mtadonnes comme lUMID (essentielle) et le Time Code (relationnelle).

tant donn le domaine des deux socits lorigine de linitiative pour le domaine Broadcast, les standards SMPTE et les dve-
EBU et SMPTE, la majorit des mtadonnes proposes ont une loppements EBU P/META et TV-Anytime.
vise dexploitation lie la pratique professionnelle de la produc-
tion-diffusion audiovisuelle et film plutt qu la gestion et la Cependant, un important travail de recherche de compatibilit est
recherche documentaire. Il faut noter que ces socits ont dcid en en cours, pour permettre lchange, limport et lexport de mta-
1999 de rejoindre linitiative ISO MPEG-7, davantage oriente donnes entre divers domaines dapplication.
multimdia ( 3.3.3) afin de normaliser le dictionnaire SMPTE des Avant de dtailler les diverses tentatives de normalisation des
mtadonnes comme un schma de description spcifique leurs mtadonnes, on prsente quelques normes de reprsentation for-
types dusage. melle, ou codage, des mtadonnes.

3.3 Vers la normalisation 3.3.1 Normes de codage des mtadonnes

Les mtadonnes [16] doivent tre exprimes (ou codes) dune


lheure actuelle, la description de contenu multimdia est large- manire normalise pour pouvoir tre lues, recherches et chan-
ment base sur des normes et standards issus de domaines particu- ges par les systmes informatiques, puis tre fournies un utilisa-
liers (tableau 6) : teur. Les mtadonnes peuvent tre enregistres dans une table ou
dans le domaine des bibliothques numriques, le Dublin Core une base de donnes, ou tre places dans un document en HTML
constitue une rfrence importante ; (Hypertext Markup Language langage de balisage hypertexte) ou
dans le domaine du multimdia en gnral, MPEG-7, norme en XML (eXtensible Markup Language langage de balisage
seulement naissante ; extensible).

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 885 9
DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION ___________________________________________________________________________________

(0)

Tableau 6 Initiatives de normalisation des mtadonnes [26]


Norme/ Origine Domaine
Nom Compatibilit
standard Date du dveloppement dapplication
Dublin Core ISO 15836 Online Computer Library Center Bibliothques Descripteurs
Dublin Core Metadata Initiative numriques + pouvant tre
1996 ressources Web intgrs
http://dublincore.org MPEG-7
MPEG-7 ISO/IEC 15938 ISO/MPEG Multimdia
1996/1998 2001/2002
http://www.chiariglione.org/mpeg/standards/mpeg-7/mpeg-7.htm
SMPTE Metadata SMPTE (+ UER) Broadcast Recherche
1996/1998 dintgration
http://www.smpte-org MPEG-7
EBU P/META EBU Chane Broadcast Recherche de
1998 & B-to-B passerelles
http://www.ebu.ch/CMSimages/en/tec_t3295_tcm6-11463.pdf avec SMPTE et
MPEG-7
TV-Anytime TV-Anytime Association Broadcast consumer
1999
http://www.tv-anytime.org

Codage HTML la structure logique du document ; par exemple, chapitres for-


Des mtadonnes simples peuvent facilement tre codes en ms de sections, etc. ;
HTML. des renseignements supplmentaires (appels attributs, ou
caractristiques) concernant les lments ; par exemple, identifica-
Un exemple de mtadonne simple, conforme la norme Dublin teurs, horodatage, etc.
Core, DC ( 3.3.2) qui pourrait tre contenue dans len-tte HTML de la Les DTD jouent le mme rle que les schmas, qui eux sont
page daccueil du Muse virtuel du Canada : davantage utiliss.
<meta name = "dc.title" content = "Muse virtuel du Canada">
Une application de mtadonnes peut faire rfrence un espace
Cette mtadonne indique que le titre de la ressource est Muse
de noms, identifi par une adresse Internet URL, qui donne des
virtuel du Canada . dtails sur les schmas de mtadonnes utiliss dans une applica-
HTML convient bien pour le codage de mtadonnes simples. Il tion particulire. Par exemple, au dbut dun enregistrement de
permet aussi un codage limit de mtadonnes plus complexes mtadonnes Dublin Core dans RDF, il peut y avoir une dclaration
mais le rsultat est souvent ambigu sur le plan smantique car il est despace de noms telle que :
impossible dexprimer clairement les relations entre les divers l- <xmlns:dc = http://purl.org/dc/elements/1.1/>
ments de mtadonnes. Cette dclaration indique que les lments qui suivent provien-
nent de lespace de noms dc (Dublin Core). Un analyseur qui lira
Codage XML lenregistrement de mtadonnes saura donc o trouver linforma-
XML est employ avec davantage de succs pour le codage de tion sur la smantique des lments de cet enregistrement.
donnes ou de mtadonnes complexes et hautement structures Souvent, une application de mtadonnes particulire requiert
(par exemple, figure 8 et figure 20). Le World Wide Web Consor- des lments de mtadonnes propres une discipline ou des voca-
tium, W3C [41], a mis au point une application XML appele RDF bulaires contrls, en plus des lments gnraux. Une application
(Resource Description Framework, ou cadre de description de res- de mtadonnes qui rsulte de la combinaison et de la rutilisation
sources) qui permet de coder de manire smantiquement non de diffrents ensembles dlments de mtadonnes est parfois
ambigu des mtadonnes structures. RDF est souvent employ appele profil dapplication.
pour le codage de mtadonnes qualifies Dublin Core et dautres
mtadonnes structures complexes. Codage KLV
KLV, signifiant Key-Length-Value, est un protocole de codage des
Schmas et DTD donnes (figure 4), et donc aussi de mtadonnes, standardis par
Le codage de mtadonnes en RDF laide de XML permet aux la SMPTE (336M). La cl (key) est une srie de bits unique indiquant
ralisateurs de publier des ensembles dlments de mtadonnes le type de donnes qui suivent (audio, vido, EDL, UMID, ...) ; elle est
sous forme de schmas dans des registres de mtadonnes. Le conforme un Digital Object Identifier (DOI) dfini par lISO, dans ce
schma est une combinaison systmatique et ordonne dlments, cas lUniversal Label de la SMPTE (298M). La longueur (length) cor-
qui constitue un ensemble de rgles dencodage de linformation respond au nombre doctets des donnes du champ suivant. La
destine une communaut prcise dutilisateurs. Lexistence de valeur (value), est le terme dsignant les donnes ou mtadonnes
registres de mtadonnes favorise la rutilisation et le partage de elles-mmes.
schmas de mtadonnes entre divers groupes, et donc linterop-
rabilit. Exemples : DC, SMPTE Registry [39], ... Key (type)
Dans certaines applications, on utilise une dfinition de type de
document (DTD). La DTD est une description formelle des compo- Valeurs donnes audio,
santes dun document ou dune catgorie de documents. Elle fournit K L V K L V K L K L V
video, metadata
une syntaxe formelle employe pour le traitement (analyse) auto-
KLV block
matique de documents crits en XML. Une DTD comprend :
les conteneurs ou lments qui constituent le document ; par Length (nombre doctets de donnes)
exemple, paragraphes, en-ttes, lments de liste, figures, tableaux,
etc. ; Figure 4 Codage KLV de donnes [35]

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 885 10 Techniques de lIngnieur
__________________________________________________________________________________ DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION

3.3.2 Dublin Core


Extraction des
Norme de description Moteur de recherche
caractristiques
Le Dublin Core est une initiative lance par OCLC (Online Compu- (Description standart) (Identification engine)
(Analysis engine)
ter Library Center), organisme priv dchange et de traduction de
donnes bibliographiques situ Dublin, Ohio, tats-Unis. La
Champ de MPEG-7
norme Dublin Core (DC) est la norme relative aux mtadonnes la (Boundaries of MPEG-7)
plus utilise pour la recherche de ressources [16]. Mise au point
dans le contexte des bibliothques numriques avec accs par le Figure 5 Champ de MPEG-7 [11]
Web par la Dublin Core Metadata Initiative [43], forum ouvert com-
pos de personnes de disciplines varies et de toutes les rgions du
monde, elle se veut facile utiliser et suffisamment gnrale pour 3.3.3.1 Termes et dfinitions
tre pertinente quelle que soit la discipline. Cette norme dfinit les MPEG-7 offre un ensemble complet doutils de description (Des-
catgories dinformation enregistrer propos dune ressource cription Tools), que sont les lments de mtadonnes, leur struc-
(page Web, document ou image) pour que cette ressource puisse ture et leurs relations, dfinis par la norme sous forme de
tre trouve. Elle a t approuve comme norme ISO sous le descripteurs (Descriptors) et de schmas de description (Description
numro 15836. Schemes).
Le Dublin Core Metadata Element Set (DCMES) se compose de Les donnes : elles reprsentent lensemble des informations
15 lments conus pour une recherche simple (tableau 7). Cepen- indexes par MPEG-7. Elles seront de prfrence des mdias num-
dant, dans certaines applications, il peut tre ncessaire de prciser riques disponibles sous nimporte quel format (MPEG, ...), mais peu-
la signification des mtadonnes de la norme DC grce un modle vent tre dune autre nature, textuelles par exemple.
appel Qualified Dublin Core, laide de qualificatifs ou de schmas Les caractristiques (features), ou attributs des informations
de codage. indexer permettant de les dcrire, pouvant avoir un sens pour cer-
tains utilisateurs ou pour certaines applications. Cela peut tre la
La norme DC ne prtend pas couvrir tous les besoins potentiels de couleur ou la texture dune image, la catgorie dune mission, le
tous les utilisateurs. Elle peut se rvler insuffisante pour des appli- titre ou le ralisateur dun film, le compositeur dune chanson, le
cations qui vont au-del des recherches simples de documents. Tou- rythme dune musique, etc.
tefois, elle offre de nombreuses qualits : cest un format Le descripteur (descriptor, D) est un modle permettant
relativement simple et qui peut tre tendu ; il a une reconnaissance dassocier une valeur codifie (ou un ensemble de valeurs) une ou
et un support larges et internationaux ; il a prouv tre utile pour plusieurs caractristiques, pour une mme donne. Par exemple,
chercher et retrouver ; sa structure lui permet dtre utilise directe- lattribut nom aura comme descripteur le nom de lauteur, qui
ment dans les sites Web et dans les bases de donnes ; il est main- pourrait tre John Erwing, et se prsentera ainsi de manire
tenu et dvelopp dans un environnement stable. informatique : (name : string). Un autre exemple est un histo-
Lobjectif vis est que des groupes dutilisateurs se servent de la gramme de couleurs.
norme DC comme dun noyau et quils mettent au point leurs pro- La valeur de la description (descriptor value, DV) : ce sont les
pres extensions en fonction des besoins de leur discipline ou de leur diffrentes instances possibles dun descripteur pour un ensemble
tablissement. En pratique, les choses se font souvent dans lautre (ou sous-ensemble) de donnes.
sens. Une application utilise une norme propre une discipline pour Le schma de description (description scheme, DS) : cest un
documenter et grer une collection, puis extrait un sous-ensemble modle de plus haut niveau dfinissant une structure et une
de ses enregistrements qui correspond aux lments de la norme smantique pour les descripteurs et les relations entre descripteurs.
Dublin Core. Ces enregistrements conformes la norme Dublin On peut lassimiler une sorte de formulaire dont les champs
Core peuvent servir des fins dchange de donnes et de recher- seraient les descripteurs. Par exemple, schmas de description de
ches simples. Divers groupes de travail sur la norme DC travaillent journal tlvis, de retransmission sportive, de varits.
llaboration densembles dlments propres une discipline afin Le langage de dfinition des descriptions (description defini-
de complter les lments du noyau. Des essais ont t raliss tion language, DDL) de MPEG-7. Cest le mtalangage qui spcifie et
pour les sons [23] et les images animes [9]. exprime les descripteurs et schmas de description. Cest cela
lenjeu proprement dit de la norme, car il va prescrire ce que lon est
capable ou pas de faire avec MPEG-7, ce qui aura t prvu comme
structure de schmas de description.
3.3.3 MPEG-7
Grce ces trois niveaux (DDL, DS, D) est gnre une descrip-
tion, la description proprement dite dun document donn (la
Le Moving Pictures Experts Group MPEG [36] a dabord dfini des notice ), ou une liste de mots cls avec Time Code, ou un guide
normes de codage et de compression du signal audio et vido lectronique de programmes dun bouquet de tlvision numri-
MPEG-1, MPEG-2 et MPEG-4 (cf. [TE 5 360], rf. [28]) destines la que.
reproduction des contenus. Contenus dsigne ici photos, graphi-
ques, modles 3D, vido, audio (paroles, musique, sons de Les schmas de description multimdia (DS) (0)

synthse, ...) et correspond lessence dans le langage SMPTE ( Ce sont des structures de mtadonnes dcrivant et annotant le
1.1). MPEG sest ensuite attach, ds fin 1996 (lappel propositions, contenu (essence) audiovisuel. Ils sont dfinis avec le langage DDL,
call for proposals, datant doctobre 1998), lidentification de ces bas sur le XML Schema Language [TE 5 887, 1], et peuvent
contenus. Cest lobjet de la norme MPEG-7 [11] [29] auparavant sexprimer sous forme textuelle (pour diter, rechercher, filtrer) ou
appele Multimedia Content Description Interface (figure 5), dont la sous forme compresse binaire (pour stockage et transmission). Ils
version finale a t publie lautomne 2001 et 2002. sont principalement conus pour dcrire des caractristiques de
haut niveau des zones, segments, objets, vnements, et dautres
Une description MPEG-7 peut vivre indpendamment du contenu mtadonnes permanentes relies (figure 6) :
dcrit, et elle est indpendante du codage et du format du contenu. des lments de base : outils et types de donnes ;
MPEG-7 veut enrichir la description textuelle des contenus par : la description du contenu (essence) :
aspects structurels des composantes spatiales, temporelles ou
des approches permettant lindexation automatique ; spatio-temporelles du contenu (transition de scne, segmentation
des approches permettant denrichir une description textuelle dune image en zones, suivi de mouvement par zone). Les
dlments perceptifs lis au contenu . segments peuvent ensuite tre dcrits plus finement sur la base

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 885 11
DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION ___________________________________________________________________________________

Tableau 7 lments de description du Dublin Core [20]


Contenu (Content)
Titre (title) Le nom donn la ressource.
Typiquement le nom par lequel la ressource est officiellement connue.
Sujet et mots cls (subject) Le sujet du contenu de la ressource.
Typiquement, le sujet sera dcrit par un ensemble de mots cls ou de phrases ou un code de classification qui prcisent le sujet
de la ressource. Lutilisation de vocabulaires contrls et de schmas formels de classification est encourage.
Description (description) Une description du contenu de la ressource.
Elle peut contenir, mais ce nest pas limitatif : un rsum, une table des matires, une rfrence une reprsentation graphique
du contenu, ou un texte libre sur le contenu.
Type (type) La nature ou le genre du contenu de la ressource.
Type inclut des termes dcrivant des catgories, fonctions ou genres gnraux pour le contenu ou des niveaux dagrgation. Il est
recommand de choisir la valeur du type dans une liste de vocabulaire contrl (par exemple, la liste de Types du Dublin Core (1).
Pour dcrire la matrialisation physique ou numrique de la ressource, il faut utiliser llment Format.
Source (source) Une rfrence une ressource partir de laquelle la ressource a t drive.
(Par exemple une version PDF dun roman peut avoir un lment source contenant un numro ISBN correspondant la version
physique du livre partir de laquelle la version PDF a t ralise.)
La ressource actuelle peut avoir t drive dune autre ressource source, en totalit ou en partie. Il est recommand de rfrencer
cette source par une chane de caractres ou un nombre conforme un systme formel didentification.
Relation (relation) Une rfrence une autre ressource qui a un rapport avec cette ressource.
Cet lment permet dexprimer les relations formelles entre des ressources qui existent aussi en temps que ressources indpen-
dantes. Par exemple, une dition dune uvre (IsVersionOf), sa traduction (IsBasdOn), un chapitre dun livre (IsPartOf), ou la tra-
duction automatique de donnes en une image (IsFormatOf).
Il est recommand de rfrencer cette ressource par une chane de caractres ou un numro conforme un systme formel
didentification.
Couverture (coverage) La porte ou la couverture spatio-temporelle de la ressource.
La couverture typiquement inclut une position gographique (le nom dun lieu ou ses coordonnes), une priode de temps
(un nom de priode, une date ou un intervalle de temps) ou une juridiction (telle que le nom dune entit administrative). Il est
recommand de choisir la valeur de Couverture dans un vocabulaire contrl (par exemple, un thsaurus de noms
gographiques, comme le Getty Thesaurus of Geographic Names (5) et, quand cela est appropri, des noms de lieux ou de
priodes plutt que des identifiants numriques tels que des coordonnes ou des intervalles de dates.
Proprit intellectuelle (Intellectual Property)
Crateur (creator) Lentit principalement responsable de la cration du contenu de la ressource.
Des exemples de Crateur incluent une personne, une organisation, ou un service. Typiquement, un nom du Crateur
(par exemple, auteur dun document ou artiste/photographe dune ressource visuelle) devrait tre utilis pour dsigner cette
entit.
diteur (publisher) Lentit responsable de la diffusion de la ressource, dans sa forme actuelle, telle quun dpartement universitaire, une entreprise.
Des exemples dditeurs incluent une personne, une organisation ou un service. Typiquement, le nom dune maison ddition
devrait tre utilis ici.
Contributeur (contributor) Une entit qui a contribu la cration du contenu de la ressource.
Des exemples de Contributeur incluent une personne, une organisation, ou un service. Typiquement, le nom dun contributeur
(par exemple : traducteur, illustrateur) devrait tre utilis ici pour dsigner lentit.
Gestion des droits (rights) Information sur les droits lis la ressource.
Typiquement, un lment Droits contiendra un tat du droit grer une ressource, ou la rfrence un service fournissant cette
information. Ces droits souvent couvrent les droits de proprit intellectuelle (IPR), Copyright, et divers droits de proprit. Si ll-
ment Droits est absent, aucune hypothse ne peut tre faite sur ltat de ces droits, ou de tout autre, par rapport la ressource.
Matrialisation (Instantiation ou Version)
Date (date) Une date associe avec un vnement dans le cycle de vie de la ressource.
Typiquement, une date sera associe la cration ou la publication dune ressource. Il est fortement recommand dencoder la
valeur de la date en utilisant le format dfini par lISO 8601 (6) sous la forme AAAA-MM-JJ.
Format (format) La matrialisation physique ou numrique de la ressource.
Typiquement, Format peut inclure le mdia ou les dimensions de la ressource. Format peut tre utilis pour prciser le logiciel, le
matriel ou autre quipement ncessaire pour afficher ou faire fonctionner la ressource.
Des exemples de dimensions incluent la taille et la dure. Il est recommand de choisir la valeur du format dans une liste de voca-
bulaire contrl (par exemple, la liste des types de mdia dfinis sur Internet (7).
Identifiant de la ressource Une rfrence non ambigu la ressource dans un contexte donn.
(identifier) Il est recommand didentifier la ressource par une chane de caractres ou un nombre conforme un systme formel
didentification.
Des exemples de systmes formels didentification incluent le Uniform Resource Identifier (URI) qui inclut le Uniform Resource
Locator (URL), le Digital Object Identifier (DOI) et lInternational Standard Book Number (ISBN).
Langue (language) Langue du contenu intellectuel de la ressource.
Il est recommand dutiliser comme valeur de llment Langue celle dfinie par la RFC 3066 (2) qui comprend un code de langage
deux caractres venant du standard ISO 639 (3), ventuellement suivi dun code deux lettres pour le pays venant du standard
ISO 3166 (4).
Par exemple, en pour langlais, fr pour le franais, ou en-uk pour langlais utilis au Royaume-Uni.
(1) DCMI Type Vocabulary. DCMI Recommendation 11 July 2000. (5) Getty Thesaurus of Geographic Names.
http://dublincore.org/documents/dcmi-type-vocabulary/ http://www.getty.edu/research/conducting_research/vocabularies/tgn/
(2) Tags for the Identification of Languages, Internet RFC 3066. index.html
http://www.ietf.org/rfc/rfc3066.txt (6) Date and Time Formats, W3C Note.
(3) ISO 639-2 Codes for the representation of names of languages. http://www.w3.org/TR/NOTE-datetime
http://www.loc.gov/standards/iso639-2/langhome.html (7) Internet Media Types.
(4) ISO 3166 Codes pour la reprsentation des noms de pays. http://www.isi.edu/in-notes/iana/assignments/media-types/media-types
http://www.univ-paris12.fr/~sirius/iso3166.html

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 885 12 Techniques de lIngnieur
__________________________________________________________________________________ DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION

Interactivit
Organisation du contenu Collections Modles utilisateur

Navigation Prfrences
Cration et et accs utilisateur
production
Rsums
Gestion
Mdia du contenu Usage Historique
utilisateur
Description Vues
du contenu

Aspects Aspects Variations


structurels smantiques

lments de base

Outils Types de donnes Liens et localisation Outils


schmas de base du mdia de base
Figure 6 Applications des schmas
de description MPEG-7 [11]

de caractristiques perceptuelles de bas niveau (couleurs, textu- Il reste alors reprsenter la structure segmentaire et les mta-
res, formes, mouvements, timbre du son, description de la donnes avec un langage tel que XML (figure 8 les traits verti-
mlodie, ...) et dune information smantique (annotations tex- caux gauche ont t rajouts pour expliciter la correspondance
tuelles), entre la structure de la reprsentation en XML et celle de la
aspects conceptuels et smantiques de la ralit capture squence vido).
par le contenu, avec des objets, des vnements, des concepts
Toutefois, le dcoupage hirarchique prdtermin na rien duni-
abstraits et des relations ;
versel. Ainsi, les notions de scne et de squence sont loin dtre
la gestion du contenu (essence) :
communment acceptes. Quant aux notions de plan et dimage, si
information de cration : titre, annotation textuelle, crateur, elles ont un fondement objectif, elles ne reprsentent pas forcment
lieux et dates ; information de classification en catgories (genre, des units de description pertinentes.
sujet, objectif, langue, ...) ; information concernant lexistence de
matriels du mme contenu,
3.3.3.2 Descripteurs MPEG-7
information du support de stockage : format, codage et
compression ; identification du master et de ses diffrentes ver- Les descripteurs MPEG-7 sont principalement conus pour
sions (Media Profiles), dcrire des caractristiques audio ou visuelles au niveau physique
information dusage du contenu : pointeurs vers les droits (indiques comme tant de bas niveau dabstraction ) telles que
dutilisation, historique de lutilisation, information financire ; couleur, texture, mouvement, nergie audio, etc., aussi bien que des
lorganisation du contenu (essence) : collections de contenu attributs du contenu audio-visuel, de lessence (indiqus alors
audio-visuel, segments, vnements, et/ou objets ; comme tant de plus haut niveau dabstraction ) tels que lieu,
la navigation et laccs : le butinage efficace du contenu temps, qualit, etc. On espre que la plupart des descripteurs physi-
(essence) laide de rsums, partitions et dcompositions (seg- ques, de bas niveau, puissent tre extraits automatiquement.
ments spatiaux, temporels ou frquentiels), versions du matriel
audio-visuel ; Descripteurs visuels
linteraction avec lutilisateur : prfrences, historique dutili- Les descripteurs visuels sont bass sur des caractristiques
sation. visuelles permettant de mesurer la similarit entre des images ou
MPEG-7 doit permettre dassocier des descripteurs un docu- des vidos.
ment structur. On peut les classer en :
Par exemple, on modlise un document multimdia compos outils de description gnriques :
daudio et de vido (figure 7). On peut dfinir la vido en squen- lments de base (utiliss par les autres descripteurs visuels) :
ces, elles-mmes dfinies en scnes, dfinies en plans, puis en grille (grid layout), sries temporelles (time series), vues 2D dun
images dfinies en objets. chaque segment sera associe une objet 3D, coordonnes spatiales 2D, interpolation temporelle,
balise structurelle (tag). descripteurs de couleur : espace des couleurs, quantification de
On peut attacher chaque niveau de dcoupage des lments couleur, couleur dominante, histogramme de couleur dans
de description, par exemple des champs de la description apparte- lespace HSV (Hue, Saturation, Value), distribution spatiale des cou-
nant la Dublin Core, DC (rectangles colors ou griss de la leurs, structure des couleurs (similaire un histogramme par blocs
figure 7). Ainsi, on va dire quune scne a un type, un identifiant, de 8 8 pixels), couleur dun groupe dimages vido ou fixes,
une description, une longueur, un temps minimale, un temps descripteurs de texture : texture homogne (fonctions de
maximal, un format et une relation dautres lments. Outre les Gabor), texture homogne (simplifi) pour recherche, texture non
champs de type Dublin Core, on peut aussi associer des descrip- homogne (distribution spatiale de 5 types dartes),
teurs physiques dfinis par MPEG-7 (cf. 3.3.3.2) extraits si possi- descripteurs de forme : rgion, contour, forme 3D,
ble automatiquement (rectangles en tiret de la figure 7). Ainsi au descripteurs de mouvement (pour la vido) : mouvement de
niveau objet, on lui associera une position, une forme, une cou- camra, trajectoire dun objet, mouvement paramtrique, degr
leur, une texture, ... dactivit,

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 885 13
DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION ___________________________________________________________________________________

DC. Titre
DC. Crateur
DC. Sujet DC. Type
DC. diteur DC. Identifiant
DC. Description DC. Description
DC. Contributeur DC. Sujet
DC. Date DC. Contributeur. Prsentateur
Document DC. Type DC. Format. Dure
multimdia DC. Format DC. Couverture. T. min
DC. Identifiant DC. Couverture. T. max
DC. Source DC. Relation. Parties
DC. Langue Descripteurs
Audio Vido DC. Relation. Parties MPEG-7
DC. Droits
Texte
DC. Type Script
DC. Identifiant Transcription
Piste Piste effets
Piste parole Squence 1 Squence 2 Squence 3 etc. DC. Description Liste de montage EDL
musique sonores
DC. Format. Dure + Images cls
DC. Couverture. t. dbut Localisation
Partition Liste DC. Couverture. t. fin Distribution acteurs
Liste des DC. Relation. Parties Objets scne
Code MIDI des effets Scne 1.1 Scne 1.2 Scne 1.3 etc.
phonmes
Tempo sonores
Texte
Script
Plan 1.1.1 Plan 1.1.2 Plan 1.1.3 DC. Type Transcription
DC. Identifiant Liste de montage EDL
DC. Description Image cl
DC. Format. Dure + Distance camra
Image 1 Image 120 DC. Couverture. t. dbut Angle camra
DC. Couverture. t. fin Mouvement camra
DC. Relation. Parties clairage
Ouverture en fondu
Objet 1 Objet 2 Objet 3
Fermeture en fondu

DC. Type Texte


DC. Type Texte DC. Identifiant Image
Code temporel
DC. Identifiant + Position DC. Description + Couleur
DC. Description Forme DC. Format. Type
Trajectoire DC. Relation. Parties Texte annotation
Vitesse Position annotation
Couleur
Descripteurs Texture
MPEG-7 Volume
Texte annotation
Position annotation

Figure 7 Exemple de structure et de descripteurs dun document audiovisuel MPEG-7 [9]

descripteurs de localisation : de zones dimage, spatio- On le voit, ltendue des domaines couverts par les schmas de
temporelle ; description et les descripteurs MPEG-7 est trs vaste. Cependant, elle
outils de description de plus haut niveau, spcifiques une nest pas uniformment explore : les descripteurs du signal numri-
application, telle que la reconnaissance de visages. Une image de que audio ou visuel, utiliss par exemple pour des recherches par
visage normalise de 56 lignes 56 valeurs dintensit/ligne, les similarit [TE 5 889, 3] font lobjet de la plus grande attention au
yeux tant positionns la 16e et 31e colonne de la 24e ligne, est dtriment des descripteurs du contenu (essence). Or, ces derniers
analyse. On en extrait des valeurs de luminance de pixels, qui sont pourtant, dun point de vue archivistique, les plus importants.
seront ensuite utilises pour la reconnaissance de visages. Cette disproportion sexplique par le fait que les experts chargs de la
normalisation taient essentiellement les reprsentants de la com-
Descripteurs audio munaut MPEG, lorigine des spcialistes du traitement du signal,
Les descripteurs audio sont bass sur des caractristiques per- de la reconnaissance de forme et de la vision artificielle.
mettant de mesurer la similarit entre des sons, tels que la musique
et la parole.
3.3.4 Broadcast & standards de mtadonnes
On peut les classer en :
outils de description gnriques, qui incluent un groupe de Comme rsultat du Groupe de travail EBU/SMPTE Task Force sur
descripteurs de bas niveau pour des caractristiques audio, appel lharmonisation des standards pour lchange des programmes
le MPEG-7 Audio Framework (figure 9) ; sous forme de flux binaires [3], des dveloppements pour la norma-
outils de description de plus haut niveau assurant les fonction- lisation des mtadonnes dans le domaine de laudiovisuel, et en
nalits suivantes : particulier de la radio-tlvision, ont t effectus par divers
description de signature audio, dcrivant le profil spectral acteurs :
(spectral flatness), le Comit Technique de la SMPTE, dans le domaine de la pro-
description du timbre (identification, recherche et filtrage) duction des programmes ;
bas sur les descripteurs de timbre dinstrument harmonique ou le groupe P/META de lUER dans les domaines des changes
percussion, Business-to-Business entre socits de production ou de
recherche de mlodie, Broadcast ;
reconnaissance et indexation gnrales de sons, le consortium TV-Anytime dans le domaine Broadcaster-to-
description de la parole. Consumer.

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 885 14 Techniques de lIngnieur
__________________________________________________________________________________ DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION

3.3.4.1 SMPTE metadata


<Mpeg7>
La SMPTE [38] [39] qui travaille pour les acteurs du Broadcast et
<DescriptionMetadata></ DescriptionMetadata>
du cinma, a cr :
<Description xsi:type=ContentEntity>
<MultimediaContent xsi:type=VideoType> un Dictionnaire des mtadonnes, MDD (Metadata Dictionary),
<Video id= video_example>
SMPTE 335M-2001 et RP210.4-2002 [19]. La structure du dictionnaire
dfinit le format des lments des mtadonnes groups en classes
<MediaInformation></ MediaInformation>
(tableau 4) ; classes auxquelles on en a rajout une pour les mta-
<TemporalDecomposition gap=false overlap=false> donnes enregistres par des organisations (Organisational registe-
<VideoSegment id=VS1> red) et une usage exprimental (Experimental) ;
<MediaTime> un registre densembles de mtadonnes, Sets Registry, dfi-
<MediaTimePoint> nissant des groupes reconnus dlments de donnes pour le stoc-
T00:00:00</ MediaTimePoint> kage ou les changes. Il dcrit lobjectif du processus et la structure
<MediaDuration>PT2M</ MediaDuration> des sets qui peuvent tre utiliss pour supporter tous les sets de
</MediaTime>
transaction requis pour lchange de mtadonnes [38].
<VisualDescriptor xsi:type=GoFGoPColorType La SMPTE utilise le protocole de codage de donnes KLV, Key-
aggregation=average> Length-Value (SMPTE 336M-2001, figure 4) comme structure des
<ScalableColor numOfCoef=8 lments de donnes et des ensembles de mtadonnes (sets). Elle
numOfBitplanesDicarded=0>
en cre aussi une reprsentation XML.
<Coeff>1 2 3 4 5 6 7 8</Coeff>
</Scalablecolor> 3.3.4.2 EBU P/META
</VisualDescriptor>
P/META, dvelopp par lUER [33] [2] [7] [8] [22], se veut un stan-
</VideoSegment> dard universel pour les changes de mtadonnes entre socits et
<VideoSegment id=VS2> professionnels des mdias. Un ensemble de dfinitions de caract-
<MediaTime> ristiques des programmes a t dvelopp. Cest un dictionnaire de
<MediaTimePoint>T00:02:00 mtadonnes ncessaires lchange business-to-business (B2B),
</MediaTimePoint> alors que celui du SMPTE vise lchange system-to-system. Il doit
permettre la squence doprations ayant lieu lors dune transac-
<MediaDuration>PT2M</ MediaDuration>
tion, en sassurant que diffrents broadcasters utilisent les mmes
</MediaTime> dfinitions. Les sous-catgories de cet ensemble de caractristiques
<VisualDescriptor xsi: type=GoFGoPColorType concernent : lidentification, les informations de production, les
aggregation=average> informations contractuelles de base, les informations de description
<ScalableColor numOfCoef=8 du programme lui-mme, les informations techniques de formats
numOfBitplanesDicarded=0> de production et de distribution. Les mtadonnes peuvent tre
codes en XML ou KLV.
<Coeff>8 7 6 5 4 3 2 1</Coeff>
</ScalableColor> Une extension de P/META inclut les donnes du domaine profes-
</VisualDescriptor> sionnel requises par le domaine du consommateur selon les sp-
</VideoSegment> cifications de TV-Anytime (figure 10).
</TemporalDecomposition>
</Video> 3.3.4.3 MXF Geneva Scheme
</MultimediaContent>
MXF est un format permettant lencapsulation et le transfert de
</Description>
fichiers [TE 5 887, 1], dvelopp et soutenu par le Pro-MPEG Forum
</Mpeg7> [35] [37], la SMPTE et lUER. Il utilise par dfaut un des ensembles
ou jeux (sets) de mtadonnes descriptives, appel Geneva
Figure 8 Exemple de description MPEG-7 de squences vido en Scheme. Ces sets (tableau 8) sont dfinis sous forme de tableaux
XML [12] incluant pour chaque mtadonne une rfrence au dictionnaire de
mtadonnes de la SMPTE. MXF est cod en KLV mais les mta-
donnes peuvent tre traduites et reprsentes en XML.
Un nouveau set peut tre ajout cette table, si il est compatible
Silence Description avec le standard SMPTE 359M-2001 (Television and Motion-Pictures
Dynamic Documents).
Timbral Spectral
Timbral Temporal Harmonic Spectral Centroid Description
Log Attack Time Description Harmonic Spectral Deviation Description
Temporal Centroid Description 3.3.4.4 TV-Anytime
Harmonic Spectral Spread Description
Harmonic Spectral Variation Description
Spectral Centroid Description Le Forum TV-Anytime [40] a t form en septembre 1999 et ras-
Basic Spectral semble une soixantaine de membres : des fabricants dlectronique
Audio Spectrum Envelope Description
Audio Spectrum Centroid Description Spectral Basic grand public, des oprateurs et fabricants de tlcoms, des broad-
Audio Spectrum Spread Description Audio Spectrum Basis Description casters, des crateurs de contenu, des fournisseurs de service. Il
Audio Spectrum Flatness Description Audio Spectrum Projection Description encourage le dveloppement de services pour les utilisateurs de la
tlvision et du multimdia exploitant une grande capacit de stoc-
Basic Signal Parameters kage sur les plates-formes de type PDR (Personal Digital Recorder).
Audio Waveform Description Audio Harmonicity Description Il vise la cration de normes ouvertes, compatibles, permettant
Audio Power Description Audio Fundamental Frequency Description des systmes intgrs depuis les crateurs de contenu, puis la dis-
tribution, jusquaux consommateurs (figure 11 a), avec voie de
Figure 9 Descripteurs de lAudio Framework [11] retour (figure 11 b).

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 885 15
DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION ___________________________________________________________________________________

Content Distributors

Third Parties
Interactive
Metadata Resolving
application
Applications authority
developers
Ancillary services

Content
Usage & Programme Internet
Creators
Rights aggregators Service Consumers
Production
Manager Internet publisher
inc. pre/post

B2B B2C

Archives Programme Broadcast


Database aggregators Interactive TV
Management Broadcast Service publisher
Figure10 ModledefluxdedonnesP/META
(+ Content Distributor de TV-Anytime) [7]

(0)
(mappings) entre les travaux de MPEG-7, de la SMPTE, etc. Un dic-
Tableau 8 Sets de mtadonnes descriptives Geneva tionnaire commun serait bien sr lidal, mais semble extrmement
Scheme MXF [35] difficile raliser. Par ailleurs, il est essentiel de dvelopper des
outils traduisant KLV en XML et vice-versa.
Set Name Set Name
Production Collection Scripting
Scene Collection Shot (plan) 4. Environnement tout-
Clip Collection Key Points (points cls)
numrique & MAM
Titles (titres) Participant
Group Contacts list
Le contenu (donnes de mdias + mtadonnes) doit tre mani-
Branding (nom gnrique) Person pulable et utilisable. Cest le rle du systme de Digital Media Asset
Identification Organization Management, dont les fonctions sont prcises ci-aprs. Mais ce
contenu nest grable quau sein de chanes tout-numriques, dont
Episode Location (lieux) quelques modles darchitecture sont ensuite proposs.
Event (vnement) Address
Publication Communications
Award (prix) Contract 4.1 Fonctions dun systme de gestion
Captions Description (sous-titres) Rights (droits) des mdias numriques
Annotation Image Format
Classification Device parameters (quipe- Le schma de principe dun systme de recherche de documents
ments) audio-vido numriques permet dillustrer les diffrentes fonctions
quaura grer, ou avec lesquelles aura collaborer un systme de
Setting Period Name-Value DMAM (figure 13).
1. leur arrive dans la chane, les sources audio/vido (cassettes/
Exemples dapplications : visionnage dune mission en diffr, disques, liaisons de contribution, ...) sont numrises et stockes
enregistrement dun programme de tlvision tout en regardant un dans un serveur de mdias diffrents niveaux de qualit (en ter-
autre, accs dun contenu la demande. mes de dbit, de dfinition selon lusage vis : consultation ou
Cela implique un schma de description et de rfrencement du browsing, archivage, distribution).
contenu (essence), la gestion des mtadonnes et la gestion des 2. Paralllement, un processus danalyse manuelle et automati-
droits [4] [5]. que a lieu fournissant des mtadonnes : donnes textuelles
TV-Anytime utilise un DDL MPEG-7 ( 3.3.3.1) pour dcrire la (mots-cls, rsums, ...), descripteurs (de colorimtrie de texture, de
structure des mtadonnes et XML pour les coder. formes, de visages, de mouvements, de mlodie, hauteur de son,
...) ; mais aussi textes (issus de sous-titres, du tltexte, de lcran
de la transcription de la bande son, ...), images-cls, rsums
3.3.5 Vers une compatibilit ? visuels, ... Tous ces index sont stocks dans une base de donnes
gre par un systme de gestion SGBD.
Le MPEG-7 Integration Group [14] a t form pour proposer un 3. Un traitement des media assets peut consister dans lassem-
cadre permettant linteroprabilit entre les systmes de mta- blage (editing) et le reformatage du contenu pour une distribution
donnes (figure 12). Cela passe par un dictionnaire de termes et de ultrieure : sur le Web, en tlvision interactive ou sur support auto-
dfinitions au sein de chaque schma, ainsi que par des passerelles nome (CD, DVD).

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 885 16 Techniques de lIngnieur
__________________________________________________________________________________ DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION

Metadata Content Content Service Network PDR Consumer


Actors Creator Provider Provider Provider
Original Descriptive Advanced Service Copyright Content
descriptive information applications, EPG management management management
information Content format Content in PDR Storage (bookmarking etc.)
Input Creator IPR Content management Location and management Descriptive
referencing in PDR Access criteria Billing Information
Copyright Payment models Payment
protection Billing User preferences
Payment models Security Usage history

(a) Metadata and Content Referencing

Descriptive Copyright Descriptive


information management information
Applications PDR storage Content format
EPG management Content managt
Output Copyright managt Payment models Payment models
Service managt Usage history
Content referencing Content reference
Security Security

Target PDR PDR PDR


Actors
Storage Consuming
Related Content Creation & Packaging Delivery, Capture Management Viewing
Processes

Metadata PDR Consumer


Actors
User profiles Content
Storage management
management (bookmarking, etc.)
Input Payment
Interactivity
User profiles

(b) Metadata

User profiles Content


Payments management
Storage Bookmarks
Output management User Profile
Interactivity
Usage History

Target Service Provider Other consumers


Actors

Figure 11 Systme de mtadonnes TV-Anytime avec voie de retour [40]

4. Lors dune interrogation, le systme au travers dun serveur grer les processus [TE 5 889, 4] ;
Web prsente une interface dinterrogation. Lutilisateur prcise les distribuer [TE 5 891, 1] ;
divers paramtres de sa recherche, qui sont ensuite traits par le grer et protger les droits associs [TE 5 891, 2] ;
systme et affins interactivement avec lutilisateur. Celui-ci obtient
une liste de rsultats qui, aprs slection finale, dclenchera la dis- vendre [TE 5 891, 3].
tribution du contenu souhait partir du serveur mdia.
5. Paralllement, des fonctions de contrle daccs de gestion des
droits et de commerce lectronique assurent une transaction 4.2 Positionnement dun systme
scurise et lgale avec le client.
de DMAM
Le processus de base dune gestion dassets recouvre donc et
relie les fonctions suivantes, qui seront dtailles dans chacun des
paragraphes des trois articles suivants de cette srie : Tout systme tout-numrique peut se reprsenter avec un modle
acqurir [TE 5 887, 1] ; avec plusieurs plans (figure 14) :
analyser et indexer [TE 5 887, 2] ;
diter [TE 5 887, 3] ; 1) celui des contenants , cest celui de la plate-forme com-
stocker et servir [TE 5 889, 1] ; portant les quipements et les logiciels :
grer les donnes et mtadonnes [TE 5 889, 2] ; des serveurs avec leur systme dexploitation et leurs applica-
rechercher [TE 5 889, 3] ; tifs [TE 5 889, 1],

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 885 17
DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION ___________________________________________________________________________________

4) celui du workflow ([TE 5 889, 4]), interface logicielle et gra-


phique permettant de programmer et de suivre la ralisation des dif-
frentes tches.
Le DMAM nest donc pas un systme indpendant ; il interagit sur
diffrents plans avec de nombreux autres systmes et modules logi-
ciels (SGBD, ...).

MPEG-7 SMPTE
Schema library dictionary
4.3 Chanes tout-numrique
& mtadonnes
Dublin
Core entities
4.3.1 Chane de tlvision
List of semantic
definitions
Pour lessentiel, la production tlvisuelle se subdivise en activi-
TV-Anytime ts, reprsentes dans le modle de la figure 15 comme des blocs
Internal
harmonization rpartis sur lensemble du premier plan vertical (vido). Dautres
blocs quivalents sont placs sur chacun des plans verticaux sui-
Etc. vants, savoir laudio, les donnes et les mtadonnes. Les activits
rattaches au plan vertical sont traverses par quatre couches de
communication horizontales, savoir applications, rseau, liaison
de donnes et couche physique. Un plan de commande et de con-
trle sous-tend ces deux ensembles de couches et plans orthogo-
naux, auxquels il est rattach.
Figure 12 Processus dintgration des mtadonnes [14]
Activits
des rseaux pour leur interconnexion et limport/export, avec Les activits reprsentent en fait les diffrentes tapes de la
les protocoles ; production : pr-production, acquisition, production, puis post-
production, distribution, stockage, transmission et archivage. Ces
2) celui du Contenu , comprenant lEssence (media data
sept activits peuvent tre utilises pour modliser pratiquement
daudio, de vido, ...) et les Mtadonnes associes ;
tout ce qui ressort du domaine de la production-distribution tl-
3) celui du systme de DMAM et de ses diverses fonctions ( visuelle. Il va sans dire que ces dfinitions seront diffrentes si, par
4.1), qui gre le contenu sur la plate-forme de niveau 1, via des exemple, elles concernent des actualits plutt quune srie tl-
modules logiciels tels que le SGBD ([TE 5 889, 2]), le HSM vise (sitcom), mais en rgle gnrale, elles sappliqueront toutes
([TE 5 889, 1]), modules dautomatisation ; les situations de production.
Serveur de mdia

Audio/Vido
non compresse
Source Media Distribution du contenu
Acquisition A/V
audio/ Distribution
Accs conditionnel et gestion des droits
Compression

(+ numrisation) compresse assets


vido

Rponse
la requte
Edit
Serveur Web

Analyse Traitement Prsentation Prcision


& SGBD requte requte requte
indexation Mtadonnes

Entre
requte

Traitement
Acquisition Gestion des donnes Requte et Distribution Utilisateurs
du mdia

Figure 13 Systme de mdias numriques & fonctions MAM [1]

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 885 18 Techniques de lIngnieur
__________________________________________________________________________________ DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION

Workflow
4

Acqurir-Indexer-
Acqu rir-Indexer-diter/Stocker-G
diter/Stocker-Grer-Rechercher/S
rer-Rechercher/Scuriser-Distribuer-Vendre
curiser-Distribuer-Vendre
Acqurir-Indexer-diter/Stocker-Grer-Rechercher/Scuriser-Distribuer-Vendre
Digital media
Media Asset Management
3

Mtadonnes
tadonnes
Mtadonn es
Contenu

Donnes mdia

HSM SGBD Modules automatisation

Plateforme (matriel + logiciel)


1

Figure 14 Modle dun systme tout-numrique et positionnement du DMAM [26]

Plan mtadonnes

Plan donnes

Plan audio

Plan vido
Applications
communication

Post-production

Transmission
Pr-production

Rseau
et mission
production
Couches

Distribution
Saisie et

Archivage
Stockage

Liaison donnes
Physique

Activits
Plan commande et contrle

Figure 15 Modle de systme Broadcast tout-numrique [21]

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 885 19
DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION ___________________________________________________________________________________

Essence et mtadonnes
Quelques
Consommation Distribution
Les plans verticaux du modle sont au nombre de quatre et con- mtadonnes
cernent le contenu (essence + mtadonnes). limines
Distribution
Le premier est lessence vido, terme faisant exclusivement rf-
rence aux flux binaires vido. De mme, lessence audio ne con- Quelques
Consommation Packaging mtadonnes
cerne que les flux sonores. Lessence donnes reprsente
linformation ayant une valeur intrinsque. Elle se distingue de limines
lessence vido et de lessence audio. Ainsi, le tltexte et le sys-
tme dincrustation de lgendes (technique de sous-titrage en Interaction Composition
temps rel utilis principalement dans les pays dots de systmes
de tlvision analogique 525 lignes) sont-ils considrs comme Stockage
tant de lessence donnes, puisquil sagit dinformations significa-
tives en tant que telles.
Commande Synthse
Viennent enfin les mtadonnes, qui nont aucune valeur en soi.
Elles sont lies dune manire ou dune autre aux essences vido,
audio et donnes. Le code horaire (Time Code) est un bon exemple
de mtadonnes. Pris indpendamment, il na aucune valeur, mais laboration Analyse
associ la trame vido, il permet son identification et son reprage.
Acquisition
Couches de communication
Production Post-production
Le modle de la figure 15 est recoup transversalement par plu-
sieurs couches de communication reprsentes par des plans hori- Flux de mtadonnes Flux dessence
zontaux. Ces couches de communication ressemblent la pile du
modle de rfrence sept couches OSI (Open Systems Intercon- Figure 16 Flux Essence et mtadonnes [6]
nection) de lISO. Quatre couches ont sembl suffisantes pour repr-
senter des installations ou un systme de tlvision. La premire
couche en commenant par le bas est la couche physique, qui con-
4.3.2 Chane de cinma numrique
cerne les caractristiques lectriques et mcaniques du systme, ou
la connectique. La suivante est la couche de la liaison des donnes,
qui concerne les protocoles reliant les dispositifs directement con- La SMPTE [15] a initi en janvier 2000 la conception dun modle
nects. Donc, si un organe de commande est branch sur un magn- darchitecture (figure 17) dun systme de cinma numrique, ou D-
toscope, la couche de la liaison de donnes gre la communication Cinema, permettant de dfinir les modules techniques spcifier.
directe entre ces deux lments. La couche rseau qui se trouve Ce modle prsente dabord les diffrentes fonctions requises dans
juste au-dessus commande les protocoles faisant le lien entre les la chane :
dispositifs indirectement connects. Enfin, la couche application, mastering, production dun fichier-source numrique pour les
qui domine le tout, commande les applications et ce que le modle images et les sons ;
OSI appellerait la couche de prsentation. compression, rduction de dbit (en option) pour rduire les
dures, et par consquent les cots de distribution ;
Plan de commande et de contrle encryption, permettant la protection (optionnelle) des mdias
film par chiffrement et leur contrle daccs (conditional access) ;
Le plan de commande et de contrle constitue les fondations du packaging, ou formatage avant distribution ;
modle. Cette couche concerne tous les autres lments du modle, transport, pour la transmission vers les salles de cinma ;
essentiellement pour assurer la coordination entre tous les l- storage, stockage sur supports informatiques ;
ments se trouvant au-dessus delle. Dans les situations de transfert, les fonctions inverses de dchiffrement (decryption) et de
mmorisation, manipulation, surveillance, diagnostic, etc., la cou- dcompression ;
che de commande et de contrle assure galement la gestion du display, ou fonction de projection.
contenu sur lensemble des activits, plans et couches. Le plan de
commande et de contrle ne ralise donc pas uniquement une fonc- Lintrt de ce modle est aussi dillustrer lassociation des mta-
tion de commande, mais il exerce aussi une fonction de gestion. Par donnes aux diffrentes fonctions.
exemple, sil savrait ncessaire de rpartir la largeur de bande de
frquences des canaux de transmission entre les dispositifs, la tche
serait effectue par le plan de commande et de contrle.
4.4 MPEG-21
Ce plan assure aussi linterface avec les utilisateurs du systme.

La figure 16 prsente le mme systme de production-distribu- MPEG-21 peut tre considr comme un modle et un ensemble
tion mais sous forme de cycle dynamique des flux dEssence et de doutils ayant lambition de sappliquer au monde universel du mul-
Mtadonnes. Les fonds griss montrent les zones correspondant timdia et de sa gestion.
des besoins utilisateurs diffrents, appelant des modles opration- Les premiers lments de la norme MPEG-21 [10], qui en com-
nels appropris. Par exemple, un modle oprationnel utilis en dis- prend 9 au total, ont t publis en 2002 et 2003.
tribution (delivery), partir dune rgie finale, ne doit pas permettre
un utilisateur denvoyer un ensemble de clips qui ncessitent un Dnomme Multimedia Framework ou e-Commerce for e-
montage pralable ou lajout deffets spciaux. Le programme doit Content , la norme MPEG-21 ambitionne de fournir un cadre gn-
tre prt diffuser (PAD). Au contraire, dans une zone de cra- rique pour permettre une utilisation transparente et accrue de conte-
tion et de production (Production et Post-production), il est totale- nus numriques, et en particulier leur distribution et leur transaction
ment appropri dchanger un grand nombre de composantes de au travers dune grande varit de rseaux et dquipements.
contenu avec les mtadonnes permettant de les assembler en un MPEG-21 est donc une norme qui recouvre un champ beaucoup
produit fini. plus large que les normes MPEG-1/-2/-4, qui sont des normes de

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 885 20 Techniques de lIngnieur
__________________________________________________________________________________ DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION

CONDITIONAL ACCESS & KEY MANAGEMENT INFRASTRUCTURE

CONTENT OWNER/DISTRIBUTOR EXHIBITOR

Originator Exhibitor
conditional conditional
acccess key access key
management management

Mastering Compression Encryption Decryption Decompression Display


(optional) (optional)
Image Image Display
Image
compression decompression system

Metadata Metadata Metadata Metadata

Theatre system storage & playout


Subtitle Subtitle
Subtitle compression decompression

Transport system
(optional) (optional)
Packaging

Metadata Metadata Metadata

Audio Audio
Audio
Audio compression decompression
system
(optional) (optional)
Metadata Metadata Metadata Metadata

Auxiliary Auxiliary
Auxiliary
Auxiliary compression decompression
system
(optional) (optional)
Metadata Metadata Metadata Metadata
Metadata

Metadata

System
control &
monitoring

Theatre
management Auditorium
Remote system/Monitoring/ system control
Exhibition information/Other system
communication (all optional) Metadata

Figure 17 Modle darchitecture du systme de cinma numrique [15]

reprsentation (codage) numrique, et que la norme MPEG-7 qui est Digital Item
une norme de description du contenu multimdia. Ce nest pas LA
Cest un objet numrique structur avec une reprsentation, une
norme de DMAM, mais cest une norme qui devrait progressive-
identification et des mtadonnes normalises dans le cadre de
ment tre intgre aux fonctions de DMAM.
MPEG-21.
Pour atteindre son objectif, MPEG-21 a tabli un modle denvi-
ronnement multimdia et a propos une architecture de briques Cet article numrique peut tre complexe. Par exemple, le Digital
technologiques normaliser. Item compilation musicale peut tre constitu de musique
(audio), de photos, dun clip vido, danimations graphiques, du
texte des paroles des chansons, des partitions, des fichiers MIDI, de
4.4.1 lments de base du modle linterview avec les chanteurs, dactualits relies une chanson, de
la dclaration dune personnalit, de la position au hit parade, des
informations de navigation guide par les prfrences utilisateurs,
Pour dessiner le cadre multimdia (multimedia framework), le
des bonnes occas , ...
modle propos (figure 18 plan horizontal du bas) dfinit deux
entits de base : les utilisateurs (Users) et lobjet ou article numri- Cest le document Digital Item Declaration DID ( 4.4.2) qui spci-
que (Digital Item). fiera la composition, la structure et lorganisation du Digital Item.

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 885 21
DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION ___________________________________________________________________________________

Examples :

Metrics & Interfaces


Event Reporting
Digital Item Container
Declaration Item
Resource
Examples :
File format. Header
Codec Content
Scalability Representation
Natural & Synthetic

Digital Item Examples :


Identification Unique Identifiers
& Description Content Descriptors

Examples : Content
Storage Management Management
Content Personalization & Usage
Metrics & Interfaces

Examples :

Event Reporting
Intellectual
Rights & Permissions
Property
Authentication
Management
Encryption
& Protection
Watermarking
Examples :
Resource Management (QoS) Terminals
Graceful Degradation & Networks
Resource Abstraction

Digital Item
User A User B
Authorization/Value Exchange

Transaction/Use/Relationship

Figure 18 Multimedia Framework [10]

Utilisateur (User) le Content Management and Usage, ou gestion et utilisation


Un Utilisateur est une entit qui interagit dans lenvironnement du contenu : concerne les interfaces et protocoles pour permettre la
MPEG-21 ou qui utilise un Digital Item. Les Utilisateurs incluent indi- cration, la manipulation, le stockage, la distribution et la (r-)utili-
vidus, consommateurs grand public, communauts, organisations, sation de contenu au travers des rseaux de distribution et des qui-
groupes professionnels, consortiums, gouvernements, organismes pements de consommation ;
et initiatives de normalisation. Les Utilisateurs sont spcifiquement lIntellectual Property Management and Protection : les
identifis par leur relation un autre Utilisateur pour une certaine moyens pour grer et protger de faon constante et fiable les droits
interaction. Dune perspective purement technique, MPEG-21 ne fait associs au contenu au travers des rseaux et quipements ;
pas de distinction entre un fournisseur de contenu et un la Content Representation, reprsentation numrique du
consommateur tous les deux sont des Utilisateurs. contenu pour le transfrer et lutiliser de faon intgre et aise ;
son niveau le plus basique, MPEG-21 fournit un cadre normalis les Terminals & Networks, terminaux et rseaux : les moyens
dans lequel un Utilisateur interagit avec un autre Utilisateur, lobjet de fournissant un accs transparent et compatible au contenu ;
cette interaction tant un Digital Item appel communment contenu. lEvent reporting ou suivi : les mesures et les interfaces permet-
Interactions tant aux utilisateurs de comprendre prcisment les rsultats de tous
les vnements faisant lobjet dun suivi dans le cadre de MPEG-21.
Les Utilisateurs peuvent : crer du contenu, fournir du contenu,
archiver du contenu, valuer un contenu, enrichir un contenu, agr- MPEG-21 ne r-invente pas tout ; il fait appel et intgre dans un
ger un contenu, vendre un contenu par lintermdiaire dun syndicat cadre global de nombreuses technologies et normes existantes.
de distribution, vendre au dtail, consommer un contenu, sabonner
un contenu, faciliter ou rguler les transactions se rapportant aux Digital Item Declaration (DID)
oprations prcdentes. Elle modlise (figure 19) les articles numriques (Digital Items) en
utilisant des lments, de plus en plus fins :
4.4.2 lments de larchitecture Multimedia le conteneur (Container), groupant des articles et/ou des conte-
Framework neurs, et formant des paquets logiques pour la transaction ou la
distribution ;
Les briques technologiques proposes la normalisation par larticle (Item), correspondant un groupe ou une slection
MPEG-21 sont les suivantes (figure 18, partie verticale) : de sous-items ou de composants qui forment une uvre ou une
compilation ;
la Digital Item Declaration : abstraction uniforme et flexible
avec un schma compatible pour dclarer les Digital Items ; la composante (Component) = ressource + descripteur
la Digital Item Identification : cadre pour lidentification et la associ ;
description de toute entit, indpendamment de sa nature, de son la ressource (Resource), correspondant un mdia
type ou de sa granularit ; identifiable : image, vido, audio, ... ;

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 885 22 Techniques de lIngnieur
__________________________________________________________________________________ DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION

Intellectual Property Management and Protection (IPMP) +


Container Rights Expression Language + Rights data Dictionary
Ces lments seront prsents dans le cadre du 4e article de la
Item Item
srie [TE 5 891, 2].
Descriptor Descriptor
Digital Item Adaptation (DIA) Rseaux & Terminaux
Component Component Le but des outils, en cours de normalisation, est de permettre un
Descriptor Descriptor accs transparent au contenu multimdia, des groupes divers
dutilisateurs, via des plates-formes multiples. Pour cela, en cours
Resource Resource de distribution-consommation, ladaptation du Digital Item sera
ncessaire et assure par deux modules dadaptation de ressource
et dadaptation de descripteur. Ces adaptations seront formalises
Component en fonction des :
Item
Descriptor caractristiques utilisateurs : prfrences de ressources mdia
Descriptor particulires, ou de leur prsentation, mobilit de lutilisateur, diver-
Resource sit des utilisateurs, y compris handicaps de la vue ou de loue ;
Component capacits du terminal : codage/dcodage de la ressource
Descriptor mdia, spcifications du matriel/logiciel/systme, protocoles de
communication ;
Resource caractristiques du rseau : utilisation de la bande passante,
dlais et taux derreurs ;
Item caractristiques de lenvironnement naturel : localisation spa-
tiale et temporelle de lutilisateur, niveaux de bruit et dclairement
Component de lenvironnement ;
Descriptor adaptabilit de la ressource : en fonction dune qualit de ser-
vice vise ;
Resource mobilit de session, ou comment communiquer ltat des Digi-
tal Items dun utilisateur lautre.

Fichier de format
Figure 19 Principaux lments du modle de Digital Item Un format de fichier polyvalent est en cours dimplmenta-
Declaration [10] tion, qui pourrait reprendre des concepts de MPEG-4.

le descripteur (Descriptor), associant mtadonnes (par exem-


ple, MPEG-7) ou descriptions aux lments du Digital Item (conte-
neurs, items, composantes). 5. Conclusion
Les lments de la Dclaration sont reprsents en XML
(figure 20 les traits verticaux gauche ont t rajouts pour expli-
citer la correspondance entre la structure de la reprsentation en Le Digital Media Asset Management devient un lment cl des
XML et celle du Digital Item de la figure 19). systmes de mdias numriques, car :
il gre le contenu, comprenant les donnes de mdias
Digital Item Identification (DII)
(essence) et les mtadonnes ;
Il permet didentifier les Digital Items et leurs parties de faon il coordonne lensemble des fonctions relatives la manipula-
unique. tion et lutilisation du contenu numrique.
Les identifiants peuvent tre insrs dans une DID et associs
avec larticle numrique (item), ou le composant (component) Cependant :
(figure 21). Cet lment est alors appel Statement (figure 20). un systme de gestion des assets ne peut pas tre un logiciel cl en
MPEG-21 ne spcifie aucun nouveau systme didentification main tant les stratgies mises en place varient dune socit lautre ;
mais normalise la syntaxe de rfrence aux identifiants des autres il remodle lorganisation des tches dans la chane (planifica-
systmes, ainsi que le processus de rsolution de lidentification. tion, production, distribution, gestion administrative, gestion des
Parmi les systmes didentification pouvant tre utiliss : CIDF (Con- droits, service technique).
tent Identification Forum), DOI, EAN/UCC (European-International Les trois articles suivants [TE 5 887], [TE 5 889] et [TE 5 891]
Article Numbering/Uniform Code Council), ISAN, ISBN, ISRC, ISSN dtailleront les groupes de fonctions mettre en uvre pour la
(International Standard Serial Number, pour les priodiques), ... gestion des mdias numriques, ainsi que la diversit des tech-
Le DII doit tre un URI (Uniform Resource Identifier), qui est une niques, des formats et des outils. Cette srie darticles se
chane compacte de caractres, et qui donc peut tre un URL (Uni- terminera par un panorama des produits de DMAM proposs
form Resource Locator, ou adresse Internet). [Doc. TE 5 891].

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 885 23
DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION ___________________________________________________________________________________

<DIDL>
<Container>
<Descriptor>
<Statement type=text/xml> MEPG-7
<mpeg7:Mpeg7> Descriptor
Creation
<mpeg7:DescriptionUnit text/xml
Information
xsi:type=CreationInformationType>
<mpeg7:Creation>
<mpeg7:Title>Musical package</mpeg7:Title>
Item
</mpeg7:Creation>
</mpeg7:DescriptionUnit>
</mpeg7:Mpeg7> Music package
Descriptor
</Statement> (one song plus
text/plain
two photos)
</Descriptor>
<Item>
<Descriptor>
<Statement type=text/plain> Item
Music Package (one song plus two photos) music.mp3
</Statement>
</Descriptor>
<Item>
<Component>
<Resource ref=music.mp3 type=audio/mp3/>
</Component> Item
</Item> photo1.jpg
<Item>
<Component>
<Resource ref=photo1.jpg type=image/jpg/>
</Component>
</Item>
<Item>
Item
<Component> photo2.jpg
<Resource ref=photo2.jpg type=image/jpg/>
</Component>
</Item>
</Item>
</Container>
Figure 20 Exemple de Digital Item
</DIDL>
Declaration en XML [18]

Identifier :
backCover.jpeg GRid
Descriptions :
metadata
Album title
MPEG-21
cover.jpeg Label
music album

coverNotes.html

Identifier :
ISRC
Descriptions :
track1.aac track2.aac track3.aac Lead Singer
metadata metadata metadata Orchestra
Conductor
Concert Hall
Identifier : Engineer
lyrics1.aac lyrics2.aac ISMN Label
metadata metadata Descriptions :
Title
Composer
Lyricist
Duration
Singer

Figure 21 Exemple de mtadonnes et didentifiants dun album musical MPEG-21 [10]

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 885 24 Techniques de lIngnieur