Vous êtes sur la page 1sur 84

Techniques de Numrisation

Cours licence BDAN IUT2 Grenoble 2011-2012

Jean-Michel Mermet Charg de Mission Documentation DSI de Grenoble Universits Tl : 04 76 51 49 18 Ml : Jean-Michel.Mermet@grenet.fr

Ce cours est diffus via une licence Creative Commons by-nc-sa (modalits http://creativecommons.org/licenses/by-ncsa/2.0/fr/)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 1/84

A.
1.

Introduction
Prsentation et primtre du cours

La numrisation est la conversion d'un signal analogique en un signal numrique en fonction de deux paramtres : l'chantillonnage et la quantification. C'est conceptuellement une modlisation mathmatique de certains aspects de la ralit. La numrisation concerne aussi bien les images, les textes, que le son et les vidos. Le cours a pour but de vous faire parcourir et rflchir sur toutes les tapes d'un projet de numrisation, depuis l'ide initiale et l'intrt d'y recourir jusqu' la production des donnes numriques. La numrisation, en effet, ne s'arrte pas, loin de l, l'tape technique qui consiste faire passer par exemple une photo argentique sous forme de fichier image : Il y a, en amont toute la rflexion de ce que l'on veut numriser, pourquoi on veut le faire, comment on va le faire, dans quels formats, pour quels publics, etc... Il y a, en aval, toute la rflexion sur le mode de mise disposition des fichiers numriques, leur identification, leur authentification, leur formats de diffusion, leur prservation pour le futur.

Il y a donc bien une vritable chane numrique concevoir, mettre en place, faire fonctionner. Nous verrons que tout projet de numrisation implique une rflexion pralable srieuse sur le long terme.

a.

Primtre du cours
les aspects juridiques ; la gestion des assets numriques par les systmes de gestion de contenu (CMS) ; la thorie des mtadonnes ; les traitements graphiques, sonores et vidos appliquer aux fichiers obtenus ; nous n'aborderons que ce qui est ncessaire pour reprsenter correctement les documents analogiques sous forme numrique ; les aspects d'archivage des donnes numriques ; la publication des collections sur internet, objet de la suite de ce cours au second semestre.

Ce cours ne couvrira que trs rapidement les notions suivantes :

2.
a.

L'importance de la numrisation
Prambule

Selon une enqute rcente du Rseau canadien dinformation sur le patrimoine propos de lutilisation de la technologie dans les muses, 94 % des institutions souhaitent faire de la numrisation leur premire priorit en matire de technologie pour lanne 2006. La numrisation [] est dsormais une activit importante pour les muses. tant donn que les connections Internet haute vitesse deviennent de plus en plus abordables et accessibles, il est normal que les muses publient de plus en plus sur leur site des images de leurs artefacts. 1 Voir aussi la liste, forcment partielle, tablie sur Wikipdia2. La numrisation a aussi d'importantes applications dans le domaine mdical, comme en tmoigne le projet PACS (Picture Archiving and Communication System) de la Socit Franaise de Radiologie, qui vise mettre en rseau les archives d'images mdicales. La mise en place devrait tre ralise en plusieurs tapes. Actuellement, les hpitaux commencent numriser leurs images mdicales ainsi que leurs archives. Dans une prochaine tape, leurs donnes seront mises en rseau pour tre changes entre les services et plus grande chelle entre les tablissements mdicaux3 Les documents numriques issus d'une numrisation servent :
1 2 3

limpression, la documentation,
http://www.chin.gc.ca/Francais/Contenu_Numerique/lere_de_la_numerisation.html (visit le 27/08/2009) http://en.wikipedia.org/wiki/List_of_digital_library_projects (visitle19/8/2010) http://www.enssib.fr/breves/2010/05/18/imagerie-medicale-numerisation-massive (visitle18/8/2010)[info du 18/5/2010]

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 2/84

la recherche, la publication en ligne, la gestion des collections, la prparation de catalogues la promotion dexpositions ../...

Pourquoi la numrisation est-elle devenue si populaire ?4 Elle permet de rendre les collections beaucoup plus accessibles (collections autrefois trop lointaines, objets trop fragiles pour tre manipuls ou exposs) Elle permet de mettre en valeur des aspects particuliers de lhistoire locale ou datteindre un public national ou international. Elle permet de rassembler, des fins de comparaison et de recherche, des objets ou des collections disperss en plusieurs lieux Elle peut devenir un puissant outil denseignement. La numrisation peut galement contribuer la gestion des collections en procurant tout le personnel une meilleure information sur le contenu des collections. Le simple fait de slectionner des objets numriser fournit au personnel une occasion supplmentaire dvaluer et de consigner ltat des objets. La numrisation incite en outre amliorer la documentation, en particulier lorsque des enregistrements daccompagnement sont destins tre rendus public en mme temps que les images numrises : le besoin de normes et dune meilleure information devient rapidement vident. Les objets numrises sont utilises dans une vaste gamme de produits de diffusion comme les sites Internet, le matriel de promotion, de nouveaux articles pour la boutique souvenir dun muse (tee-shirts, mugs, ...). La numrisation contribue aux stratgies de conservation puisque, une fois numriss, les originaux analogiques fragiles sont davantage labri des manipulations et des agressions. Comme la technologie numrique permet de faire une recherche dans un grand nombre denregistrements, de modifier et de traiter des images et des textes et de rassembler des lments disparates selon des modalits nouvelles, elle peut se rvler un outil souple et prcieux dans tous les secteurs dun muse. La facilit dexcution des tches mentionnes ci-dessus favorise galement une collaboration plus troite avec dautres tablissements.

b.

Pourquoi numriser ?
Plus de dtrioration des supports analogiques en consultation Une fois numriss, les documents originaux peuvent tre conservs dans des conditions optimales, sans le danger que reprsente leur manipulation. On augmente donc leur scurit. Reproduction - il est possible de raliser facilement et rapidement des copies de l'information dj numrise, sans perte de qualit. Automatisation - sont automatiss non seulement la restitution des lments demands, grce l'utilisation de systmes de stockage robotiss, mais aussi le processus de reproduction. Recherche - la numrisation offre la possibilit d'effectuer des recherches dans les catalogues aussi bien locaux que lointains et de crer un tissu de liens ou de pointeurs renvoyant du document consult par l'utilisateur des documents connexes de la mme collection ou d'autres. Des recherches de texte intgral peuvent en outre tre effectues. Des techniques de recherche analogues sont actuellement labores pour les documents sonores et les images (recherche et reconnaissance de phrases musicales, de rythmes, de motifs, de formes, ...) Accessibilit distance elle tient la capacit d'envoyer un signal numrique sur les rseaux de tlcommunications sans perte de qualit. Selon Francis Pisani5 : L'intrt primordial de la
http://www.chin.gc.ca/Francais/Contenu_Numerique/ Guide_Gestionnaires/introduction.html (visit le 24/7/2006) http://pisani.blog.lemonde.fr/pisani/2006/06/plein_de_bonnes.html, (visit le 18/08/2007)

4 5

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 3/84

numrisation des livres est la mise du savoir la disposition de populations qui sans cela n'y auraient pas accs, notamment dans le sud . Accessibilit temporelle -- la collection numrise est accessible 24 heures sur 24 avec un minimum de personnel. Accessibilit aux personnes prsentant un handicap - l'accessibilit est grandement amliore pour des publics dficients visuels ou moteurs. Qualit - elle tient la possibilit de numriser un document avec une trs forte rsolution, selon les besoins. Il est galement trs facile de raliser des copies de qualit infrieure partir de la copie de haute qualit, chaque fois que ncessaire. Espace ncessaire - la haute densit du stockage de l'information sur les supports numriques peut se traduire par une rduction majeure de l'espace de stockage ncessaire. D'o, galement, une rduction de l'espace ncessitant une rgulation climatique conforme aux normes archivistiques et, en consquence, un abaissement des frais de fonctionnement de l'institution. Par ailleurs, un signal numrique peut tre fortement compress avec ou sans perte d'information (dans le cas de la perte d'information, elle peut tre indtectable). Une information numrique est facilement stockable sur des supports dont la capacit augmente et dont le cot et la taille diminuent rapidement au fil des annes. Futurs transferts de la collection - si une collection est copie sur un support analogique, le cot de ses futurs transferts sera identique celui de cette premire reproduction. Si elle est copie sur un support numrique, on pourra, lors des futurs transferts, tirer parti des possibilits de recopie automatise inhrentes au numrique. Le transfert de collections de donnes numriques n'est pas un phnomne nouveau. Les milieux bancaires, par exemple, ont transfr plusieurs fois avec succs leurs banques de donnes. Leur exprience peut offrir des enseignements utiles pour le transfert de l'information textuelle, visuelle et sonore. Incitation entreprendre des recherches les chercheurs seront d'autant plus enclins exploiter un fonds qu'il sera numris, avec tous les avantages que cela lui procure. La numrisation facilite et rend plus efficace la recherche par les conservateurs, les tudiants, les enseignants, les rudits, les chargs de cours l'universit, les chercheurs et les spcialistes, car elle permet d'tudier des documents disparates dans des contextes nouveaux. Il y a davantage d'exploration de ressources lies aux objets exposs, et l'information propos du muse et de ses collections importantes s'en trouve amliore. Les images numrises peuvent tre utiles aux professionnels et chercheurs de muses du monde entier qui explorent les liens, les ressemblances et les diffrences avec les travaux d'autres tablissements. Constitution d'une copie de sauvegarde/ de remplacement Le document numrique peut tre considr comme une copie de sauvegarde de l'original. La numrisation offre une stratgie de remplacement pour des objets, par exemple des films et des archives sonores, en voie de dtrioration. Amlioration de la lisibilit des documents : le traitement numrique peut amliorer la lisibilit des documents. La transmission numrique est plus rsistante que l'analogique aux dfauts de transmission puisqu'il suffit de reconnatre, la rception du message, sa prsence et non sa forme pour le reconstituer ; la puissance ncessaire pour la transmission est donc plus faible et les quipements de rception souvent plus petits. On peut galement vrifier la bonne transmission par des techniques de chiffrages telles que les checksums : un calcul trs sensible aux erreurs est effectu avant et aprs la transmission. Les rsultats sont compars suite un transfert. Si l'information numrique a t modifie, mme trs peu, les rsultats du checksum sont trs diffrents. On retransmet alors automatiquement les donnes numriques. Par ailleurs, le numrique permet de transmettre tous les signaux de la mme manire, quelle que soit la nature de l'information (voix, donnes, images...) ; les quipements de transmission sont donc les mmes pour le tlphone ou la tlvision par exemple. Le volume ou le dbit d'un signal transmis numriquement peut galement tre fortement rduit par compression, sans perte (loseless) ou sans perte sensible de la qualit, en supprimant toutes les informations inutiles (redondantes ou imperceptibles par les sens humains). Dans une transmission vido par exemple, au lieu de traiter numriquement 24 images par seconde, on ne traite que la diffrence entre deux images conscutives. Cette diffrence tant la plupart du temps trs faible, plus de 98% de l'information peut tre laisse de ct sans perte de qualit des images.

Conclusion technique : La numrisation apporte ainsi de nombreux avantages, facilitant le traitement et le stockage des informations et offrant une qualit de transmission incomparable. Ces qualits doubles de son

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 4/84

indpendance par rapport la nature de l'information transmise expliquent la gnralisation de l'emploi des technologies numriques aux dpens des technologies analogiques. Un billet du blog Figoblog6 dtaille un ensemble de raisons pour lesquelles on peut vouloir numriser en bibliothque. L'auteur distingue plusieurs raisons : la valorisation d'un fonds : Avantage : c'est joli, ludique, attrayant, a donne une bonne image de la bibliothque et a plat aussi aux gens qui ne sont pas spcialistes. Inconvnient : ce genre d'interface est inutilisable par des personnes qui s'intressent au mme document d'autres fins. la numrisation " la demande" ou spcialise : Avantage : le public est dj cibl et on rpond prcisment ses attentes donc le succs est plus facilement assur, au moins auprs d'un nombre limit de personnes. Inconvnient : c'est toujours inutilisable par des personnes qui s'intressent au mme document d'autres fins (typiquement, c'est bien de ne numriser que des enluminures mais celui qui travaille sur le texte du manuscrit se retrouve le bec dans l'eau). Ou alors cela ne couvre qu'un spectre documentaire/thmatique trs limit. la numrisation de sauvegarde : Avantage : une grande facilit de consultation par rapport l'ancien support de substitution, qui n'offrait que des capacits limites de lecture simultane et une "exprience de lecture" peu optimise. Inconvnient : pas de public assur pour consulter cette numrisation, et comme les originaux sont en voie de disparition, il faut qu'elle soit fiable, authentique et prenne car c'est bientt (ou dj) le seul moyen d'accder ces documents l. la bibliothque numrique : Avantage : c'est un service cohrent avec une politique documentaire, des missions, des services, etc. capable en principe de rpondre aux besoins d'un public diversifi. Inconvnient : c'est trs compliqu et coteux organiser. Mme trs trs compliqu.

c.
I.

Inconvnients, limites et risques de la numrisation


LE COT

C'est un des reproches souvent fait aux projets de numrisation. Les points soulevs ci-aprs 7 sont parfois judicieux, parfois exagrs. Ils mritent en tout cas qu'on sache y rpondre le cas chant. Investissement initial - le matriel ncessaire pour effectuer la numrisation peut tre coteux et demande souvent tre utilis par des oprateurs qualifis pour donner les meilleurs rsultats. Contraintes de rangement - les supports utiliss pour stocker l'information numrise devront tre conservs dans un environnement trs propre et trs stable en temprature et en hygromtrie, ce qui accrotra la consommation d'nergie imputable la collection. L'amnagement de cet espace de rangement l'atmosphre stabilise exige en outre un investissement initial. Frais de fonctionnement - on craint qu'une collection numrise ne doive elle aussi tre frquemment recopie, avec les cots de main-d'uvre, d'nergie et d'achat de nouveaux supports que cela implique et que la survie de l'information numrique ne soit pas garantie au-del de deux trois ans si elle est stocke sur bande magntique et de trois cinq ans si elle est conserve sur disque optique. Cots de prparation - un document doit tre prpar (parfois de faon destructrice, comme le massicotage des ouvrages avant leur passage par le scanner) pour la saisie numrique. Outre l'ventuelle prparation physique requise, le contenu initial doit en tre class et index et les rfrences textuelles introduites dans la base de donnes par du personnel spcialis, oprations qui peuvent tre coteuses. On pense que la copie de l'information des supports existants sur de nouveaux supports implique d'importantes contraintes de main-d'uvre.

II.

LE RISQUE IMPORTANT DE MAUVAIS CHOIX TECHNOLOGIQUES


Lors de la numrisation. Des erreurs notamment lors du choix de l'chantillonnage ou du format de fichier (formats propritaires) peuvent empcher une exploitation future des donnes. Lors de la gestion des documents numriques. Des erreurs lors du stockage (supports, conditions de stockage) et lors de la prservation des documents peuvent conduire des pertes svres de donnes (cas des donnes sur les vols lunaires de la NASA). Ne jamais oublier que les dbuts de l're informatique ont t marqus par la plus grande perte de donnes de l'histoire de l'humanit.
http://www.figoblog.org/document1637.php (visit le 19/07/2007) Tir de http://www.unesco.org/webworld/mdm/administ/fr/MOW_finD.html#3 (visit le 19/07/2007)

6 7

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 5/84

III.

LA PERTE DE REPRES PHYSIQUES

Une partie de l'information d'un document est contenue dans le support physique. La numrisation ne retient donc pas tout : l'odeur, le poids, la texture ne sont pas reproduits.

IV.

UNE MOINS GRANDE FACILIT D'ASSIMILATION DES CONTENUS

Une moins grande facilit d'assimilation des contenus par rapport aux mdia analogiques du fait de la non-linarit de la lecture dans les documents multimdia. Ce point est discut, mais il faut peut-tre le considrer dans la problmatique plus gnrale des limites actuelles des interfaces d'accs l'information.

d.
I.

Quelques grands programmes de numrisation


GOOGLE BOOKS

L'extraordinaire projet de Google8, qui a fait couler beaucoup d'encre ... lectronique ! Pour revenir l'historique de ce dossier mouvement, on peut lire avec intrt le dossier l'Atelier de Jean de Chambure9 (article datant de 2005). Depuis ce dossier, la partie semble bien mal engage par Europanea... Dpart de Jeaneney, et les Vaudois qui, les premiers europens, rompent le front du refus et signent avec Google. Cf l'article Les Vaudois vendent leur patrimoine crit Google 10 : Quelque 100000 ouvrages, tous libres de droits, du XVIIe au XIXe sicle, seront digitaliss Lausanne selon un calendrier dfini dans un mois. Cette numrisation sera presque entirement finance par Google, ce qui reprsente environ 12,5 millions de francs. La BCU ne payera que le traitement des fichiers pour la consultation et l'engagement d'une personne qui suivra l'aventure jusqu'au bout. Mais la diffrence avec les projets publics de bibliothque sur Internet, c'est que les fichiers de livres numriss deviennent possession de Google. La dcision de la BCU est indite : jusqu'ici, toutes les bibliothques francophones, qu'elles soient de France, de Belgique, de Suisse ou du Canada s'taient ranges derrire les projets publics concurrents l'offensive Google, c'est--dire la Bibliothque numrique francophone et Europeana, le noyau embryonnaire de bibliothque numrique europenne lance en mars dernier par la France, la Hongrie et le Portugal. En concluant un partenariat avec Google, la BCU ouvre une brche et manifeste tout haut l'impatience que d'autres ressentent face la lenteur des projets de numrisations publics: Le partenariat avec Google s'annonce autrement plus srieux que le projet europen , dclare Hubert Villard, directeur de la Bibliothque cantonale et universitaire vaudoise. Voir aussi, en juillet 2008, la dcision de la ville de Lyon de faire appel Google pour des projets de numrisation11 Lobjectif de la BM de Lyon est de numriser 500 000 ouvrages sur les 1 350 000 de son fond ancien, dans un dlai de 10 ans. Il sagit de documents antrieurs au XX sicle et libres de droits. Google devra les numriser la fois en mode image et en mode texte, dans leur intgralit. Linternaute pourra alors avoir accs aux informations par le mode classique de recherche par page de Google mais pourra galement tlcharger les uvres intgralement. En change, Google devient propritaire de ces fichiers numriques et dispose dune exclusivit commerciale pour leur exploitation durant 25 ans. Voir enfin les rumeurs (fondes infondes) de collaboration entre la BNF et Google. Qui l'eut cr !

II.

GALLICA

Serveur de consultation distance des collections numrises de la Bibliothque Nationale de France 12. Les fonds numriss constituent une bibliothque patrimoniale et encyclopdique, avec des ouvrages numriss
8 9 10 11 12 http://books.google.com/ (visitle19/07/2007) http://www.atelier.fr/type/bataille,livre,internet-30041-Dossier.html (visitle19/07/2007) Le temps.ch du 16 mai 2007 http://libelyon.blogs.liberation.fr/info/2008/07/la-bibliothque.html (visitle25/07/2007) http://gallica.bnf.fr/ (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 6/84

en mode image, et en mode texte, des images fixes, des documents sonores (fonds du domaine public). Ces documents sont imprimables et tlchargeables par le lecteur, dans le cadre d'un usage strictement priv. Gallica offre (au 20/8/2010)13 : Vous trouverez sur Gallica 1 191 998 documents 184 642 Livres, 10 241 Cartes, 5 494 Manuscrits, 160 890 Images, 773 287 Presse et Revues, 3 092 Partitions, 1 071 Paroles et musiques, 27 570 de E-distributeurs, 25 711 d'autres bibliothques

Le taux mensuel de consultation des documents a pass la barre du million en mars 2006.

III.

PROJET NUMDAM DE LA CELLULE MATHDOC GRENOBLE

Numrisation de Documents Anciens Mathmatiques14 : dans le but de soutenir les revues de mathmatiques, le programme NUMDAM met en place un libre accs aux donnes bibliographiques et au texte des articles qui y sont parus. Pour chaque revue concerne, la totalit des volumes publis jusqu'en l'an 2000 a t convertie au format numrique, ce qui reprsente actuellement plus de 560 000 pages numrises et 27 000 articles mis en ligne. Les articles eux-mmes sont disponibles pour consultation en ligne l'issue d'un dlai (crneau mobile) pendant lequel ils sont rservs aux seuls abonns. Il est possible de rechercher directement un article par nom d'auteur, mots du titre ou mots cls prsents dans le texte. Il est galement possible de feuilleter les sommaires de l'ensemble des volumes. Voir les collections sur la page ddie du site15.

IV.

INTERNET ARCHIVE

Internet Archive16 est une organisation but non commercial fonde dans le but d'tre la bibliothque d'internet . Son but est de s'adresser aux chercheurs, aux historiens, aux tudiants, aux personnes prsentant un handicap et au grand public pour leur offrir des collections historiques qui existent en format numrique. Fonde en 1996, puis refinance en 1999, cette organisation connu une grande croissance et inclut maintenant des collections consquentes. Elle propose des textes, de l'audio, des films, des logiciels ainsi que des pages web archives. Elle travaille fournir des services plus spcialiss lis l'enseignement et la formation et l'accs aux collections par des personnes prsentant un handicap.

V.

LE GRAMOPHONE VIRTUEL

Enregistrements historiques canadiens, site Web multimdia en pleine croissance consacr aux dbuts de l'enregistrement sonore au Canada. Dot d'une base de donnes d'images et d'enregistrements audionumriques canadiens, ainsi que de biographies de musiciens et d'un rsum de l'histoire de la musique et de l'enregistrement sonore au Canada, Le Gramophone virtuel offre aux chercheurs et aux mordus de musique un aperu dtaill de l'poque des 78 tours au Canada.17

VI.

EXEMPLES D'INTERFACES DE CONSULTATION

L'extraordinaire Cit de Dieu par la Bibliothque municipale de Nantes18, voir pour le ralisme du tourner de pages et pour le zoom trs puissant. Online Gallery19, projet de la British Library, ce magnifique exemple pousse le dtail trs loin : c'est la souris qu'on tourne les pages de superbes manuscrits.

13 14 15 16 17 18 19

http://gallica.bnf.fr/content?lang=fr#stats http://www.numdam.org (visit le 19/07/2007) http://www.numdam.org/spip.php?rubrique4 (visit le 28/8/2009) http://www.archive.org (visit le 19/07/2007) http://www.collectionscanada.ca/gramophone/index-f.html (visit le 19/07/2007) http://arkhenum.picturelan.com/bm_nantes_oeb/ (visitle19/07/2007) http://www.bl.uk/onlinegallery/ttp/ttpbooks.html (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 7/84

Deux exemples d'utilisation d'une loupe magique (retranscrivant le texte issu d'critures manuscrites) : le Journal de Martha Ballard20 et Bill of sale for slave named Kate21. Multi-touch screen interface demonstration22 : Fluidbook23 : une interface spcialise dans la prsentation de catalogues.

VII.

LISTES DE BIBLIOTHQUES NUMRIQUES

D'aprs l'excellent article24 du blog Figoblog : List of digital library projects25 Liste internationale du blog NetBib26 The British Columbia International Digital Library27, une liste de listes A selection of web accessible collections28 (Harvard University Library)

3.
a.
I.

La numrisation ?
Quelques dfinitions
UN SIGNAL ANALOGIQUE

Un signal analogique est un signal qui reproduit l'analogue (qui transpose) un phnomne physique, tel qu'une onde mcanique (pour le son) ou une onde lectromagntique (pour l'image) ou une combinaison des deux (pour la vido). C'est une fonction continue dans le temps et/ou dans l'espace. Remarquez que les signaux analogiques numriser ne sont pas forcment perus par nos sens : on peut numriser par exemple le chant des baleines dont les frquences ne se situent pas dans l'intervalle de celles perues par l'homme (20 Hz 20 kHz environ). Exemple : analyse d'un signal analogique audio. On analyse le signal audio reproduit par un systme analogique (radio FM, platine disque 33 tours, ...) et on reprsente ici la puissance instantane du signal en fonction du temps, tout d'abord en vue gnrale, puis en vue agrandie pour voir quoi ressemble le signal.

20 21 22 23 24 25 26 27 28

http://dohistory.org/diary/exercises/lens/ (visit le 19/07/2007) http://memorialhall.mass.edu/activities/media.jsp?itemid=7797&img=0 (visit le 19/07/2007) http://www.youtube.com/watch?v=89sz8ExZndc (visit le 19/07/2007) http://www.fluidbook.com/demo/fr/ (visit le 28/08/2009) http://www.figoblog.org/document933.php http://en.wikipedia.org/wiki/List_of_digital_library_projects (visit le 19/07/2007) http://wiki.netbib.de/coma/DigiMisc (visit le 19/07/2007) http://bcdlib.tc.ca/ (visit le 19/07/2007) http://digitalcollections.harvard.edu/ (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 8/84

Illustration 1: Signal audio - vue gnrale

Puis on zomme sur une partie du signal ...

Illustration 2: Signal audio - vue agrandie

II.

LA NUMRISATION

La numrisation est la conversion d'un signal analogique en un signal numrique en fonction de deux paramtres : l'chantillonnage et la quantification29. C'est conceptuellement une modlisation mathmatique de la ralit. Note terminologique : le terme anglais est digitization, d'o vient le franglais digitalisation qui est proscrire. La numrisation d'une image est parfois effectue l'aide d'un scanner. On parle alors, toujours improprement d'un scan , d'un scannage , scannrisation , etc... A proscrire galement !

III.

L'CHANTILLONNAGE

L'chantillonnage consiste remplacer une fonction continue dans le temps ou dans l'espace par la suite des valeurs qu'elle prend en des instants ou des zones discret(e)s priodiques. Ces valeurs suffiront pour reconstituer la fonction dans une tape ultrieure.

29 On considre ici le processus Pulse-code modulation (PCM). Cf http://en.wikipedia.org/wiki/Pulse-code_modulation pour plus d'explications. D'autres processus de numrisation existent, plus complexes, et ne seront pas examins dans le cadre de ce cours.

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 9/84

L'exemple classique est celui du stroboscope, qui permet de dcomposer les mouvements (en fait de les chantillonner) : 1. 2. 3. le flash claire la piste de danse pendant un temps trs court et l'il reoit une image des danseurs immobiles . La priode suivante est dans l'obscurit, aucun signal n'est reu par l'il qui, par un phnomne de rmanence, retient l'image fixe reue prcdemment. L'clair suivant rajuste l'image des danseurs dans une position lgrement diffrente (car la danse est analogique, une fonction continue dans le temps et dans l'espace !) et la sensation est celle d'un mouvement saccad.

La mesure effectue un instant/lieu donn est appele un chantillon. Prenons un autre exemple : imaginons qu'on veuille numriser l'image d'un parterre de fleurs. On commence par quadriller l'image et on dtermine la couleur de chaque carr. Chaque carr est appel chantillon. Pour faire le travail correctement, on la quadrille de faon suffisamment fine de manire ce que dans chaque petit carr on ne trouve qu'une couleur (environ).

IV.

LA QUANTIFICATION

Poursuivons l'exemple de la numrisation de l'image d'un parterre de fleurs. Il faut maintenant dcider de la faon de mmoriser la couleur dans chaque carr. 1. 2. 3. 4. On se dfinit un ensemble limit de couleurs permises, par exemple : {0rouge, 1bleu, 2vert, 3jaune}. En fonction du lieu de mesure, on relve la couleur. Si cette couleur se rapproche d'un vert, on choisit la valeur vert , si la couleur est plus proche d'un jaune, on choisit jaune . On a le choix ici entre 4 valeurs. Une fois tous les chantillons analyss et un choix de valeur effectu pour chacun, on dispose d'une numrisation de l'image du parterre de fleurs ... en quatre couleurs. Le rsultat sera sans doute mdiocre, comme vous pouvez l'imaginer !

Calculons la place ncessaire pour enregistrer cette information. On dispose de 4 valeurs donnes, et l'information se code en binaire en informatique (base 2, seuls les chiffres 0 et 1 sont autoriss). Il faudra donc un nombre binaire deux chiffres (22=4) pour coder le choix : 0rouge 1bleu 2vert 3jaune cod cod cod cod 00 01 10 11

Ce nombre binaire deux chiffres, exprim en bits, permet de coder la valeur permise pour un chantillon. L'enregistrement de l'information issue de la numrisation de ce parterre de fleurs ncessite donc 2 bits par chantillon. La taille du fichier (en bits) issu de la numrisation est donc de 2 x nombre d'chantillons. On comprend immdiatement dans cet exemple que... ... plus le nombre de valeurs permises est important, ... ... plus fidle est l'enregistrement du signal. On comprend aussi que ... ... plus l'on choisit de valeurs permises, ... ... plus il faudra de place pour stocker, dans chaque chantillon, la valeur choisie. Si maintenant on choisit un nombre de valeurs permises plus important, par exemple 1024 valeurs, (codes en 10 bits car 210=1024), la taille finale de la numrisation sera 5 fois plus importante, et le rsultat obtenu beaucoup plus fidle.
Cours numrisation (c) JMM 2011-2012 version du 16/12/11 page 10/84

La quantification est l'opration par laquelle on examine l'chantillon mesur et l'on choisit la valeur la plus proche mmoriser parmi un ensemble prdfini des valeurs permises.

V.

UN DOCUMENT NUMRIQUE

Un document numrique est un fichier informatique (donc reprsent par une suite de 0 et de 1) dont le contenu, structur selon les spcifications d'un format de fichier, reprsente une information comprhensible par un humain et/ou par un ordinateur.

b.

Un Exemple

Prenons la numrisation d'un signal audio (agrandi depuis les illustrations prcdentes). En ordonne on indique la puissance instantane du signal, en abscisse le temps. Le signal se prsente ainsi :

on chantillonne ce signal une frquence donne : c'est un dcoupage temporel.

... et on mesure la valeur du signal chaque dcoupe.

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 11/84

chaque intersection, on prend la valeur en ordonne. On obtient donc une srie de valeurs comme dans le tableau suivant (donnes compltement fictives) dans lequel on mesure chaque milliseconde une valeur (VM) (par exemple lectrique).

T 0 (ms) VM 763

1 783

2 874

3 885

4 910

5 921

6 911

7 917

8 903

9 901

10 902

11 904

12 876

... ...

Chaque valeur mesure est ensuite ramene la valeur autorise la plus proche.

Dans le tableau suivant, (rappel, en donnes fictives) on compare les valeurs mesures (VM) avec les valeurs autorises et on choisit les valeurs autorises les plus proches (VC) (ici les multiples de 10). En vert sont reprsentes les valeurs qui ne changent pas (ou peu) par cette opration, en rouge celles qui changent beaucoup.

T (ms) VM VC diff.

0 763 760 3

1 783 780 3

2 874 870 4

3 885 890 5

4 910 910 0

5 921 920 1

6 911 910 1

7 917 920 3

8 903 900 3

9 901 900 1

10 902 900 2

11 904 900 4

12 876 880 4

... ... ...

Les valeurs autorises sont celles qui sont sauvegardes dans le fichier numrique. C'est la modlisation numrique du signal analogique initial. Un fichier numrique en rsulte.

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 12/84

Effectuons maintenant l'opration inverse, celle de la reproduction de ce signal numris. Comme le dispositif humain de perception des sons est analogique, il faut reconvertir ce signal numris en signal analogique. La suite de valeurs numriques est donc convertie en un nouveau signal analogique :

... qu'on peut comparer avec le signal analogique initial pour faire apparatre les approximations et les erreurs dues la numrisation :

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 13/84

Les facteurs qui influent sur la qualit de la modlisation de ce signal sont de deux ordres : Le frquence d'chantillonnage et la prcision de la quantification.

I.

LA FRQUENCE D'CHANTILLONNAGE.

Elle s'exprime en Hertz, l'inverse de la seconde. Plus celle-ci est leve (plus la priode est faible), meilleure est la prise en compte des vnements rapides, et meilleure est la fidlit du signal numrique par rapport au signal analogique. Mais comment choisir cette frquence ? En pratique, on applique le thorme de Shannon (certains disent qu'il s'agit de celui de Nyquist) qui prcise que la frquence minimale d'chantillonnage d'un signal doit tre au moins le double de la frquence maximale contenue dans le signal chantillonner. Soit ech la frquence d'chantillonnage, et thorme stipule que :

Fmax_signal la frquence maximale du signal numriser, ce

Fech2*Fmax_signal
Autre formulation : Pour ne pas perdre d'information dans un signal la distance entre deux chantillons doit tre infrieure la demi-priode du signal. Ce thorme peut tre appliqu aux images : pour ne pas perdre de dtails dans une image, la taille des pixels doit tre moins de la moiti du plus petit dtail de l'image. Exemple pour la musique, la frquence maximale audible est de 20 kHz, en comptant trs large. La frquence d'chantillonnage des CD-audio, de 44,1 kHz, plus du double de 20, respecte bien ce thorme. Application la voix en tlphonie : frquence maximale : 3700 Hz. Quelle frquence d'chantillonnage minimale choisir ?

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 14/84

II.

LE SOUS-CHANTILLONNAGE

On parle de sous-chantillonnage si la frquence d'chantillonnage n'est pas suffisante pour reprsenter de faon adquate le signal. Le rsultat issu d'une reconversion en analogique n'a alors plus rien voir avec le signal de dpart. Pour une numrisation audio, cela peut se traduire par de forts chos, des repliements de bandes, etc. trs audibles.

Dans le schma ci-dessus, le signal d'origine est numris avec un chantillonnage trop faible. Le signal qui est reconstruit partir de la numrisation est notoirement diffrent du signal original. l'inverse, un surchantillonnage consiste prendre trop d'information, beaucoup plus qu'il n'en faut pour reprsenter de faon adquate le signal analogique. Il n'en rsulte pas forcment une meilleure qualit sonore dtectable, mais en tout cas une quantit de donnes beaucoup plus importante traiter.

III.

LA PRCISION DE LA QUANTIFICATION.

Elle doit tre adapte au signal numris, c'est--dire que la valeur analogique maximale du signal numriser doit tre code par la valeur numrique maximale, idem pour les valeurs minimales. Plus elle comprend de valeurs diffrentes, plus le codage sera prcis, ... mais plus l'information sera volumineuse stocker. Exemple : le signal audio d'un CD-audio est cod sur 16 bits sur chaque voie, soit valeurs chaque chantillon strophonique.

22 =265536

16

Exercice : calculer la taille non compresse d'un morceau de musique de 3 minutes cod sur un CD-audio : 3x60 = 180 secondes Chaque seconde, le signal est code 44100 fois sur 2 fois 16 bits. La taille du morceau est donc de : 180x44100x2x2 soit environ 30 Mo !

Exercice 2 : combien peut-on placer de minutes de musique sur un CD-audio ?

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 15/84

B.
1.
a.
I.

La numrisation des sons


Le mcanisme de l'audition
Qu'est-ce que le son ?
DE LA VIBRATION NAIT LE SON :

Phnomne moins vident saisir que pour les images, il est ncessaire de rappeler quelques notions de base sur le son. Le son est cr lorsqu'un objet vibrant transmet sa vibration l'air ambiant. Le son se propage dans l'air travers de multiples collisions entre les particules. Admettons qu'on ait un haut-parleur et que celui-ci soit notre source sonore. La membrane du haut-parleur se dplace en avant et en arrire suivant l'ampleur du signal lectrique qui est appliqu l'inducteur sur lequel il s'appuie. Ainsi, il dplace les particules de l'air d'abord en les comprimant puis en les dilatant :30

Illustration 3 : Compression (C= compression) et Dilatation (ou Rarfaction) (R= rarfaction) des particules d'air

Suivons la propagation du son partir de la source (le haut-parleur). Pour tre plus clair nous supposerons d'abord qu'une compression se produit vers la droite, puis une dilatation vers la gauche :

Illustration 4 : Mouvement du haut-parleur

La membrane du haut-parleur se dplace et pousse les particules de l'air qui se trouvent droite en provoquant une compression. Celles-ci leur tour vont dplacer les particules qui sont proches en leur transmettant l'nergie reue du haut-parleur. Aprs quoi la membrane revient en arrire et provoque une compression sur le ct oppos, soit une dilatation vers la gauche, et de ce fait cre devant lui une dpression qui sera colmate par les particules d'air se trouvant proximit. Ces particules qui se dplacent crent leur tour une dpression leur droite et ainsi de suite. Ce procd fait en sorte que les particules transmettent l'nergie en oscillant et non pas en se dplaant physiquement dans la direction de la propagation du son. Si le haut-parleur est pilot par un signal sinusodal, la pression atmosphrique immdiate aura le parcours dcrit dans la figure ci-aprs :

30 http://www.audiosonica.com/fr/cours/post/5/Theorie_du_son_Propagation_du_son visit le vendredi 9 septembre 2011 (pour ce paragraphe et les suivants)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 16/84

Illustration 5 : Cheminement sinusodal de la pression atmosphrique

La vibration de l'air se propage alors et atteint nos oreilles, o elle fait vibrer nos tympans. L'oreille interne transforme alors cette information mcanique en signaux lectriques que le cerveau sait interprter. Le son est donc une grandeur analogique qu'il convient de transformer si on veut la stocker pour la reproduire. C'est le rle du microphone (qui transforme la vibration acoustique en un signal lectrique), puis du pramplificateur (qui amplifie le niveau lectrique extrmement faible du microphone).

II.

ENREGISTREMENT ANALOGIQUE:

Pendant de nombreuses annes, la seule technologie connue tait l'enregistrement analogique du son. Enregistrements sur des cylindres, puis des disques en cire et en vinyle, et enfin sur des bandes magntiques. La technologie analogique a atteint ses limites dans les annes 80. Les dispositifs existants ne permettaient plus d'amlioration significative de la qualit, notamment l'augmentation de la dynamique (le rapport entre le son le plus fort et le son le plus faible dans un mme enregistrement) et la diminution du bruit de fond. Historique rapide de l'enregistrement des sons31 : 1807 : L'amricain Thomas Young invente un instrument capable d'inscrire les variations acoustiques sur la surface d'un cylindre couvert de suie. En 1857, Lon Scott de Martinville perfectionne ce procd et invente un appareil, le Phonautographe, constitu d'une membrane vibrante, place au bout d'un tube acoustique, qui transmet les vibrations sonores un stylet qui les grave sur un cylindre enduit de noir de fume. Mais ce dispositif ne permet pas de relire les courbes ainsi dessines. 1877 : Thomas Edison construit le premier systme permettant l'enregistrement et la reproduction des sons, le phonographe. La transformation entre les ondes acoustiques et les informations enregistres tait accomplie par la gravure d'une feuille d'aluminium recouvrant un cylindre rotatif. Il prend de cours Charles Cros qui avait quelques mois plus tt dpos un brevet pour un appareil similaire. 1887 : l'Allemand Emile Berliner, migr aux Etats-Unis, met au point le gramophone, avec son disque plat en zinc enduit de cire que l'on grave avec un burin mtallique. On attaque ensuite l'acide chromique le zinc qui a t mis nu par la gravure. Ce disque peut alors tre facilement reproduit en un nombre infini de copies en fabricant un moule par galvanoplastie. Le disque tourne 78 tours par minute. Cylindre contre disque plat, c'est la premire guerre des formats. 1889 : Le premier enregistrement magntique est ralis par le physicien Danois Valdeman Poulsen. Cet appareil, le "Tlgraphon", utilise un cble d'acier enroul hlicodalement autour d'un cylindre tournant sous un lectro-aimant, connect un microphone au charbon ou un casque. En 1900, il remporte le Grand Prix de l'Exposition universelle, mais comme on ne sait pas encore amplifier le signal lectrique, le son de l'appareil est trop faible pour tre utilis pour la musique. On l'utilise comme dictaphone et, partir de 1925, comme rpondeur tlphonique. Accessoirement, la marine allemande s'en sert galement pour envoyer des messages cods durant la I guerre mondiale En 1893, Berliner fonde aux USA la Gramophone Company. En 1895, la compagnie des chemins de fer de Pennsylvanie investit la somme de 25 000 dollars dans ce nouveau support, ce qui permet Berliner de perfectionner sa machine et de la lancer commercialement ds 1896. Le succs est norme ; deux ans plus tard, il se vend pour un million de dollars de gramophones aux USA. En 1898, Berliner et ses associs fondent en Angleterre The Gramophone Company, qui deviendra His Master's Voice puis E.M.I. ; en Allemagne la Deutsche Grammophon Gesellschaft est la premire usine au monde spcialise dans le pressage des disques ; et l'anne suivante en France la Compagnie Franaise du Gramophone.

31 Lire la surprenante histoire de l'enregistrement sonore http://www.questmachine.org/article/Histoire_de_l_enregistrement_sonore visit levendredi 9 septembre 2011. une partie des explications ci-dessous est directement tire de cette ressource.

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 17/84

En 1904, l'usine de Hanovre presse 25 000 disques par jour et le catalogue contient dj plus de 5000 titres, en 1929 elle fabrique 10 millions de disques par an ! 1905-1926 : L'industrie du 78-tours croit rapidement, et la recherche sur l'enregistrement magntique pitine. Ds 1920, premiers essais d'enregistrement en strophonie, peu exploitables. 1931 : En Allemagne, Pfleumer et AEG conoivent et utilisent le premier magntophone avec une bande similaire ceux d'aujourd'hui. 1948 : les firmes Columbia et RCA-Victor prsentent leurs disques microsillon sur disque vinyle : celui de Columbia a 30 cm de diamtre et tourne 33 1/3 tours-minute ; celui de RCA a 17,5 cm de diamtre et tourne 45 tours-minute. 1948 : L'utilisation des magntophones devient plus courante, mais ils sont toujours lourds et encombrants. Les magntophones mobiles sont installs dans des camions. 1949 : disque microsillon en vinyle, commercialis en France. Avec un sillon trois fois plus fin que celui du 78 tours, il permet une dure de 20 30 minutes par face au lieu de 3 4'30 maximum. Fabriqu en PVC, il est aussi nettement moins bruyant que les disques en gomme-laque (5,6 fois plus de dynamique). Les derniers 78 tours sont fabriqus en 1956. 1955 : Lancement des magntophones strophoniques. 1957 : vente des premiers disques strophoniques 1974 : Les premiers magntophones numriques PCM pour instrumentation font leur apparition. 1979 : Les firmes Philips, Sony et Hitachi prsentent le Compact Disc (CD), marque dpose, qui remplacera petit petit le disque microsillon. 1983 : Le DAT (magntophone numrique) est annonc par la firme Sony (la commercialisation sera faite en 1987). 1992 : Sony prsente le MiniDisc numrique et Philips commercialise la Digital Compact Cassette, cette dernire devant prendre la suite de la Compact Cassette (CC). 1995/96 : Apparition des premiers graveurs de CD-R vendus dans le grand-public, puis des disques CDRW renregistrables (disques magnto-optiques). 1998 : Premier microphone numrique (Beyer).

III.

ENREGISTREMENT NUMRIQUE

C'est au cours des annes 80 que la numrisation du son a progressivement envahi les studios d'enregistrement, puis s'est installe chez l'utilisateur final. Les ordinateurs multimdias modernes permettent de donner un nouvel intrt au son numrique, puisqu'il devient possible d'enregistrer des sons moindre frais sur son disque dur ou sur un CD enregistrable. Le tout est de savoir comment s'y prendre, car le numrique n'est pas un gage de qualit en soi. Un enregistrement rat restera toujours un enregistrement rat... ft-il numrique !

2.

Les diffrents types de documents analogiques "sons" numriser

Des enregistrements sur tous types de supports : disques vinyles 78, 45 et 33 tours/min (1899 1960s) cassettes audio et micro cassettes (1965 Present) bandes (6,25 et 6,35 mm, 1,2 - 2,4 - 4,75 - 9,5 - 19 cm/s, 2 et 4 pistes - c. 1945 Prsent) cylindres32 de cire (2 4 minutes d'enregistrement - 1888 1929) fil magntique (15 30 minutes d'enregistrement - c. 1945 1955) son des vido (Hi8, Video 8, DV) ...

32 http://cylinders.library.ucsb.edu/ (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 18/84

Sans oublier les vnements live !

3.
a.

Les concepts de base (Dfinitions/Vocabulaire)


Numrisation d'un son

Voir les prconisations du rapport Best Practices For Audio Preservation 33 pour complter les informations ci-dessous. Comme nous l'avons dfini dans l'introduction du cours, le son numriser doit tre chantillonn et quantifi.

I.

L'CHANTILLONNAGE D'UN SON

Le son doit tre chantillonn une frquence au minimum suprieure au double de la frquence maximale contenue dans le signal analogique (thorme de Shannon). Notre oreille peroit les sons jusqu 20 kHz (au grand maximum et partir de l'adolescence, a ne cesse de baisser). Donc la frquence d'chantillonnage doit tre au moins de l'ordre de 40 000 Hz. Quand ce n'est pas le cas, comme on le verra ci-dessous, il est indispensable de supprimer les frquences suprieures la moiti de l'chantillonnage prvu, par un filtre passe-bas. Seules les frquences infrieures une valeur fixe seront transmises au sortir du filtre. On parle aussi de limitation de la bande passante . Frquences d'chantillonnage normalises : 32 kHz : pour la radio FM en numrique (bande-passante limite 15 kHz) 44.1 kHz : pour l'audio professionnelle et les compact-disques 48 kHz : pour les enregistreurs numriques multipistes professionnels et l'enregistrement grand public (DAT, MiniDisc). 96 kHz (en 5.1) : norme pour le DVD-Audio.

II.

LA QUANTIFICATION D'UN SON

Plus le nombre de bits utilis pour le codage sera grand, meilleure sera la ressemblance avec le signal original. Les systmes grand-public actuels (CD, DAT) travaillent avec 16 bits, soient 65536 niveaux. Le standard du DVD audio et des nouvelles machines professionnelles est de 24 bits 96 kHz. Ces caractristiques permettent encore d'amliorer la dynamique et la bande-passante des signaux audio, une reproduction encore plus proche de la ralit, ainsi que la possibilit de se livrer des traitements numriques plus sophistiqus. Comparaison des formats CD-Audio et DVD-Audio34 :

CD-audio Capacit Nombre de canaux Dure denregistrement Nature du signal audio Frquence d'chantillonnage 640 Mo 2 (stro) 74 minutes PCM35 44, 1 kHz

DVD-audio 4,7 Go 26 74 min en 6 canaux PCM et MLP36 Jusqu 192 kHz

33 34 35 36

http://www.dlib.indiana.edu/projects/sounddirections/papersPresent/sd_bp_07.pdf (visit le 24/07/2008) http://www.son-video.com/Conseil/Hifi/DVDAudio.html (visit le 19/07/2007) http://en.wikipedia.org/wiki/PCM (visit le 19/07/2007) http://en.wikipedia.org/wiki/Meridian_Lossless_Packing (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 19/84

CD-audio Dbit 1,4 Mbps

DVD-audio 9,6 Mbps

Le concurrent du DVD-Audio est le Super-Audio CD dont les performances sont comparables mais les technologies sont diffrentes et incompatibles. Jusqu' preuve du contraire, les lecteurs aussi sont incompatibles. [Mise jour du 26/07/2011 : ni l'un ni l'autre des formats ne semble avoir connu de succs. L'heure est d'ailleurs la dmatrialisation des supports, c'est--dire qu'on s'en passe...] Quel format employer en fonction de la qualit souhaite ? Type d'enregistrement Qualit souhaite Studio / Master CD Musique strophonique Archive qualit CD Assez bonne qualit pour transmission sur Internet Studio / Master CD Voix ou musique mono Archive qualit CD Assez bonne qualit pour transmission sur Internet Son type "tlphone" Format employer 48~96 KHz - 16~24 bits linaire - stro 44,1 KHz - 16 bits linaire - stro 44,1 KHz - 16 bits - MPeg 256K - Stro 32 KHz - 16 bits - MPeg 128K Stro-joint 48~96 KHz - 16~24 bits linaire - mono 44,1 KHz - 16 bits linaire - mono 44,1 KHz - 16 bits - MPeg 128K - mono 32 KHz - 16 bits - MPeg 64K mono 16 KHz - 8 bits - Mono

La taille mmoire occupe par du son numrique : Un enregistrement de qualit CD (44,1 kHz, 16 bits stro) occupe 1,4 Mbits/s soit environ 10 Mo / min

la diffrence des images, les sons numriques doivent subir un processus de reconversion en valeurs lectriques analogiques pour pouvoir tre reprsents. Les images, elles, peuvent tre constitues directement de pixels de valeurs de couleurs ponctuellement trs prcises et correspondant directement l'information numrique. Pour le son, on ne peut pas se passer de microphones, d'enceintes ou de casques.

b.
I.

La mesure des sons


LES FRQUENCES DES SONS

Les frquences des signaux sonores se mesurent en Hz, et sont l'inverse de la longueur d'onde du signal. Si vous avez d'excellentes oreilles, les limites frquentielles de votre spectre d'audition s'tendront de 20Hz (vers le grave) jusqu' 15-20kHz (dans les aigus). Attention, notre audition nest pas aussi transparente quon pourrait le croire : nous avons l'impression d'entendre aussi bien les sons aigus, que le mdium ou les graves mais ce n'est pas le cas. L'oreille est trs sensible aux alentours de 2,8-3 kHz, ce qui n'est pas un hasard puisque c'est la frquence moyenne de la voix humaine37. Important : il n'y a aucune raison de limiter la numrisation de l'audio aux frquences et puissances admises et reconnues par l'oreille humaine. Les infra sons et surtout les ultrasons peuvent parfaitement tre capts et numriss. Il faudra simplement un dispositif de transcodage (visuel ou audio) pour les rendre accessibles aux humains.
37 http://www.restauration-audio.com/Les-traitements-psychoacoustiques_a22.html (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 20/84

II.

LES DCIBELS

(Source38). C'est un fait d'exprience ... nos sensations physiques " varient peu " lorsque la grandeur provoquant la stimulation " varie beaucoup ". Fait surprenant mais vrifiable : lorsque nous doublons la puissance d'un appareil producteur de son, c'est peine si nous nous apercevons de l'augmentation de volume ! C'est l'quipe de Graham Bell qui, pour la premire fois de l'histoire, a dvelopp une technique dont l'aboutissement tait l'apprciation de l'un des sens humains : l'audition. Il fallait s'adapter et l'on chercha une fonction qui, comme les sensations, varie peu quand la variable varie beaucoup. Tous les types de logarithmes rpondent ce critre, en particulier le logarithme dcimal. Observons qu'il s'agit, non pas de mesurer, mais de comparer deux sensations. Ds lors, on tablit cette comparaison en prenant le logarithme du rapport des puissances (au sens de la physique) des grandeurs qui provoquent les deux sensations. Ce nombre, cens reprsenter une diffrence de sensations, est donn en Bel, en hommage Graham Bell.

Ecart de sensations en dciBel (dB) =

1 0log

P2 P1

Jusqu'ici, les dcibels ont servi mesurer des variations d'une grandeur. Ils peuvent servir reprer le niveau d'une grandeur physique par rapport un repre appel 0 dB et choisi par pure convention. La puissance sonore (en mW) qui correspond 0 dB rsulte d'une convention internationale. C'est la puissance considre comme minima de perception par un chantillon moyen de population. Cette dfinition est trs arbitraire et dpend la fois des conditions de vie des personnes (campagne calme ou ville bruyante) et du type de bruit considr (stridences, bruit sourd des autos, ptarades etc.). La mesure de la pression acoustique se fait en dcibel (dB)39

La formule

10 log

acoustique multiplie par 10. La valeur de rfrence est le seuil de l'audition (un moustique volant 3 mtres de notre oreille). Le seuil de l'audition est fix 0dB, le seuil de la douleur est de 120dB. Pour bien comprendre ce que signifient ces chiffres, la pression acoustique est multiplie par un facteur de 1000 milliards entre 0 et 120 dB. Quelques chiffres sur les intensits sonores : 0 dB : seuil d'audibilit De 0 10 dB : dsert De 10 20 dB : cabine de prise de son De 20 30 dB : conversation voix basses, chuchotement De 30 40 dB : fort De 40 50 dB : bibliothque, lave-vaisselle De 50 60 dB : lave-linge De 60 70 dB : sche-linge, sonnerie de tlphone, tlviseur, conversation courante De 70 80 dB : aspirateur, restaurant bruyant De 80 90 dB : tondeuse gazon, klaxon de voiture De 90 100 dB : route circulation dense, trononneuse, atelier de forgeage De 100 110 dB : marteau-piqueur moins de 5 mtres dans une rue, discothque De 110 120 dB : tonnerre, atelier de chaudronnerie 120 dB : seuil de la douleur De 120 130 dB : sirne d'un vhicule de pompier, avion au dcollage ( 300 mtres) , concert amplifi 180 dB : dcollage de la fuse Ariane, lancement d'une roquette 194 dB : son le plus bruyant possible Source : wikipedia40

P2 P1

signifie qu'une augmentation d'un dciBel correspond une pression

38 http://perso.orange.fr/arsene.perez-mas/signal/decibels/decibels.html (visit le 19/07/2007) 39 http://en.wikipedia.org/wiki/Decibels (visit le 19/07/2007) 40 http://fr.wikipedia.org/wiki/D%C3%A9cibel (visit le 25/09/2008)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 21/84

III.

DYNAMIQUE D'UN SON ET SA COMPRESSION

Attention de ne pas confondre compression dynamique des sons avec la compression informatique (voir ciaprs). La dynamique (audio) c'est l'cart existant entre le son le plus faible et le plus fort dans un morceau. La 9e symphonie de Beethoven est connue pour tre l'une des uvres de la musique classique ayant la plus grande dynamique. Cela signifie que dans cette uvre il existe des passages qui sont extrmement doux (pianissimo) et d'autres au contraire extrmement forts (fortissimo). Il est possible suivant les interprtations et les effectifs qu'en concert les 100 dB de dynamique soient dpasss, ce qui est norme. La compression dynamique audio consiste rduire artificiellement cette dynamique, cet cart entre les sons faibles et les sons forts. Une srie d'articles de blog retrace l'histoire de la compression dynamique du son enregistr et diffus. C'est passionnant mais cela dpasse largement la porte de ce cours41.

c.

La visualisation d'un son

Outre l'coute, le travail sur un son sera grandement facilit par les techniques permettant de le visualiser...

I.

VOIR LA PUISSANCE DU SON EN FONCTION DU TEMPS

En utilisant Audacity, on peut visualiser un graphique reprsentant la puissance acoustique en fonction du temps. Les zones faiblement actives reprsentent des silences.

II.

VOIR LA DISTRIBUTION INSTANTANE DES FRQUENCES D'UN SON

D'autres visualisations sont possibles, par exemple un diagramme frquence instantan : chaque colonne reprsente un chantillon temporel du son, l'intensit de chaque frquence est rendue par la valeur de luminosit.

41 http://blog.formations-musique.com/index.php?post/2009/04/02/49-sommaire-de-l-histoire-de-la-compression-dynamique-audio (visit le 20/8/2010)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 22/84

... et un sonagramme qui reprsente en dynamique quelles frquences sont prsentes dans un signal un instant prcis :

4.
C h a d e tr n e ite e a m tn m r e s n u u u n iq d o n : r e u u te iq p g a lo C a S to , e g a k c tlu u q g s a e m n ia h n p o o lc r d e ic e r m ,t tu a m T tr ite s u o n p tu h d s n a r l n : a e r u te iq c g u o A C T N C A A n m ite a A r N A q g o tn lifc p r m u a e o lin p m fic a q g r u te a d n O r n o s e 1 0 1 1 0 0 1 1 0 0 1 1 0 0 1 D o lo e e in u a iq mg i a m u mu o e D n iq r e D e u in iq a g m lo o a e O n e d s o e r n m u a iq tis g r lo e a v n n r o u C e i g u lo tis a r m e u v n n C o q

La prsentation de la chane numrique

On peut reprsenter la chane de traitement numrique par le schma suivant :

Pour un expos complet des meilleures pratiques de numrisation des sons, cf Capturing Analog Sound for Digital Preservation: Report of a Roundtable Discussion of Best Practices for Transferring Analog Discs and Tapes, March 2006 42 voir aussi, en franais, l'article Numrisez vos vinyles grce GarageBand 43

42 http://www.clir.org/pubs/reports/pub137/pub137.pdf 43 http://www.cuk.ch/articles/3040 (visit le 29/08/2009)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 23/84

5.

Les matriels et logiciels

Voir sur le site d'un passionn de restauration numrique une liste d'appareils de niveau professionnel44.

a.
I.

La lecture
POUR LES DISQUES

Ncessite un capteur de la meilleure qualit possible et un support analogique le plus propre possible. Il existe des appareils spcialiss : la KEITH MONKS cleaning machine. Machine professionnelle destine nettoyer en profondeur les 78 tours et les vinyles. Il existe des platines disques professionnelles, telles que : la Platine tourne disques Bang & Olufsen BEOGRAM 4002 bras tangentiel. Platine tourne disques professionnelle STANTON avec un choix de plusieurs cellules et diamants de diffrentes tailles, pour s'adapter le mieux possible aux caractristiques du sillon lire. Possibilit de lecture l'envers, souvent utile pour les sillons fatigus d'tre lus l'endroit...

II.

POUR LES BANDES

La rfrence reste le STUDER REVOX PR99. Machine professionnelle de fabrication Suisse, la plus utilise dans les radios et les studios d'enregistrement avant le passage au numrique. 2 pistes. Vitesses 19 et 38 cm/s.

b.

La pr-amplification

Le pramplificateur effectue un premier traitement analogique sur le son (cette tape inclut les oprations de mixage dont la complexit dpasse le cadre de ce cours). On branche ensuite le pramplificateur l'entre line-in de la carte son de l'ordinateur (o, pour des projets trs pointus, on branche un Convertisseur Analogique Numrique externe)

c.

Les logiciels d'enregistrements

Un logiciel spcialis intervient alors pour numriser le son entrant dans l'ordinateur (rglages effectuer pour la qualit de l'chantillonnage et de la quantification). Par exemple on peut employer Audacity, logiciel Open Source, multi-plate formes et trs complet permettant d'effectuer toutes sortes de traitements. Des experts utilisent Audacity pour numriser professionnellement des sons. Voir l'excellent article Digitizing records and tapes with Audacity 45 Par contre, la rfrence reste Pro Tools HD distribu par DIGIDESIGN. diteur audio rput dans tous les studios du monde.

d.

Le traitement

Vise supprimer les silences non dsirs, nettoyer l'enregistrement d'ventuels cracks , filtrer les frquences contenant trop de souffle, etc... Des logiciels trs spcialiss permettent d'effectuer ces oprations trs coteuses en temps de faon semi-automatique. Exemple : CEDAR DC1 Declicker. Capable d'effectuer 50 millions d'oprations la seconde ce qui lui permet d'radiquer plus de 2500 "scratches" ou "clicks" par seconde. Systme coteux mais un des meilleurs. Aural exiter APHEX 204. Permet de redonner de l'paisseur, de la brillance et ses harmoniques natives un enregistrement analogique altr par le temps et l'usure des lectures.

Il est possible d'couter des exemples sonores46 de restauration47.

44 45 46 47

http://www.restauration-audio.com/L-equipement-audio-du-studio-LRA_a6.html (visit le 20/8/2010) http://www.linux.com/articles/119550 (visit le 17/06/2008) http://www.restauration-audio.com/index.php?action=article&id_article=174099 (visit le 19/07/2007) http://www.restauration-audio.com/Qu-est-ce-que-la-restauration-sonore-_a13.html (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 24/84

Les logiciels d'dition audio classiques peuvent aussi restaurer et amliorer les sons numriss. Consultez le guide de restauration audio sur le site digitalFAQ48 et les fonctions utiles d'Audacity49.

6.
a.

Enregistrement et compression de l'audio


Introduction sur la taille des fichiers audio non compresss

Ci-dessous un tableau des tailles de fichiers non compresss en fonction de la qualit de la numrisation voulue. On comprends vite la ncessit de trouver un moyen d'en rduire la taille. Qualit Tlphone Radio Radio CD Audio Echantillonnage (kHz) 11 22 22 44 Quantification (bits) 8 8 16 16 Mono/Stro mono stro stro stro Taille (1 min, en Ko) 660 2560 5120 10 240

Les formats audio sont multiples et il est parfois difficile de s'y reprer. Consultez un tableau complet50 et trs document sur le site Sustainability of Digital Formats Planning for Library of Congress Collections .

b.

Notion de CODEC

Un codec est un programme informatique charg de COder un fichier numrique d'un format un autre, souvent plus lger. Il est aussi charg, dans l'autre sens, de DECoder le fichier encod. La notion de CODEC n'est pas la mme que celle du format de fichier : un unique format de fichier (exemple .wma) peut accueillir en son sein des donnes mdia encodes par diffrents codecs (en l'occurrence diffrentes versions du codec audio de Microsoft). En d'autres termes, la connaissance du format d'un fichier ne suffit pas toujours dterminer comment les donnes mdia ont t encodes. Toutefois, lorsque c'est le cas, on a tendance confondre format et codec...

c.

Compression de mdia vs. compression de fichiers textes

Les codecs bureautiques classiques (zip, bz2, 7z, ...) recherchent des redondances de caractres pour allger l'encodage des textes. Ils sont notoirement inefficaces pour compresser les mdia audio et vido.

d.

Codecs et formats sans pertes

Pour une analyse dtaille des diffrents codecs audio sans pertes , c'est--dire partir desquels on peut reconstituer octet par octet le fichier audio initialement numris, voire aussi la page Lossless comparaison 51.

I.

WAV (FORMAT OUVERT)

Wav (.wav) est le format standard pour l'audio numris mais non compress, en utilisant le codec de base PCM52. Les CD Audio stockent leurs donnes dans un format proche du WAV. Les logiciels d'dition sonore ncessitent galement que les sons soient dans ce format pour pouvoir les diter. Des logiciels comme Audacity permettent tout de mme d'importer des fichiers mp3 qu'ils reconvertissent d'abord en .Wav (Source53). Attention, les fichiers Wav sont limits 2 Gio, ce qui peut tre limitant dans certains cas. Codage/dcodage dans Audacity notamment.

48 49 50 51 52 53

http://www.digitalfaq.com/guides/video/introduction-restore-audio.htm (visitle18/8/2010) http://www.tested.com/news/how-to-rip-and-clean-your-analog-audio-collection/460/ (visitle18/8/2010) http://www.digitalpreservation.gov/formats/fdd/sound_fdd.shtml (visit le 19/07/2007) http://wiki.hydrogenaudio.org/index.php?title=Lossless_comparison (visit le 19/07/2007) http://fr.wikipedia.org/wiki/Modulation_d%27impulsion_cod%C3%A9e (visit le 29/08/2009) http://fr.wikipedia.org/wiki/WAVEform_audio_format (visit le 7/09/2009)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 25/84

II.

BROADCAST WAVE FORMAT (BWF)

C'est une extension du format WAV, permettant l'ajout de mtadonnes internes au fichier. Les fichiers BWF ont une extension WAV et sont lus par les logiciels lisant habituellement le WAV. Cf la page BWF 54 de Wikipedia pour plus d'info.

III.

MPEG-4 AUDIO LOSSLESS CODING (ALS) MPEG

La compression sans pertes est le dveloppement le plus rcent du standard audio MPEG-4, destine aux signaux audio en haute dfinition. La technologie de base a t dveloppe par le NUe Group (Fachgebiet Nachrichtenbertragung) l'universit technique de Berlin. La norme ISO du MPEG-4 ALS est ISO/IEC 144963:2005/Amd 2:2006.55 Ce format n'est pas encore rpandu du fait du manque (depuis 2006) d'encodeurs et de dcodeurs.

IV.

APPLE AAC LOSSLESS (CODEC ET FORMAT PROPRITAIRES)

Apple Lossless Audio Codec (ALAC) est un codec d'encodage sans perte (lossless) apparu en 2004. Il a t dvelopp par Apple pour combler une lacune de la norme MPEG-4, dont la partie consacre l'encodage sans perte tardait alors tre finalise. ALAC est un codec propritaire et qui s'adresse majoritairement aux utilisateurs d'iTunes et des iPod. l'instar de tous les codecs sans perte, ALAC permet de compresser sans aucune dgradation des fichiers musicaux au format PCM un taux de compression voisin de 40 50% (les ratios mesurs peuvent cependant grandement varier en fonction principalement du volume de la piste : plus le volume est fort (pour la pop music par exemple), plus le ratio est mauvais, l'inverse du classique. En regard des codecs concurrents, ALAC prsente une efficacit moindre. Cette contre-performance est toutefois partiellement dlibre, puisque le codec a t essentiellement dvelopp en vue de produire des fichiers capables d'tre dcods par des appareils bien moins puissants et autonomes que les ordinateurs de bureau (pour l'ipod en particulier). Une meilleure compression suppose en effet une complexit accrue, complexit ayant pour consquence de rduire l'autonomie des appareils nomades. Ainsi, les quelques pourcentages perdus en terme de ratio de compression sont compenss par une implmentation matrielle facilite. Nanmoins, ALAC reste actuellement infrieur aux autres codecs sans perte de faible complexit. FLAC prsente ainsi une rapidit suprieure pour un taux de compression quasiidentique, alors que WavPack bnficie de performances en tous points (ratio de compression, vitesse d'encodage et de dcodage) suprieures. Codage/Dcodage : iTunes, QuickTime (Source56).

V.

FLAC CODECETFORMATOUVERT) (

Free Lossless Audio Codec (FLAC) est un codec libre de compression audio sans perte. Un enregistrement numrique (tel qu'un CD) cod en FLAC peut tre dcompress pour obtenir une copie identique octet par octet celle de l'enregistrement numrique initial. Les sources audio peuvent tre codes en FLAC pour permettre une rduction de taille de 30 70 %. La rduction de taille dpend de la source : plus le signal est constitu d'ondes rgulires (sons naturels), meilleure est la compression. Par contre, un signal alatoire (bruit) ne se compresse pas trs bien. Ce phnomne se constate pour tous les codecs de compression sans perte. FLAC est appropri pour tous les archivages de donnes audio, avec le support des mtadonnes, de l'image de couverture, ainsi que pour la recherche rapide. FLAC est libre et open source ; ne ncessitant pas le paiement de redevances, il est bien support par de nombreux logiciels.57 Codage/dcodage par de nombreux outils gratuits ou OpenSource dont Audacity, lecture par VLC.

54 55 56 57

http://en.wikipedia.org/wiki/Broadcast_Wave_Format visit le mardi 6 septembre 2011 http://en.wikipedia.org/wiki/MPEG-4_ALS (visit le 29/08/2009) http://fr.wikipedia.org/wiki/Apple_Lossless (visit le 19/07/2007) http://fr.wikipedia.org/wiki/Free_Lossless_Audio_Codec (visit le 7/09/2009)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 26/84

e.

Codecs et formats avec pertes

Pour compresser plus fortement les fichiers audio, on utilise les limitations de l'oreille humaine qui ne peroit pas certaines donnes audio58 et on code de faon compacte des donnes rptitives.

I.

MP3 FORMATETCODECPROPRITAIRES) (

Le MPEG-1/2 Audio Layer 3, plus connu sous son abrviation de MP3, est la spcification sonore du standard MPEG-1, du Moving Picture Experts Group (MPEG). C'est un codec capable de rduire drastiquement la quantit de donnes ncessaire pour restituer de l'audio, mais qui, pour l'auditeur, ressemble une reproduction du son original non compress, c'est--dire avec perte de qualit sonore significative mais acceptable pour l'oreille humaine. L'extension de nom de fichier est .mp3 et le type MIME est audio/mpeg[1]. Ce type de fichier est appel fichier MP3 . Le codage MPEG-1/2 Layer 2 est n avec le projet Digital Audio Broadcasting (radio numrique DAB) qui fut lanc par le Deutsche Luft und Raumfahrt. Ce projet a t financ par l'Union europenne, et faisait partie du programme de recherche EUREKA. Ce format populaire de compression audio permet une compression allant de 1/4 1/12. Un fichier audio occupe ainsi quatre douze fois moins d'espace une fois compress au format MP3. Le taux de compression peut tre augment en choisissant un dbit binaire (en anglais bitrate) plus faible. On considre en gnral qu'il faut au moins 128 ou 192 kilobits par seconde (kbit/s) pour bnficier d'une qualit audio acceptable pour un morceau de musique. 8 kbit/s, le son est fortement altr (bruits parasites non attendus, spectre sourd , ). Ce codec utilise un systme de compression partiellement destructif. Il ne stocke pas intgralement le spectre des frquences audio. Il tente d'annuler d'abord les sons les moins perus de faon ce que les dgradations se fassent le moins remarquer possible. Ce n'est pas une compression proprement parler, mais plutt une suppression d'informations. La compression au format MP3 exploite un modle psycho-acoustique de l'effet dit de masque : si deux frquences d'intensits diffrentes sont prsentes en mme temps, l'une peut tre moins perue que l'autre selon que ces deux frquences sont proches ou non. La modlisation de notre audition selon ce principe est au dpart empirique, mais assez efficace. Toutefois, si le taux de compression est trop important, on peut tre amen faire ressortir certaines harmoniques inattendues. Cela donne alors l'impression de bruits parasites et dsagrables au milieu du son. On peut amliorer la qualit dbit moyen gal en utilisant un dbit binaire variable (VBR ou Variable Bit Rate par opposition un dbit constant Constant bit rate, CBR). Dans ce cas, les passages peu complexes, comme les silences seront cods avec un dbit d'information plus faible (avec moins d'octets ). On peut ainsi coder 64 kbit/s au lieu de 128, rduisant ainsi la taille totale du fichier tout en gardant une trs bonne qualit lors des passages riches en harmoniques. L'amlioration apporte est variable selon le morceau cod. L'encodage en VBR peut nanmoins poser des problmes de compatibilit avec certains lecteurs.59 La popularit du format MP3 ne se dment pas, mme compte tenu de son obsolescence technique. L'un des plus importants magasins de vente de musique en ligne, Amazon, utilise encore ce format. Codage/dcodage avec le codec LameEncoder, encoder MP3 Open Source, qui produit, de l'avis gnral, la meilleure compression. LameEncoder est intgrable Audacity.

58 http://en.wikipedia.org/wiki/Psychoacoustics (visit le 19/07/2007) 59 http://fr.wikipedia.org/wiki/Mp3 (visit le 7/09/2009)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 27/84

II.

REALAUDIO FORMATETCODECPROPRITAIRES) (

RealAudio (.ra)60 est un format de stream (de diffusion en continu) souvent utilis par les radios qui diffusent sur internet. A qualit quivalente, les fichiers en RealAudio sont plus petits qu'encods en MP3 mais de moins bonne qualit si le dbit est faible. Codage/dcodage : RealProducer61, dcodage simple avec le lecteur RealPlayer.

III.

OGGETVORBIS(FORMATETCODECOUVERTS)

Ogg (prononcer augue ) est le nom du principal projet de la fondation Xiph.Org dont le but est de proposer la communaut des formats et codecs multimdias ouverts, libres et dgags de tout brevet. Cest aussi le nom du format de fichier conteneur propos par ce mme projet. Lextension .ogg est une des extensions possibles pour les fichiers au format Ogg. Par abus de langage, on appelle couramment fichier Ogg un fichier audio au format Ogg contenant des donnes audio compresses en Vorbis, lun des codecs du projet Ogg. La fondation Xiph.Org a pourtant cr un ensemble d'extensions pour les diffrents types de contenus : .oga pour les fichiers audio uniquement, .ogv pour la vido (gnralement encode avec Theora)62 codage/dcodage : Audacity ; lecture : vlc.

IV.

MP3PRO FORMATETCODECPROPRITAIRES) (

La compression mp3Pro63 se prsente comme un successeur avantageux au mp3. En effet, les fichiers gnrs par un encodeur mp3PRO sont compatibles avec tous les lecteurs mp3. Cependant seuls les lecteurs certifis mp3PRO bnficient des avantages supplmentaires de cet encodage. L'encodage mp3Pro prsente trois particularits qui en font un systme de compression offrant de meilleurs rsultats sonores que ceux d'un simple mp3 standard : L'utilisation du VBR (pour Variable Bit Rating) qui adapte en temps rel le dbit en fonction de la densit et de la complexit sonore ; La prservation de la bande passante aigu normalement sacrifie par le mp3 standard ; Une qualit sonore quivalente au 320 kbit/s du layer III en VBR (qui varie entre 64 kbit/s et 128 kbit/s) si bien qu' qualit gale un fichier mp3Pro permet un gain de place substantiel par rapport un fichier mp3 standard (entre 25% et 50% de gain).

Le Codec mp3PRO est propritaire. Nanmoins un lecteur MP3 standard saura lire un mp3PRO, avec une qualit moindre. Trs peu de logiciels prennent en compte le mp3PRO et seuls les baladeurs de marque Thomson et ses filiales savent en tirer pleinement profit. Codage/dcodage : Thomsom Encoder64, ou Audion pour Mac65.

V.

AAC FORMATOUVERT) (

AAC - Advanced Audio Coding - L'Advanced Audio Coding ou AAC est un algorithme de compression audio avec perte de donnes ayant pour but d'offrir un meilleur ratio qualit/compression que le format plus ancien MPEG-1/2 Layer 3 (plus connu sous le nom de MP3). Utilis dans iTunes, iPod et largement rpandu grce au succs de l'Itunes Store. Peut-tre utilis avec des DRM. Il est dfini dans la partie 3 de la norme MPEG4 . Les amliorations apportes par l'AAC touchent notamment :
60 61 62 63 64 65

les frquences d'chantillonnage : de 8 kHz 96 kHz (MP3 officiel : 16 48 kHz) ; le nombre de canaux : jusqu' 48 ; une meilleure gestion des frquences au-del de 16 kHz ; Ces avances techniques devant apporter l'auditeur un message audio d'une qualit et d'une stabilit accrue par rapport au MP3 frquence d'chantillonnage quivalente ou infrieure.

http://en.wikipedia.org/wiki/Realaudio (visit le 19/07/2007) http://www.realnetworks.com/products/producer/index.html (visit le 19/07/2007) http://fr.wikipedia.org/wiki/Ogg (visit le 7/09/2009) http://fr.wikipedia.org/wiki/Mp3PRO (visit le 7/09/2009) http://www.mp3prozone.com/download.htm (visit le 19/07/2007) http://www.panic.com/audion (visit le 9/10/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 28/84

L'AAC adopte une approche modulaire du codage : en fonction de la complexit du flux coder, de la qualit vise et de la taille du fichier que l'on souhaite obtenir. L'utilisateur peut crer des profils afin de dfinir l'outil qu'il souhaite utiliser parmi le jeu de rglages prdfinis. l'intgration de systmes de DRM.

L'extension de fichier gnralement adopte est .mp4 (pour MPEG-4), .m4a (pour MPEG-4 audio) ou .m4p (pour MPEG-4 protg). Codage/dcodage : iTunes, QuickTime, VLC pour le dcodage des fichiers sans DRM.

VI.

WINDOWS MEDIA AUDIO FORMATETCODECPROPRITAIRES) (

Windows Media Audio66 aussi appel WMA est un format propritaire de compression audio de type lossy (destructeur) dvelopp par Microsoft. Le format WMA offre pour spcificit la possibilit de protger ds l'encodage les fichiers de sortie contre la copie illgale par une technique de gestion des droits numriques (DRM en anglais). Le format existe sous deux formes : le WMA Standard, le premier tre sorti, le plus rpandu sur Internet et le seul tre lisible (actuellement) sur de nombreux baladeurs numriques le WMA Pro, thoriquement de meilleure qualit mais bien moins rpandu.

Les deux sont capables de coder en dbit constant (CBR) ou en dbit variable (VBR). Le codec wma est parmi tous les formats d'encodage avec pertes disponibles l'un des plus rapides.

f.

Cas du MIDI

Le Musical Instrument Digital Interface ou MIDI est parfois confondu avec les formats dcrits ci-dessus. C'est un protocole de communication et de commande permettant l'change de donnes entre instruments de musique lectronique, un ou plusieurs de ces instruments pouvant tre des ordinateurs. Il permet de prciser le type d'instrument, la note, la dure, etc... Les fichiers MIDI sont reproduits sur ordinateurs ou sur instruments MIDI l'aide de sons pr-numriss ou synthtiss. En ce sens, les fichiers MIDI sont l'quivalent des formats vectoriels pour les images. Ils prennent en gnral trs peu de place puisque ne sont codes que des descriptions textuelles des sons reproduire.

g.

Le(les) formats choisir pour l'archivage

Les formats privilgier pour un archivage des sons (on parle de fichiers master ou matres partir desquels seront drivs les fichiers de diffusion) sont ceux qui contiennent toute l'information numrise, et qui sont donc de la qualit maximale possible. On choisira prfrentiellement le format Wav (aucune compression) ou FLAC (compression sans pertes).

h.

Les formats choisir pour la diffusion

Pour la diffusion, on peut choisir un format avec pertes (MP3, MP4 ou OGG), dont les paramtres seront soigneusement choisis pour minimiser la perte d'information et, suivant les besoins, stream. viter les formats propritaires tels que WMA. On voit apparatre de nouvelles faons de diffuser, en intgrant le son dans un fichier flash. L'avantage est l'absence de plugins supplmentaires ncessaires la lecture (Flash tant extrmement rpandu) et une certaine barrire la rcupration du fichier son en tant que fichier indpendant. Cette protection est cependant bien facilement contournable. L'anne 2005/2006 a aussi t marque par le dveloppement du podcast qui combine une diffusion de fichiers MP3 ou MP4 un abonnement RSS. Cf Best Practice Guidelines for Digital Collections at the UM Libraries67 appendice VIII pour des exemples de bonnes pratiques. Cf Appendix IV: A Typology of Formats pour des guides de rfrence sur les formats audio.

i.

Paramtres de numrisation et de compression

Les paramtres de numrisation et de compression s'expriment d'une faon lgrement diffrente de ce qui a t prsent jusqu' prsent. On utilise l'chantillonnage d'une part, exprim en Hz, et le dbit, exprim en kbps. En dehors de contraintes spcifiques lies aux technologies de diffusion (tlphone, bande FM, )
66 http://en.wikipedia.org/wiki/Windows_Media_Audio (visit le 19/07/2007) 67 http://www.lib.umd.edu/dcr/publications/best_practice.pdf (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 29/84

l'chantillonnage n'est pas une valeur qu'on peut modifier loisir cause du thorme de Shannon. Il est le plus souvent fix 44,1 kHz ou 48 kHz. Par contre, le vritable paramtre sur lequel on peut ajuster la qualit de compression est le dbit (outre le CODEC de compression videmment). Petit rappel de robinets qui remplissent des baignoires qui fuient (!) : Un dbit de 1 kbps = 1000 bits par seconde. Un fichier audio ayant un dbit de 1 kbps et durant 3 minutes aura donc une taille de : 3*180*1000/8 = 67500 octets soit 67,5 Ko. Un fichier de 3 minutes numris et compress au dbit constant (ou moyen) de 320 kbps aura la taille suivante : 3*60*320000/8 = 7,2 Mo Prenons l'exemple d'une compression en mp3 en utilisant Audacity avec le plugin LameEncoder. Le flux bitrate est ici choisi en mode moyenne (ABR : Average Bitrate) ce qui permet au compresseur de dpenser plus d'information dans les passages sonores qui le ncessitent tout en assurant une taille moyenne prdictible. Voici quelques uns des paramtres qu'on peut conseiller pour la diffusion : rglage tlphone : 16kbps/mono voix : 56kbps/mono fm/tape : 112kbps hifi : 160kbps cd : 192kbps studio : 256kbps

j.

Exemples de paramtres d'un fichier audio rel

* * * MediaInfo Mac 0.7.33.4 file analysis report. Report for file: 0001-version_brute.mp3 General / Container Stream #1 Total Audio Streams for this File.................1 Audio Codecs Used.................................MPEG-1 Audio layer 3 File Format.......................................MPEG Audio Play Time.........................................3mn 12s Total File Size...................................2.94 MiB Total Stream BitRate..............................128 Kbps Audio Stream #1 Codec.............................................MPEG Audio Audio Stream Length...............................3mn 12s 390ms Audio Stream BitRate..............................128 Kbps Audio Stream BitRate Mode.........................CBR Number of Audio Channels..........................1 Sampling Rate.....................................44.1 KHz Audio Stream Delay................................187ms Audio Stream Size.................................2.94 MiB (100%)

Pour info, la meilleure qualit en MP3 s'obtient en choisissant un mode constant bitrate et un flux de 320kbps, en chantillonnant la frquence maximale (48kHz). Faut-il encore que le son analogique et numris soient de grande qualit, sinon, c'est inutile. Un contrle auditif est toujours conseill (attention la qualit du matriel de reproduction et aux conditions environnementales).

k.

Restitution du son

Comme indiqu ci-avant, la restitution d'un son ncessite son codage inverse en analogique l'aide d'un processeur ou d'un processus CNA (Convertisseur Numrique Analogique). Si le format n'est pas un format directement exploitable il faut d'abord ramener le son un format WAV puis le convertir en analogique.

l.

En savoir plus sur les formats...

C'est le document le plus complet que j'ai trouv ! Le Guide Mthodologique pour le choix de formats numriques prennes dans un contexte de donnes orales et visuelles du projet TGE-Adonis68.

7.

tude de cas : le Cornell Lab of Ornithology

68 http://www.tge-adonis.fr/sites/default/files/ressourcesdoc/guide_formats_numeriques-05.pdf, visit le mardi 6 septembre 2011

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 30/84

a.

Introduction

Ce qui suit est la traduction partielle et grands traits de l'article Digitizing the Worlds Largest Collection of Natural Sounds : Key Factors to Consider when Transferring Analog-Based Audio Materials to Digital Formats 69 de la revue RLG DigiNews (fvrier 2004). Il est fortement recommand de le lire en intgralit ! Projet de la Macauly Library70 : Concerne : the Macaulay Library of Natural Sounds (MLNS)[1] at Cornell University, 160 000 enregistrements d'oiseaux, d'insectes, de grenouilles, et de cris de mammifres. Formats analogiques : disques actates, cassettes, bandes, dans des tats de conservation trs varis (certaines bandes ont ncessit un traitement spcifique avant exploitation). 6 studios de numrisation compltement quips

b.
I.

Etapes cruciales de ce projet


LES MDIA ET FORMATS ANALOGIQUES
Examen des bandes, et traitement prventif pour temporairement les "stabiliser" par une cuisson 50C pendant 24 heures. Certaines avaient leurs axes briss, d'autres avaient des traces d'adhsifs. Examen du format d'enregistrement de chaque bande, rendu ais par des "mtadonnes" compltes sur l'enregistrement et le modle de magntophone utilis pour les produire. Pour les cas litigieux, utilisation d'un "dveloppeur magntique" permettant de visualiser l'enregistrement magntique et de dterminer quelles ttes choisir. Utilisation d'un magntophone haut de gamme (Studer A-820) dont la propret et la tension de la bande ont t rgulirement vrifis. Lecture en vitesse lente pour tenir compte des bandes fragiles Calibration des ttes de lecture en utilisant des normes internationales : alignement des ttes (hauteur, azimuth, ...), qualisation de la lecture, niveaux de lecture, vitesse, ...

Concernant les cassettes audio, lecture par un magntophone professionnel Nakamichi CR-7A calibr et mis en marche avec le mme soin Les calibrations et alignements des ttes furent accomplies l'aide de tests informatiss de la socit Audio Precision, spcialise dans toutes les mesures audio. Les rsultats des tests initiaux furent rgulirement compars aux tests raliss en cours de numrisation pour suivre l'volution des performances des lecteurs. Ceci permit de dceler les problmes avant qu'ils aient des incidences sur le processus de numrisation luimme.

II.

LA CONVERSION ANALOGIQUE/ NUMRIQUE

Le convertisseur fut l'objet d'une attention toute particulire. Cet lment est l'un des maillons primordiaux de la chane de numrisation et son mauvais fonctionnement pouvait dtruire tous les efforts effectus par ailleurs. Dans le cas prsent, les sons sont d'excellente qualit, couvrant un large spectre. Les objectifs taient ici de raliser une numrisation d'une qualit sans compromis. Les tests raliss sur 6 matriels aux caractristiques techniques apparemment proches ont donn des rsultats trs diffrents. Le choix s'est finalement port sur le Prism Dream AD-2, le seul dispositif ne pas "colorer" les signaux. Qu'est-ce qui constitue un bon convertisseur analogique/numrique ? : capacit prendre en compte l'intgralit du spectre sonore numriser : de 4 32 kHz, chantillonn 96 kHz capacit rendre la dynamique : quantification sur 24 bits (128 dB rendus)

(cf les autres caractristiques dans l'article original)

69 http://worldcat.org/arcviewer/1/OCC/2007/08/08/0000070519/viewer/file3226.html (visit le 7/09/2009) 70 http://www.animalbehaviorarchive.org/loginPublic.do (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 31/84

Ces spcifications ne sont pas facilement rencontres dans les cartes sons prsentes dans les ordinateurs, ni dans les enregistreurs de CD-AUDIO grand public. Les quipements doivent de plus : avoir un courant lectrique trs pur, tre fixs au sol pour viter toute vibration tre pilots par des horloges ultra prcises utiliser des composants lectroniques de trs grande qualit faible tolrance, un design de carte lectronique de trs grande qualit.

Tout ceci un prix, mais cela en valait la peine pour ce projet Un autre lment cl du processus fut la dtermination du niveau de signal de transfert : utilisation d'un pramplificateur Benchmark Media trs faible bruit, et faible distorsion entre le lecteur analogique et le convertisseur A/N. Ses vue-mtres ont t trs utiles pour dterminer le bon niveau d'entre sur le convertisseur A/N (pas assez = perte de dynamique, trop fort : saturation du signal). En complment de la surveillance du signal par vue-mtres, un second dispositif de surveillance a t mis en place utilisant l'oreille humaine. Il a fallu pour cela employer un convertisseur inverse (numrique => analogique) et des hauts-parleurs de contrle. Un dispositif permettait l'oprateur de passer facilement de la lecture analogique la lecture du signal numris et, ainsi, de se rendre compte trs rapidement de tout problme potentiel.

III.

L'DITION DU SIGNAL NUMRIQUE

Grce une station digital audio workstation (DAW), le cas chant, pour crer des fade-in fade out, ajouter des mta informations vocales, attribuer chaque fichier un nom unique et construire les fichiers permettant en fin de compte de crer les DVD-R. Le modle retenu a t un matriel Sonic, pour sa capacit prserver la qualit du signal des enregistrements initiaux vers les enregistrement finaux en 48 bits tout au long du processus ( la diffrence de la plupart des units logiques qui travaillent en 32 bits en virgule flottante, le Sonic Studio HD utilise des units logiques de 48 bits - c'est une prcision suprieure de 16 bits ce qu'on a habituellement avec des signaux 24 bits). Ceci amliore grandement les erreurs d'arrondis.

IV.

QUELS FORMATS ET MDIA CHOISIS ?

Donnes prliminaires : le choix du stockage optique avait dj t fait les besoins de stockage allaient tre normes (32 Mo/minute en stro) cause des paramtres de numrisation choisis (chantillonnage 96 kHz, sur 24 bits)

le choix du DVD-R a t fait sur ces bases. Concernant le format, le DVD-Audio a t envisag mais ses contraintes en termes de protection par les industriels ont ts juges rdhibitoires. Le choix finalement a t fait de graver les disques en format DVDROM et en AIFF (quivalent du Wav). Chaque fichier audio comporte une identification audio au dbut qui est compose du numro de l'asset. Ce numro est repris dans le nom du fichier. Aucune autre mtadonne n'est inclue dans les fichiers audio. Elles sont enregistres dans une base de donnes relationnelle spare. Les disques ont t gravs en utilisant des Pioneer DVR-S201. Les disques ont t achets par lots de 100 ou 200 chez Maxell, TDK et Pionner. Il faut environ une heure pour enregistrer 4,3 Go de donnes (les disques ne sont pas remplis car les tests ont rvl que leur qualit se dgrade au centre !) Chaque disque a t grav en double exemplaire et contient 125 minutes de stro ou 250 minutes de mono. Un disque est plac dans un jukebox Plasmon D-480 pour la distribution en interne, le second est dplac hors site, pour un stockage scuris, l'atmosphre contrle, sous terre.

V.

LE CONTRLE QUALIT

Les DVD-R, comme les CD-R peuvent poser problme lors de leur conservation au cours du temps. Des tests effectus pour maximiser la dure de vie de chaque disque enregistr : chaque disque vierge est analys par le systme "AudioDev Computer Aided Test System" qui consiste en 20 tests diffrents. chaque disque enregistr est vrifi. 50 paramtres importants sont tests cette tape. Les disques rejets sont examins en dtail.

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 32/84

Surveillance des archives : Toutes les donnes du contrle qualit sont stockes numriquement. Les disques sont priodiquement et alatoirement re-tests. Les donnes des tests sont compares aux donnes de tests initiales. Toute dgradation est rapidement analyse et un clone est cr. Cf aussi le cours sur l'archivage pour plus de dtail sur ces procdures qualit.

VI.

ACCESSIBILIT/DISTRIBUTION

Ces disques sont les "curs d'archive". Les donnes hautes-rsolutions sont disponibles uniquement en interne. Pour la distribution par internet, des fichiers drivs de moindre qualit sont crs et notamment des enregistrement au format CD-audio, des MP3 96kbps, des streams RealAudio et Quicktime. Ces donnes rsident sur un serveur Apple Xserve RAID de 25 teraoctets. Le backup de ces fichiers est assur par un systme bandes.

c.

Autre tude de cas

Large Scale Digitization of Oral History71

8.

Quelques documents importants

a. Guide pour l'criture d'un cahier des charges de numrisation de collections sonores, audiovisuelles et filmiques
Le Ministere de la Culture et de la Communication a publi en 2009 un guide trs complet couvrant la fois les collections sonores et les collections audiovisuelles. Sa lecture est recommande, il est consultable en ligne72

b.

Le Cours Audio Multimdia...

... est un Cours de technique du son, discipline qui, au fil des annes s'est de plus en plus dveloppe, touchant d'autres secteurs spcialiss. Ce Cours essaie donc d'offrir un panorama, le plus complet possible, sur tous les aspects en question. Une excellente ressource ! Consultable en ligne73.

71 http://www.dlib.org/dlib/may07/weig/05weig.html (visit le 19/07/2007) 72 crire un cahier des charges de numrisation de collections sonores, audiovisuelles et filmiques, Paris, Ministre de la Culture et de la Communication, comit de pilotage numrisation, Bibliothque nationale de France, 2009, 33 p. < http://www.culture.fr/culture/mrt/numerisation/fr/technique/documents/cahier_charges_numerisation.pdf > Consult le mardi 6 septembre 2011. 73 http://www.audiosonica.com/fr/cours/post/2/Table_des_matieres visit le vendredi 9 septembre 2011

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 33/84

C.
1.

La numrisation des images et des textes


Les diffrents types de documents analogiques visuels numriser

Les documents analogiques visuels numriser peuvent tre trs varis, la liste ci-dessous n'est sans doute pas exhaustive : documents A4 tableaux, tapisseries Affiches Albums de photos Bandes dessines Cartes Cartes postales Dessins techniques Diapositives 35 mm en couleurs et en noir et blanc Diapositives sur verre preuves photographiques en couleurs et en n&b Gravures Livres, cahiers, revues, journaux Microfiches Ngatifs en couleurs et en noir et blanc Pages de manuscrit Partitions musicales Tissus Transparents n&b et en couleur

Ces documents trs divers seront numriss par des matriels trs diffrents les uns des autres : scanners plat scanners spcifiques (de livres, de plans, de diapositives, ...) appareils photo numrique ...

Les documents numriques rsultants pourront parfois voir leur intrt augment par des traitements informatiques adquats qui permettront de faire des recherches, des classements, des comparaisons, ... : Reconnaissance optique de caractres (ROC ou OCR : Optical Character Recognition) Reconnaissance de forme Amlioration de la lisibilit du document (amlioration du contraste, suppression du bruit, rparation des images, etc.) segmentation smantique (reprage automatique d'lments smantiquement signifiants) hyperliens, dispositifs de navigation, ...

2.
a.

La numrisation d'objets 3D et/ou de grandes dimensions


Production d'images 2D l'aide d'un appareil photo numrique

Dans de nombreux cas, il est pertinent d'utiliser un appareil photo numrique pour numriser des documents visuels . C'est particulirement vrai quand : l'objet quand il quand il quand il quand il possde une 3me dimension , est trop fragile (et notamment quand l'exposition une lumire trop vive le dtriorerait), ne peut tre dplac, est trop grand pour tre numris autrement. doit tre numris rapidement

C'est le cas dans la numrisation d'objets d'art de muses (poteries, sculptures, tapisseries, peintures, ) et d'articles d'architecture. La numrisation par prise de photo numrique ne s'improvise pas. Il faudra veiller : aux conditions d'clairage, aux angles de prise, la rsolution des images.

Selon Gord Carter, le secret dune image de qualit rside avant tout dans lclairage utilis. Il recommande lune ou lautre source de lumire pour la numrisation : les petites lampes studio ou les petits flashs. Cependant, quelle que soit la mthode adopte, le principal est davoir un niveau dclairage uniforme. 74 Pensez donc faire intervenir un photographe professionnel !

74 http://www.chin.gc.ca/Francais/Contenu_Numerique/lere_de_la_numerisation.html (visit le 27/08/2009)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 34/84

Dans certains cas, la numrisation s'effectuera par morceaux (trs grande tapisserie par exemple). Il faudra le cas chant : planifier les prises de vue, prvoir avec prcision : la position et l'angle de l'appareil photo, les zones de recouvrement, la cohrence en termes de lumire et d'exposition.

Des logiciels spcialiss pourront, partir de multiples images fractionnaires, reconstituer une image complte. Des tests devront tre effectus pour vrifier la qualit de la numrisation effectue (cf plus loin dans ce cours).

Illustration 6 : Exemple de numrisation par parties d'un objet trop grand pour procder autrement. Noter l'importance du recouvrement pour faciliter le travail du logiciel charg par la suite d'assembler les diffrentes parties.

Illustration 7 : Exemple d'une statue photographie de multiples fois en tournant autour d'elle pour en capturer la troisime dimension.

Dans certains cas, de la numrisation d'objets en 3 dimensions de l'extrieur (poterie) ou de l'intrieur (salle, ...) pourra rsulter un document interactif dans lequel il est possible de faire des explorations . C'est le cas avec le Quicktime VR par exemple. Voici de trs bons exemples de numrisations d'objets en 3D VIAMUS75. Visite de salle76 Numrisation d'une statue : exemple 177, exemple 278

b.

La 3D stroscopique

L'anne 2010 aura vu le dveloppement de la 3D stroscopique au cinma ( l'age de glace 3 , Avatar , ...) et dans les appareils photo et camra grand public ([info du 18/8/2010] : arrive d'un appareil photo numrique dote de deux capteurs 10 mgapixels synchroniss et dun cran de 3,5 pouces sur lequel on
75 76 77 78 http://viamus.uni-goettingen.de/fr/pages/ (visit le 19/07/2007) http://viamus.uni-goettingen.de/fr/sammlung/ab_rundgang/q/11 (visit le 19/07/2007) http://viamus.uni-goettingen.de/fr/sammlung/ab_rundgang/q/01/01 (visit le 19/07/2007) http://viamus.uni-goettingen.de/fr/sammlung/ab_rundgang/q/05/06 (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 35/84

peut visionner les images ou les vidos 3D sans lunettes ; 449 euros79). La dnomination 3D est trompeuse : en aucun cas vous ne pouvez voir le dos de l'acteur qui vous fait face. Il s'agit simplement d'un dispositif adressant chaque il une image lgrement diffrente, donnant ainsi l'illusion du relief. Ces technologies peuvent prsenter un intrt dans la cration de collections destines au grand public.

c.

Production directe d'objets 3D

La socit amricaine EMS80 diffuse des outils pour numriser directement en 3D (cf aussi la socit Zcorp81). Ils sont beaucoup utiliss dans le prototypage rapide d'objets82. Il est dsormais possible de numriser l'aide de scanners 3D de plusieurs types : scanners 3D LASER tripod scanners 3D LASER main scanners 3D contact

Le format de donnes ncessit par les imprimantes Illustration 8 : Numrisation d'objets 3D 3D est le STL83. Un fichier numrique STL est donc le rsultat de la numrisation des objets 3D. Cependant, on numrise souvent en 3D pour pouvoir reproduire des objets physiques en les imprimant .

d.
I.

La 3D devient raliste
LA RECONSTITUTION 3D TEND AU PHOTORALISME
Veille (janvier 2009) : La reconstitution 3D tend au photoralisme - Un scanner mobile permet de reconstituer les lieux en volume avec une prcision ingale jusque-l. Premire application : faire naviguer des enquteurs dans cette scne virtuelle, sans les sortir de leurs bureaux. Naviguer dans des immeubles, reconstituer des sites historiques, amliorer la ralit augmente, les jeux vido etc. c'est ce que promet au systme de numrisation 3D dvelopp par des chercheurs no-zlandais de la compagnie Industrial Research Limited (IRL) d'Auckland. En attendant, il va assister les experts en sciences judiciaires. Ceux-ci n'auront plus besoin de se rendre de multiples fois sur le lieu d'un crime pour le passer au peigne fin. Ils pourront le faire depuis leurs bureaux grce au scanner mobile qui permet de "peindre" un modle virtuel de la scne du crime. L'appareil est capable de capturer des structures 3D trs complexes et cela, trs rapidement. Filme au millimtre prs, la scne est ensuite informatise en trois dimensions. Scanner laser, camras, GPS Le dispositif complet couple le fameux scanner laser des vido camras numriques qui capturent des objets et des scnes de tailles variables (d'un dix mtres) aussi bien l'intrieur qu' l'extrieur. Le scanner cre un modle 3D de la scne sur lequel sont superposes les images prises par la camra. Pour ce faire, l'appareil doit tre golocalis par un systme GPS. Des "satellites", placs sur trpieds autour de la scne, mettent des pulsations lasers. Ces dernires, dtectes par des capteurs embarqus sur le scanner permettent au dispositif de calculer sa position par triangulation. Le systme dfinit alors lui-mme ses cibles pour reconstruire une scne o toutes les donnes ncessaires seront reprsentes. Un feedback en temps rel "Au moins une vingtaine de balises laser sont ncessaires," indique au New Scientist Robert Valkenburg, le dveloppeur de cette technologie, "plus il y a de balises, plus le modle 3D sera dtaill."Au moment mme o l'appareil est pass devant des objets, murs ou autres surfaces, ces derniers apparaissent automatiquement sur l'cran. Semblables, pour reprendre l'expression du chercheur, " de petites touches de pinceau" qui dessinent la scne en 3D. De nombreux scanners sont dj disponibles, "cependant aucun ne peut capturer des scnes avec autant de photo ralisme," remarque Valkenburg. Rien n'est laiss de ct : l'appareil se manuvre aussi

79 http://www.zdnet.fr/actualites/fujifilm-finepix-real-3d-w3-photo-et-video-en-3d-et-haute-definition-39753932.htm#xtor=RSS-8 (visit le 18/8/2010) 80 http://www.ems-usa.com/RE_services.html (visit le 19/07/2007) 81 http://www.zcorp.com/Products/3D-Scanners/ZScannerandtrade-700/spage.aspx#imagesets (visit le 10/7/2008) 82 http://en.wikipedia.org/wiki/Rapid_prototyping (visit le 19/07/2007) 83 http://en.wikipedia.org/wiki/STL_%28file_format%29 (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 36/84

manuellement, de faon l'orienter de manire optimale et accder des surfaces difficiles d'accs. 84

II.

L' IMPRESSION EN TROIS DIMENSIONS

L' impression en trois dimensions se fait sur une imprimante 3D en solidifiant couche aprs couche un matriau poudreux ou liquide85, tels que proposs par EMS86. Le rsultat est un objet ralis le plus souvent base de polymres. Cet ensemble de technologies fait de rels progrs annes aprs annes et pourra sans doute tre utilis d'ici quelques temps pour reproduire des statues, des objets antiques, etc. Voir aussi la socit Dynamic 3D87 N'oublions pas non plus les hologrammes numriques88 dont les progrs sont rcents et trs prometteurs89.

Illustration 9 : Objets 3D imprims -- http://bit.ly/9rhEzs

3.

Les concepts de base (Dfinitions/Vocabulaire)

Dans le domaine du traitement d'images numriques, il est bon de connatre quelques termes fondamentaux :

a.

Formats vectoriels et matriciels

Il existe deux types fondamentaux de formats d'objets graphiques en informatique, les formats matriciels et les formats vectoriels. Le type de format choisi dtermine les outils employer. Les formats matriciels, aussi appels images en mode point, sont utiliss pour la cration de photographies numriques. Ils se prsentent (dcompresss) comme des matrices de points colors. Les formats vectoriels sont surtout employs pour les dessins. Leur codage s'apparente en fait un langage de programmation o l'on dtermine les caractristiques des objets afficher par leurs coordonnes mathmatiques et leurs relations les uns par rapport aux autres. De ce fait, le codage est extrmement compact.
Illustration 10: Exemple d'image en format vectoriel

Illustration 11: Exemple d'image au format matriciel

Certains logiciels sont en capacit de vectoriser des images matricielles et donc d'en faire des versions vectorielles, par exemple Inkscape. Le rsultat n'est pas toujours excellent, tout dpend de la complexit de l'image et du nombre de formes diffrentes reconnatre. Mais la vectorisation est trs adapte certains types de documents tels que les plans, les schmas, les dessins au trait, Dans toute la suite, nous nous intresserons uniquement aux images matricielles.

84 http://www.atelier.fr/usages/10/12012009/new-scientist-industrial-research-limited-scanner-3d-robert-valenburg-gps-37683-.html visit le 26/08/2009 85 http://www.ems-usa.com/Pdf/How_Does_it_Work.pdf (visit le 19/07/2007) 86 http://www.ems-usa.com/ZCorp_products_main.html (visit le 19/07/2007) 87 http://www.dyn3d.com (visitle24/07/2008) 88 http://en.wikipedia.org/wiki/Digital_holography (visit le 19/07/2007) 89 cf Digital Holography: Digital Hologram Recording, Numerical Reconstruction, and Related Techniques (Hardcover) by Ulf Schnars, Werner Jueptner " Springer-Verlag Berlin 2005

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 37/84

b.

Types de Documents
Texte Imprim/Dessin au TraitImage contours distincts, sans variation de tonalit, tel qu'un livre contenant du texte et des graphismes au trait. ManuscritsImages contours distincts ralises la main ou mcaniquement, mais ne prsentant pas les bords distincts typiques du procd mcanis, tel que lettre ou dessin au trait. Demi-tons ou Simili reproduction de travaux graphiques ou photos reprsents par une grille de points ou lignes de taille variable et rgulirement espacs, en gnral inclins selon un angle dfini. Englobe galement certains procds artistiques, comme la gravure par exemple.
Illustration 12: Image en demi-tons

Tons Continusdocuments tels que photographies, aquarelles et autres dessins au trait finement excuts qui forment des changements subtils ou progressifs de tons. Mixtesdocuments contenant deux ou plusieurs des catgories cites ci-dessus tels que les ouvrages illustrs.

c.

Pixels

Une image numrique est forme d'une grille de petits carrs appels pixels (de l'anglais picture element, lment d'image). Ce sont les plus petits lments employs par les moniteurs et imprimantes d'ordinateur pour reprsenter des caractres, des graphiques ou des images. Dfinition : Un pixel Mot abrg de l'anglais picture element (lment d'image), la plus petite unit constitutive d'une image. Chaque pixel affiche une et une seule couleur. Le pixel est galement employ comme unit de mesure de la taille et, improprement, de la rsolution d'une image.

d.

Image numrique

Matrice de pixels dont chacun comporte une information de couleur et de luminance. Cette matrice simule une image quand la taille des pixels est suffisamment petite (et donc la rsolution suffisamment leve cf cidessous).

e.

Rsolution spatiale

La rsolution est une mesure de la densit d'une image numrique. La dfinition complte du terme rsolution recouvre les notions de rsolution spatiale et de rsolution en luminance. Dans l'usage courant toutefois, le terme rsolution est le plus souvent employ pour parler de la rsolution spatiale. Plus la rsolution est grande, plus l'image est dtaille, (et plus le fichier correspondant est volumineux). Elle s'exprime en dpi (dots per inch, ou points par pouce) en se rappelant qu'un pouce = 2,54cm. Bien distinguer : pour un scanner, la rsolution de limage en entre. Jusqu' 3200 dpi (et 11 000 dpi pour les scanners tambour). Pour un moniteur, la rsolution de limage lcran. Classiquement 72 ou 96 dpi, mais de nouveaux moniteurs affichent 120 dpi et certains petits crans jusqu' 320 dpi (cran de l'iPhone 4). Le 2" QHD, prsent en septembre 2008 par Casio, a une rsolution de 546 points par pouce. Sur 2 pouces de diagonale, la taille en pixels est donc de 960x540 pixels (vive Pythagore). Toshiba annonce quand lui (octobre 2011) un cran de 6,1 pouces 498 dpi de 2560 x 1600 pixels90. Pour une imprimante, la rsolution de sortie et la linature (nombre de lignes par unit de longueur sur une trame). Jusqu' 2 880 dpi.

f.

Rsolution en luminance

Encore appele profondeur de couleur.

90 http://www.macbidouille.com/news/2011/10/24/toshiba-annonce-un-ecran-en-498-ppi (visit le 7 novembre 2011)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 38/84

Un pixel est non seulement un point situ une position donne de l'image, mais c'est aussi un point d'une couleur prcise. La rsolution en luminance d'une image se rapporte au nombre de couleurs possibles de chaque pixel. La luminance (la valeur de couleur de chaque pixel) est code par un ou plusieurs bits. Plus le nombre de bits par pixel est lev, plus la rsolution en luminance est grande et plus le fichier d'image est volumineux. Voici des valeurs couramment employes de rsolution en luminance, exprimes en nombre de bits : Une image 1 bit ne permet de reprsenter que deux valeurs, par exemple le noir et le blanc. Ce mode est utilis en dtection de contours pour des applications infographiques et aussi par la reconnaissance optique de caractres (OCR). Une image 8 bits chelle de gris peut avoir 256 nuances de gris. Chaque pixel est noir, blanc, ou de l'une parmi 254 nuances de gris. Il s'agit normalement du plus grand nombre de nuances utilis pour des images qui ne sont pas en couleurs. Une image 8 bits en couleurs peut avoir 256 couleurs. On utilise de moins en moins cette rsolution sur Internet, les images en couleurs tant crneles. Une image 24 bits en couleurs peut avoir jusqu' 16,8 millions de couleurs. Chaque pixel est dcrit par trois octets qui donnent respectivement 256 valeurs possibles pour le rouge, le vert et le bleu. Une image 24 bits est dite en vraies couleurs et de qualit photographique , car c'tait la rsolution en luminance maximale il y a encore quelques annes. Ces dnominations devraient dsormais tre utilises pour les profondeurs de couleur suprieures. Une image 30 et jusqu' 48 bits peut avoir de 1 plusieurs milliards de couleurs. Ce genre d'image est souvent utilis pendant le processus de numrisation, afin de donner une meilleure graduation tonale (ombrages dans les diapositives et les preuves imprimes, et les zones de lumire dans les images produites partir de ngatifs ). Cette profondeur de couleur est aussi obtenue par les formats RAW des appareils photo numriques. Pratiquement tous les programmes de traitement d'image peuvent dsormais tirer parti de ces informations complmentaires pour optimiser en dernier lieu la rduction de la profondeur de couleur 24 bits, (Bibble de Bibble Labs 91, Photoshop, ...). Pour la conversion de fichiers RAW en fichiers JPG, on peut aussi utiliser l'utilitaire OpenSource DCRAW92 qui s'intgre comme un plugin Gimp.

Exemple de tailles de fichiers issus d'une numrisation diffrents chantillonnages (rsolutions) et Rsolution (dpi) Profondeur de couleur 1bit (noir ou blanc) 8bits (chelle de gris) 24bits couleurs) 1 Ko 9 Ko 5 Ko 39 Ko 118 Ko 11 Ko 89 Ko 267 Ko 20 Ko 158 Ko 475 Ko 100 200 300 400

(vraies 29 Ko

Tableau 1: Exemples de tailles de fichiers (non compresss) d'une image de 1x1 pouce (2,54 cm) numrise diffrentes rsolutions

g.

Formats de fichier

Les images numriques sont stockes selon divers formats de fichier, dont certains sont propres un type donn d'ordinateur ou de logiciel. Nous examinerons en dtail les diffrents types de formats de fichier ultrieurement.

h.

Compression

On peut appliquer un fichier d'image numrique un algorithme de compression, parce qu'un fichier plus petit est plus facile stocker, manipuler et transmettre. On distingue les diverses techniques de compression selon qu'elles suppriment ou non des informations dans les images : Les techniques de compression sans perte permettent de rduire la taille en octets des images sans perdre d'information du fichier original. Le processus est rversible (en dcompressant le fichier compress, on retombe sur le fichier non compress) Les techniques de compression avec perte prsentent des taux de compression bien suprieurs au prix de l'irrversibilit du processus de compression (en dcompressant le fichier compress, on ne retombe pas sur le fichier non compress).

91 http://www.bibblelabs.com/products/bibble/bibble4.html (visit le 19/07/2007) 92 http://www.cybercom.net/~dcoffin/dcraw/(visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 39/84

Nous examinerons en dtail les diffrents types de compression.

i.

Modles de couleurs

Les moniteurs couleur, comme les tlviseurs, utilisent le rouge (R), le vert (V) et le bleu (B) (RVB) pour produire le spectre complet des couleurs. Dans le cas de l'impression, le processus de quadrichromie fait appel quatre pigments : cyan (C), magenta (M), jaune (J) et noir (N) (CMJN) pour la reproduction des couleurs. Ces systmes ou modles de couleurs portent galement le nom d' espaces couleurs , espaces chromatiques ou espaces colorimtriques . Examinons ces modles plus en dtail.

I.

LE MODLE LAB :

les lettres du sigle Lab dsignent des composantes individuelles d'une couleur : L pour luminance, a pour la chrominance rougevert, et b pour la chrominance bleujaune.

Ce modle est bien adapt la modification de la luminosit d'une image sans changer les valeurs de couleur et de saturation, en particulier du fait que trs peu ou pas du tout d'information est perdue lorsque l'on convertit une image vers le modle Lab ou partir de celui-ci. De plus, le modle Lab a la prtention de constituer un espace couleur indpendant des appareils employs et convient donc au transfert d'images entre des systmes diffrents. Malgr ces avantages, le modle Lab n'est pas trs rpandu.

II.

YCC

Le modle YCC, trs semblable au modle Lab, est employ dans les images de format PhotoCD de Kodak.

III.

LE MODLE RVB EN SYNTHSE ADDITIVE

Le modle RVB est le modle de couleurs standard d'cran d'ordinateur. Les lettres RVB reprsentent le rouge, le vert et le bleu, les trois couleurs primaires du modle de couleurs additives. Les moniteurs d'ordinateur et les tlviseurs fonctionnent selon ce modle. Chaque pixel se compose en ralit de trois minuscules points fluorescents dont chacun met une nuance prcise de rouge, de vert ou de bleu. Ensemble, ces trois points dterminent la couleur du pixel. Lorsqu'ils brillent tous les trois l'intensit maximale, ils produisent du blanc.

Illustration 13: Choix d'une couleur en RVB

IV.

LE MODLE

TEINTE SATURATION LUMINOSIT

C'est un autre modle en synthse additive, identifi par l'acronyme HSL ou HSV. Ce mode est utile dans les logiciels de traitement d'image pour choisir plus aisment une couleur et il est plus proche de la perception retinienne que le modele RVB93. Voici 3 exemples ci-dessous pour mieux comprendre ce modle :

93 Le Guide Mthodologique pour le choix de formats numriques prennes dans un contexte de donnes orales et visuelles < http://www.tge-adonis.fr/sites/default/files/ressourcesdoc/guide_formats_numeriques-05.pdf > visit le mardi 6 septembre 2011 page 18

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 40/84

V.

LE MODLE EN SYNTHSE SOUSTRACTIVE CMJN

Les lettres CMJN dsignent les couleurs cyan, magenta, jaune et noir. En thorie, le noir est superflu puisqu'un mlange uniforme de cyan, de magenta et de jaune produit du noir. En pratique cependant, un mlange de cyan, de magenta et de jaune donne un brun-gris plutt sale , et c'est pourquoi l'on ajoute le noir. Ces couleurs primaires sont l'origine de toutes les couleurs produites l'impression. Une imprimante produit de nombreux points minuscules, chacun d'une couleur primaire et si prs les uns des autres que l'il humain les peroit comme un seul point d'une couleur donne. Le problme de la relation entre les modles de couleurs RVB et CJMN vient de ce que l'espace de couleur RVB possde des couleurs que l'espace CMJN ne peut pas reproduire. Pour tre concret, parfois, des images qui ont l'air trs belles l'cran ont un autre aspect, un peu moins attrayant, une fois imprimes. Pour maintenir ces diffrences au minimum, de puissants programmes d'dition d'image offrent la possibilit de convertir une image RVB en CJMN et vice-versa c'est la sparation des couleurs et de l'afficher l'cran. Mme si le moniteur ne peut afficher que des images RVB, ces programmes grent une image CMJN en n'utilisant que les couleurs disponibles dans l'espace couleur CMJN. Certains services web permettent de convertir des images RVB en CMJN : RGB2CMYK 94 et CMYK95 Les images destines tre affiches par exemple sur un navigateur, n'ont pas besoin d'tre produites selon le modle CMJN. Par contre, ce modle devient important lorsqu'il s'agit d'imprimer des images l'aide de presses professionnelles, ou de simuler le rsultat venir avant de lancer un important travail d'impression (vrification d'preuve). Le concept de couleur et de ce qui la provoque, l'influence, ... est un domaine trs riche que nous ne pouvons pas approfondir dans le cadre de ce cours. Consulter l'excellent cours sur la colorimtrie 96 et le site Comprendre la couleur et ses profils 97 pour en apprendre (beaucoup) plus...

j.

La taille des fichiers non compresss

Ci-dessous vous trouverez des formules toutes faites pour calculer la taille en octects d'une image non compresse. Elles sont utiles mais il vaut bien mieux comprendre ces formules et la logique qui les sous-tend que de les apprendre par cur. Chacune d'elles peut-tre rtablie en 30 secondes avec un peu de logique !

94 95 96 97

http://www.rgb2cmyk.org/ (visit le 17/08/2010) http://www.cmykconverter.com/ (visit le 17/08/2010) http://www.colorimetrie.be/ (visit le 19/07/2007) http://www.profil-couleur.com (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 41/84

I.

SI VOUS CONNAISSEZ LES DIMENSIONS PHYSIQUES DE L'IMAGE

La taille des fichiers non compresss se calcule de la faon suivante : Soit h la hauteur d'une image en pouce Soit l la largeur d'une image en pouce Soit p la profondeur de bit (luminance), habituellement 8 ou 24 soit dpi la rsolution de l'image en nombre de points par pouce (identique sur chacune des dimensions),

... alors la taille du fichier (en octets) est donne par la formule suivante :

taille =

hl pdpi 8

II.

SI VOUS CONNAISSEZ LES DIMENSIONS DE L'IMAGE EN PIXELS


Soit h la hauteur d'une image en nombre de pixels Soit l la largeur d'une image en nombre de pixels Soit p la profondeur de bit (luminance), habituellement 8 ou 24

... alors la taille du fichier (en octets) est donne par la formule suivante :

taille=

hl p 8

Bien sr, dans les deux cas, il faut utiliser les units adaptes, sachant que : 1 1 1 1 1 1 bit = 0 ou 1 en binaire octet = 8 bits kilooctet (1 Ko) = 1000 octets, soit environ 210 octets mgaoctet (1 Mo) = 1000 kilooctet, soit environ 220 octets gigaoctet (1 Go) = 1000 mgaoctet, soit environ 230 octets traoctet (1 To) = 1000 gigaoctet, soit environ 240 octets

Attention aux confusions : 1. 2. Le mot anglais pour octet est byte , d'o la confusion possible entre un bit et un byte ! Depuis 199898, il faut employer les mots kibi pour kilo binaire (1024 octets), mbi pour mga binaire (1024 kibi), gibi pour giga binaire (1024 megi) , tbi pour tra binaire (1024 gibi) ... et rserver les notations kilo, mga, giga des multiples de 1000... Ces dernires sont les conventions que nous appliquerons dans le cours.

4.
a.
I.

Les matriels et logiciels


Introduction : prsentation de la chane numrique.
MATRIELS
Appareils de numrisation Moniteurs haute rsolution Stations de travail Serveurs et appareils de stockage Imprimantes adaptes aux travaux numriser

II.

LOGICIELS
Numrisation, dition d'image, visualisation, gestion des couleurs et contrle de la qualit Cration d'images drives Gestion des fichiers, gestion de workflows Indexation, Reconnaissance Optique des Caractres (ROC ou OCR en anglais), structuration Systme de gestion des bases de donnes

98 voir http://fr.wikipedia.org/wiki/Octet

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 42/84

III.

AUTRES QUIPEMENTS ET FOURNITURES


Appareils et fournitures de Contrle de Qualit Fournitures de bureau habituelles Mdias de sauvegarde, papier, cartouches d'encre Documentation, manuels techniques, publications de rfrences

b.
I.

Appareils de numrisation : les scanners


PRINCIPE

La numrisation est rendue possible grce aux capteurs du scanner sensibles la lumire rediffuse par les couleurs des documents. Ces capteurs, appels capteurs CCD (Charge Coupled Device), sont composs de photodiodes dont la conductivit lectrique dpend de l'intensit lumineuse. Si l'on numrise un document opaque, les capteurs mesurent l'intensit de la lumire rflchie par le document. Si l'on numrise un document transparent, les capteurs mesurent la lumire qui traverse ce document.

Selon les types de scanners utiliss, il existe trois techniques d'analyse de la lumire : la numrisation en mode point. L'analyse de la lumire se fait pixel par pixel sur l'ensemble du document. Ce processus est long mais offre une rsolution d'entre trs leve. Cette technique est employe par les scanners tambour pour les arts graphiques. la numrisation linaire. Les photodiodes sont disposs en barrette, elles peuvent analyser toute une largeur de la surface expose du document. En se dplaant, la barrette analyse le document ligne par ligne. Ce procd est couramment employ par les scanners de bureau. la numrisation matricielle. Dans cette technique, le capteur est fixe et constitu d'une grille complte de photodiodes. L'information analyser est saisie en une seule fois sur toute la matrice. Le temps d'exposition est rapide mais la rsolution obtenue n'est pas toujours satisfaisante. Les appareils photonumriques utilisent cette technique.

Il existe trois procds de rendu de la couleur par les scanners : Le plus complexe consiste employer un clairage color, mais cela implique de travailler dans le noir. Cette technique est utilise pour la prise de vue en directe d'uvres d'art. Le deuxime procd a recours un prisme, il est utilis par les camras professionnelles et certains scanners tambour. La dernire technique, et la plus courante, consiste interposer successivement trois filtres colors rouge, vert et bleu.

Un document d'un tutoriel amricain (en franais)99 rsume bien les diffrents types de scanners et leurs usages.

99 http://www.library.cornell.edu/preservation/tutorial-french/technical/technicalB-03.html (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 43/84

II.

LES SCANNERS BUREAUTIQUES PLAT


Produits standards, les scanners plat donnent une bonne qualit de numrisation en bitonal, niveaux de gris ou couleurs. Ils conviennent de nombreuses utilisations, sont faciles utiliser et peu onreux. A l'autre bout, les units professionnelles destines au march des arts graphiques rivalisent en qualit avec les scanners tambour. Ils proposent diffrentes options permettant par exemple de numriser des documents transparents (ngatifs, diapositives, ektachromes) ou de numriser en masse des pages volantes grce un passe-feuilles. Ces scanners fonctionnent selon la technique du scanning linaire : les photodiodes disposes en ranges se dplacent en longueur et analysent le document ligne aprs ligne. On distingue deux catgories de capteurs : Les capteurs CMOS (Complementary Metal Oxyd Semiconductor, ou encore MOS complmentaires). On parle alors de technologie CIS (Contact Image Sensor). Ce type de dispositif utilise une rampe de LED (Light Emitting Diode) pour l'clairage du document et requiert une distance trs faible entre les capteurs et le document. En contrepartie, la technologie CIS est bien moins consommatrice d'nergie. Les capteurs CCD (Charge-coupled devices). Les scanners utilisant la technologie CCD sont souvent plus pais car ils utilisent une lampe froide de type non. La qualit de l'image numrise est en revanche globalement meilleure, grce un rapport signal/bruit plus faible.

Source : http://bit.ly/bq4Ejo

(Source100). Cependant, ces scanners n'autorisent pas des formats suprieurs au A3, ils abment la reliure des livres et ne peuvent servir la numrisation systmatique des collections. Les scanners plat trouvent surtout leur place dans les services gnraux des bibliothques.

Illustration 14: Scanner plat

Illustration 15: Scanner Le scanner vertical est une variante spcialise du scanner plat dans laquelle la vertical source de lumire du scanner, le dispositif de capteurs et les optiques sont dplacs vers un ensemble d'appui sous lequel un volume reli peut tre plac face vers le haut pour la numrisation.

III.

SCANNERS DFILEMENT

Les scanners dfilement utilisent la mme technologie de base que les scanners plat mais maximisent le dbit, au dpend de la qualit, en gnral. Normalement conus pour des environnements professionnels de traitement de grands volumes, ils numrisent gnralement en noir et blanc ou en niveaux de gris des rsolutions relativement basses. Les documents doivent tre de tailles gales et assez solides pour rsister une manipulation un peu rude, bien que les mcanismes de transport sur les modles plus rcents permettent de rduire l'effort. Que le transport soit effectu par rouleau, ceinture, tambour ou vide, le capteur et la source lumineuse restent immobiles tandis que le document est pass au-dessus. Une sous-classe importante de scanners dfilement sont des modles verticaux spcialement conus pour les documents de taille suprieure tels que les cartes ou les plans d'architecture.

100http://www.commentcamarche.net/pc/scanner.php3 (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 44/84

IV.

LES SCANNERS TAMBOUR

Les scanners tambour offrent la rsolution la plus leve et la numrisation la meilleure de tous les types de scanners, mais un certain prix. En dehors de leur cot lev, les scanners tambour sont lents, non adapts aux documents fragiles et exigent des comptences leves de manipulation. Par consquent, on les retrouve en gnral dans les bureaux de prestataires de services pour le march pr-presse101. Les principes de base du scanner tambour sont simples : Limage est dpose sur la face externe d'un cylindre de plexiglas transparent, le tambour. Elle y est fixe laide de bande adhsive et de poudre ou d'huile. Le tambour tourne grande vitesse (300 1500 tours/min.), juste quelques millimtres dun capteur. Depuis l'intrieur de ce capteur, une source extrmement lumineuse (lumire xnon ou halogne) claire le document. Dans le mme temps, un petit rayon conique manant du capteur balaye pixel par pixel ce document. L'avantages du scanner tambour est essentiellement sa haute rsolution, jusqu' 11 000 dpi.

V.

LES SCANNERS DE LIVRES OU SCANNERS LIVRE OUVERT

Ces produits correspondent bien aux besoins des bibliothques car leur vaste surface de numrisation assure le traitement des grands formats. Lors du traitement, le livre est ouvert, texte dirig vers le haut, le dispositif de numrisation se trouvant au-dessus. Parfois, un plateau ajustable compense la diffrence de hauteur une fois le livre ouvert. Il existe deux gammes de scanners de livres : des produits abordables, d'une qualit suprieure aux scanners plat, acceptent des formats jusqu'au A2 / A3 dont la reliure ne dpasse pas quelques centimtres d'paisseur. Ils ne produisent pas toutefois de rsultats trs satisfaisants pour les documents anciens. des scanners beaucoup plus labors, et coteux, correspondent davantage aux besoins des bibliothques, mais seules les grandes institutions peuvent s'quiper. Leurs appareils acceptent des formats allant jusqu'au A1 et des reliures de 50 cm ; ils sont quips d'un plateau de type Roberval, et comportent souvent une vitre. Certains dispositifs permettent de numriser des ouvrages ne pouvant s'ouvrir plus de 90, voire 60.

Les scanners de livres emploient deux types de scanners : ceux qui analysent une image optique du document. Dans ce cas, l'clairage du document numris peut occasionner quelques difficults. Le document est en effet clair par des sources lumineuses places sur les cts du scanner. Il est difficile d'assurer un clairage uniforme sur tout le document, or la grande sensibilit des capteurs CCD accentue ces variations dans le rendu. En outre, le document est soumis une temprature qui peut l'endommager. Voir en exemples le fonctionnement du BookDrive DIY102 et la gamme professionnelle Zeutschel103. ceux qui balayent le document et qui produisent un nombre fixe de pixels au millimtre. Un systme coulissant muni d'un capteur CCD linaire et d'un clairage, balaie le document. Le principe est le mme que celui du scanner plat. La numrisation se fait en dimension relle et non partir d'une image optique du document, la rsolution est constante quelle que soit la taille du document. Quant l'clairage, il est mieux matris et n'affecte que la surface en cours de traitement.

Exemple de machine APT BookScan 2400104 capable de numriser 2 400 pages l'heure, produisant des fichiers de 36 bits de profondeur de couleur, capteurs de 21 Mpixels (par appareils photo numriques), 400 dpi, OCR automatique. Ce numriseur permet de tourner automatiquement les pages une par une "plus dlicatement qu'une main humaine" dixit les fabricants. Pour l'instant, les institutions ne font pas vraiment confiance ces tourne-pages.

Illustration 16: APT BookScan 2400


101http://www.hk-gap.de/FRENCH/digital/trommel_scanner.htm (visit le 19/07/2007) 102http://atiz.com/bookdrive_diy.php (visit le 19/07/2007) 103http://www.zeutschel.de/produkte.html (visit le 19/07/2007) 104http://www.kirtas.com/apt_2400RA.html (visit le 15/10/2008)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 45/84

VI.

LES APPAREILS PHOTOGRAPHIQUES NUMRIQUES

Les appareils photographiques numriques sont commercialiss dans une gamme trs large de produits, de l'appareil photo amateur jusqu' l'appareil professionnel. Les appareils d'entre de gamme sont matrice ; ils permettent une numrisation rapide mais de faible dfinition. Les systmes professionnels sont gnralement barrette ; ils fonctionnent par balayage, la numrisation est plus longue mais la qualit meilleure. Les appareils professionnels codent les couleurs sur 48 bits pour des rsolutions allant jusqu' 6 000 x 8 000 pixels. Ils se prsentent sous la forme de dos qui se fixent aux appareils traditionnels (appareils chambre) alors que les appareils d'entre de gamme sont des appareils photo complets. Les appareils les moins chers utilisent une mmoire de type carte flash. Ces cartes sont onreuses et disposent de capacits limites, rendant difficiles les campagnes de prises de vue sur des lots importants. Les appareils haut de gamme doivent tre constamment associs un micro-ordinateur, rendant dlicates les campagnes de prises de vue hors studio. L'IRHT (IRHT, institut de recherche et dhistoire des textes) 105 a choisi ce type de matriel pour numriser les manuscrits enlumins des bibliothques.

VII.

LES SCANNERS DE MICROFORMES

Deux types d'appareils numrisent les micro formes (microfilms et microfiches) : Une premire gamme de produits propose une numrisation en 600 dpi. Il s'agit de lecteurs dots d'une fonction de numrisation ou encore d'un quipement adaptable sur un lecteur classique. Dans ce dernier cas, une barre de CCD monte sur chssis balaie l'image sur l'cran. Les appareils haut de gamme automatisent la numrisation. Ces machines disposent de systmes permettant un reprage des images, ce reprage est plus rapide lorsque les films disposent de pavs optiques (blips).

VIII.

LES SCANNERS DE DIAPOSITIVES ET DE TRANSPARENTS


support procd certains dans le

Comme nous l'avons voqu prcdemment, il est possible de numriser des documents sur transparent partir d'un scanner plat quip d'un dos et d'un dispositif de rtro-clairage. Mais ce reste trs limit car il exige de positionner chaque document chaque nouvelle prise de vue, dans cas il est possible de monter en bande quelques diapositives sur un support plastique gliss numriseur. Ce traitement ne peut tre que ponctuel.

Il existe des appareils dans le monde professionnel bien adapts la numrisation des diapositives ou de documents transparents qui utilisent des chargeurs ou des systmes d'introduction semi-automatiques. (Source106)

IX.

AUTRES TYPES
Les scanners grande largeur : scanners grands formats du 25'' (635 mm) au 54" (extra-large : 1370 mm) ; les scanners de cartes fentre ; les scanners main.

X.

ELEMENTS PERMETTANT DE CHOISIR UN SCANNER

Le type de besoins conditionne le type de scanner parmi la liste ci-dessus. On peut voquer diffrents critres techniques, qualitatifs et quantitatifs : La rsolution. La reproduction des couleurs. Le bruit. La taille maximale de numrisation (A3 A0) Les dispositifs techniques de fonctionnement (dclenchement par pdale, aide au relevage de la vitre de protection, automatisations, ...) Les artefacts : des non uniformits dans l'illumination ; de la poussire et les rayures ;

105http://www.irht.cnrs.fr/ (visit le 14/10/2009) 106http://www.culture.gouv.fr/culture/mrt/numerisation/fr/dll/techn.htm (visit le 9/09/07)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 46/84

des problmes de rendu des couleurs ; des moirs ; des problmes autour des contours. Ces scanners sont souvent pilots par des logiciels spcifiques. Il faudra considrer aussi la richesse fonctionnelle et l'volutivit du logiciel, la disponibilit d'une aide jour en franais. Il faudra enfin considrer les contrats de maintenance associs au scanner et son logiciel.

c.
I.

Les logiciels d'acquisition


TWAIN

TWAIN107 est un protocole informatique standard destin au contrle logiciel des scanners de document ou des appareils photos numriques. Il s'agit d'une interface de programmation (API) de capture d'image pour les systmes d'exploitation Microsoft ou Apple. Ce standard a t cr en 1992 par un organisme regroupant les socits Aldus, Kodak, Hewlett-Packard et Logitech. Il en est actuellement la version 1.9 de janvier 2000. Le protocole TWAIN est essentiellement utilis en tant qu'interface entre un scanner ou un appareil photo numrique et un logiciel de traitement d'images. Il existe galement un autre standard pour grer les scanners nomm ISIS. De multiples logiciels intgrent TWAIN pour le pilotage des scanners.

d.

Les logiciels de traitement d'images

Lors de l'achat d'un scanner, une offre logicielle est gnralement fournie. Je vous propose ci-dessous une slection de logiciels.

I.

PHOTOSHOP

Standards du march, il intgre tous les outils ncessaires pour amliorer les images obtenues suite une numrisation. Par contre, c'est un logiciel complexe et coteux, avec lequel il est difficile de travailler lorsqu'on est nophyte.

II.

GIMP

Logiciel libre dont les fonctionnalits sont quivalentes Photoshop (y compris dans la difficult relative de sa prise en main). Les limitations les plus gnantes pour l'usage de Gimp en milieu professionnel sont : Pas de licence pour le systme Pantone. Sparation CMYK encore hsitante Traitement des images en 8 bits, ce qui est parfois insuffisant. noter, les deux points prcdents devraient disparatre avec l'arrive des versions en prparation.

III.

IMAGEMAGICK,

Outil en ligne de commande capable de prendre en charge des lots d'images. Un avantage de ce logiciel est son fonctionnement en ligne de commande : il peut tre utilis pour crer automatiquement des images rduites (vignettes, ...) partir d'un lot arbitrairement important d'images. C'est un logiciel libre, qui peut lire des images dans une grande varit de formats. Quelques exemples de ce qu'il peut faire : conversion d'un format l'autre, redimensionnement, rotation, affinage, rduction de couleurs ou ajout d'effects spciaux une image cration de planches-contact de vignettes composition automatique d'image partir de plusieurs clichs traage de formes et impression de textes sur l'images bordures automatiques analyse des caractristiques des images On peut aussi utiliser, plus simplement, le logiciel multiplateforme et opensource Xnconvert.

e.

Les logiciels catalogueurs d'images

Ce sont des logiciels dont le but est de grer les images dj numrises : ils les prsentent sous forme d'imagettes, permettent de les classer, de les comparer, de les organiser. Quelques exemples
107http://fr.wikipedia.org/wiki/TWAIN (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 47/84

XnView (libre), iPhoto, livr en standard avec les Mac. Picasa, propos gratuitement par Google. iView MediaPro Extensis PortFolio & Canto Cumulus, trs grosses applications.

f.

Logiciels de reconnaissance optique de caractres (OCR)

Se reporter ci-dessous au chapitre traitant spcifiquement de cette problmatique (chapitre 8).

5.

Le processus de numrisation

Dans ce qui suit, nous nous appuierons parfois sur le tutoriel108 de la bibliothque de l'Universit Cornell.

a.

Prparation des documents numriser


tris et ordonns pour faciliter la manutention, ventuellement massicots, nettoys (ainsi que le matriel), ...

Les documents numriser doivent le cas chant tre prpars :

b.

Choix du scanner

Cf ci-dessus les diffrentes sortes de scanners et les critres de choix

c.

Choix de la rsolution et de la profondeur de couleur

Fortement dpendante de l'usage prvu de la ressource finale. Il est vivement conseill d'examiner un ventail de l'ensemble des types de documents numriser et de noter : les dtails (taille, type) et les traits. Le thorme de Shannon permet de calculer une rsolution telle que le plus petit dtail visible doive tre reprsent par 2 pixels au minimum. En pratique on majorera gnreusement cette valeur. les tons et le nombre de couleurs la prsence de demi teintes La prsence de tons continus : Les conditions de rsolution requises pour les photographies et autres documents en tons continus sont difficiles dterminer car il n'existe aucun systme fix de mesurer des dtails. De nombreux organismes ont contourn le problme de la dfinition des dtails en basant leur rsolution sur la qualit ncessaire pour effectuer des tirages d'une taille donne (p.ex. 8 pouces par 10) partir d'un certain format de film (p.ex. 35mm, 4x5 pouces). Le facteur important garder en mmoire propos des documents en tons continus est que la reproduction des tons et des couleurs est aussi importante, sinon plus, que la rsolution pour dfinir la qualit de l'image. du texte faire reconnatre ensuite par un logiciel d'OCR. La valeur recommande est alors de 300 dpi en bitonal. Attention, dans le cas d'un document tach, on aura intrt numriser en nuances de gris ... puis de procder par essais et valuations. Les valeurs utiles connatre sont les suivantes : rsolution d'un cran standard informatique : de 72 120 dpi rsolution d'une page imprime de type bureautique : 300 ou 600 dpi voire 1200 dpi pour un rsultat optimal Une image 1600x1200 pixels peut tre imprime en un format 15x11,25 cm, environ 270 dpi

Voici quelques standards de base par lesquels dmarrer109 : photographies : TIFF, 16 bits en niveaux de gris ou 48 bits en couleurs, de 300 800 dpi matriels graphiques : TIFF, 16 bits en niveaux de gris ou 48 bits en couleurs, de 600 800 dpi textes : TIFF, 1 bit ou 16 en niveaux de gris, ou 48 en couleurs, 300 dpi

108http://www.library.cornell.edu/preservation/tutorial-french/conversion/conversion-01.html (visit le 19/07/2007) 109D'aprs http://booleanoperator.org/?p=67 (visit le 26/08/2009)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 48/84

Pour des prconisations plus pousses, voir la charte technique de la numrisation la BnF110

d.

Phase de test

Un bon test consiste numriser les documents reprs dans l'ventail des types dfinis plus haut, puis comparer les rsultats partir d'un cran correctement rgl (s'adresser pour cela un professionnel des arts graphiques) et des originaux.

e.

Numrisation proprement dite

Suivant les cas, ce travail s'effectue de faon manuelle ou semi-automatique. Bien penser l'ordre de traitement des originaux pour savoir identifier de faon non quivoque les fichiers numriques obtenus. On appellera "brut de scan" une image non traite.

f.

Le retraitement des images sur ordinateur


l'orientation de l'image le contraste, la luminosit les dfauts de numrisation (poussires, trams, rayures) la rpartition des couleurs les annotations bibliothconomique (les tampons, inscriptions diverses)

Le rglage prcis du scanner ne permet pas d'viter une reprise des images pour corriger :

Par ailleurs, il sera intressant de remplir un certain nombre de mtadonnes de l'image, par exemple les champs de l'IPTC (avec GraphicConverter sous Mac, irfanview sous PC, Xnview en multiplateforme). Il est conseill, lorsque le scanner le permet, dincorporer dans le fichier le profil dentre du scanner.

g.

Le calcul de la taille des images numriques non compresses

On calcule facilement la taille d'une image non compresse en multipliant le nombre de ses pixels par la profondeur de couleur (en bits). Le rsultat sera divis par 8*1024 pour obtenir le rsultat en Ko. Exemple 1 : une image de 1600x1200 pixels en niveau de gris aura une taille de : 1600x1200x8/(8*1024) : 1875 Ko soit 1,8 Mo Exemple 2 : une image de 12 cmx 16 cm numrise en vraie couleur 600 dpi : Nbre de pixels : 12x16/(2,542)x6002= 10 713 621 pixels

10 713 621x24/(8x10242)= 30 Mo !
En pratique, les images dcompresses ne sont manipules qu'au sein des programmes de traitement d'images et ne sont jamais rencontrs stockes dans des fichiers. Les formats dits non compresss (type RAW) utilisent en fait une compression non destructive.

6.
a.

La compression des images


Principe et dfinition de la compression.

En informatique et en thorie de l'information, la compression de donnes est un processus d'encodage de l'information qui utilise moins de bits que n'aurait ncessit une reprsentation non encode. On remarque en effet lors de lanalyse du contenu dun fichier image que certaines informations sont redondantes. En compression dimages numriques, il y a trois types de redondances : Redondances de code : Une redondance apparat dans le code dune image si ses niveaux de couleur sont cods dune faon qui utilise plus de symboles que strictement ncessaire. Par exemple une image en niveaux de gris code en vraies couleurs

110charte technique de la numrisation la BnF : documents iconographiques, documents imprims, presse (fvrier 2009) [22 pages - fichier .pdf - 350 Ko] http://www.bnf.fr/pages/infopro/numerisation/pdf/charte_numerisation.pdf (visit le 26/08/2009)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 49/84

Redondances inter-pixels : Des calculs statistiques montrent quil existe des images pour lesquelles des niveaux de couleur se rptent de faon priodique. Dautres calculs montrent la forte corrlation qui existe entre des pixels adjacents. Ceci nous permet de prdire la valeur dun pixel partir de la connaissance des valeurs de ses voisins. On peut donc reprsenter une image en codant la diffrence quil y a dun pixel un autre. Redondances psychovisuelles : La visualisation dune image ne requiert pas lanalyse quantitative de chaque pixel. Seuls certains lments cls, comme par exemple les lignes de changement de couleur, vont permettre au cerveau de reconstituer limage. Les autres informations sont dites psychovisuellement redondantes. Elles peuvent donc tre limines sans affecter de faon significative la lisibilit de limage. Cette opration est irrversible et conduit une compression avec pertes.

Ces types de redondance sont exploits dans les mthodes de compression d'images avec et sans perte d'information111 : sans pertes d'information : exemple du RLE (Run-Length Encoding) code les squences identiques sous la forme pattern x fois et convient bien aux images simples tels que les dessins, cliparts, etc... Le format PCX utilise cette forme de compression, ainsi que les fax avec pertes d'information : par rduction de l'espace des couleurs repres par une palette ; les pixels font rfrence l'index de la couleur dans la palette au lieu de coder directement la couleur ; par sous-chantillonnage chromatique ; utilise la caractristique de l'il d'tre beaucoup plus sensible aux variations de luminosit qu'aux variations de couleur pour sous-coder ces dernires par rapport au codage des variations de luminosit ; par opration mathmatique de transformation pour ne pas retenir l'information laquelle l'il humain n'est pas sensible. JPEG utilise cette mthode. Par compression fractale (surtout valable pour les scnes naturelles).

En choisissant le type de format d'enregistrement d'une image dans un logiciel de traitement d'image type Gimp, on a, le cas chant, accs la (aux) technique(s) de compression propose(s) par ce format.

7.

Choix d'un format de fichier image

Cette partie du cours prsente les formats que vous tes le plus susceptible d'utiliser ou de rencontrer. Mme si des dizaines de formats de fichier d'image ont t crs au cours des annes, la plupart sont tombs en dsutude ou ne sont utiliss que dans des circonstances particulires, ce qui doit nous alerter sur l'importance du choix d'un format pour la prennit des informations numriques. De nouveaux formats font aussi leur apparition en fonction de nouveaux besoins, d'volutions technologiques ou de concurrence technologique. Les formats de fichier d'image les plus utiliss l'heure actuelle sont le TIFF, pour la reprsentation d'images en mode point en noir et blanc, chelle de gris ou en couleurs, le JPEG, trs employ pour des images sur Internet, et PNG, pour des lments graphiques faible rsolution. TIFF est concurrenc par le JPEG-2000, JPEG est concurrenc par le format WebP de Google. Plusieurs formats sont largement rpandus parce qu'ils sont reconnus dans divers environnements informatiques et qu'ils respectent des normes ouvertes. D'autres formats sont devenus populaires parce qu'ils sont pris en charge par plusieurs fournisseurs. Le choix d'un format de fichier peut tre dtermin par les utilisations prvues des images. On peut utiliser diffrents formats selon l'tape du traitement d'image et selon le type de sortie, par exemple l'impression ou l'affichage sur Internet.

a.

Le RAW

Le format RAW (littralement mode brut) des appareils photographiques est d'une grande importance pour extraire le maximum d'informations d'une image112. Les donnes qui s'y trouvent sont celles qui sortent directement du capteur CCD ou CMOS : elles ne sont pas altres (en principe) par le logiciel interne de l'appareil. Les donnes dans le format RAW ne sont pas compresses (ou alors selon une mthode non destructrice) ce qui permet de garder intact le contenu de votre prise de vue, contrairement au JPEG qui dtruit une partie des donnes et produit des artefacts. Grce cela il est possible partir du RAW de raliser un vrai traitement d'image.

111http://en.wikipedia.org/wiki/Image_compression (visit le 19/07/2007) 112http://www.astrosurf.org/buil/us/coolpix_raw/raw.htm (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 50/84

La dynamique de l'image dans un fichier RAW est nettement plus leve que celle qui se trouve dans un fichier JPEG ou TIFF standard. Typiquement elle est de 10 16 bits par plan couleurs (donc de 30 48 bits sur les 3 plans de couleurs) comparer avec les 8 bits du JPEG (24 pour les 3 plans). L'inconvnient du format RAW est qu'il n'est pas directement exploitable : il faut utiliser un logiciel qui doit en extraire les trois plans couleurs fondamentaux (rouge, vert et bleu). Chaque image doit tre spcifiquement traite, ce qui peut ajouter un temps considrable de post-traitement lors d'une campagne de numrisation. Une dernire difficult, et non des moindres, est qu'il n'existe pas actuellement (en 2011) de standard en matire de format RAW entre les constructeurs, bien qu'existe la norme OpenRaw et le DNG par Adobe (cf ci-dessous). Format proscrit en archivage !!

b.

Le DNG

C'est un format RAW normalis et ouvert, propos par Adobe. Bnfices (selon Adobe) : utilisable de faon plus sereine pour l'archivage puisque la norme est ouverte et donc sera connue dans le futur ; un process de production plus simple et plus rapide.113 Se mfier de telles affirmations !

c.

Le TIFF

Le format TIFF (Tagged Image File Format format de fichier d'image tiquete) a t mis au point par Aldus Corporation spcifiquement pour l'enregistrement d'images saisies l'aide d'un lecteur optique ou d'un capteur de page-cran, et manipules l'aide de programmes de dessin ou de retouche de photographies. l'heure actuelle, c'est probablement le format d'image en mode point le plus versatile, le plus fiable et le plus rpandu, pris en charge par pratiquement toutes les applications de dessin, d'dition d'images et de mise en pages. Comme il comprend plusieurs schmas de compression, il n'est pas li des lecteurs optiques, imprimantes ou moniteurs prcis. Le format TIFF reconnat les modles CMYK, RGB et Lab, ainsi que des fichiers en mode point. Plusieurs projets de traitement d'images numriques de muse font appel ce format pour l'archivage et le traitement de copies numriques. Par contre, il existe plusieurs variantes du format TIFF, et une application peut parfois avoir de la difficult ouvrir un fichier TIFF cr par une autre application.

d.

Le GIF

Le format GIF (Graphics Interchange format fichier d'image graphique) est un format populaire utilis pour l'affichage de graphiques et d'images en fausses couleurs dans des pages Internet. Ce format est limit 8 bits et donc une palette de 256 couleurs. Pris en charge par de nombreux logiciels, ce format convient bien pour des images chelle de gris et des dessins au trait, mais moins bien des images photographiques en vraies couleurs. Le format GIF est libre de droits (brevets tombs dans le domaine public le 1/10/2006) et existe en deux versions : le format original GIF 87a et le format plus rcent GIF 89a.

Le format GIF n'est videmment pas adapt au stockage de photos. Trs peu utilis en numrisation d'images.

e.

Le JPEG

Le format JPEG (Joint Photographic Experts Group groupe conjoint d'experts en photographie) est largement utilis pour l'affichage de photographies et d'autres images en tons continue dans Internet. Remarque : on parle de JPEG comme d'un format de fichier, mais c'est en ralit le nom d'une technique de compression avec perte. Le nom correct du format d'un fichier qui contient une image comprime l'aide de la technique JPEG est JFIF (JPEG File Interchange Format format d'change de fichiers JPEG). Comme on a pris l'habitude d'appeler aussi JPEG le format de fichier, nous allons nous conformer cet usage dans ce qui suit. la diffrence du format GIF (voir plus haut), JPEG conserve toute l'information couleur sur 24 bits selon le modle RVB mais comprime les fichiers en liminant certaines donnes. Une image JPEG est automatiquement dcomprime lorsque l'on ouvre le fichier qui la contient. JPEG code les couleurs en 24 bits, et est donc conu pour des images en vraies couleurs ou chelle de gris. Il fonctionne bien sur des photographies, mais moins bien sur des textes ou des dessins au trait. JPEG permet l'utilisateur de choisir le degr de compression et donc le compromis faire entre la taille du fichier et la
113http://www.adobe.com/products/dng/(visitle24/07/2008)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 51/84

qualit de l'image. Les taux de compression vont de 10 40 (c'est dire que les fichiers issus de la compression sont de 10 40 fois plus petits que les fichiers non compresss).

f.

Le JPEG 2000

Le format JPG2000, rcent standard ouvert, apporte des amliorations importantes par rapport au format JPEG actuel, notamment : la possibilit de compression sans perte, la dcompression progressive, la compression par ondelettes, la prise en charge de couleurs 48 bits (3 plans de 16 bits). Il permet d'implmenter des schma de mtadonnes dans sa structure interne. Il est utilis comme technologie sous-jacente dans des applications mdicales de pointe. Il est conu pour faciliter la visualisation en multi rsolutions

Attention, tous de logiciels ne savent pas encore le lire. Cependant, il est apparu rcemment comme un concurrent trs srieux du TIFF : Certains 114 argumentent fortement pour le choix du JPEG2000 comme format d'archivage et de consultation des donnes images. Avec JPEG 2000, une application peut n'accder et ne dcoder que la partie de l'image sur laquelle elle effectue une tche. Cela signifie qu'un programme de visualisation peut, par exemple, ouvrir une image d'un Gigapixels pratiquement instantanment en ne dcompressant tout d'abord qu'une version en basse rsolution puis dcompresser et visualiser les zones zoomes trs rapidement. L'image peut tre convertie en JPEG pour une visualisation sur un navigateur standard ou bien visualise via un plug-in spcifique. Il est possible de ne produire qu'une seule image matre liminant la ncessit de produire et de stocker des images drives qui sera exploite en de multiples rsolutions, d'o une simplification et un gain de place pour le stockage. Beaucoup de projets utilisant le JPEG-2000 le font avec son option de compression quasiment non destructive qui, bien que perdant des informations, produit des artefacts non dcelables qui n'interfrent pas avec les traitements d'images ultrieurs. Compars aux fichiers TIFF, les fichiers JPEG-2000 de qualit identiques psent facilement 10 fois moins lourd voire encore moins. .115 Exemple de tailles constates avec un rapide test utilisant Gimp pour crer les diffrents fichiers : Format Taille d'image JPEG 4,7 Mo JPEG-2000 20) 1,3 Mo (compression TIFF (LZW non destructif) 18,8 Mo

Tableau 2: Test de tailles d'images qualit perue quivalente en JPEG, JPEG-2000 et TIFF

Veille du 6/10/2009 : The Wellcome Library, anticipating a growth in digitization of library materials as it takes forward an ambitious digitization program, recognises the value of efficiency in storing its digital content whilst maintaining the high levels of quality and open standards required for longterm preservation. However, JPEG2000 comes in a variety of "flavours" and comprises 12 "parts", as explained in the JPEG2000 specification. Seeking to determine exactly which JPEG2000 format to use to meet the aims of long-term storage and accessible delivery services, the Library commissioned a report by Simon Tanner, Director of King's Consultancy Service (KDCS). The report was written in conjunction with Robert Buckley of Xerox Corporation, an expert in the technical specifications of the JPEG2000 format. As a result of the recommendations and conclusions provided in the report, the Wellcome Library will adopt a "visually lossless" lossy compression to gain at least 75% storage savings in comparison to a TIFF version (depending on the type of material being digitized). The recommended compression parameters will produce an image with no visible difference in image quality, but the compression is irreversible - i.e. the original bit stream will not be possible to reconstruct. As the Library will be digitizing physical items that can (if necessary) be re-digitized, it was considered an acceptable compromise. Embedding multiple resolution layers and tiling will facilitate dissemination, allowing a single image file to address multiple needs (such as thumbnails, screen resolution, and print resolution). In future, the Library will incorporate a web delivery system that can exploit these characteristics to create onthe-fly derivatives that can be viewed through a browser or downloaded (e.g. JPEG and PDF). 116 Pour tre complet, il faut savoir qu'il y a des possibilits de drive colorimtrique sur certains matriels...
114http://dltj.org/2007/02/jpeg2000-for-digital-preservation/ (visit le 19/07/2007) 115http://www.dpconline.org/docs/reports/dpctw08-01.pdf (visitle24/07/2008) 116http://wellcomelibrary.blogspot.com/2009/09/wellcome-library-to-use-jpeg2000-image.html (visit le 6/10/2009)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 52/84

g.

Le WebP

Le WebP (on prononce weppy ) est un format d'image matricielle dvelopp par Google et prsent en 2010 en version alpha. Il exploite un algorithme de compression avec pertes prdictif utilis pour les images cls du VP8 (qui est le codec vido du format WebM) et un conteneur lger et extensible RIFF. Test sur un million d'images, Google affirme que ce nouveau format permet de rduire de 39% la taille des fichiers par rapport aux formats JPEG, PNG et GIF, sans perte de qualit perceptible117. Est-ce un jpeg-killer ? Je laisse un expert en parler (en date du 1/10/2010) : All in all, Id say that googles claims are valid its a compression schema that does seem to outperform jpg. So should we all jump ship and never touch jpg again? No, absolutely not. Webp is in an alpha stage right now, and there doesnt yet exist a browser (or an image viewer for that matter) that supports it. Its also missing some key features such as color profiles and alpha channels. When it gathers those things and adds some polish, it will be a strong contender in the world of images on the web. Nonetheless even then it will have a long path ahead of it backwards compatibility is a big issue here, and I dont see them being able to get Microsoft to include support for quite some time (remember how long it took to get png support with alpha transparency by default?). However, for mobile devices I think it has a strong business case less data means faster page loads, which is crucial on mobile connections with limited bandwidth. Googles hardest road ahead lies not in improving the already decent algorithm, but in getting it adopted. 118

h.

Le PNG

Le format PNG (Portable Network Graphics graphique rseau portable) a t mis au point comme un format ouvert de remplacement pour le format GIF. Le format PNG est employ pour la compression sans perte et l'affichage d'images dans Internet. la diffrence du format GIF, PNG prend en charge des images 24 bits et plus, de mme que les nuances de gris et le modle de couleurs RVB, et peut produire un arrireplan transparent sans crnelage, anti alisas, grce une couche alpha de transparence 256 niveaux. Attention, certaines anciennes versions de navigateurs Web peuvent ne pas reconnatre les images PNG.

i.

Le PhotoCD

Le format Photo CD est un ancien format propre Kodak mis au point pour le stockage sur disque optique compact d'images numriques en couleurs de grande qualit. Photo CD enregistre plusieurs images selon une structure de fichier appele Imagepac. Photo CD, qui fait appel une technique de compression avec perte, convient bien au stockage des documents initialement sur pellicule comme des diapositives 35 mm. Il prend en charge la gestion des couleurs. Le format PhotoCD peut tre employ pour les fichiers d'archives mais il faut reconnatre qu'il n'a pas connu un succs de masse, essentiellement cause de la nature propritaire de ce format. Il a t suivi par le format Picture CD (essentiellement du JPEG) pour le grand public mais certaines professionnels des arts graphiques continuent privilgier le Photo CD.

j.

Le BMP

Le format BMP (bitmap mode point) est un format commun reconnu par la plupart des applications Windows. Il reconnat les modles de couleur RVB, fausses couleurs, chelle de gris et mode point. Les images sont stockes dans un format en mode point indpendant de l'appareil, qui permet Windows de les afficher sur n'importe quel cran. Le format est dit indpendant de l'appareil parce que la couleur des pixels est spcifie sous une forme indpendante de la mthode employe par l'appareil pour reprsenter les couleurs. Le format BMP reconnat des donnes 24 bits sans compression intgre. Il fait appel la technique RLE (Run Length Encoding codage l'excution) pour comprimer des donnes 8 bits, ce qui est efficace pour des graphiques mais beaucoup moins pour des photographies en tons continus (cf ci-dessus).

k.

L'EPS

Le format EPS (Encapsulated PostScript) prend en charge des images vectorielles et matricielles, et est reconnu par presque tous les programmes d'infographie, d'illustration et de mise en pages. Lorsque l'on ouvre l'aide de PhotoShop un fichier EPS qui contient des graphiques vectoriels crs l'aide d'une autre application, PhotoShop le convertit en une image matricielle en transformant les primitives en pixels. Les fichiers EPS contiennent galement de l'information qui dcrit la structure des pages. Le format EPS est reconnu dans tous les ordinateurs, mais les fichiers PostScript ne sont pas tous de structure identique et donc pas toujours lisibles d'un programme l'autre.
117http://fr.wikipedia.org/wiki/WebP (visit le 6/10/2010) 118http://englishhard.com/2010/10/01/real-world-analysis-of-googles-webp-versus-jpg/ (visit le 6/10/2010)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 53/84

l.

Le FlashPix

FlashPix est un nouveau format ouvert, mis au point par Kodak, Hewlett-Packard, Live Picture et Microsoft. Les images sont stockes en plusieurs rsolutions dans un seul fichier. FlashPix prend en charge un certain nombre d'autres caractristiques dans le but de rpondre des besoins du march actuel du traitement d'images, en ce qui concerne notamment le droit d'auteur (filigrane numrique), les mtadonnes, les ressources informatiques, la gestion des couleurs et la compression JPEG.

m.

Le PSD

Le format propritaire PSD est le format d'origine de PhotoShop d'Adobe. C'est surtout un format de travail qui permet de conserver les calques, les masques, etc. Il peut coder la couleur sur 8, 16, 24 ou 32 bits, donc le noir et blanc, la couleur RVB et CMJN. Il est parfois compress par la compression RLE. L'quivalent pour Gimp est le format xcf. Ce n'est pas un format de conservation de l'information, ni de diffusion.

n.

le TGA

Le format TGA (TARGA) a t le premier format populaire conu pour des images haute dfinition. Un fichier TGA peut tre non comprim, ou comprim selon la technique RLE, ou encore un mlange de RLE, Huffmann et codage delta. Le format TGA reconnat des images chelle de gris, des images en couleurs 8, 16, 24 et 32 bits, ainsi que des images en fausses couleurs.

o.

Le PDF

Le format PDF (Portable Document Format)119 constitue une norme mondiale de fait pour la transmission et l'change de documents numriques. C'est un format de choix pour l'archivage de documents (Research Reveals PDF is Format of Choice for Document Archiving120). Le format PDF a t conu par la socit ADOBE. Le format PDF est ouvert, il n'est pas ncessaire d'utiliser le logiciel payant Adobe Acrobat pour la cration de fichiers PDF car certaines entreprises ou personnes ont dvelopp des systmes, des programmes et des mthodes permettant de crer du PDF gratuitement. (voir par exemple PDFcreator ou OpenOffice.org).

I.

LES AVANTAGES DU FORMAT PDF :


permet de garder l'aspect et la mise en page d'origine quelles que soient les polices utilises, les applications (traitement de textes, logiciel de Publication Assiste par Ordinateur, tableur, base de donnes, etc...) et les images. Le document au format PDF s'imprimera exactement comme ce que vous apercevez l'cran, il est WYSIWYG (What You See Is What You Get : ce que vous voyez est ce que vous obtenez). un format ouvert Le standard de facto de l'change d'informations lectroniques rsolument plus scurises et fiables reconnu par les secteurs d'activit et administrations du monde entier. Conforme aux standards du march, notamment PDF/A (cf ci-aprs), PDF/X et PDF/E. un format multiplate-forme Consultable et imprimable sur toute plate-forme Macintosh, Microsoft Windows, UNIX et nombre de plates-formes mobiles. un format Fiable Avec plusieurs centaines de millions de documents PDF actuellement publis sur le Web, les tablissements sont nombreux faire confiance la technologie Adobe PDF pour collecter des informations. un format qui permet la Prservation de l'intgrit des informations Les fichiers Adobe PDF sont fidles aux documents originaux et les informations du fichier source sont prserves texte, dessins, images couleur 3D, photos quelle que soit l'application utilise pour le crer. un format qui permet la Scurisation des informations Vous pouvez apposer une signature numrique ou protger par mot de passe des documents Adobe PDF. un format qui permet l'Indexation. un format qui permet l'Accessibilit Compatibles avec les technologies d'assistance, les documents Adobe PDF facilitent l'accs aux informations lectroniques des personnes souffrant de handicaps.

119http://fr.wikipedia.org/wiki/Portable_Document_Format (visit le 19/07/2007) 120http://www.aiim.org/Research/PDF-Format-of-Choice-for-Document-Archiving.aspx (visit le 26/08/2009)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 54/84

II.

LES INCONVNIENTS DU FORMAT PDF


Mme s'ils peuvent l'tre dans des proportions rduites, les documents au format PDF ne sont pas faits pour tre modifis. Le format PDF a t conu pour la publication, la diffusion, l'archivage de documents publiables et l'impression. Si vous souhaitez modifier un document au format PDF, il faut utiliser le logiciel payant Adobe Acrobat (qui propose par ailleurs beaucoup d'options concernant la protection, les hyperliens, l'organisation et le plan du document...), ne pas confondre avec le logiciel gratuit Adobe Acrobat Reader (qui permet seulement de lire et d'extraire des donnes ).

III.

UNE NORME INTERNATIONALE POUR L'ARCHIVAGE, LE PDF/ARCHIVE SECURES ISO APPROVAL


Article du blog Zaphir121 : Une partie du format PDF a t normalis par l'ISO, sous la rfrence ISO 19005, Gestion de documents Format de fichier des documents lectroniques pour une conservation long terme Partie 1: Utilisation du PDF 1.4 (PDF/A-1). Il est possible de l'acqurir sur le site de l'ISO . Cette norme est mieux connue sous le nom PDF/A ou PDF Archive. Extrait d'un article du blog Les petites cases 122 : Trois points lui [au PDF/A ndla] donnent un avantage par rapport une autre version de PDF : * le fait qu'il soit normalis l'ISO sous le numro ISO19005-1 lui assure une documentation complte, mais la version 1.7 de PDF est aussi normalise l'ISO sous le numro ISO 32000 ; * les restrictions d'utilisation par rapport une autre version de PDF qui vont dans le sens de la matrise et la description de l'information (mtadonnes obligatoires, absence d'objets dynamiques, inclusion des polices de caractres, interdiction de lancement de scripts, absence de chiffrement...) ; * l'auto-documentation du format, un fichier en PDF/A doit contenir lui-mme toutes les informations ncessaires pour le dcrypter. Justement, ce dernier point est intressant, car il faut rappeler que PDF est un format composite et binaire. Un fichier PDF peut donc contenir du texte et des images. Dans le cas de ces dernires, l'encodage binaire est dcrit dans la norme PDF/A, mais cela n'enlve en rien le fait que l'outil de rendu devra tre capable de dcrypter ce format d'images. Bref, la migration et l'volution d'un fichier au format PDF/A pourrait finalement s'avrer plus complexe qu'un format texte et le prsenter systmatiquement comme la solution ultime me parat exagr. Vous l'aurez compris, l'important pour les formats est de conserver l'ensemble de leur documentation et de veiller disposer systmatiquement d'outils pour les exploiter

Le format PDF (Portable Document Format) y est dfini comme un "format d'change de documents lectroniques qui permet de transmettre des documents contenant du texte, des graphiques, des images et de la couleur, indpendamment du matriel et du systme d'exploitation utiliss". Ce format a t propos en tant que norme internationale afin d'assurer l'archivage prenne des documents lectroniques. Attention, la normalisation concerne uniquement une partie du format. C'est--dire que l'encodage de certains contenus multimdia contenus dans les versions rcentes du format PDF ne sont pas concernes par cette norme. Pour en savoir plus, consultez l'article PDF/A-1, PDF for Long-term Preservation, Use of PDF 1.4 123 ou le site d'Adobe124 A noter, le PDF 1.7 a t rcemment t accept comme standard ISO (ISO/DIS 32000)125 Un article simple pour bien comprendre sur le blog Formats ouverts 126. Un ensemble de recommandations pour crer des pdf adapts la prservation long terme : Recommendations for the creation of PDF files for long-term preservation and access127

121http://zaphir.canalblog.com/archives/2005/10/14/893371.html (visit le 19/07/2007) 122http://www.lespetitescases.net/vous-avez-dit-format-perenne (visitle18/8/2010) 123http://www.digitalpreservation.gov/formats/fdd/fdd000125.shtml (visit le 19/07/2007) 124http://www.adobe.com/fr/products/acrobat/pdfs/pdfarchiving.pdf (visit le 19/07/2007) 125http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=45873 (visit le 10/7/2008) 126http://formats-ouverts.org/blog/2007/05/03/1190-autour-du-format-pdf (visit le 19/07/2007) 127http://www.kb.nl/hrd/dd/dd_links_en_publicaties/PDF_Guidelines.pdf (visitle24/07/2008)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 55/84

p.

Le DjVu

Le format DJVU (rfrence128 et article Wikipedia129). Format trs adapt la publication des documents dont le fond n'est pas blanc puisqu'il code sparment le fond de page du texte pour arriver des taux de compression impressionnant tout en conservant une qualit visuelle excellente. Problme, ce format ncessite un plug-in pour tre visualis et ce dernier ne s'est jamais dmocratis. Trs intressant tout de mme. noter, cette technologie se retrouve dans certains logiciels propritaires de cration de pdf qui, grce elle, proposent des fichiers beaucoup plus lgers que ceux qu'Adobe Acrobat produit avec, en interne, une compression JPEG. La diffusion de ces fichiers pdf est nanmoins dconseille par les grands acteurs de la numrisation en France (BNF, ..) du fait de leurs artefacts parfois trs visibles et gnants.

q.

HD Photo de Microsoft - JPEG XR

Un nouveau venu130 : Le 8 mars 2007 Las Vegas, lors du International Convention and Trade Show du Photo Marketing Association 2007, Microsoft a annonc le lancement de son nouveau format destin la photo numrique haute dfinition, HD Photo. Premier point noter, le format du nom : HD Photo n'voque en rien Windows ou Microsoft... alors que le nom initial tait Windows Media Photo (WMPhoto). Ce nouveau format est en concurrence avec le JPEG ou le JPEG 2000. Microsoft avance qu'il possde un meilleur taux de compression, donc un poids moindre, et une meilleure qualit. Veille : le 17/07/2009 ce format est devenu un standard ISO/IEC 29199-2 sous le nom de JPEG XR. Commentaire : a n'en fait toujours pas un format succs ;-)

8.
a.

L'OCR
Principe

La reconnaissance optique de caractres (OCR : Optical Character Recognition) est un ensemble de techniques informatiques qui realisent une reconnaissance de la forme des caractres, apres captation dimage par procede optique. Le rsultat de ce traitement est un fichier informatique de traitement de texte. Pour la reconnaissance des caractres, trois techniques sont utilisees : Comparaison par modeles : Il sagit dune technique qui consiste a comparer le signe de chaque caractre avec un modele preenregistre. Extraction de proprietes : C'est un ensemble de techniques qui consistent a dterminer les proprietes gomtriques des caractres a reconnaitre, telles que les fins de segments, les angles prononces, les croisements, etc. Mthodes structurelles : C'est un ensemble de methodes dont le principe consiste a exprimer une lettre par une combinaison dattributs generaux, comme par exemple, le rapport entre la hauteur et le largueur du caractre, etc.

Attention, des tudes ralises par des quipes de chercheurs montrent que la reconnaissance optique de caractres tente sur des documents anciens qui utilisent des polices de caractres dsutes donnent de trs mauvais rsultats, tels qu'il est plus conomique de les faire saisir par des dactylos. Certaines socits prsentes sur le territoire national exploitent des rseaux de dactylos localiss dans des pays en voie de dveloppement, abaissant ainsi les cots de prestation de cet l'OCR manuel . tudier au cas par cas l'opportunit d'utiliser chaque technologie.

b.

Logiciels

OmnipagePro131, FineReader132, ReadIris Pro133 et Abby FineReader134 sont les leaders reconnus dans leur domaine. Ils traitent les images bitmap des textes et reconnaissent grce des algorithmes complexes, les caractres numriss.

128http://www.mosarca.com/2000/pdf/pdf99/DJVU170.pdf (visit le 19/07/2007) 129http://en.wikipedia.org/wiki/Djvu (visit le 19/07/2007) 130http://formats-ouverts.org/blog/2007/03/09/1132-hd-photo-nouveau-format-de-microsoft (visit le 19/07/2007) 131http://www.nuance.com/omnipage/ (visit le 19/07/2007) 132http://finereader.abbyy.com/ (visit le 23/8/2010) 133http://www.irislink.com/ (visit le 19/07/2007) 134 http://http://www.abbyy.com/document_conversion/ visite le lundi 5 septembre 2011

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 56/84

noter, il est dsormais possible d'utiliser des logiciels d'OCR en ligne, comme par exemple FineReaderOnline135 Free-OCR136, OCT Terminal137, OCRonline138 ... Une page les recence139.

c.

Notes/commentaires sur l'OCR


Les amliorations apportes sur ce genre de produit ces derniers temps ont port sur l'amlioration de l'algorithme de reconnaissance bien sr, mais galement sur la reconstitution de la mise en page. Le logiciel consulte mme des dictionnaires spcialiss pour rduire encore le taux d'erreur qui reste, malgr tout, non nul. Quelle que soit la solution choisie, il faut garder lesprit que les performances sont trs fort dpendantes du type de document original (police et taille des caractres), de son tat (papier transparent), et de la qualit de la numrisation (une rsolution dacquisition de 350dpi devrait souvent garantir la meilleure reconnaissance) ; il convient donc de tester chaque solution sur des exemples reprsentatifs du fonds que dont vous souhaitez reconnatre le texte. Dans tous les cas, le meilleur taux de reconnaissance est denviron 99,97% ; cela peut sembler norme, mais signifie quil y a un peu moins dune faute tous les 1000 caractres (une page en comporte 2500 caractres minimum). Toute opration professionnelle d'OCR ncessite une relecture humaine. A noter, l'OCR le plus fiable est ralis sur les encres magntiques des numros de chques (1 erreur tous les 20,000 30,000 chques) qui combine reconnaissance optique et magntique. Veille : le projet Google Book utilise une camra infra-rouge amliorant le fonctionnement de l'OCR : Google created some seriously nifty infrared camera technology that detects the three-dimensional shape and angle of book pages when the book is placed in the scanner. This information is transmitted to the OCR software, which adjusts for the distortions and allows the OCR software to read text more accurately. No more broken bindings, no more inefficient glass plates. 140

d.

Le format des donnes issues d'un processus d'OCR

Les donnes issues d'un processus d'OCR sont enregistres dans des fichiers de bureautique (traitement de texte ou feuille de calcul). On portera une attention trs importante aux formats de fichier choisis. La meilleure prennit des informations est obtenue en choisissant des formats ouverts et structurs, soit, dit autrement, des formats dcrits et publis en DTD ou schma XML. La DTD doit tre ouverte, sous licence libre, pour garantir qu'aucun oprateur priv ou autre, ne puisse vous empcher l'avenir d'accder aux donnes et d'y effectuer des traitements. La meilleure option est de choisir le format OpenDocument , normalis, implment dans OpenOffice.org v3.0141. Il est noter que Microsoft s'tait vu refuser la normalisation du format XML de sa dernire suite bureautique, concurrent d'OpenDocument, en septembre 2007. Il a depuis russi inverser ce rsultat. Il y a donc aujourd'hui deux normes incompatibles pour le mme usage (et des tudes ont montr qu'il sera trs difficile de passer de l'une l'autre)

e.

Les formats de visualisation flash (issuu, fluidbook, )

L'anne 2009 voit arriver de nouveaux modes de publications de documents visuels, l'image de la rvolution qui a eu lieu les annes prcdentes pour la vido avec YouTube (entre autres). Ces nouveaux services utilisent le Flash pour proposer une interface de consultation intgre et trs simple mettre en uvre. Ces services connaissent un trs grand succs et peuvent sans aucun doute tre utiliss pour la diffusion des documents issus des projets de numrisation. Services phares : Issuu 142 et fluidbook143 mais il y en a d'autres. Prfrez les services qui permettent une installation en local des documents visualiser et du script de visualisation. noter, certains scripts de visualisation permettent d'muler le fonctionnement des visionneuses en flash en utilisant des images redimensionnes la vole et affichables avec un effet tourne page raliste. Exemple considrer : la visionneuse du projet Archive.org144.

f.

Les formats pour ebook - exemple d'epub

EPUB est un format ouvert standardis pour les livres lectroniques. Propos par l'International Digital Publishing Forum (IDPF), ses fichiers ont l'extension .epub. EPUB est conu pour faciliter la mise en page du contenu, le texte affich tant ajust pour le type d'appareil de lecture. Il est galement conu comme seul

135http://finereaderonline.com (visit le 26/08/2009) 136http://www.free-ocr.com/ (visit le 26/08/2009) 137http://www.ocrterminal.com (visit le 26/08/2009) 138http://www.ocronline.com/(visit le 23/8/2010) 139http://roget.biz/4-ocr-gratuits-en-ligne-et-sans-logiciel (visit le 23/8/2010) 140http://www.guardian.co.uk/technology/blog/2009/may/04/google-gadgets (visit le 26/08/2009) 141http://www.oasis-open.org/committees/tc_home.php?wg_abbrev=office (visit le 19/07/2007) 142Http://issuu.com (visit le 16/09/2009) 143Http://www.fluidbook.com (visit le 16/09/2009) 144http://www.archive.org/stream/captainnathaniel00spea#page/n13/mode/2up visit le lundi 5 septembre 2011

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 57/84

format pouvant la fois satisfaire les diteurs pour leurs besoins internes et la distribution. Ce format englobe le standard Open eBook. En savoir plus : page de wikipedia anglophone sur epub145

g.

Conclusion

Le choix d'un format de diffusion peut se discuter. Les formats les plus pertinents sont souvent JPEG ou PDF. Tout autre choix devra tre motiv trs srieusement eu gard des risques de difficult de configuration (installation de plug-ins, etc.) et d'accessibilit des images. De mme, il y a peu de formats reconnus pour archiver les fichiers (fichiers matres) : TIFF est le format le plus courant. De plus en plus le JPEG-2000 pour les raisons voques ci-dessus... JPG : utiliser lorsque vous tes amens archiver des images contenant un trs grand nombre de pixels. Cependant, il faut tre conscient des limites et des artefacts qu'entrane l'utilisation de ce format. Cf What is Inside a JPEG File 146 pour plus de dtails. JPEG-2000 tend supplanter JPG pour ces trs grosses images.

Choisir une profondeur de couleur de 24 bits. Les fichiers images matres rencontrs dans les projets de numrisation ont souvent une taille de 4000x6000 pixels. Tout autre choix de format devra tre motiv trs srieusement eu gard des risques d'obsolescence et donc de prennit des informations numrises. Cf Ecrire un cahier des charges de numrisation Annexe 1 Recommandation sur les caractristiques techniques des fichiers images 147 des Archives de France, qui fournit une liste de recommandations pour un grand nombre de documents analogiques : Documents textuels manuscrits ou dactylographis, sans image trame manuscrits ou dactylographies feuille feuille registres manuscrits ou dactylographies double page (avec option page par page) documents iconographiques et cartographiques, sans image trame plans au trait monochromes plans en couleurs ou au lavis, vues architecturales, cartes, affiches, lithographies encre couleur, sanguines, dessins dessins en couleurs, peintures, aquarelles estampes, affiches au trait, dessins au trait, la plume, lithographies en noir documents photographiques, sans image trame tirages photographiques, polarods, hliogravures, cartes postales sans trame10 plaques photographiques en verre, planfilms autochromes, ektas de grand format positifs en couleurs ngatifs standards de petit et moyen format (135, 4x4, 620, 120, 220), films 65 mm, et amateurs (126), pocket, disc, advantix diapositives standards de petit et moyen format (135, 4x4, 620, 120, 220), et amateurs (126), stroscopies sur film, films fixes (35mm) documents avec images trames imprims relis ou non avec similigravures et textes journaux, quotidiens - relis ou non microformes microfilms 16 et 35 mm noir et blanc microfiches a6, cartes fentre 35 mm microfilms 35 mm et microfiches a6 couleur

9.

P.S. : conseils concernant la compression avec perte


Le taux de compression indiqu par un logiciel est spcifique ce logiciel de traitement d'images et n'est pas transposable un autre logiciel de traitement d'images, chaque algorithme de compression tant diffrent. Il n'est pas possible de prdterminer le taux de compression appliquer une srie d'images, car les algorithmes de compression donneront des rsultats diffrents en fonctions de plusieurs paramtres tels que le type d'image, le contraste, la technique de cration de la photographie, l'existence ventuelle de pr-traitements, ... l faudra procder comme suit :

145http://en.wikipedia.org/wiki/EPUB (visit le 7/9/2010) 146http://www.imaging.org/resources/web_tutorials/inside_jpeg/inside_jpeg.cfm (visit le 19/07/2007) 147http://www.archivesdefrance.culture.gouv.fr/static/1309 (visit le 28/09/2009)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 58/84

Tester un taux de compression donn sur un lot de fichiers images (exemple 70% sur Gimp). Examiner avec attention le rsultat obtenu avec le fichier original (en TIFF) avec un agrandissement 100% l'cran (1 pixel de l'image correspondant 1 pixel sur l'cran). Veillez particulirement aux bordures et aux zones de faux aplats ou la couleur volue en de trs lgers dgrads. Reprer les ventuelles zones en blocs et les flous autour des caractres et des traits. Certains formats trs populaires, comme le JPEG, sont l'objet de recherches trs actives dans le domaine de la compression sans perte visible. Des avances trs intressantes sont obtenues par de nouveaux algorithmes qui sont testables sur internet, voir par exemple le service JPEGmini148 gratuit.

10.
a.

Le contrle qualit
Plan d'assurance-qualit

Il est important, ds le moment de la conception du projet, de dfinir un plan qualit149 : Assurance-qualit du processus. Le projet de numrisation doit tre guid par : les spcifications du projet, les critres de slection, le manuel des procds dcrivant tous les processus tape par tape, les thsauri et vocabulaires utiliser. Assurance-qualit des oprations automatises : gestion des fichiers, cration de fichiers drivs, extractions automatiques de mtadonnes Assurance-qualit des contrles manuels qui permettront de prciser les paramtres du processus. Ces contrles devraient tre effectus par une personne diffrente de l'oprateur qui a suivi le process de numrisation. Les contrles manuels doivent tre signs et horodats pour une tracabilit maximale. Retour usagers. Il faut permettre l'usager final d'effectuer un retour sur les erreurs ou les problmes qu'il a rencontr ou dtect.

b.

Validation technique des images numrises. Exemple de l'histogramme

Grce diffrents outils des logiciels graphiques tels que Photoshop ou Gimp, et grce un contrle visuel sur un bon moniteur correctement talonn. Nous verrons parmi ceux-ci l'histogramme de couleurs. Il y en a d'autres. Cf Best Practice Guidelines for Digital Collections at the UM Libraries 150 Appendix VI: Quality Control for Images , Quality Assurance / Introductory Information151 et Quality Assurance / Indepth Reports 152 pour une checklist de contrle qualit des images. Lhistogramme est l'outil le plus simple pour jauger rapidement de la qualit d'une numrisation du point de vue de la reproduction des couleurs. Lhistogramme : est un graphe doccurrence dun niveau de gris ou dune couleur. Il vous renseigne sur la rpartition des niveaux de gris de votre image et des niveaux de luminosit des couches RVB de votre image. est un indice de la qualit de restitution de votre image, il pourra vous aider estimer la qualit dexposition de votre numrisation. donne aussi une image rapide de la gamme de couleurs tonale de l'image ou du type de dominante.

148http://www.jpegmini.com/ visit le lundi 5 septembre 2011 149http://www.tasi.ac.uk/advice/creating/qassurance.html (visit le 14/09/07) 150http://www.lib.umd.edu/dcr/publications/best_practice.pdf (visit le 19/07/2007) 151http://www.tasi.ac.uk/advice/creating/quality.html (visit le 14/09/07) 152http://www.tasi.ac.uk/advice/creating/qassurance.html (visit le 14/09/07)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 59/84

Laxe horizontal de l'histogramme reprsente les valeurs colorimtriques des pixels, des plus sombres

gauche (0) aux plus claires droite (255).

Si la rpartition est homogne, cf les 3 histogrammes de couleurs ci dessous (un par plan de couleur), la numrisation est de bonne qualit (sauf exception des images originales).

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 60/84

Histogramme d'une image sous-expose

Histogramme d'une image sur-expose Lanalyse des histogrammes de ces images, la premire surexpose, la seconde sous-expose, montre, que dans les hautes lumires et les basses lumires certaines informations de l'image ne sont plus prsentes. Or, une correcte rpartition des densits de l'image doit tre obtenue ds la numrisation de l'image au moment du scan, sinon vous risquez de perdre des informations. Nous allons voir ci-aprs comment corriger les couleurs d'une image Comment rgler l'Histogramme : La correction consiste dfinir les points dentre et de sortie de votre image, c'est dire les tons clairs et foncs. Cette correction permet gnralement de redistribuer correctement les pixels des tons moyens du fichier, le cas se prsente souvent avec certains scanners qui ont tendance adoucir l'image. Pour redistribuer les tons moyens il suffit de ramener les curseurs de l'histogramme de la gauche vers la droite pour les noirs, de la droite vers la gauche pour les blancs.

11.

Etude de cas

Un document trs intressant sur l'tat de l'art dans la numrisation des journaux : The Current State-of-art in Newspaper Digitization - D-Lib Magazine - January/February 2008153
153http://www.dlib.org/dlib/january08/klijn/01klijn.html (visitle24/07/2008)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 61/84

D.
1.
a.
I.

La numrisation des images animes


Introduction
L'histoire de l'image anime
LA PRHISTOIRE

Premire projection cinmatographique payante le 28 dcembre 1895 au Salon Indien du Grand Caf Paris, avec notamment le film la Sortie de l'usine Lumire Lyon. Ce sont les dbuts du cinma commercial et de l'industrie cinmatographique. Exploit de front en salles et dans les ftes foraines, le cinma devient rapidement un art populaire. Trs vite, les frres Lumire envoient des cameramen travers le monde pour en rapporter des scnes de la vie de tous les jours. Ce sont les dbuts du cinma d'actualits. Dans le cadre de la guerre des brevets initie par Edison, toute l'industrie cinmatographique tombe sous le monopole du Trust Edison jusqu'en 1918. Prcurseur des effets spciaux, du cinma de fiction, d'un cinma thtral et d'un cinma potique, Georges Mlis, illusionniste de formation, ralise les premires fictions dotes d'effets spciaux en trompe-l'il (le Voyage dans la lune (1902) entre autres).

II.

LA SORTIE DU SILENCE
Jusqu' la fin des annes 1920, aucune bande sonore n'accompagne l'image sur la pellicule et c'est alors souvent un ou des musicien(s) prsent(s) dans la salle de projection qui accompagne(nt) les films, les dialogues des films narratifs tant retranscrits par des intertitres . Nombreuses tentatives faites pour synchroniser le son et l'image, par exemple en calant le projecteur avec le sonographe. Le son a dtermin la cadence de projection autrefois alatoire (16, 18, 25 images par secondes selon le bras du camraman qui tournait la manivelle, ce qui provoque une acclration du mouvement lorsqu'ils sont projets la vitesse standard actuelle de 24 images par secondes). partir du film : le Chanteur de Jazz en 1927, des sons (de la musique, puis des dialogues et des bruitages) peuvent tre enregistrs et reproduits lors de la projection.

III.

LES VOLUTIONS TECHNIQUES MAJEURES...


L'arrive de la couleur et des formats larges dans les annes 1950 L'allgement du matriel qui permit l'avance du cinma exprimental, du cinma documentaire L'arrive de la synthse d'images informatiques dans les annes 1990 L'arrive du son numrique dans la mme priode. L'arrive du numrique HD 3D pour le grand public partir de l't 2009 (deux projeteurs HD projettent le film au travers de deux filtres polarisant la lumire verticalement et horizontalement. Les spectateurs utilisent une paire de lunettes qui filtre l'information visuelle destine chaque il).

IV.

LARRIVE DES AMATEURS...

partir de 1965, le super 8 devient accessible au grand public. C'est la vrai naissance du cinma amateur. Comme le super 8, son infrastructure trs lgre, et son cot moindre, la vido, d'abord trs lourde et rserve un usage professionnel , deviendra dans les annes 1980 un mdium privilgi, notamment pour les jeunes crateurs. Dans la mme ligne que le super 8, le 16 mm, et la vido, l'arrive du numrique ajoute une possibilit la palette des pratiques lgres possibles et rend plus facile la postproduction d'effets spciaux (par exemple l'Attaque des clones), ou la souplesse dans le montage (voir l'Auberge espagnole de Cdric Klapisch) et bien sr la lgret dans le tournage.
Cours numrisation (c) JMM 2011-2012 version du 16/12/11 page 62/84

b.

Qu'est-ce qu'une vido ?

Une vido est une succession d'images une certaine cadence. L'il humain a comme caractristique de ne pas tre capable de distinguer plus de 20 images par seconde : sa rmanence suite l'affichage d'une information est plus longue que le temps d'affichage d'une image ; l'il ne distingue pas le passage l'image suivante. Ainsi, en affichant plus de 20 images par seconde, il est possible de tromper l'il et de lui faire croire une image anime. On caractrise la fluidit d'une vido par le nombre de trames par secondes (en anglais frame rate), exprim en FPS (Frames per second, en franais trames par seconde). Une trame est soit une image complte soit une image n'affichant qu'une ligne sur deux. D'autre part la vido est gnralement accompagne de donnes audio.

c.

Cinma et vido analogique.

On distingue gnralement plusieurs grandes familles d'images animes analogiques : Le cinma, consistant stocker sur une pellicule la succession d'images en ngatif. La restitution du film se fait alors grce une source lumineuse projetant, partir d'un ngatif, les images successives sur un cran. La vido analogique, reprsentant l'information comme un flux magntique de donnes analogiques, destine tre affiches sur un cran de tlvision (bas sur le principe du balayage). Il existe plusieurs normes pour la vido analogique :

I.

PAL ET SECAM

Le format PAL/SECAM (Phase Alternating Line/Squentiel Couleur avec Mmoire), utilis en Europe pour la tlvision hertzienne, permet de coder les vidos sur 625 lignes (576 seulement sont affiches car 8% des lignes servent la synchronisation) raison de 25 images par seconde un format 4:3 (c'est--dire que le rapport largeur sur hauteur vaut 4/3). Or 25 images par seconde, de nombreuses personnes peroivent encore un battement dans l'image. Ainsi, tant donn qu'il n'tait pas possible d'envoyer plus d'informations en raison de la limitation de bande passante, il a t dcid d'entrelacer les images, c'est--dire d'envoyer en premier lieu les lignes paires (trame n), puis les lignes impaires (trame n+1). L'ensemble est appel trame entrelace. Grce ce procd appel "entrelacement", le tlviseur PAL/SECAM affiche 50 trames par seconde ( une frquence de 50 Hz), soit 2x25 images en deux secondes.

II.

NTSC

La norme NTSC (National Television Standards Committee), utilise aux tats-Unis et au Japon, utilise un systme de 525 lignes entrelaces 30 images/sec (donc une frquence de 60Hz). Comme dans le cas du PAL/SECAM, 8% des lignes servent synchroniser le rcepteur. Ainsi, tant donn que le NTSC affiche un format d'image 4:3, la rsolution rellement affiche est de 640x480.

2.
a.

Les diffrents types de documents analogiques "vido" numriser


Formats rencontrs
films professionnels 16mm, 35 mm films amateurs : Super 8, bandes vido analogiques : betamax, VHS, V2000, Bandes issues de camescopes Les signaux tlvisuels ....

Les films et vido numriser existent sous de multiples formes :

Voici un tableau des formats analogiques les plus courants154 :

154http://www.nyu.edu/its/humanities/ninchguide/VII/ (visit le 26/11/2010)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 63/84

Moving Image Media

Properties

Source Device

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 64/84

8mm & Super 8 Film

18 fps (frames per second) most common frame rate, followed by 12 fps and 24 fps (often used with sound film). The latter frame rate tended to be used by professionals or for capturing moving objects. During the early 1960s 18 fps started to appear. 8mm sound film appeared around 1960. Super 8 introduced by Kodak in 1965. It is perforated in the center and not the edges of the frame. 3 diameter reels are most common, 6 and 7 reels and cassettes are also found. Very common film format Very common film format Can be confused with audio tape. 10 reels are audio, some video, as well as audio, formats used 7 and 5 reels.

An 8mm film projector, for "standard" 8mm and/or Super 8 film. Determining the original frame rate can be problematic. Most older projectors are variable speed which is useful. Projectors should be in excellent condition and the film unshrunken. Capstan drives are better for the film and the sprockets.

16mm Film 35mm Film

16mm film projector 35mm film projector

Reel to Reel Video Tape

videotape recorder.

(12.5mm) Video Tape

Reel-to-Reel

videotape recorder. Machine maintenance and replacement parts very difficult. Broadcast TV format. U-Matic has been around since the early 1970s and remains a popular production and archive format because of relatively low cost compared to Betacam SP.

(U-Matic) Tape or Cassette

U-Matic machine. Come in fixed or portable, reel or cassette versions

1 Reel to Reel Video Tape Television programs from the late 1950s to 1970s. 8mm video comes in two formats 8mm and Hi-8 (equivalent to VHS and SVHS) Betacam SP is a popular field and post-production format. M-II is a popular broadcast quality format. S-VHS is a higher quality format of the ubiquitous VHS home video cassette. The now obsolete Beta and Video 2000 formats also used tape cassettes.

1 Reel to Reel tape player. 2 Reel to Reel tape player. Playback equipment for this has become increasingly rare. Hi-8 players can play standard 8mm cassettes but not vice versa. Betacam SP and M-II require compatible players. S-VHS players will play standard VHS cassettes but not vice versa. Although almost identical, S-VHS cassettes have additional holes in the casing.[2]

2 Reel to Reel Video Tape

8mm Video Cassette

(12.5mm) Cassette

Video

Tape

Pour tre plus prcis, voir les tableaux ANALOG VIDEOTAPE FORMATS p.22 et DIGITAL VIDEOTAPE FORMATS p.24 du document Videotape Preservation Handbook 155.
155http://www.amianet.org/resources/guides/WheelerVideo.pdf (visit le 29/10/2008)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 65/84

b.

Nettoyage et preparation

noter156, pour garantir la meilleure qualite de lecture du document ainsi que la conservation du support dorigine, le nettoyage de la plupart des supports est indispensable. Cette operation est a determiner au cas par cas : Debobinage / rembobinage (bandes, cassettes, film...) Controle des collures (bandes, film...) Depoussierage Nettoyage a sec (bandes, cassettes...) Nettoyage humide (disques, film...) Chauffage eventuel en cas de bandes ou cassettes crissantes (audio) ou encrassantes.

Differents outils sont disponibles sur le marche pour ces operations. Meme dans le cas ou un nettoyage des bandes et cassettes nest pas imperatif, une simple operation de debobinage / rembobinage est preconisee avant lecture. Pour ce faire, une ressource de lecture (magnetophone ou magnetoscope) en bon etat de marche peut etre suffisante. Dans le meme ordre didee, une premiere lecture du document peut etre le moyen le plus efficace pour nettoyer un cylindre ou un disque. Il sera neanmoins prudent, a cette occasion, de numeriser le signal issu de cette premiere lecture.

c.

Reconditionnement

Il peut etre souhaitable de profiter du processus de numerisation pour reconditionner les supports originaux. Cela passe par un changement de boitier, de bobine, de pochettes... a des fins de conservation ou de magasinage. Lusage de materiaux et de conteneurs offrant les garanties ncessaires en termes de conservation est videmment fortement recommand ; par exemple : papier neutre pour des pochettes de disques, flasques offrant un maximum de rigidit pour le rangement vertical des bandes magntiques, boites polypropylene pour les coffrets de CD, boites et noyaux plastiques grands diametres pour les films....157

d.

Lecture
Choix de la ressource de lecture (platine tourne-disque, magnetophone, magnetoscope, telecinema) Choix des accessoires (cellules, pointes...) Choix des peripheriques (filtres, TBC...) Etat des ressources et peripheriques (assurance dune maintenance periodique) Suivi de lusure des accessoires (changements de pointes ou tetes magnetiques) Controle du bon calibrage des machines utilisees Choix des parametrages retenus (vitesse, niveaux...) Choix des materiels de lecture et des logiciels dextraction dans le cas des CD Audio

Dune manire gnrale, la plus grande attention sera apportee aux points suivants :

Dans un contexte de supports anciens, il nest pas choquant de faire appel a des appareils de lecture contemporains des documents a lire, dans la mesure ou la maintenance en a ete assuree correctement. Il nest pas rare que cela soit dailleurs lunique solution. Lexperience a prouve que des outils de traitement de limage recents (numeriques, donc) supportaient moins facilement les defauts inherents a des supports anciens que des machines de la generation des documents en question (souvent analogiques). Dans dautres cas, des magnetoscopes recents, compatibles avec des bandes dancienne generation ne donneront pas daussi bons resultats que des machines plus specifiques construites des annees plus tot. Enfin, il est fondamental de prendre en compte la notion dexpertise. De jeunes techniciens formes au tout-numerique nauront pas le meme bagage quun personnel ayant connu lepoque de lanalogique. Il est en tout cas evidemment fondamental de porter toute lattention possible a cette etape car il est peu probable (et peu souhaitable) de pouvoir la reproduire ulterieurement.158

156Ce point est repris depuis le guide : crire un cahier des charges de numrisation de collections sonores, audiovisuelles et filmiques Paris, Ministre de la Culture et de la Communication, comit de pilotage numrisation, Bibliothque nationale de France, 2009, 33 p. < http://www.culture.fr/culture/mrt/numerisation/fr/technique/documents/cahier_charges_numerisation.pdf > Consult le mardi 6 septembre 2011. 157Ce point est repris depuis le guide : crire un cahier des charges de numrisation de collections sonores, audiovisuelles et filmiques Paris, Ministre de la Culture et de la Communication, comit de pilotage numrisation, Bibliothque nationale de France, 2009, 33 p. < http://www.culture.fr/culture/mrt/numerisation/fr/technique/documents/cahier_charges_numerisation.pdf > Consult le mardi 6 septembre 2011. 158Ce point est repris depuis le guide : crire un cahier des charges de numrisation de collections sonores, audiovisuelles et filmiques Paris, Ministre de la Culture et de la Communication, comit de pilotage numrisation, Bibliothque nationale de France, 2009, 33 p. < http://www.culture.fr/culture/mrt/numerisation/fr/technique/documents/cahier_charges_numerisation.pdf > Consult le mardi 6 septembre 2011.

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 66/84

3.

Production directe de vidos numriques


(concerts,

Les camescopes modernes sont maintenant tous numriques. Filmer un vnement manifestations, congrs, ...) avec un tel matriel est une manire de le numriser .

4.

Les concepts de base (Dfinitions/Vocabulaire)

Il existe beaucoup de normes et de standards diffrents dans le domaine de la vido, mais on rencontre souvent : La vido numrique grand public sappuie sur le standard DV. Les professionnels utilisent dautres standard proches du DV, mais de meilleure qualit (DV-CAM, DVPro, Beta Numrique, du format le plus public jusqu'au format le plus professionnel)

a.

Principes de numrisation d'une vido

Les principes de numrisation d'une vido sont assez simples : La premire tape consiste chantillonner chaque image selon une taille en pixels donne (par exemple 720 x 486 pixels pour une vido standard, 1280x720 ou 1920x1080 pour la HD). La seconde tape consiste associer une valeur numrique (la quantification) chacun des lments qui forment la couleur de ce pixel (YUV159 ou RGB) en utilisant une table de conversion de couleurs (normalement 24 bits par pixels pour 16 millions de couleurs possibles en chaque point). Ce procd de conversion doit se faire trs rapidement, prs de 30 images par seconde (25 images de 720 x 576 pixels par seconde en PAL et bien davantage avec les formats HD) ! Des circuits spcialiss, prsents dans les cartes d'acquisition numriques vido des ordinateurs, sont mme de raliser cette opration.

Si un signal vido de 720x486 pixels de rsolution est numris en utilisant la norme YUV 4:2:2, le fichier rsultant sera de 683.44 Ko par image ou 20.02 Mo/sec. C'est ce qu'on appelle le format non compress de ratio 1:1. 20 Mo par seconde, c'est 1.2 Go de donnes par minute de vido. A la fois le stockage et la transmission de tels signaux non compresss est problmatique. La compression numriques est donc indispensable, mme pour les fichiers matres. Les algorithmes d'encodage utiliss sont destructifs, en l'tat actuel des techniques, sauf pour le rcent MJPEG-2000 (cf page 72).

b.

Les diffrentes tailles de vido en vigueur

Pendant plusieurs annes, la taille souvent rencontre tait dite standard , de 720x486 pixels. La vido numrique, l'arrive de la tlvision haute dfinition et l'apparition d'crans mobiles ont boulevers la donne. On rencontre aujourd'hui plusieurs standards en termes de tailles d'images vido. Ces tailles sont dnommes par un code qui peut tre : xxxi pour xxx lignes entrelaces (interlaced) : seule une ligne sur 2 est modifie chaque nouvelle trame vido. xxxp pour xxx lignes en balayage progressif. Le balayage progressif (progressive scan) est le mode d'affichage utilis par les crans ayant une grande frquence de rafrachissement : crans d'ordinateurs modernes, tlvisions haute dfinition. Sur l'cran, l'image arrive de manire non entrelace. Chaque trame correspond donc une image entire.

Les tailles rencontres sont160 : 576p pour une dfinition vido EDTV de 720 x 576 pixels en progressif en 50 Hz d'un ratio 4/3 ou 16/9. Un signal bas de gamme, YUV ou DVI, analogique ou numrique. C'est aussi la dfinition vido des tlviseurs dit PAL (RGB ou composite).

159YUV models human perception of color more closely than the standard RGB model used in computer graphics hardware, but not as closely as the HSV color space. Y stands for the luminance component (the brightness) and U and V are the chrominance (color) components. Cf http://en.wikipedia.org/wiki/YUV pour en savoir plus sur YUV 160Source : Wikipedia, articles idoines

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 67/84

720p pour une dfinition vido HD commune (CIF) de 1 280 x 720 pixels en progressif tout aussi bien en 50 comme 60 Hz, d'un ratio 16/9. Notamment utilise par la tlvision portant un logo HD-Ready et console de jeux vido mais aussi en informatique comme WXGA-H 1080i est une dfinition vido haute dfinition de 1 920 1 080 pixels en entrelac, cest--dire que pour chaque trame, il ny a que la moiti des lignes reues, soit 540, tout aussi bien en 50 comme 60 Hz. Limage a un rapport 16/9. Le 1080i est notamment utilise par la tlvision et peut tre affich sans perte de qualit par les appareils portant un logotype Full HD. Une dsignation complte du format ncessite de prciser le nombre de trames par seconde, exemple : 1080i50 (pour 50 trames par seconde) ou 1080i60 (pour 60 trames par seconde).

Illustration 17 : comparaison des taille des images dans les diffrents formats vido

1080p dsigne une norme vido HD CIF correspondant une image d'une dfinition de 1 920 1 080 ou 1 440 1 080 pixels, analyse et/ou affiche en balayage progressif, dont la frquence image s'chelonne de 24 100 Hz, d'un rapport largeur/hauteur de 16/9 et notamment utilise par les tlviseurs [Full HD 1080p]. Une dsignation complte du format considr ncessite de prciser le nombre de trames par seconde, exemple : 1080p25 (pour 25 images par seconde) ou 1080p30 (pour 30 images par seconde).

[Veille Novembre 2007] : une crmonie tlvise a t retransmise entre le Japon et la Sude avec un format d'image de 4096x2160 pixels. Soit quatre fois la rsolution 1080i...

5.
a.

Compression vido, codecs et formats de fichiers


Introduction

D'aprs Le Signal Vido Numrique161 et A Survey of Digital Formats for Storage 162 Les techniques de compression vido utilisent le fait qu'une vido contient une grande quantit d'informations redondantes : La redondance spatiale. Dans une image donns, deux pixels adjacents ont souvent une information identique ou trs proche. Voir les considrations sur la redondance dans la compression d'images fixes. La redondance temporelle. Deux images successives sont souvent trs similaires. La redondance audio. Voir ci-dessus les considrations sur la redondance dans la compression du son.

La compression va donc consister tenir compte de ces redondances pour coder l'information en prenant moins de place, avec perte d'information le plus souvent.
161http://danjean.developpez.com/video/signal-video-numerique/ (visit le 19/07/2007) 162http://www.prestospace.org/project/deliverables/D12-6.pdf (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 68/84

b.

Notion de codec

Afin de pallier la difficult de la taille des donnes numrises, il est possible de recourir des algorithmes permettant de rduire significativement les flux de donnes en compressant / dcompressant les donnes vidos. On appelle ces algorithmes CoDec (pour COmpression / DECompression). Ils peuvent tre raliss directement par des circuits spcialiss. Attention de ne pas confondre les codecs et les formats de fichiers : Les codecs sont des algorithmes informatiques ralisant une compression. Parfois, le codage de vidos numriques se reconnat par l'extension de son enveloppe de transport, (.MPG par exemple). Dautres utilisent une structure de transport standard, cas du format de fichier AVI (Audio Video Interleave) ou Quicktime MOV qui ne permettent pas de dterminer le CODEC utilis.

c.

Le M-JPEG

La premire ide qui vient l'esprit aprs s'tre intress la compression d'images est d'appliquer ce type de mthode une succession d'images numriques (animation ou vido). Le principe du Motion JPEG (not MJPEG ou M-JPEG, ne pas confondre avec le MPEG) consiste appliquer successivement l'algorithme de compression JPEG toutes les images d'une squence vido. tant donn que le M-JPEG code sparment chaque image de la squence, il permet d'accder n'importe quelle image d'une vido. Son dbit de 8 10 Mbps le rend utilisable dans les studios de montage numrique. Tant que l'on se contente de facteurs de compression relativement faibles (de 2:1 4:1) il peut s'appliquer du travail de production ou de post-production de qualit et, optimis, il est quasi-transparent. Toutefois, lorsque le facteur de compression devient plus important (au del de 10:1), la dgradation des images devient perceptible par l'il humain. En outre, ces dgradations s'additionnent d'une gnration l'autre (par exemple si chaque opration d'dition on recompresse le film, les artfacts de la compression vont s'additionner et finir par devenir trs visibles), jusqu' devenir rapidement inacceptables.

d.

La famille de CODECS MPEG

Dans de nombreuses squences vidos, de nombreuses scnes sont fixes ou bien changent trs peu. C'est ce que l'on nomme la redondance temporelle. Lorsque seules les lvres de l'acteur bougent, presque seuls les pixels de la bouche vont tre modifis d'une image l'autre, il suffit donc de ne dcrire que le changement d'une image l'autre. C'est l la diffrence majeure entre le MPEG (Moving Pictures Experts Group) et le M-JPEG. Cette mthode compressera beaucoup moins efficacement une scne d'action. Le groupe MPEG a t tabli en 1988 dans le but de dvelopper des standards internationaux de compression, dcompression, traitement et codage d'image animes et de donnes audio. Il existe plusieurs standards MPEG :

I.

LE MPEG-1,

Dvelopp en 1988, est un standard pour la compression des donnes vidos et des canaux audio associs (jusqu' 2 canaux pour une coute stro). Il permet le stockage de vidos un dbit de 1.5Mbps dans une qualit proche des cassettes VHS sur un support CD appel VCD (Vido CD).

II.

LE MPEG-2,

Un standard ddi originalement la tlvision numrique (HDTV) offrant une qualit leve un dbit pouvant aller jusqu' 40 Mbps, et 5 canaux audio surround. Le MPEG-2 permet de plus une identification et une protection contre le piratage. Il s'agit du format utilis par les DVD vidos. Pourquoi ne pas l'utiliser tout au long d'une chane de production vido professionnelle ? Les raisons sont multiples : le processus de compression est beaucoup plus complexe que le processus de dcompression. Il faut donc une puissance de calcul de loin suprieure pour la compression que pour la dcompression. Ceci ne pose pas de problme lorsqu'il s'agit de distribuer des images. Dans le cas d'une chane de

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 69/84

postproduction, il en va tout autrement ; il faut pouvoir compresser et dcompresser chaque maillon de la chane. De plus, le systme MPEG n'a pas t conu pour faire du montage l'image prs.

III.

LE MPEG-4,

Finalis en 1998, MPEG-4 est un standard destin permettre le codage de donnes multimdia sous formes d'objets numriques, afin d'obtenir une plus grande interactivit. Son usage est particulirement adapt pour les applications web et pour la consultation via les mobiles, PDA, ... MPEG-4 devait initialement succder aux normes MPEG-1 (compression et transfert audio/vido) et MPEG-2 (tlvision numrique). Cependant, son champ d'applications s'est tendu : la norme est maintenant destine permettre des applications dans tous les mdia, via internet, via les rseaux de tlcommunication et via la tlvision (mdia qui tendent fusionner dsormais). Elle a t conue et continue d'tre dveloppe par un consortium runissant des centres de recherche universitaires et privs, de grandes socits d'informatique, de grands groupes industriels acteurs dans les domaines des tlcommunication, soit plusieurs centaines d'ingnieurs mobiliss. MPEG-4 permet la production de squences rutilisables et intgre des dispositifs de protection des uvres. Voici quelques exemples d'applications pour le MPEG-4 : La La Le La La La Le communication temps rel surveillance. stockage et la recherche dinformations bass sur le contenu. lecture de vido sur Internet/Intranet en streaming. tlconfrence. postproduction (cinma et tl). DVD Haute dfinition

Cf Compression vido MPEG-4 163 pour en savoir plus.

IV.

LE MPEG-7,

C'est un standard visant fournir une reprsentation standard des donnes audio et visuelles afin de rendre possible la recherche d'information dans de tels flux de donnes, en dcrivant comment sont combins les images, graphiques, audio, vido. Une description peut tre attache n'importe quel matriau multimdia, quel que soit le format de la reprsentation. MPEG-7 s'appuie sur MPEG-4 pour le codage des objets vido. En savoir plus : La compression vido MPEG-7 164

V.

LE MPEG-21,

En cours d'laboration, dont le but est de fournir un cadre de travail (en anglais framework) pour l'ensemble des acteurs du numriques (producteurs, consommateurs, ...) afin de standardiser la gestion de ces contenus, les droits d'accs, les droits d'auteurs, ...

VI.

LE DIVX ;-) (DRIV DE MPEG-4)

Le format DivX ;-)165 est un format de compression/dcompression vido permettant d'obtenir des vidos compresses trs peu volumineuses avec une perte de qualit trs raisonnable. Ainsi le format DivX ;-) permet de stocker un film complet sur un CD-ROM de 650 ou 700 Mo. Petite histoire du format DivX ;-) : Le format DivX a t mis au point en 1999 par un dveloppeur franais de 27 ans, du nom de Jrome ROTA, partir du codec MPEG-4 v3 de Microsoft. En effet le codec MPEG-4 fourni en standard avec la version Bta du lecteur multimdia Windows Media Player tait parfaitement oprationnel mais la sortie de la version officielle, celui-ci ne fonctionnait plus correctement. C'est la raison pour laquelle Jrme ROTA dcida de le corriger ainsi que d'y ajouter la possibilit de compresser le son au format MP3 et mit au point ce qui allait devenir le format "DivX ;-)" (avec un D et un X majuscules). Ce nom est un clin d'oeil

163http://danjean.developpez.com/video/mpeg-4/ (visit le 19/07/2007) 164http://danjean.developpez.com/video/mpeg-7/ (visit le 19/07/2007) 165http://www.commentcamarche.net/video/divx.php3 (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 70/84

au systme divx (Digital Video Express) dont l'objectif tait de protger les DVD contre les copies illgales mais qui ne vit jamais le jour dans la mesure o les DVD ainsi protgs devenaient illisibles au bout de quelque temps. Le codec, jusqu' sa version 3.11 alpha, tait un projet OpenSource (appel OpenDivX et port par le Project Mayo) bas sur un "hack" du codec de Microsoft. En 2001, Jrme ROTA fonda l'entreprise DivX Networks afin de produire un nouveau codec propritaire entirement rcrit afin de s'affranchir de la dpendance des droits vis--vis de la firme Microsoft, ce qui dboucha sur la version 4 du codec, baptise DivX4. Lors du passage la version 5 du codec (nomme DivX5), le codec de compression DivX est devenu payant (DivX) ou bien contenait un spyware dans sa version gratuite (DivXTM). La version actuelle Divx 7 qui permet la gestion de diffrentes bandes sonores (multilingues), les soustitres, les chapitres et, surtout, les menus interactifs, amenant le DivX au niveau du DVD quant au confort d'utilisation. Le codec est disponible pour toutes les plates-formes.

Les diffrents codecs DivX : XviD : Le format XviD est une implmentation OpenSource du codec Divx, dveloppe partir de 2001, l'occasion du passage du format DivX original (port par le groupe Project Mayo) un format propritaire. Le format XviD propose ainsi une compression de trs bonne qualit. VP3 : Le format VP3 est un format alternatif Open Source. La qualit des vidos est moindre qu'en DivX mais le format VP3 est avant tout destin une utilisation en streaming. 3ivX : est un format de compression vido alternatif permettant une compression MPEG-4 dans des fichiers Apple QuickTime

VII.

H.264 OU MPEG-4 AVC (ADVANCED VIDEO CODING)

(Source166). Qualit maximale, tailles de fichiers minimales ! Le codec H. 264 utilise les dernires innovations dans le domaine de la compression vido pour fournir une qualit maximale avec un dbit le plus rduit possible. Par exemple, le codec fournit des vidos de mme qualit que celles encodes en MPEG-2 avec un dbit rduit au tiers ou la moiti. Avec un dbit identique au MPEG-2, on fournit des images jusqu' quatre fois plus grandes. Ce codec est utilisable quelque soit la taille en pixels de la vido. On peut en effet l'utiliser depuis les vidos destines aux rseaux 3G jusqu'au haut dbit Scnario d'utilisation Contenus pour mobiles Internet/Dfinition standard Haute dfinition Full HD Resolution & trames /s 176x144, 10-15 fps 640x480, 24 fps 1280x720, 24p 1920x1080, 24p Exemples dbits 50-60 Kbps 1-2 Mbps 5-6 Mbps 7-8 Mbps typiques de

Le nouveau standard de l'industrie. C'est le codec utilis pour les DVD Blue-Ray, pour les dernires versions des normes DVB (Digital Video Broadcasters) et 3GPP (3rd Generation Partnership Project). Ajoutons que les nouvelles chanes de la TNT sont diffuses en MPEG-4 (les chanes du bouquet de base sont parfois encore en MPEG-2).

166http://www.apple.com/quicktime/technologies/h264 (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 71/84

VIII.

MJPEG 2000

MJPEG-2000 est driv du format JPEG-2000. Comme le codec JPEG 2000 est capable d'effectuer une compression sans perte, le codec MJPEG 2000 peut compresser sans pertes. Chaque image est compresse sparment, ce qui permet un arrt du lecteur sur n'importe quelle image et permet un montage trs prcis. Le meilleur taux de compression est d'1/3 (mode sans pertes, comparer celui du MPEG-4 : 1/40), mais c'est un excellent choix pour l'archivage en haute fidlit.

e.

Autres CODECS

Il existe encore d'autres codecs, moins rpandus, plus rcents ou moins conseills pour un projet de numrisation qui se veut prenne...

I.

THORA

Codec libre dvelopp et maintenu par la fondation Xiph.Org. Souvent associ au format de fichier container OGG.

II.

REALVIDEO

Codec propritaire de RealNetworks167. Support sur un grand nombre de plates-formes dont Windows, Mac, Linux, Solaris et de nombreux tlphones portables. Peut tre stream en utilisant le protocole internet Real Time Streaming Protocol (RTSP).

III.

DIGITAL VIDEO (DV)

Le format Digital Video, ou DV168, est un format/codec vido qui date de 1996 et qui permet d'enregistrer des vidos sur des cassettes en numrique avec une faible compression pour chaque image. Ceci facilite le transfert direct de la vido vers un ordinateur pour le montage. Les cassettes DV existent en sept formats : DV, MiniDV, DVCAM, Digital8, DVCPRO, DVCPRO50 et DVCPRO HD. Elles enregistrent une vido numrique compresse grce une mthode DCT. La qualit vido numrique est suprieure aux formats analogiques courants, tels que 8mm, VHS-C ou Hi-8. La compression (qui utilise les outils du JPEG et MPEG) s'effectue selon le contenu de l'image en intra-frame ou en intra-image. Cela pour tenir compte, quand elles existent, des redondances entre les deux trames d'une image et obtenir une meilleure efficacit de compression. En aucun cas, il n'est tenu compte de la redondance temporelle entre les images, chacune d'entre elles tant code sparment et ne dpendant d'aucune autre ce qui permet un montage l'image prs. Le dbit initial du signal vido 4:2:0 ou 4:1:1 est de 125 Mbits/s. Il est rduit, aprs compression 25Mbits/s d'o un taux de compression de l'ordre de 5:1. Le format DV, peut traiter 4 pistes chantillonnes 32 khz et codes en 12 bits, ou 2 pistes en 48 khz et codes sur 16 bits. Le dbit total enregistr (vido + audio + signaux auxiliaires) avoisine les 41,85 Mbits/s. Depuis quelques annes est apparu le HDV169 en capacit d'enregistrer des squences vido en haute dfinition.

IV.

VC-1 / SMPTE 421

Source : Wikipedia article sur VC-1170 VC-1 is the informal name of the SMPTE 421M video codec standard initially developed by Microsoft. WMV3, better known as Windows Media Video 9 codec, served as the basis for development of the VC1 codec specification. On April 3, 2006, SMPTE announced the formal release of the VC-1 standard as SMPTE 421M. Its most popular implementation is Windows Media Video 9. VC-1 is an evolution of the conventional DCT-based video codec design also found in H.261, H.263, MPEG-1, MPEG-2, and MPEG-4. It is widely characterized as an alternative to the latest ITU-T and MPEG video codec standard known as H.264/MPEG-4 AVC. VC-1 contains coding tools for interlaced video sequences as well as progressive encoding. The main goal of VC-1 development and standardization is
167http://www.realnetworks.com/products/codecs/realvideo.html (visit le 19/07/2007) 168http://en.wikipedia.org/wiki/DV (visit le 19/07/2007) 169http://en.wikipedia.org/wiki/HDV (visit le 19/07/2007) 170http://en.wikipedia.org/wiki/VC-1 (visit le 6/09/07)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 72/84

to support the compression of interlaced content without first converting it to progressive, making it more attractive to broadcast and video industry professionals. Although widely considered to be Microsoft's product, there are actually 15 companies in the VC-1 patent pool (as of August 17, 2006). As an SMPTE standard, VC-1 is open to implementation by anyone, although implementers are hypothetically required to pay licensing fees to the MPEG LA, LLC licensing body or directly to its members, who claim to hold essential patents on the format (since it is a nonexclusive licensing body).[1] Both HD DVD and Blu-ray Disc have adopted VC-1 as a mandatory video standard, meaning their video playback devices will be capable of decoding and playing video-content compressed using VC-1. Windows Vista partially supports HD DVD playback by including the VC-1 decoder and some related components needed for playback of VC-1 encoded HD DVD movies.[2] Microsoft has designated VC-1 as the Xbox 360 video game console's official video codec, and game developers may use VC-1 for full motion video included with games. By means of an October 31, 2006 update, people can now play all formats of Windows Media Video on the Xbox 360 from a disc, USB storage device, or streaming from their PC via Windows Media Connect/Windows Media Player 11. This allows anyone to play VC-1 encoded files on the console. The FFmpeg project includes a free implementation of this codec. V. VP8

Codec de compression dont le code a t libr par Google en 2010. Le WebM Project cr en mai 2010, et comprenant des acteurs tels que Mozilla, Opra, Google, et 40 autres, travaille l'utilisation de VP8 comme le codec vido de HTML5171. C'est un concurrent direct du H.264. Il faut considrer ce codec comme un outil du combat sans merci entre Google d'un ct, Microsoft, Apple et beaucoup d'autres acteurs de l'industrie de l'autre, pour la domination de l'industrie culturelle multimdia de demain.

f.

Les formats de fichiers vido

Comme nous l'avons vu en introduction, les formats de fichiers sont soit spcifiques un ensemble de codecs, cas de la famille MPEG, soit de simples enveloppes de transport pour des structures numriques issus de n'importe quel codec. Nous passons en revue ci-dessous les principaux formats de fichiers que vous pouvez rencontrer.

I.

AVI - AUDIO VIDEO INTERLEAVE

Format Container . Utilis pour les fichiers Motion Jpeg, codec logiciel ou matriel, tels que Indeo, les fichiers numriques DV, Les fichiers Divx ;-).

II.

MATROSKA

Format Container ouvert. Peut contenir un nombre illimit de squences vido, audio, images et soustitres. L'extension est .MKV pour la vido, .MKA pour l'audio. Les fichiers .MKV sont lus par VLC.

III.

OGG

Format Container ouvert. Peut contenir un nombre illimit de squences vido, audio, images et soustitres. Souvent associ avec le codec Theora pour la vido et au codec Vorbis pour l'audio.

IV.

AVCHD (ADVANCED VIDEO CODEC HIGH DEFINITION)

Format rcent destin contenir de la vido haute dfinition, originellement dvelopp par Sony et Panasonic pour leurs systmes de Home Theater.

171http://en.wikipedia.org/wiki/Vp8 (visitle18/8/2010)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 73/84

V.

MOV

Format Container . Utilis pour les fichiers vido Quicktime sur Apple MAC et Windows. Ces fichiers sont lus aprs installation du logiciel Quicktime. Quicktime, originellement dvelopp sur Mac, est conu comme un ensemble de spcifications trs ouvert, capable d'intgrer facilement un grand nombre d'volutions matrielles et logicielles. The advanced QuickTime architecture provides state-of-the-art multimedia technologies that enable everything from high-definition audio and video playback to the creation of immersive environments. QuickTime empowers the development of innovative software such as iTunes, iMovie and Final Cut Pro from Apple as well as thousands of cross-platform programs from third parties. Apple designed the QuickTime architecture as a powerful, extensible and flexible platform for creating digital media that maintains backwards compatibility with previous versions as new ones come to market. So files created using QuickTime 1 more than a decade ago continue to play smoothly today in QuickTime 7. Trusted File Format : The .mov file format sets QuickTime apart from other media platforms. Structured like a container , it can hold a variety of media types such as audio, video, Macromedia Flash, text, images and sprites. Each of these media types is stored as a separate track , which allows for both easy manipulation as well as backwards compatibility with previous versions. Developers can easily extend the .mov file format with new media types, or tracks , by creating QuickTime components.

VI.

MPG

Utilis pour les fichiers encods grce au codec MPEG-1. Le lecteur multimdia suffit.

VII.

ASF, WMV

Utilis par les fichiers Windows Media, fichiers destins du streaming. Format Container . Vido pour Windows est un ensemble logiciel commercialis par Microsoft permettant la captation et la restitution de vido anime sur PC. L'excution de squences vido est possible sans matriel spcifique. A travers un ensemble de pilotes, Vido pour Windows sera capable de supporter des priphriques aux fonctionnalits diverses tout en assurant, autant que possible, les fonctions manquantes au niveau logiciel. Pas plus que Quicktime, Vido pour Windows n'est pas un algorithme de compression. Il s'agit plutt d'une interface standardise entre le matriel et les procds de codage et de compression, qui offre des API (interfaces de programmation) relativement indpendantes du matriel. Cependant, comme Apple, Microsoft a dfini des algorithmes de compression adapts diffrentes situations (Microsoft Vido 1, Microsoft RLE compressor), et intgre ceux proposs par des socits tierces, comme Indeo d'Intel.

VIII.

MP2, M2P

Gnralement utilis pour les fichiers MPEG-2. Quelques logiciels de lecture DVD peuvent les lire. Le lecteur multimdia de Windows peut galement les lire mais Windows ne dispose pas de base dun dcodeur MPEG2.

IX.

REALMEDIA

C'est un container de contenus multimdia cr par RealNetworks. Utilis dans les lecteurs RealVideo et RealAudio. Format de fichier souvent rencontr dans les projets de diffusion de contenus stream.

X.

VOB

Fichiers prsents sur un DVD-Video, donc du MPEG-2. Ils contiennent dautres information en plus de la vido (sous-titrages, angles, pistes audio distinctes, menus, ...).

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 74/84

XI.

FLASH

Le format de fichier swf d'Adobe est lu par la quasi totalit des ordinateurs de la plante grce des plug-ins intgrs partout aux navigateurs internet (et maintenant par des lecteurs ddis). C'est ce qui fait sa grande force. Les plateformes d'changes de vido telles que YouTube (rachet par Google en septembre 2006) ne s'y sont pas tromps et diffusent leurs millions de vidos dans ce format. Depuis dbut 2009 sont apparues des vidos dites HD sur ces sites de partages. Elles correspondent souvent la rsolution 720p et non au full HD 1080p. [Veille 20/11/2009] Les vidos full HD 1080p apparaissent sur Youtube... Les concurrents suivent ! Cependant, le format flash est mis mal au printemps 2010 par le refus d'Apple d'en autoriser la lecture sur ses produits phare iphone, ipod et ipad, arguant qu'avec le HTML 5 et sa balise <video> il tait tout fait possible de s'en affranchir pour lire des vidos embarques dans des pages web. Le codec h.264 est l'occasion fortement prconis par Apple, mme si des incertitudes demeurent sur les cots associs son utilisation en production. En novembre 2010, la situation est encore confuse mais Adobe semble perdre du terrain, de nombreux sites proposant une diffusion via html 5 pour tre prsent sur l'ipad. Google a libr le code de son codec WebM qui devient donc ouvert. Google, paul par la Fondation Mozilla, positionne son codec comme le seul pouvoir tre diffus via la balise <video> du HTML 5. Apple et consorts (promouvant le MPEG-4) rpliquent en attaquant en justice la lgalit de la libration du Codec : De gros enjeux financiers de l'industrie culturelle internationale se jouent derrire cette querelle technique. En novembre 2011, la perte du terrain semble se confirmer pour Adobe et son format Flash. D'une part Adobe a annonc le dveloppement d'outils de cration en HTML5 et a trs rcemment annonc l'arrt du dveloppement des lecteurs Flash pour mobiles.... Chronique d'une lente mort annonce d'un format encore ultra-dominant il y a encore deux ans.

XII.

SMIL - SYNCHRONIZED MULTIMEDIA INTEGRATION LANGUAGE

On prononce "smile"! SMIL est un standard du W3C qui dfinit un langage d'intgration d'lments multimdia (squences de textes, squences d'images fixes, diaporama, son, vido ) dans une structure Web. Il intgre le multimdia temps rel dans le Web. Les lments de base de SMIL sont des clips multimdia comprenant : du texte, de la voix (audio), des images fixes, et de la vido. Il est bas sur le XML . Ce langage, n en 1997, dcrit comment jouer plusieurs clips multimdia simultanment. Il permet d'affecter une partie d'cran chaque lment, de passer d'un clip l'autre, d'inclure des liens hypertexte et possde la facult de tester l'environnement de l'utilisateur. Trs similaire au H.T.M.L. la programmation est assez aise, un simple diteur de texte permet de crer des fichiers smil. Pour pouvoir lire un fichier S.M.I.L. , il est ncessaire de possder un lecteur, il en existe de nombreux tels que : Real Player , Quick Time, etc. Grce ce langage, il est possible de lire de nombreux formats ... de de de de fichiers fichiers fichiers fichiers vido : avi, mpeg, rm, mov ... audio : mp3, mid, rp, wma ... images et animations : jpeg, gif, animation flash, animation Shockwave ... texte ...

Malgr les avantages clairs du SMIL, il ne semble rencontrer qu'un succs d'estime.

g.

la diffusion en streaming

la condition (exigeante !) de disposer d'un serveur et d'une bande passante ddis, il est possible de diffuser la vido en streaming, c'est--dire de permettre la lecture d'un film dont les donnes sont envoyes au fur et mesure du serveur vido au client. Le choix d'un format de streaming est effectuer en fonction de la disponibilit et du taux de pntration des diffrents lecteurs dans la population cible. Cf A Survey of Digital Formats for Storage 172 p.23 noter, la diffusion en streaming peut tre mule par le tlchargement de vidos optimises pour le web (une simple option slectionner lors de l'encodage de la vido), dont la lecture peut dmarrer ds que quelques secondes de vido sont arrives au client. C'est ce systme qui est utilis par les sites de diffusion de vidos en flash dont on peut suivre la double progression tlchargement/lecture dans la barre

172http://www.prestospace.org/project/deliverables/D12-6.pdf (visit le 19/07/2007)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 75/84

de commande. C'est aussi le systme qui est propos dans les lecteurs de vido du site des podcasts de l'Universit de Grenoble173. Les deux seuls intrts du streaming sont : 1. 2. la rservation de la bande passante ncessaire la diffusion sans heurt du flux vido : c'est une garantie de qualit de diffusion, la protection des contenus apporte par la technologie, les donnes vido n'tant pas stockes sur la machine cliente.

Le streaming est aujourd'hui pass de mode et ces points peuvent tre contests : sur le point 1, les dbits des rseaux actuels sont considrablement amliors par rapport l'poque de la mise en place de solutions de streaming. On ne gre plus la raret des ressources, du moins dans les pays occidentaux. Les fluctuations dans la lecture de fichiers issus de tlchargements sont supprims par une simple attente de quelques secondes qui permet de remplir un cache absorbant les fluctuations de dbit. Sur le point 2, les systmes de screencast permettent de capturer tout ce qui est diffus sur un cran informatique, rendant le dispositif de protection illusoire : tout ce qui est affich est dsormais capturable. D'autres systmes permettent de cumuler le flux vido reu et de reconstituer le fichier stream, en moins de temps qu'il n'en faut pour le lire. Le stream impose une connectivit permanente alors que le tlchargement permet une mobilit trs apprciable. Les quipements ncessaires au stream sont lourds et coteux.

h.

Conclusion sur le choix de codecs vido pour la conservation et la diffusion

Pour la distribution de contenu, plusieurs solutions sont envisageables, la plus moderne tant sans aucun doute l'utilisation du MPEG-4 /H.264 cause de sa versatilit et des taux de compression suprieurs qualit gale. Pour les vidos streamables, le codec RealVideo est un bon choix. Nouvelles possibilits offertes par des sites comme YouTube, Google Video et quelques dizaines d'autres (!), la diffusion encapsule dans un fichier Flash. Avantage, 98% des navigateurs disposent du plug-in Flash et donc la diffusion s'effectue sans avoir installer quoi que ce soit sur l'intgralit du parc machine (avec les rserves nonces plus haut). Pour la conservation long terme (en compression avec pertes), on peut penser du H.264 en haute rsolution, mais aussi au M-JPEG qui garde pour lui la possibilit d'tre dit l'image prs, ce que ne permet pas forcment le MPEG. Le codec Motion-JPEG2000, qui offre des caractristiques suprieures au H.264 de trs hautes rsolutions174 et est le seul proposer une compression sans pertes, au prix il est vrai d'un faible taux de compression (1/3). Cf Best Practice Guidelines for Digital Collections at the UM Libraries 175 Appendix IV: A Typology of Formats pour des guides de rfrence sur les formats vido.

6.
a.

Le processus de numrisation
Nettoyage

Avant toute numrisation, il faut nettoyer la pellicule en l'essuyant avec un produit spcial. Il faut vrifier les collages, faire les rparations qui s'imposent, ajouter des amorces qui vitent de perdre les premires et dernires images du film, etc.176 Les gros projets mettront en uvre des machines spcifiques de nettoyage, par exemple la Cleaning machine - ULTRACLEAN Series177

173 Http://podcast.grenet.fr 174http://www.f4.fhtw-berlin.de/~barthel/paper/spie03_marpe_et_al.pdf#search=%22Motion%20JPEG2000%22 (visit le 19/07/2007) 175http://www.lib.umd.edu/dcr/publications/best_practice.pdf (visit le 19/07/2007) 176http://www.familymovie.fr/Numerisation-Transfert-Film-Super8-et-8mm-Definition-Standard-SD (visit le 28/11/2011) 177http://www.ctmdebrie.com/index.php?option=com_content&task=view&id=81&Itemid=119 (visit le 28/11/2011)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 76/84

b.
I.

Acquisition
DANS LE CAS D'UNE VIDO SOUS FORME LECTRONIQUE ANALOGIQUE

Le processus est trs simple dans la mesure o le format analogique d'entre et celui de compression numrique sont connus. La source analogique est relie par cble une carte d'acquisition (interne ou externe) de l'ordinateur. Il existe plusieurs types de cartes d'acquisition : ATI AIW (multi usage) MPEG only AVI only (technologie souvent ancienne) NLE (pour les studios professionnels, onreuses) DV (les plus simples mais paramtrages limits)

Voir le tableau du site digitalFAQ178 pour plus de dtails. L'acquisition s'effectue alors par la lecture de la source analogique sur le lecteur adquat et l'enregistrement par un logiciel adquat. Celui-ci est souvent livr avec la carte d'acquisition. Il en existe d'autres, comme par exemple VirtualDub. Voir le tableau du site digitalFAQ178 pour plus de dtails.

II.

DANS LE CAS D'UNE SOURCE ANALOGIQUE LA NUMRISATION PAR CONDENSATEUR

On peut premirement projeter l'image dans une lentille optique (condenseur) pour la concentrer sur le capteur d'une camra numrique afin de raliser la numrisation179. Si la camra est directement relie l'ordinateur, l'acquisition se fait en temps rel. Sinon, il faut ensuite transfrer les informations stockes sur le mdia d'enregistrement de la camra vers l'ordinateur (solution de plus en plus obsolte). Cette technique qui a le mrite apparent de la simplicit prsente pourtant de nombreux dfis relever : scintillement de l'image du fait de la diffrence de frquence entre le projecteur et la camra, et aussi la ncessit d'utiliser un projecteur adquat, qu'il est parfois difficile de faire fonctionner.

III.

DANS LE CAS D'UNE SOURCE ANALOGIQUE LA NUMRISATION PAR TLCINMA

La plupart des socits qui transfrent des films sur DVD utilisent un appareil spcifique qui va numriser chaque image de la pellicule et reconstituer le film. Lentranement du film est assur par cabestan donc sans utiliser les perforations qui ne sont exploites que pour le contrle de la stabilisation par laser. La source lumineuse est compose de diodes, par dfinition "froides", ce qui vite tout risque de bruler le film.180 Voici, issu d'une documentation commerciale181, le dtail du fonctionnement d'un tlcinma :

178http://www.digitalfaq.com/guides/video/introduction-record-capture.htm (visit le 18/8/2010) 179Voir plus d'info sur cette technique sur la page ddie, http://www.transfert-films-dvd.com/transfert-par-condenseur.html (visit le 28/11/2011) 180http://www.familymovie.fr/Numerisation-Transfert-Film-Super8-et-8mm-Definition-Standard-SD (visit le 28/11/2011) 181http://www.transfert-sur-dvd.com/pages/Memory_HD.pdf (visit le 28/11/2011)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 77/84

Illustration 18 : extrait d'une documentation sur le fonctionnement du tlcinma MEMORY SD & HD 8/S8/9,5/16/S16

Dtail du miroir galvanomtrique utilis :

Illustration 19 : miroir galvanomtrique du tlcinma MEMORY SD & HD 8/S8/9,5/16/S16

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 78/84

IV.

CHOIX DU CODEC D'ACQUISITION

Dans tous les cas, il faudra choisir un codec et des paramtres de compression adapts la source analogique numriser178 : Si vous voulez diter la vido aprs acquisition, choisissez un codec sans perte tel que HuffYUV 182 ou avec peu de perte (MPEG faiblement compress) et choisissez le format de fichier AVI transitoire. Si vous n'avez pas besoin d'diter le fichier au del du dcoupage et de la suppression de certaines squences, choisissez directement le codec de destination pour le fichier matre.

V.

CHOIX DES PARAMTRES D'ACQUISITION

Il faut choisir, lors de l'acquisition, des paramtres qui permettent d'obtenir la mme qualit de rendu que la source originale. Cette recommandation est spcifique la numrisation de la vido existant dj sous une forme lectronique analogique. Exemple, il est quelque peu aberrant de numriser en H.264 1920x1080, 24p une source analogique VHS ! Le 480p suffira largement. Par contre, bien rflchir ce qu'il est pertinent de faire avec une source projete l'cran, en fonction de la qualit du support analogique. On peut tenter, pour dcider, d'utiliser la rgle de Shannon qui vaut pour les images, et qui affirme qu'il faut coder le plus petit dtail visible par 2 pixels... Voici quelques valeurs conseilles de rsolution de numrisation en fonction du type de vidos analogiques183 (valeurs correspondant au standard NTSC. Remplacer 480 par 576 dans le cas de vidos en PAL) : 480x352 : VHS, S-VHS, 8mm, Hi8, Betamax, vidos analogiques transmises par satellite, cable, antennes TV classiques 640x480 : cas gnral 704x480 ou 720x480 : laserdiscs, Betacam SP, chanes satellites PPV

Le site DigitalFAQ donne un tableau beaucoup plus complet184. Les films peuvent quant eux se rvler d'excellente qualit. Utiliser alors une rsolution Full HD sans complexe ! Finalement, bien penser au traitement du son. Il a t not que les visiteurs de sites de vidos tels que YouTube acceptent plus volontiers une image de qualit moyenne si le son reste de bonne qualit. L'inverse ne semble pas vrai.

c.

Montage vido

Sans aucun doute, les vidos numrises devront ensuite tre reprise dans un logiciel de montage numrique tel que Final Cut Pro ou Premiere. Ces logiciels permettront entre autres : d'ajuster les dpart et fin des films ; de les squencer en prvoyant les transitions ; de titrer les films ; d'amliorer ventuellement le rendu (couleurs, nettet, ...) ; d'encoder le film master dans des formats de diffusion en y insrant des mtadonnes adquates. Prendre en compte dans la rflexion sur les formats de diffusion les contraintes techniques telles que le dbit typique de la connexion internet d'un utilisateur, ou de la taille des mdia de diffusion (d'un DVDROM).

Suivant les cas, il peut tre utile de tenter d'amliorer la qualit par des traitements de restauration vido. Cf le guide de restauration vido du site digitalFAQ185. La diffusion se fera ensuite soit au travers d'un serveur de fichiers (en podcast vido par exemple) ou d'un serveur vido spcifique capable de faire du stream (cf plus haut).

7.

Les matriels et logiciels

182http://en.wikipedia.org/wiki/HuffYUV(visitle18/8/2010) 183http://www.digitalfaq.com/dvdguides/capture/intro.htm (visit le 19/07/2007) 184http://www.digitalfaq.com/guides/video/capture-understand-sources.htm (visit le 18/8/2010) 185http://www.digitalfaq.com/guides/video/introduction-restore-video.htm (visitle18/8/2010)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 79/84

a.

Matriels de lecture des sources analogiques

Les matriels de lecture peuvent tre, en raison mme du grand nombre de formats analogiques, trs varis : projecteurs antiques bricols , projecteurs professionnels, magntoscopes de diffrents formats, ...

b.

Camras numriques

Choisir du matriel semi-professionnel comprenant notamment 3 capteurs pour les 3 couleurs fondamentales (3CCD).

c.

Cartes d'acquisition
Botier d'acquisition vido Pinnacle Studio MovieBox Deluxe Plus Version 9 Botier d'acquisition analogique et numrique Connexion sur port USB 2.0, compatible PC sous Windows XP

Exemple de caractristiques :

Leurs caractristiques sont tudier en fonction des besoins mais a priori, toutes les cartes actuelles suffisent pour effectuer du travail professionnel aux formats standards.

d.

Le retraitement des vidos sur ordinateur

Le retraitement principal consiste en la numrisation des signaux, puis le montage. Le standard du march est Final Cut Studio (240). Dans le monde Windows on peut utiliser Adobe Premiere.

8.

Quelques bonnes adresses


crire un cahier des charges de numrisation de collections sonores, audiovisuelles et filmiques Paris, Ministre de la Culture et de la Communication, comit de pilotage numrisation, Bibliothque nationale de France, 2009, 33 p. < http://www.culture.fr/culture/mrt/numerisation/fr/technique/documents/cahier_charges_numerisation.pdf > Consult le mardi 6 septembre 2011. Institut Louis Lumire186 Rcapitulatif des principaux formats187 Les diffrents formats vidos (physiques)188 Tous les formats vido du VHS au HDCAM et les formats d'enregistrement189 Le Signal Vido Numrique - une tude complte et dtaille190 Introduction la vido numrique191 De nombreux projecteurs de films analogiques sont prsents sur le site CINEMATOGRAPHICA192

186http://www.institut-lumiere.org/ (visit le 12/11/2007) 187http://www.lumiere.org/techniques/formats-recapitulatif.html (visit le 12/11/2007) 188http://thedvdexperience.online.fr/dossiers/video/dossier_video.html (visit le 12/11/2007) 189http://www.corsaire.org/consulting/formats.html (visit le 12/11/2007) 190http://danjean.developpez.com/video/signal-video-numerique (visit le 12/11/2007) 191http://gillesboulet.ca/textes/VideoNumerique.pdf (visit le 12/11/2007)
192http://www.xs4all.nl/~wichm/cinemat_fr.html (visit le 7/8/2008)

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 80/84

Table des matires


A. Introduction...................................................................................................2 1. Prsentation et primtre du cours.........................................................................................2
a. Primtre du cours.......................................................................................................................2 a. Prambule....................................................................................................................................2 b. Pourquoi numriser ?....................................................................................................................3 c. Inconvnients, limites et risques de la numrisation....................................................................5
I. Le cot...........................................................................................................................................5 II. Le risque important de mauvais choix technologiques..................................................................5 III. La perte de repres physiques......................................................................................................5 IV. Une moins grande facilit d'assimilation des contenus.................................................................6

2. L'importance de la numrisation.............................................................................................2

d. Quelques grands programmes de numrisation..........................................................................6


I. Google Books..................................................................................................................................6 II. Gallica ..........................................................................................................................................6 III. Projet NumDam de la cellule Mathdoc Grenoble .......................................................................7 IV. Internet Archive............................................................................................................................7 V. Le Gramophone virtuel..................................................................................................................7 VI. Exemples d'interfaces de consultation.........................................................................................7 VII. Listes de bibliothques numriques............................................................................................8

3. La numrisation ? ...................................................................................................................8
a. Quelques dfinitions.....................................................................................................................8
I. Un signal analogique......................................................................................................................8 II. La numrisation.............................................................................................................................9 III. L'chantillonnage.........................................................................................................................9 IV. La quantification...........................................................................................................................9 V. Un document numrique.............................................................................................................10 I. La frquence d'chantillonnage. ..................................................................................................13 II. Le sous-chantillonnage..............................................................................................................14 III. La prcision de la quantification.................................................................................................14

b. Un Exemple................................................................................................................................10

B. La numrisation des sons..............................................................................15 1. Le mcanisme de l'audition...................................................................................................15


a. Qu'est-ce que le son ?................................................................................................................15
I. De la vibration nait le son :...........................................................................................................15 II. Enregistrement analogique: ........................................................................................................16 III. Enregistrement numrique.........................................................................................................17

2. Les diffrents types de documents analogiques "sons" numriser ....................................17 3. Les concepts de base (Dfinitions/Vocabulaire) ....................................................................17
a. Numrisation d'un son................................................................................................................18
I. L'chantillonnage d'un son...........................................................................................................18 II. La quantification d'un son............................................................................................................18

b. La mesure des sons....................................................................................................................19


I. Les frquences des sons...............................................................................................................19 II. Les dcibels.................................................................................................................................19 III. Dynamique d'un son et sa compression......................................................................................20 I. Voir la puissance du son en fonction du temps.............................................................................21 II. Voir la distribution instantane des frquences d'un son ............................................................21

c. La visualisation d'un son.......................................................................................................21

4. La prsentation de la chane numrique................................................................................22 5. Les matriels et logiciels.......................................................................................................23


a. La lecture....................................................................................................................................23 b. La pr-amplification....................................................................................................................23 c. Les logiciels d'enregistrements..................................................................................................23 d. Le traitement..............................................................................................................................23
I. Pour les disques............................................................................................................................23 II. Pour les bandes...........................................................................................................................23

6. Enregistrement et compression de l'audio.............................................................................24


a. Introduction sur la taille des fichiers audio non compresss......................................................24 b. Notion de CODEC........................................................................................................................24 c. Compression de mdia vs. compression de fichiers textes........................................................24 d. Codecs et formats sans pertes .............................................................................................24
I. Wav (format ouvert).....................................................................................................................24 II. Broadcast Wave Format (BWF)....................................................................................................24

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 81/84

e. Codecs et formats avec pertes ............................................................................................25


I. MP3 (format et codec propritaires).............................................................................................25 II. RealAudio (format et codec propritaires)...................................................................................26 III. Ogg et Vorbis (format et codec ouverts).....................................................................................26 IV. MP3Pro (format et codec propritaires)......................................................................................27 V. AAC (format ouvert)....................................................................................................................27 VI. Windows Media Audio (format et codec propritaires)................................................................27

III. MPEG-4 Audio Lossless Coding (ALS) MPEG................................................................................25 IV. Apple AAC Lossless (codec et format propritaires)....................................................................25 V. FLAC (codec et format ouvert).....................................................................................................25

7. tude de cas : le Cornell Lab of Ornithology..........................................................................29


a. Introduction................................................................................................................................29 b. Etapes cruciales de ce projet......................................................................................................29
I. Les mdia et formats analogiques................................................................................................29 II. La conversion analogique/ numrique.........................................................................................30 III. L'dition du signal numrique.....................................................................................................30 IV. Quels formats et mdia choisis ?................................................................................................30 V. Le contrle qualit ......................................................................................................................31 VI. Accessibilit/Distribution............................................................................................................31

f. Cas du MIDI.................................................................................................................................28 g. Le(les) formats choisir pour l'archivage..................................................................................28 h. Les formats choisir pour la diffusion........................................................................................28 i. Paramtres de numrisation et de compression........................................................................28 j. Exemples de paramtres d'un fichier audio rel.........................................................................28 k. Restitution du son.......................................................................................................................29 l. En savoir plus sur les formats......................................................................................................29

8. Quelques documents importants...........................................................................................31


a. Guide pour l'criture d'un cahier des charges de numrisation de collections sonores, audiovisuelles et filmiques.............................................................................................................31 b. Le Cours Audio Multimdia... .....................................................................................................32

c. Autre tude de cas......................................................................................................................31

C. La numrisation des images et des textes......................................................33 1. Les diffrents types de documents analogiques visuels numriser...............................33 2. La numrisation d'objets 3D et/ou de grandes dimensions...................................................33
a. Production d'images 2D l'aide d'un appareil photo numrique ..............................................33 b. La 3D stroscopique.................................................................................................................34 c. Production directe d'objets 3D....................................................................................................35 d. La 3D devient raliste.................................................................................................................35
I. La reconstitution 3D tend au photoralisme.................................................................................35 II. L' impression en trois dimensions..........................................................................................36

3. Les concepts de base (Dfinitions/Vocabulaire).....................................................................36


a. Formats vectoriels et matriciels ................................................................................................36 b. Types de Documents .................................................................................................................36 c. Pixels...........................................................................................................................................37 d. Image numrique.......................................................................................................................37 e. Rsolution spatiale.....................................................................................................................37 f. Rsolution en luminance.............................................................................................................37 g. Formats de fichier.......................................................................................................................38 h. Compression...............................................................................................................................38 i. Modles de couleurs....................................................................................................................38
I. Le modle LAB : ...........................................................................................................................38 II. YCC .............................................................................................................................................39 III. Le modle RVB en synthse additive..........................................................................................39 IV. le modle Teinte Saturation Luminosit.....................................................................................39 V. Le modle en synthse soustractive CMJN..................................................................................39

j. La taille des fichiers non compresss..........................................................................................40


I. Si vous connaissez les dimensions physiques de l'image..............................................................40 II. Si vous connaissez les dimensions de l'image en pixels..............................................................40

4. Les matriels et logiciels.......................................................................................................41


a. Introduction : prsentation de la chane numrique..................................................................41
I. Matriels.......................................................................................................................................41 II. Logiciels......................................................................................................................................41 III. Autres quipements et fournitures.............................................................................................41 I. Principe........................................................................................................................................41 II. Les scanners bureautiques plat ...........................................................................................42 III. Scanners dfilement................................................................................................................43
Cours numrisation (c) JMM 2011-2012 version du 16/12/11 page 82/84

b. Appareils de numrisation : les scanners...................................................................................41

c. Les logiciels d'acquisition...........................................................................................................45


I. TWAIN..........................................................................................................................................45

IV. Les Scanners Tambour ...........................................................................................................43 V. Les scanners de livres ou scanners livre ouvert........................................................................43 VI. Les appareils photographiques numriques...............................................................................44 VII. Les scanners de microformes....................................................................................................44 VIII. Les scanners de diapositives et de transparents......................................................................44 IX. Autres types...............................................................................................................................44 X. Elements permettant de choisir un scanner................................................................................45

d. Les logiciels de traitement d'images..........................................................................................45


I. Photoshop....................................................................................................................................45 II. Gimp............................................................................................................................................45 III. ImageMagick, .........................................................................................................................45

5. Le processus de numrisation...............................................................................................46
a. Prparation des documents numriser....................................................................................46 b. Choix du scanner........................................................................................................................46 c. Choix de la rsolution et de la profondeur de couleur................................................................46 d. Phase de test..............................................................................................................................47 e. Numrisation proprement dite...................................................................................................47 f. Le retraitement des images sur ordinateur.................................................................................47 g. Le calcul de la taille des images numriques non compresses................................................47 a. Principe et dfinition de la compression. ...................................................................................48 a. Le RAW.......................................................................................................................................49 b. Le DNG.......................................................................................................................................49 c. Le TIFF........................................................................................................................................49 d. Le GIF.........................................................................................................................................49 e. Le JPEG.......................................................................................................................................49 f. Le JPEG 2000...............................................................................................................................50 g. Le WebP......................................................................................................................................51 h. Le PNG........................................................................................................................................51 i. Le PhotoCD..................................................................................................................................51 j. Le BMP.........................................................................................................................................51 k. L'EPS...........................................................................................................................................51 l. Le FlashPix...................................................................................................................................52 m. Le PSD.......................................................................................................................................52 n. le TGA.........................................................................................................................................52 o. Le PDF.........................................................................................................................................52
I. Les avantages du format PDF :.....................................................................................................52 II. Les inconvnients du format PDF.................................................................................................53 III. Une norme internationale pour l'archivage, le PDF/Archive Secures ISO Approval......................53

e. Les logiciels catalogueurs d'images...........................................................................................46 f. Logiciels de reconnaissance optique de caractres (OCR)..........................................................46

6. La compression des images...................................................................................................48 7. Choix d'un format de fichier image........................................................................................48

8. L'OCR.....................................................................................................................................54
a. Principe.......................................................................................................................................54 b. Logiciels......................................................................................................................................54 c. Notes/commentaires sur l'OCR...................................................................................................55 d. Le format des donnes issues d'un processus d'OCR.................................................................55 e. Les formats de visualisation flash (issuu, fluidbook, ) ............................................................55 f. Les formats pour ebook - exemple d'epub..................................................................................55 g. Conclusion..................................................................................................................................56 a. Plan d'assurance-qualit.............................................................................................................57 b. Validation technique des images numrises. Exemple de l'histogramme................................57

p. Le DjVu.......................................................................................................................................54 q. HD Photo de Microsoft - JPEG XR................................................................................................54

9. P.S. : conseils concernant la compression avec perte............................................................56 10. Le contrle qualit...............................................................................................................57 11. Etude de cas........................................................................................................................59 D. La numrisation des images animes.............................................................60 1. Introduction...........................................................................................................................60
a. L'histoire de l'image anime.......................................................................................................60
I. La prhistoire...............................................................................................................................60 II. La sortie du silence......................................................................................................................60 III. Les volutions techniques majeures...........................................................................................60 IV. Larrive des amateurs...............................................................................................................60
Cours numrisation (c) JMM 2011-2012 version du 16/12/11 page 83/84

b. Qu'est-ce qu'une vido ?............................................................................................................61 c. Cinma et vido analogique. .....................................................................................................61


I. PAL et SECAM...............................................................................................................................61 II. NTSC............................................................................................................................................61

2. Les diffrents types de documents analogiques "vido" numriser....................................61


a. Formats rencontrs....................................................................................................................61 b. Nettoyage et preparation...........................................................................................................63 c. Reconditionnement.....................................................................................................................63 d. Lecture.......................................................................................................................................63

3. Production directe de vidos numriques..............................................................................63 4. Les concepts de base (Dfinitions/Vocabulaire).....................................................................64


a. Principes de numrisation d'une vido.......................................................................................64 b. Les diffrentes tailles de vido en vigueur.................................................................................64

5. Compression vido, codecs et formats de fichiers.................................................................65


a. Introduction................................................................................................................................65 b. Notion de codec..........................................................................................................................65 c. Le M-JPEG....................................................................................................................................66 d. La famille de CODECS MPEG.......................................................................................................66
I. Le MPEG-1, ..................................................................................................................................66 II. Le MPEG-2, .................................................................................................................................66 III. Le MPEG-4, ................................................................................................................................66 IV. Le MPEG-7, ................................................................................................................................67 V. Le MPEG-21, ...............................................................................................................................67 VI. Le DivX ;-) (driv de MPEG-4)...................................................................................................67 VII. H.264 ou MPEG-4 AVC (Advanced Video Coding) ......................................................................68 VIII. MJPEG 2000..............................................................................................................................68 I. Thora..........................................................................................................................................68 II. RealVideo....................................................................................................................................69 III. Digital Video (DV).......................................................................................................................69 IV. VC-1 / SMPTE 421.......................................................................................................................69 V. VP8..............................................................................................................................................70

e. Autres CODECS...........................................................................................................................68

f. Les formats de fichiers vido......................................................................................................70


I. AVI - Audio Video Interleave.........................................................................................................70 II. Matroska......................................................................................................................................70 III. OGG............................................................................................................................................70 IV. AVCHD (Advanced Video Codec High Definition)........................................................................70 V. MOV............................................................................................................................................70 VI. MPG............................................................................................................................................71 VII. ASF, WMV .................................................................................................................................71 VIII. MP2, M2P .................................................................................................................................71 IX. RealMedia...................................................................................................................................71 X. VOB ............................................................................................................................................71 XI. Flash...........................................................................................................................................71 XII. SMIL - Synchronized Multimedia Integration Language..............................................................72

6. Le processus de numrisation...............................................................................................73
a. Nettoyage...................................................................................................................................73 b. Acquisition..................................................................................................................................73
I. Dans le cas d'une vido sous forme lectronique analogique.......................................................73 II. Dans le cas d'une source analogique La numrisation par condensateur..................................73 III. Dans le cas d'une source analogique La numrisation par tlcinma.....................................74 IV. Choix du codec d'acquisition......................................................................................................75 V. Choix des paramtres d'acquisition.............................................................................................75

g. la diffusion en streaming............................................................................................................72 h. Conclusion sur le choix de codecs vido pour la conservation et la diffusion............................73

7. Les matriels et logiciels.......................................................................................................76


a. Matriels de lecture des sources analogiques............................................................................76 b. Camras numriques.................................................................................................................76 c. Cartes d'acquisition....................................................................................................................76 d. Le retraitement des vidos sur ordinateur.................................................................................76

c. Montage vido............................................................................................................................75

8. Quelques bonnes adresses....................................................................................................76

Cours numrisation (c) JMM 2011-2012

version du 16/12/11

page 84/84