Vous êtes sur la page 1sur 34

LES DIFFERENTS

FORMATS DE
COMPRESSION AUDIO

- -
2 \ 7>/o
1 NSTITU TE
Mmoire Hallet Sbastien Juin 2009
AEPS 1007
SAE Bruxelles
Formats de compression audio- Mmoire HALLET Sbastien I
SOMMAIRE
Introduction
ABR, CBR, VBR >>
Formats de compression Lossys
o Le MP3 (extension .mp3)
o Le Mp3Pro (extension .mp3)
o Le Ogg Vorbis (extension .ogg)
o Le Musepack (extension .mpc)
o Le Wma (extension . wma)
o L'AdvancedAudio Coding (AAC)
o Atrac 3
Formats de compression Lossless
o Principe de fonctionnement des formats lossless
o APE
o Flac
o WavPack
o Alac
o Shorten
Codee
Comparatif des formats audio FLAC APE MP3 MP3PRO MPC
OGGWMA
Annexes
Formats de compression audio - Mmoire HALLET Sbastien II
INTRODUCTION
Il existe de nombreux formats de compression audio tel que le mp3, le mp3 pro,
1' ogg vorbis, le mpc, le wma, 1' ape, le flac ...
Les diffrents paramtres prendre en compte lors de la compression audio sont
les suivants :
Il faut distinguer les fichiers qui compressent la musique d'origine sans
aucune perte (les lossless) et ceux qui suppriment certaines frquences et
certains chantillons, donc en dgradant 1 'original, afin de rduire la place
occupe par les donnes encodes (les lossy ).
Les fichiers audios peuvent tre encods selon deux modes, le CBR pour
Constant Bitrate et le VBR, Variable Bitrate. Le premier encodera chaque
seconde de musique de la mme faon, un taux constant, par exemple
128K, mme si c'est une seconde de silence. Le second va adapter
1' encodage de chaque seconde en fonction de la complexit des samples
rencontrs, autour d'un taux nominal donn. Il en rsultera souvent un
fichier ayant un bien meilleur rendu qu'un CBR (parce que moins lisse)
pour une taille moins importante.
La qualit de l'extraction en premier lieu, les capacits du codee servant
1' encodage des fichiers audios dans un deuxime temps, ainsi que le
soin apport par le rippeur sa ralisation ont une importance capitale
qui font qu'un fichier sera parfait ou totalement quelconque. Prfrez
donc les fichiers qui vous donnent dans leur intitul une indication sur les
conditions de ralisation.
Le point de dpart de toute bonne compression audio reste une bonne extraction.
Celle-ci se pratique par l'intermdiaire d'un programme appel rippeur. Tous
ceux prsents sur le march ne sont pas d'gale qualit.
Formats de compression audio- Mmoire HALLET Sbastien III
ABRCBRVBR
CBR (Constant BitRate): Quelque soit la difficult du signal (scne rapide ou
lente) tout moment, le dbit de 1' encodage restera constant et ne changera donc
pas. Le CBR est bien adapt au streaming sur rseau. Le CBR est bien adapt au
streaming sur rseau. Le VBR quant lui est bien adapt aux lecteurs MP3,
lecteurs de DVD et missions satellite.
VBR (Variable Bitrate ): Par rapport au CBR, le VBR est justement fait pour
faire varier le dbit de l'encodage en fonction de la difficult du signal (scne
rapide ou lente). Lorsque l'on se rfre aux codees, un taux d'chantillonnage
variable fera varier les donnes requises pour encoder chaque seconde d'un
fichier multimdia tel qu'une vido ou une piste audio, et ce, bas sur la
complexit de ces derniers. Le but est videmment de raliser le meilleur
compromis possible entre la qualit finale du fichier multimdia et sa taille, en
opposition au CBR qui garde constamment le mme taux d'chantillonnage.
Plus d'espace est allou aux scnes complexes alors qu'un cran noir dans un
fichier vido par exemple ne requiert qu'une petite quantit de donnes. De
mme, les sons complexes sont cods un dbit lev et les sons simples un
dbit plus bas. La taille fmale ne peut pas du tout tre prdite contrairement aux
CBR. Ce type d'encodage ncessite d'tre inform du bitrate minimum et
maximum et d'un bitrate moyen que l'on souhaite obtenir. Il est assez
compliqu de calculer la taille du fichier de sortie pour un encodage VBR.
ABR (Average BitRate) : voici un encodage driv du VBR qui tentera de
respecter le bitrate cible qu' on lui aura impos. La taille du fichier de sortie sera
donc plus prvisible qu'un encodage VBR. Fait rfrence au montant moyen de
donne transfr par unit de temps, habituellement mesure en seconde. On y
fait communment rfrence en musique ainsi que vido.
Formats de compression audio - Mmoire HALLET Sbastien IV
FORMATS DE COMPRESSION LOSSY
Le Mp3 (MPeg Layer 3) :
Vous connaissez tous le format Mp3 qui est le plus courant et le plus populaire.
Celui-ci existe en diffrents niveaux de qualit, mesure la fois par le bitrate
(nombre de Kbps Kilobites per second) auquel le morceau a t encod mais
galement par la qualit de l'encodeur utilis (les plus connus Lame ou Blade,
mention que 1' on voit souvent sur le rseau) ainsi que par la technique
d'encodage, CBR ou VBR. Ce format populaire de compression audio permet
une compression approximative de 1:4 1:12.
La qualit la plus banale est le 128 Kbps. C'est celle que l'on rencontre, sauf
indication contraire, pour les fichiers musicaux proposs en vrac. En dessous de
ce bitrate, la qualit est mdiocre et vous devez viter ce genre de fichier.
Quelques mp3 sont proposs en 160, 192 ou mme 256 Kbps, offrant une
meilleure qualit bien entendu mais avec un poids trs nettement suprieur.
Le codage MPEG-1/2 Layer 2 est n avec le projet Digital Audio Broadcasting
(radio numrique DAB) qui fut lanc par le Deutsche Luft und Raumfahrt. Ce
projet a t fmanc par l'Union europenne, et faisait partie du programme de
recherche EUREKA, plus connu sous le nom de EU-147.
Le projet EU-147 exista de 1987 1994. En 1991, deux formats taient
disponibles :
MUSICAM (Mas king pattern adapted Universal Subband Coding And
Multiplexing), bas sur un pur codage psycho-acoustique et un banc de
filtres adapts aux sons de type percussifs ;
ASPEC (Adaptive Spectral Perceptual Entropy Coding), qui introduisait
la technologie de codage entropique.
Le format Musicam conu par le CCETT, Philips et l'IRT fut choisi par l'ISO
MPEG Audio dirig par Hans-Georg Mussman en raison de sa structuration
modulaire en plusieurs couches de codage [Layers ], sa simplicit de mise en
uvre ct dcodeur et sa grande tolrance aux erreurs de transmission.
la demande de Hans-Georg Mussman, un groupe de travail regroupant Leon
Van de Kerkhof (Philips), Geri Gking (TDF -CCETT), Karlheinz Brandenburg
(Fraunhofer-Gesellschaft) reprit des ides de Musicam et d'ASPEC, ajouta de
Formats de compression audio - Mmoire HALLET Sbastien v
nouveaux outils technologiques et cra le format MP3 (Layer III ou couche III),
conu pour tre de mme qualit 128 kbit/s que le MP2 192 kbit/s.
La norme ISO MPEG Audio avec ses trois couches de codage Layer I, Layer II
(Musicam), Layer III (.MP3) fut acheve officiellement en 1992 et constitua la
premire partie du MPEG-1, le premier travail du groupe MPEG, groupe
l'origine de la norme internationale ISO/CEl 11172-3, publie en 1993. Le
travail sur l'audio MPEG se termina en 1994 et constitua la seconde partie
(MPEG-2) de la norme internationale ISO/CEl 13818-3, publie pour la
premire fois en 1995.
Les quipes de normalisation procdrent de nombreux tests subjectifs en
double aveugle sur de nombreux matriaux sonores pour dterminer le niveau de
compression appropri pour les diverses couches de l'algorithme. On a
notamment utilis Tom's Diner, la chanson de Suzanne Vega comme squence
de test pour l'algorithme de compression du MP3. Cette chanson a t choisie
cause de sa finesse et de sa simplicit, qui facilite la dtection des imperfections
du codee.
Qu'est ce que le MP3 ?
C' est un format de compression de fichier son qui permet de compresser les
morceaux sonores de faon trs importante. MP3 est l'abrviation de Mpeg- 1
Audio Layer 3. C'est un format de son compress par perte de donnes. En effet,
le principe du MP3 est de retirer les sons qui ne sont pas audible pour 1' oreille
humaine comme les ultrasons (aigu) ou les infrasons ainsi que 1' effet de
masque. L'oreille humaine ne discerne que les sons pris entre 0.20 khz et 20khz
mais le mp3 peut aller jusqu'a 44khz afin qu'aucun son grave ou aigu ne
puisse nous chapper. Un CD audio (16 bits, 44.1 khz, Stro) peut tre
compress jusqu' a 12 fois sa taille original au format mp3. Par exemple, une
minute de chanson au format wave prend 10 Mo alors qu'en mp3 elle ne prend
que 1 mo environ. Le principe est relativement similaire celui utilis dans la
compression d'image au format Jpeg.
Quel est son mode de fonctionnement ?
Le MP3 est divise en plusieurs paquets. Chaque paquet est divis en 3 blocs
distincts : synchronisation : Cette partie indique au logiciel ou commence la
lecture du fichier.
I.D Celle-ci contient 12 renseignements 8 sur la proprit du son 4 sur les droits
d' auteurs/reproduction, cette section indique au lecteur s'il doit jouer le morceau
Formats de compression audio - Mmoire HALLET Sbastien VI
en mono ou en stro. Elle indique aussi le dbit ("bitrate" en anglais) :Le dbit
va de 8 kbits/s 320 kbits/s.
bande usante (khz) Mode bitrate
2.5 mono 8
Radio ondes courtes 4.5 mono 16
Radio AM 7.5 mono 32
Radio FM 11 stro 56 64
Proche CD 15 stro 96
ualitCD 15 stro 112 128
L'ensemble des donnes musicales qui permettront de reproduire le son.
Le fichier MP3 peut tre complter par un TAG; celui-ci nous renseigne sur le
morceau de musique. Il y a le tag ID3 qui est le plus courant. Il nous renseigne
sur le nom de l'artiste et de l'anne du morceau de musique. TAG Lyris 3 :Plus
complet il peut en plus insrer des images et des liens internet
LeMp3PRO:
Ce codee est une volution de mp3 et prsente un meilleur ratio qualit/poids. A
qualit gale, on obtient frquemment des fichiers moiti moins lourds qu'avec
e mp3, surtout si 1' encodage se fait en VBR.
Comme pour le mp3 normal, la qualit de 1' encodage ne se rsume pas au
ombre de Kbit mais dpend aussi de la qualit du codee de dpart et des choix
CBR ou VBR qui auront t faits. Un 96 Kbps High Quality est la plus haute
qualit en CBR.
C'est un format qui est lu par les principaux programmes (winamp, sonique,
etc.) que vous pouvez donc tlcharger sans risque, mme si on trouve peu de
spcimens sur le rseau.
Thomson a annonc en 2001 1' arrive de mp3PRO, la nouvelle gnration du
mp3. Mp3PRO prsente deux avantages essentiels: une qualit sonore
suprieure et une compression amliore. Il offre des performances de 128 Kbits
par seconde avec un dbit d'encodage de 64 Kbits par seconde, pour une vraie
qualit CD, tout en permettant aux diffuseurs sur Internet de rduire leurs cots
en bande passante.
Cette technologie nouvelle a t apporte par le partenaire sudois Coding
Technologies, qui l'a mise au point lors de recherches sur un systme
d'assistance aux malentendants. Le principe est d'extraire des parties de grande
qualit du bas de la plage de frquences d'un fichier musical pour les dupliquer
Formats de compression audio - Mmoire HALLET Sbastien VII
une frquence suprieure. Coding Technologies a associ ses rsultats aux
ravaux de pionniers du codage audio de Thomson et du Fraunhofer Institute
our crer mp3PRO, qui permet de tlcharger et d'enregistrer 24 albums sur un
seul CD-R.
Le format de compression le plus rpandu au monde s'amliore
considrablement avec le nouveau format de codage-encodage mp3PRO
compatible avec le mp3 traditionnel et qui gnre des fichiers dont la taille est
rduite de moiti par rapport celle des fichiers traditionnels, tout en offrant une
excellente qualit sonore.
A propos de mp3PRO et de sa compatibilit :
Grce des techniques sophistiques de psycho-acoustique et d'analyse
musicale, mp3PRO gnre des fichiers prenant moins de place que les fichiers
mp3 traditionnels, avec une qualit sonore gale ou suprieure, tout en tant
compatible avec le format mp3. V os fichiers mp3 actuels pourront tre lus tout
ait normalement par les lecteurs mp3PRO, mais cela ne permettra pas
a' exploiter la qualit suprieure offerte par mp3PRO. Les nouveaux fichiers
mp3PRO lus sur un lecteur mp3PRO permettront de bnficier d'une qualit
onore optimale.
Comment la technologie mp3PRO fonctionne t-elle ?
Lorsqu'il gnre un fichier mp3PRO, le nouvel encodeur mp3PRO scinde les
enregistrements audio en 2 parties. La partie analyse les donnes en basse
quence et 1' encode en mp3 traditionnel, permettant ainsi 1' encodeur de se
concentrer sur moins d'information et ainsi d'effectuer un encodage de
eilleure qualit. Ce systme permet galement d'offrir une entire
compatibilit sur les lecteurs mp3 traditionnels. La seconde partie analyse les
donnes en haute frquence et les encode en donnes mp3 que les lecteurs mp3
traditionnels ne peuvent pas reconnatre. Les nouveaux lecteurs, ou ceux qui ont
t actualiss pour le format mp3PRO, permettent de combiner ces 2 parties
pour offrir, rsultant en une bande passante audio complte.
Toujours plus de musigue
e format mp3PRO rduit de moiti la place des fichiers, doublant ainsi 1' espace
disponible sur les cartes mmoires flash et les CDs. Par exemple, des CDs audio
traditionnels contiennent 15 titres, et jusqu' 150 titres encods 128 Kps.
rochainement, lorsque les lecteurs de CD mp3 seront quips du dcodeur
p3PRO, il sera possible d'encoder plus de 300 titres sur un CD encod en
p3PRO.
Formats de compression audio- Mmoire HALLET Sbastien VIII
Le Ogg Vorbis (.o2g) :
Vorbis est un algorithme de compression et de dcompression (codee) audio
numrique, sans brevet, ouvert et libre, plus performant en termes de qualit et
taux de compression que le format MP3, mais moins populaire que ce dernier.
Promu par la fondation Xiph.org, c'est un des composants de leur projet Ogg,
qui a pour but de crer un ensemble de formats et codees multimdia ouverts
(son, vido), libre de tout brevet.
Le format sonore Vorbis doit obligatoirement tre en capsul. Ill' est dans la
majorit des cas par le format Ogg, d'o l'appellation de Ogg Vorbis.
Nanmoins, Vorbis et Ogg sont diffrents (l'un tant le contenu et l'autre le
contenant, Matroska pouvant servir de contenant alternatif). Ogg Vorbis n'est
donc pas un format, mais un ensemble de formats.
Comme le MP3, V orbis est un format de compression audio destructeur ou avec
pertes, c'est--dire que le fichier compress puis dcompress ne sera pas
identique bit pour bit avec l'original. On peut le comparer au format JPEG pour
les images, d'autant qu'il utilise des techniques similaires. Comme tous les
formats de compression fonds sur ce principe, il est conu pour que l'auditeur
ne fasse pas la diffrence l'coute avec l'original, en exploitant les
caractristiques de la perception acoustique humaine, plus particulirement en
supprimant les frquences prsentes les moins audibles par rapport aux autres.
Les outils de codage exploits par le format sont plus avancs que ceux
qu'exploite le MP3, qui paie ici son anciennet. Cela explique les performances
suprieures du format, notamment pour les bas dbits, infrieurs 100 kbit/s.
Toutefois, ces algorithmes plus performants induisent une complexit de
traitement plus importante, et donc un temps de compression gnralement
suprieur un mme fichier qu'on compresserait en MP3 sur une machine de
mme puissance.
partir d'une source strophonique chantillonne 44,1 kHz en 16 bits
(chantillonnage standard d'un CD audio), le codeur V orbis produit des fichiers
dont le dbit de sortie varie entre 30 et 500 kbit/s, en fonction de la qualit de
codage choisie et du type de musique. Vorbis est un format VBR (Variable
Bitrate, ou dbit variable). Cela lui permet d'allouer plus d'informations pour
compresser des passages difficiles (gnralement, mais pas toujours, les
passages difficiles coder sont les passages trs polyphoniques contenant
beaucoup de frquences aigus, mais cela dpend aussi beaucoup du genre
musical), et d'pargner de la place sur des passages moins exigeants (par
exemple une entame de morceau o le batteur donne le tempo, ou idalement un
Formats de compression audio - Mmoire HALLET Sbastien IX
silence numrique). Ainsi, c'est la qualit sonore qui est constante (en thorie) et
non pas le dbit de donnes, ce qui semble souhaitable dans tous les cas, sauf
dans certains cas de streaming sur internet qui peut avoir des exigences de
gularit du dbit.
partir d'un flux audio stro chantillonn 44,1 kHz, le codeur produit en
sortie un flux un dbit de 45 500 kbit/s suivant la qualit choisie. Le
coefficient de qualit est une mtrique arbitraire et peut varier de -1 1 O.
Les fichiers cods la qualit 5 ( -q5), par exemple, devraient avoir la mme
qualit sonore quelle que soit la version du codeur, mais les nouvelles versions
doivent tre capables d'atteindre cette qualit avec un dbit binaire plus faible.
Les dbits binaires fournis dans le tableau le sont titre indicatif, Vorbis ayant
intrinsquement un dbit binaire variable, ce dernier peut donc changer
considrablement d'un chantillon l'autre. Il est sans doute le meilleur dans les
trs hauts niveaux d'encodage (de q5 q10). Si nous devions tablir une
quivalence avec le mp3 on aurait peu prs ceci :
Ogg q5 > Mp3 160 Kbps 1 Ogg q7 > Mp3 224 Kbps 1 Ogg q9 > Mp3 320 Kbps 1
Ogg q10 > Mp3 500 Kbps
Comparatif Ogg vorbis 1 Mp3 :
pour la mme qualit audio, le fichier Ogg Vorbis est, la plupart du temps, plus
petit que le fichier mp3, donc un meilleur taux de compression. La compression
Ogg Vorbis utilise une compression nomme compression dbit binaire
variable. Qu'est-ce que ceci? Et bien les mp3 standards ont un nombre de bits
txe pour encoder une dure fixe de son. Par exemple, une compression mp3
128 kilobits/sec occupera, comme il est indiqu, 128 kilobits d'espace disque
pour une seconde de son. Le dsavantage de cette technique est que mme le
silence sera encod en utilisant 128 kilobits pour une seconde et qu'un son plus
iche, une symphonie avec des cordes et des cuivres sera encod avec le mme
ombre de bits. En fait, si on y rflchit, il serait mieux de prendre moins de bits
our encoder un son plus pauvre et d'en prendre plus lorsque le son est plus
riche. C'est exactement ce que fait la compression Ogg Vorbis et c'est
pourquoi on nomme cette technique comme une compression dbit binaire

Le format mp3 peut supporter ce type de compression mais il est moins


opulaire. Ogg Vorbis supporte 1' encodage canaux multiples alors que les mp3
e supportent que l'encodage deux canaux (stro).
Le Musepack (.mpc) :
Comme l'ogg, c'est galement plus qu'une alternative Mp3 le Mpc est un
format destructeur de compression audio bas sur le format Mpeg2. Il est aussi
Formats de compression audio - Mmoire HALLET Sbastien x
appel Mp+. Ce format offre une excellente qualit audio. Andree Buschmann
ni ti a en 1997 le dveloppement de Musepack. Le dveloppement sera repris
lus tard par Franck Klemm. Actuellement, la Musepack Development Team
(MDT) assure le dveloppement, avec l'assistance de Frank Klemm.
e Mpc est un format qui offre bien des avantages :
.- Une qualit d'coute vraiment exceptionnelle, bien suprieure au Mp3 ou
encore 1' Ogg .
.- Il est gratuit (mais l'encodeur n'est pas OpenSource) .
.- Trs rapide 1' encodage (environ x9 sur un Athlon 1 Ghz et x20 sur un
2600+) .
.- Il est Gapless, cet--dire qu'il n'y aura pas de petite coupure entre 2 morceaux
(contrairement au Mp3)
.- Des presets sont disponibles pour les dbutants
.- Le format Mpc dpasse tous les autres formats dans les dbits suprieurs
160 kbps. Des presets sont votre disposition :
standard ( --quality 5) : bitrate de 1 70kbps environ : trs grande transparence
(99% des utilisateurs en sont satisfait).
extreme ( --quality 6) : bitrate de 200kbps environ : Difficile de voir la diffrence
avec 1' originale.
insane ( --quality 7) : bitrate de 240kbps environ : Transparence absolue.
braindead ( --quality 8) : bitrate de 260kbps : A utilis uniquement si vous voulez
perdre de la place sur votre disque dur
LeWMA:
Windows Media Audio aussi appel WMA est un format propritaire de
compression audio dvelopp par Microsoft. Le format WMA offre la
possibilit de protger ds l'encodage les fichiers de sortie contre la copie
illgale par une technique nomme gestion numrique des droits (ou GND).
Le format existe sous quatre formes :
Formats de compression audio- Mmoire HALLET Sbastien XI
le WMA Standard, le premier tre sorti, le plus rpandu sur Internet et le
seul tre lisible (actuellement) sur de nombreux baladeurs numriques ;
le WMA Pro, thoriquement de meilleure qualit mais bien moins
rpandu.
le WMA Lossless qui offre une qualit sonore identique l'original, un
concurrent srieux des formats sans perte comme Monkeys Audio ou
Flac
le WMA Voice, spcialement ddi l'encodage de la voix et ce, faible
dbit (infrieurs ou gaux 20 kbit/s)
Le Standard et le Pro sont capables de coder en dbit constant (Constant bit rate
- CBR) ou en dbit variable (VBR). Le lossless est totalement orient VBR. Le
oodec WMA est parmi tous les formats d'encodage avec pertes disponibles l'un
des plus rapides.
Avec le WMA encod en mode VBR, on trouve les niveaux de qualit VBR
100, 98, 90, 75, 50, 25, 10. Les chiffres n'ont aucun rapport avec le dbit. C'est
en fait le pourcentage de qualit thorique par rapport au fichier original,
mais il s'agit uniquement d'un repre arbitraire, une fraction de qualit musicale
n'ayant aucune signification en soi.
100 correspond au fichier son non compress et n'a pas d'quivalent CBR
thorique
98 correspond environ un CBR de 320 kbit/s ;
90 correspond environ un CBR de 192 kbit/s ;
75 correspond environ un CBR de 112-128 kbit/s;
50 correspond environ un CBR de 64-80 kbit/s.
Cette correspondance qualit thorique et dbit en CBR vaut galement pour les
ouveaux codees 9.1 et 9.2 sortis respectivement en 2004 et en 2006.
L' Advanced Audio Coding (AAC) :
Advanced Audio Coding (AAC) est un algorithme de compression audio avec
_perte de donnes ayant pour but d'offrir un meilleur rapport qualit /dbit
binaire que le format plus ancien MPEG-112 Layer 3 (plus connu sous le nom de
MP3). Pour cette raison, il a t choisi par diffrentes firmes comme Apple ou
RealNetworks.
1 a t conu par le Fraunhofer Institut fr integrierte Schaltungen en
collaboration avec AT&T, Sony et Dolby pour remplacer le MP3. L'AAC,
ISO/CEl 13818-7, est une extension du MPEG-2 (ISO/CEl 13818-3) et a t
amlior en MPEG-4, MPEG-4 Version 2 et MPEG-4 Version 3 (ISO/CEl
Formats de compression audio- Mmoire HALLET Sbastien XII
14496-3). Il a t dclar standard international par le Moving Pictures Expert
efroup (MPEG) fin avril1997.
Versions:
AAC (LC-AAC) (AAC)
Low Complexity Advanced Audio Coding
AAC+ (HE-AAC) (aacPLUS) High Efficiency Advanced Audio Coding
HE AAC v2 est utilise par la radio numrique (norme DAB+ et DMB).
eAAC+ (HE-AAC-PS) (Enhanced AAC)
High Efficiency Advanced Audio Coding with Parametric Stereo
ALAC (Lossless) (Lossless Audio Codee)
Apple 's Lossless Audio Coding
Technique:
Les amliorations apportes par 1' AAC touchent notamment :
les frquences d'chantillonnage :de 8kHz 96kHz (MP3 officiel : 16
48kHz);
le nombre de canaux : jusqu' 48 ;
une efficacit de codage amliore pour les signaux stationnaires (la taille
des blocs a t porte de 576 1 024 chantillons);
une efficacit de codage amliore pour les signaux de transition (la taille
des blocs a t rduite de 192 128 chantillons);
une meilleure gestion des frquences au-del de 16 kHz ;
une jonction stro (joint-stereo) plus souple (distincte pour chaque
bande);
une compatibilit de gestion des droits numriques (DRM) pour contrler
1 'utilisation des fichiers dans ce format.
Ces avances techniques devant apporter l'auditeur un message audio d'une
qualit et d'une stabilit accrue par rapport au MP3 dbit quivalent ou
infrieur.
L' AAC adopte une approche modulaire du codage : en fonction de la complexit
du flux coder, de la qualit vise et de la taille du fichier que 1' on souhaite
Formats de compression audio -Mmoire HALLET Sbastien XIII
obtenir. L'utilisateur peut crer des profils afin de dfinir l'outil qu'il souhaite
utiliser parmi le jeu de rglages prdfinis.
Utilisation :
AT&T, Dolby Laboratories, Fraunhofer liS et Sony Corp sont l'origine de la
normeAAC.
L' AAC est le format audio utilis pour le rseau radio numrique japonais ISDB
(Jntegrated Services Digital Broadcasting).
L' AAC est le format des fichier audio support par Apple au sein de son
baladeur numrique iPod et de son logiciel iTunes. Pour ce qui est de son
service de vente musicale en ligne iTunes Store, la norme AAC ne proposant pas
de systme de gestion des droits numriques, Apple a dvelopp son propre
systme, appel FairPlay. Les crateurs de la cassette (Philips) et du baladeur
CD (Sony) ont achet, lors de problmes fmanciers connus de la Socit
InterTrust, la Technologie InterTrust DRM concurrente d'Apple.
L'extension de fichier gnralement adopte est .mp4 (pour MPEG-4) et .aac,
Apple a introduit les extensions .m4a (pour MPEG-4 audio) ou .m4p (pour
MPEG-4 protg).
La Nintendo DS qui a intgr un lecteur musical dans la console permet de lire
des fichiers musicaux avec seul format audio, le AAC.
La Nintendo Wii, aprs la mise jour 1.1 de la chane photos, lit le AAC la
place du MP3 dans les diaporamas.
Perte de donnes :
L' AAC tant un format de compression avec perte de donnes (sauf la variante
~ t _ J ~ l e Lossless, comme son nom l'indique), il provoque une perte de qualit
notable par rapport aux formats sans perte de donnes (le AIFF par exemple).
anmoins mmoire de stockage gale, le AAC provoque moins de variations
perceptibles que le MP3 mais plus que le Musepack.
L'Atrac3:
daptive Transform Acoustic Coding (A TRAC extension .omg pour l'atrac3)
est une technologie de compression audio avec pertes dveloppe par Sony en
1992 et utilise notamment dans les appareils MiniDisc. Seul le A TRAC
Formats de compression audio- Mmoire HALLET Sbastien XIV
Advanced Lossless propose une compression sans pertes. Aujourd'hui, le format
A TRAC est utilis dans de nombreux baladeurs audio de marque Sony, ainsi
que sur les jeux de sa console portable la PlayStation Portable. Ce format a subi
plusieurs volutions: ATRAC3, ATRAC3plus et A TRAC Advanced Lossless se
sont succd respectivement en 1999, 2002 et 2006. Le 30 aot 2007, Sony a
annonc la fm du support du format A TRAC avec la commercialisation de
nouveaux lecteurs audios compatibles MP3, AAC et WMA. L'Atrac3 est un
format propritaire de Sony. Celui-ci a t cr dans le but de multiplier par
deux (LP2) ou par quatre (LP4) la capacit d'un MD, permettant ainsi de stocker
el).viron 160 minutes 132kbps de musique en LP2 et jusqu' 320 minutes
66kbps en LP4. Il est possible de lire, encoder et convertir librement en
A TRAC, ATRAC3 et A TRAC Advanced Lossless, Sony distribuant librement
le codee. En revanche le format protg ATRAC3plus ne peut tre reconverti ou
lu sur ordinateur. Les appareils de lecture ncessitant de possder un mulateur
i terne devant tre dans le systme pour que le dcryptage fonctionne et donc la
lecture.
ATRAC:
I s'agit de la premire version de la technologie A TRAC sortie en 1992 pour
quiper les lecteurs et enregistreurs de MiniDisc.
ATRAC3:
ATRAC3 est la premire volution d'A TRAC et est connue sur les enregistreurs
MiniDisc en tant que mode LP2 et LP4 (Long Play).
TRAC3plus:
ACTRAC3Plus quipe les appareils Hi-MD ainsi que d'autres appareils
ortables tels que la PlayStation Portable.
A TRAC Advanced Lossless :
Cette version permet de compresser des donnes audio sans aucunes pertes pour
obtenir, selon leur nature, une rduction de taille entre 20% et 70%.
Les fichiers crs avec A TRAC Advanced Lossless contiennent les donnes
qu'auraient gnr A TRAC3 et ATRAC3plus, ce qui permet leur extraction pour
une lecture sur un appareil compatible uniquement avec ATRAC3 ou
ATRAC3plus.
Formats de compression audio- Mmoire HALLET Sbastien xv
ORMATS DE COMPRESSION LOSSLESS
On connat essentiellement deux formats que vous pouvez rencontrer sur le
rseau : APE (MAC) et Flac.
Les lossless sont en fait les * .zip ou * .rar de 1' audio car ils permettent
"l' archivage" d'un CD sans aucune perte d'information. Ce que vous graverez
une fois dcod sera vraiment la rplique exacte de 1 'original, sans aucune
dgradation. Les gains de taille de fichier sont assez intressants (bien sr moins
qu'avec un format lossy) puisqu'ils peuvent tre voisin de 60% avec le Monkey
audio APE, format pouvant tre galement directement lu par Winamp.
Principe de fonctionnement des formats Lossless :
1) Conversion en X,Y:
La premire tape de la compression losseless consiste en un modle plus
e ficace de conversion des canaux Let R en valeurs X et Y. Il y a trs souvent
de la corrlation entre les canaux gauche et droit, et celle-ci peut tre exploite
de diffrentes manires, avec une voie populaire consistant en 1' encodage centre
1 cot. Dans ce cas, les valeurs du centre (X) et d'un cot (Y) sont encods la
p ace des valeurs gauche et droite. Ce qui donne :
~ = ( L + R)/ 2
Y= (L- R)
2 Prdicteur:
Les informations X et Y sont ensuite passes a travers un prdicteur
qui va essayer d'enlever toute redondance. Le but principale de cette tape est de
rendre les valeurs reprsentant X et Y les plus petites possibles tout en
conservant la possibilit d'tre dcompresss.
3 Encodage des donnes :
Les donnes sont alors encodes toujours de manires ce que les plus
petites valeurs soient utilises afm qu'elles utilisent le moins de bits possible.
L'APE:
Monkey's Audio est un codee de compression audio sans perte. l'inverse de
codees tels que MP3 ou Vorbis, il n'enlve aucune information du flux audio.
Formats de compression audio - Mmoire HALLET Sbastien XVI
L'extension de Monkey's Audio est: .ape (ape signifiant en anglais "grand
singe", tout comme monkey).
Les partisans du logiciel libre lui prfrent FLAC, un peu moins performant
11;1ais existant comme codee libre.
a dernire mise jour (4.05) date du 3 Fvrier 2009.
Le FLAC:
Free Lossless Audio Codee (FLAC) est un codee libre de compression audio
sans perte. l'inverse de codees tels que MP3 ou Vorbis, il n'enlve aucune
information du flux audio.
Comme d'autres mthodes de compression, FLAC a pour principal avantage de
duire le dbit ou la capacit de stockage ncessaire, sans perdre d'informations
de la source audio (en anglais, lossless signifie sans perte ). Par exemple, un
enregistrement numrique (tel qu'un CD) cod en FLAC peut tre dcompress
pour obtenir une copie identique des donnes audio. Les sources audio peuvent
tre codes en FLAC pour permettre une rduction de taille de 30 70 %. La
rduction de taille est dpendante de la source :plus le signal est constitu
d'ondes rgulires (sons naturels), meilleure est la compression. Par contre, un
signal alatoire (bruit) ne se compresse pas trs bien. Ce phnomne se constate
pour tous les formats de compression sans perte.
FLAC est appropri pour tous les archivages de donnes audio, avec le support
des mtadonnes, image de couverture, ainsi que pour la recherche rapide.
LAC est libre et open source ; ne ncessitant pas le paiement de redevances, il
est bien support par de nombreux logiciels. Le support de la restitution de
FLAC sur les appareils audio portables, et les systmes audio ddis est limit
mais en progrs. John Coalson est le premier auteur de FLAC.
Le 29 janvier 2003, Xiphophorus (appele, en 2004, Xiph.org) annonce
l'incorporation de FLAC sous la bannire de Xiph.org, rejoignant ainsi le
conteneur Ogg et les codees Vorbis, Theora et Speex.
Projet:
Le projet FLAC est constitu de plusieurs lments:
le format de flux ;
un format conteneur appel Native FLAC ;
libFLAC, une bibliothque de codage et dcodage ainsi qu'une interface
aux mtadonnes ;
Formats de compression audio - Mmoire HALLET Sbastien XVII
libFLAC++, un accs objet libFLAC;
flac, un accs en ligne de commande libFLAC pour coder et dcoder des
fichiers .flac ;
metaflac, un diteur en ligne de commande pour les fichiers .flac ;
des plugins d'entre pour plusieurs lecteurs musicaux populaires
(Winamp, XMMS ... ) ;
avec l'inclusion dans le projet Xiph.org, le conteneur Ogg, adapt pour le
streaming (l'ensemble est appel Ogg FLAC).
Les spcifications du format de flux sont dans le domaine public (le projet
FLAC se rserve les droits quant aux spcifications et la certification de
compatibilit). Le projet s'attache aussi ce qu'aucun brevet ne couvre le format
ou es mthodes de codage/dcodage. Les bibliothques libFLAC et libFLAC++
sont disponibles sous licence BSD, les sources de flac, metaflac et des plugins
sont sous licence GPL.
Comparaisons :
FL C se distingue d'algorithmes sans perte (tels que ZIP et gzip) en ce qu'il a
t cr spcifiquement pour compresser des donnes audio. La mthode ZIP
r uit la taille d'un fichier audio de qualit CD de 20 40 %, alors que FLAC
obtient des taux de 30 70 %. Par ailleurs, un fichier FLAC est compos de
blocs successifs d'environ 100 ms de donnes, et peut tre dcompress la
vole durant la lecture (quel que soit le niveau de compression), y compris par
un systme autonome quip de peu de mmoire (platine CD FLAC, lecteur
portable disque dur ou mmoire Flash, lecteur autonome disque dur pour
chane Hi-fi ou voiture).
Bien que des codees perte puissent atteindre des ratio de 80-90 %, voire plus,
ils le font en liminant des donnes du flux originel. FLAC utilise une technique
similaire, mais il ajoute galement des donnes rsiduelles permettant de
restaurer l'original sans dformation.
Comme la plupart des codees sans pertes, le FLAC est trs utilis comme format
d'archivage car il permet de retrouver une copie exacte des fichiers d'origine (ce
qui n'est pas possible avec les formats tel que le MP3, ou Vorbis). Un fichier
Cue sheet (CUE) peut ventuellement tre cr quand on rippe un CD. Si le CD
est lu et ripp parfaitement en fichier FLAC, le fichier CUE permet de pouvoir
graver plus tard un CD audio qui est la rplique exacte de celui d'origine, en
incluant l'ordre des pistes, prgaps, et CD-Text. Pourtant certaines donnes
se ont tout de mme perdues, comme les informations de paroles, les graphiques
d' CD+G. Car ces informations ne sont pas incluses dans le fichier CUE. Ces
donnes ne seront donc pas archives.
Formats de compression audio - Mmoire HALLET Sbastien XVIII
FLAC est disponible pour pratiquement tous les systmes d'exploitation.
Union europenne de radio-tlvision (UER) a choisi le format FLAC pour son
rseau Euroradio, pour la distribution audio de haute qualit.
D' tails techniques :
F AC permet seulement les chantillons virgule fixe, pas ceux virgule
flottante. Il peut manipuler n'importe quelles donnes audio PCM avec une
profondeur d'chantillonnage de 4 32 bits par chantillon, n'importe quelle
frquence d'chantillonnage de 1Hz 1 048 570Hz avec des incrments de
1 , et n'importe quel nombres de canaux audio de 1 8. Les canaux peuvent
tre groups comme dans le cas de la stro et des canaux 5 .1 surround pour
tirer parti de la corrlation intercanal pour augmenter la compression. FLAC
ut1ise un CRC pour identifier les morceaux corrompus dans le cas de
l'utilisation en streaming, mais aussi le hachage MD5 complet des donnes PCM
brutes stocks dans leur en-tte de mtadonnes STREAMINFO.
FLAC admet un paramtre de Golomb entre 0 et 16 pour le code de Rice, et
jusqu' 8 canaux audio et une large gamme de frquence d'chantillonnage
jusqu' 192 KHz, avec des profondeurs d'chantillonnages variables. FLAC
prend aussi en charge le Replay Gain.
F AC est mis en uvre dans libFLAC (une bibliothque pour coder & dcoder).
Le programme flac (utilisable en ligne de commande), est le programme de
r rence qui utilise l'API libFLAC. Ce codee API est aussi disponible en C++
s us le nom de libFLAC++.
L'"mplantation de rfrence de FLAC peut-tre compile sur de nombreuses
plateformes, incluant la plupart des Unix (tel que Linux,* BSD, Solaris et Mac
0 ~ X), Windows, BeOS, et OS/2.
P ur les mtadonnes, FLAC utilise le mme systme que les mtadonnes du
format V orbis.
Le WavPack:
WavPack est un format de fichier ainsi qu'un outil de compression audio
permettant d'encoder (et de restaurer) un flux PCM sans perte ou avec pertes et
mme de cumuler les deux aspects (format hybride, voir ci-dessous). Le format
est ouvert, et l'outil est libre, distribu selon les termes de la licence BSD.
Formats de compression audio - Mmoire HALLET Sbastien XIX
Les modes d'encodages :
WavPack est constitu de trois modes d'encodages.
Le mode dit sans perte (couramment dsign par l'anglicisme lossless)
utilise des techniques similaires celles utilises par des encodeurs
gnralistes tels que Zip ou 7z. Sa finalit rside dans la compression de
donnes. Ce mode d'encodage prsente pour intrt majeur de
n'occasionner aucune espce de dgradation des donnes: une fois
dcod, le flux audionumrique est rigoureusement identique celui
prcdent l'encodage. Appliques l'audio, ces techniques de
compression sans perte se rvlent donc idales pour tous les travaux
scientifiques (gnalogie, ocanologie ... ) ou ceux concernant l'archivage;
l'encodage sans perte est galement pris pour une utilisation audiophile
trs stricte. En contrepartie, le taux de compression atteint est plus faible
que celui obtenu par des encodeurs de type avec pertes (lossy) tels que
le MP3. De manire gnrale, l'encodage avec WavPack permet de
rduire de moiti le volume original du fichier source. Ces performances
peuvent atteindre -80% avec des fichiers plus compressibles (fichiers
monophoniques, ou ceux prsentant un spectre sonore tronqu) et peuvent
descendre -20% peine pour les cas les plus extrmes.
Le mode dit avec pertes (l'anglicisme lossy est frquemment employ)
est une caractristique originale de WavPack. Le mode permet
l'utilisateur de spcifier le dbit d'encodage et par consquent de prvoir la
taille finale, qui est par nature imprdictible en lossless. Ce mode
d'encodage peut tre rapproch du MP3 en ce qu'il occasionne une
dgradation irrmdiable du signal. Toutefois, WavPack lossy s'en
dmarque d'un point de vue technique, car il n'exploite pas la plupart des
ressources utilises par les encodeurs perceptuels (MP3, WMA, V orbis,
AAC . .. ) traditionnels, se rapprochant davantage d'encodeurs reposant sur
la pure quantification tel que l'ADPCM. C'est pourquoi WavPack lossy est
inadapt aux bas dbits d'encodage (le dbit minimal est d'environ 200
kbps pour une source PCM 44.1KHz/16 bit), tout en devenant
thoriquement suprieur aux encodeurs perceptuels des dbits plus
levs (350 .. .400 kbps).
Le mode dit hybride permet de combiner les deux modes d'encodages
prcdent. Son fonctionnement consiste en l'encodage d'un premier fichier
avec perte, et d'un second l'accompagnant et qui comprend toutes les
donnes de correction ncessaires la restauration parfaite du signal
d'origine. L'utilisation la lecture de cette annexe dite de correction
est optionnelle. Un utilisateur pourra par exemple lire depuis un rseau un
fichier dgrad pour en conomiser les ressources, ou activer la correction
Formats de compression audio- Mmoire HALLET Sbastien xx
si besoin est. Autre forme d'utilisation : le tlchargement depuis internet
d'un fichier imparfait ncessitant peu de bande passante, avec en cas de
satisfaction la possibilit d'y ajouter les "donnes manquantes". La forme
"avec pertes+ correction" prsente un dbit trs faiblement major (1%
au plus) par rapport un encodage simplement "sans perte", pour un
rsultat (ou qualit) rigoureusement identique. Cette forme d'encodage
permet ainsi aux utilisateurs de bnficier simultanment d'un double
encodage lossy et lossless, mais gr de manire plus efficace (pas de
redondance donc moins d'espace consomm) qu'avec une combinaison de
type "MP3 + sans perte".
Asymtrie:
Un encodage est dit asymtrique lorsque le temps ncessaire sa ralisation est
entirement dcorl avec le temps ncessaire au dcodage. La plupart des
formats de type lossless sont en effet symtriques: un encodage trs lent
(forte compression) aura pour contrepartie un dcodage trs lent, et si l'encodage
est rapide (compression plus faible) le dcodage ncessitera moins de ressources
p, ocesseur. WavPack prsente de manire optionnelle des optimisations
asymtriques (appeles par la commande -x) permettant l'obtention d'un taux de
compression plus lev sans porter atteinte la vitesse de dcodage
(paradoxalement amliore avec ce mode)
Caractristiques dtailles de WavPack :
gestion complte du PCM (8-, 16-, 20-, 24-bit; 32-bit flottant; mono,
stro, multicanal (triphonie, quadraphonie, 5.0, 5.1, 7.1. .. ); frquences
d'chantillonnage comprises entre 6 et 192KHz)
format multiplateforme (Windows, Linux, MacOS, Solaris, BSD, PA-
RISC et architectures 64-bit sont actuellement supports)
format libre et ouvert, rgit par la licence non-restrictive de type BSD
navigation instantane et gestion du streaming
format orient bloc facilitant le dcodage logiciel et matriel
mode asymtrique
signature md5 intgre (facilitant vrification et identification des
fichiers)
utilisable en vido (avec ou sans perte & hybride)
pleinement support dans le conteneur Matroska
mode hybride
mode avec perte permettant le codage 2.25 bit par chantillon et plus
executables de taille rduite (programme indpendant de toute application
surdimensionne)
rtrocompatibilit totale avec les version antrieures (WavPack 1.0
3.97)
Formats de compression audio - Mmoire HALLET Sbastien XXI
gestion des archives auto-extractibles (un fichier WavPack auto-
extractible est transformable en fichier W A V sans besoin d'un autre
fichier/programme sous Windows)
support de ReplayGain
support des tags au format ID3v1 et APEv2
enchanement dit gapless (littralement, sans blanc )
gestion du piping (autorise un r encodage la vole dans un autre format,
par exemple)
Histoire:
Le dveloppement de WavPack commence au milieu de l'anne 1998 avec la
sortie par David Bryant de la version 1.0, aux performances dj remarquables.
La version 2.0 ne tarde pas suivre et, reprenant une ide dj introduite par
Monkey's Audio (un autre format de compression lossless), prsente ses
u ilisateurs un mode d'encodage avec pertes. La version 3.0 est lance l'anne
suivante, et parmi les innovations offertes par cette nouvelle version, on peut
citer: un mode d'encodage rapide, la gestion des fichiers PCM "brut" (raw) ainsi
q 'un mcanisme de dtection d'erreurs (CRC 32 bit). Ces innovations ne
s ffisent cependant pas sduire les utilisateurs, dont une large majorit
continuera de prfrer des formats plus performants tels que Monkey's Audio ou
FLAC. Il est vrai que le mode de navigation (seeking) des plus poussifs de
WavPack 3 (latence pouvant atteindre une dizaine de secondes pour aller d'un
point un autre!) n'tait gure attrayant ...
cnq annes de gestation et de maturation seront ncessaires pour qu'arrive,
e fin, une version 4.0 du format riche en fonctionnalits. Enfin dot d'un mode
de navigation performant (devenu au passage le plus ractif et le plus rapide
jamais cod!), grant le multicanal, les sources trs haute dfmition codes en
virgule flottante, prsentant un mode avec perte largement amlior, la signature
md5, le codage asymtrique ... WavPack 4 dispose dsormais de toutes les cartes
e main pour conqurir le cur des utilisateurs (ainsi que leur disque dur).
AJac:
Apple Lossless Audio Codee (ALAC) est un format d'encodage sans perte
(lossless) apparu tardivement (2004). Le format a t dvelopp par Apple pour
combler une lacune de la norme MPEG-4, dont la partie consacre l'encodage
sans perte tarde encore tre finalise. ALAC est un format propritaire et qui
s'adresse majoritairement aux utilisateurs d'iTunes et de l'iPod.
Formats de compression audio - Mmoire HALLET Sbastien XXII
Performances :
l'instar de tous les formats sans perte, ALAC permet de compresser sans
aucune forme de dgradation des fichiers musicaux au format PCM un taux de
compression voisin de 40 50% (les ratios mesurs peuvent cependant
grandement varier en fonction principalement du volume (en dcibels) de la
piste, plus le volume est fort, pop music par exemple, plus le ratio est mauvais,
l'"nverse du classique). Au regard des formats concurrents, ALAC prsente une
e ficacit moindre. Cette contre-performance est toutefois partiellement
dlibre, puisque le format a t essentiellement dvelopp en vue d'tre
dcod par des appareils bien moins puissants et autonomes que les ordinateurs
e bureau (comprendre des baladeurs et l'iPod en particulier). Une meilleure
compression suppose en effet une complexit accrue, complexit ayant pour
consquence de rduire l'autonomie des appareils nomades. Ainsi, les quelques
nourcentages perdus en termes de ratio de compression sont compenss par une
implmentation matrielle facilite. Nanmoins, ALAC reste actuellement
infrieur aux autres formats sans perte de faible complexit. FLAC prsente
insi une rapidit suprieure pour un taux de compression quasi-identique, alors
que WavPack bnficie de performances en tout point (ratio de compression,
vitesse d'encodage et de dcodage) suprieures.
Shorten:
Shorten (qui signifie raccourcir en anglais) est un format de fichier audio
sans perte, de qualit CD ( 44.1 kHz 16-bit stro PCM). Il est similaire aux
ormats ZIP ou RAR, mais conu pour l'audio puisque les compressions
traditionnelles ne sont gnralement pas efficace sur des donnes audio. La
compression est beaucoup moins efficace que celles qu'offrent les formats Ogg
Vorbis ou MP3 (10% de la taille PCM original contrairement 50 70% pour
les deux derniers). Les codees tel queTTA ou FLAC sont d'autres codees audio
sans perte plus populaires que le format .SHN.
'algorithme et son code de source ont t implments et dvelopps par Tony
Robinson de l'universit de Cambridge en 199211993 et plus tard la SoftSound
Ltd. Le code a t rendu public sous une licence non-commerciale et a t
amlior par Wayne Stielau pour inclure une table des pistes pour pouvoir
maviguer plus aisment dans le fichier.
Formats de compression audio - Mmoire HALLET Sbastien XXIII
CODEC
Le mot-valise codee vient de compression-dcompression (ou codage-
dcodage- COde-DECode en anglais) et dsigne un procd capable de
compresser ou de dcompresser un signal, analogique ou numrique. Ce procd
peut exister sous forme matrielle ou logicielle.
D'un ct, les codees encodent des flux ou des signaux pour la transmission, le
s ockage ou le chiffrement de donnes. D'un autre cot, ils dcodent ces flux ou
signaux pour dition ou restitution.
Les diffrents algorithmes de compression et de dcompression peuvent
correspondre diffrents besoins en qualit de restitution, de temps de
compression ou de dcompression, de limitation en termes de ressource
processeur ou mmoire, de dbit du flux aprs compression ou de taille du
fichier rsultant. Ils sont utiliss pour des applications comme la tlphonie, les
visioconfrences, la diffusion de mdias sur Internet, le stockage sur CD, DVD,
la tl numrique par exemple.
Les notions de codee, norme et conteneur sont souvent confondus par les
nophytes, ou par abus de langage.
La norme dcrit le format des donnes.
Le codee est le logiciel ou le matriel qui met en uvre un procd
capable de compresser ou dcompresser les donnes de format normalis.
Par exemple, MPEG-4 A VC/H.264 est une norme vido, et x264 est un codee
capable de produire un flux vido respectant cette norme. Il existe d'autres
codees pour cette norme. Lorsqu'il n'existe qu'une seule implmentation, les
termes codee et norme sont confondus (exemple: VC-1).
Un format conteneur contient des flux audio et vido respectant une
quelconque norme. Ce format permet d'entrelacer les donnes audio et
vido, et contient les informations permettant de les synchroniser au
moment de la restitution. Un conteneur peut contenir plusieurs flux audio
et vido, mais aussi des sous-titres, du chapitrage et des menus.
Le choix d'un conteneur peut par contre limiter les normes utilisables
intrieur de celui-ci. Ainsi un conteneur MPEG-2 ne peut contenir que des flux
vido MPEGV2 et des flux audio MPEGA 1, 2 ou 3 ou des flux audio AAC.
Formats de compression audio - Mmoire HALLET Sbastien XXIV
Godees propritaires
Oertains constructeurs de matriels lectroniques dveloppent eux-mmes des
codees audio ou vido.
On pourra citer l'Avchd par exemple, qui est en fait un driv du x264, une
i plmentation de H.264 ; mais ayant certaines fonctionnalits qui sont propres
aux fabricants qui l'utilisent ou l'diteur du logiciel.
Certains codees drivs d'une pr-version de norme; par exemple Div X, qui
tait une implmentation de la norme en cours d'laboration H.263 et H.264.
Les codees propritaires sont dvelopps par des entreprises, et font souvent
l'objet de brevets dans les pays o c'est possible.
Les codees libres ou ouverts comme V orbis, sont invents et dvelopps par des
acteurs du logiciel libre pour permettre aux utilisateurs de garder le contrle des
mdias qu'ils produisent eux-mmes.
Lorsqu'une norme ISO est publie, il est demand aux entreprises de ne pas
dposer de brevets ou de ne pas rclamer de droits sur ceux existant, quant la
dcompression. Les normes ISO des formats MPEG ne dfinissent que la
manire de dcompresser; chaque entreprise est alors libre de faire ce qu'elle
eut sur les astuces de compression.
Formats de compression audio - Mmoire HALLET Sbastien xxv
COMPARATIFS DES FOMRATS AUDIO
Flac Ape Mp3 Mp3pro Mpc Ogg Wma
ous prendrons comme rfrence pour ce comparatif le format wav, format non
compress rcupr ici par CDex (programme gratuit et open source qui rip les
cds et les transforme mp3, ogg, wma, aac ... ).
Les graphiques sont gnrs par audacity, enregistreur gratuit de type
soundforge. Le morceau est une boucle de 10 secondes.
Les fichiers mp3 sont encods avec le codee Lame mp3 Encoder via CDex
es fichiers ogg sont encods avec le codee OGG V orbis DLL Encoder via
CD ex
es fichiers wma sont encods avec le codee Microsoft WMA codee via CDex
Le fichier mp3Pro est encod avec THOMSON mp3PRO Audio Player
(encodage gratuit pour le 64/kbps)
Les fichiers mpc sont encods avec Musepack
Le fichier flac est encod avec FLAC Frontend
Le fichier ape est encod avec le codee Monkey audio via CDex
:ILes formats non destructif :
WAV44
lfuz stro
Format de
base non
compress
, c'est la
meilleure
.
mats auss1
e fichier
e plus
lourd.
Rfrence
Formats de compression audio - Mmoire HALLET Sbastien
Poids:
1843ko
Rduction
111
XXVI
FLAC 44khz
stro
Compresse un
fichier wav
sans perte de
qualit. Vous
pouvez
10 dB
utiliser le
compresseur
dcompresseu
r gratuit
FLAC, qui
"zip" le
fichier audio
et vous fait
gagner prs
de 45% du
poids initial.
Idal pour les
audiophiles
les+
exigeants. Est
lu par
inamp5
APE44 khz
tro
Compresse un
fichier wav
ans perte de
qualit. Vous
pouvez 10 dB
utiliser le
compresseur
dcompresseu
r gratuit
Monkey
udio, qui
''zip" le
fichier audio
et vous fait
gagner plus
de 50% du
poids initial.
Idal pour les
audiophiles
les+
Est
Formats de compression audio- Mmoire HALLET Sbastien
Poids:
1007ko
Rduction
111.83
Poids:
870ko
Rduction
1/2.11
XXVII
lu par
Winamp 5
'
Les formats destructifs:
Qualite 256 kbps Stro MP3 vs OGG vs MPC
MP3 44khz
stro
MPEGl
Commence
tricher
prtir de
17khz,
s'arrte
nette
20khz
OGG44khz
stro
Petite perte
partir de
20khz,
presque
i entique
l'original
pour un
excellent
taux de
compress10n
MPC44khz
s 'ro
Petite perte
partir de
20khz, quasi
i entique
l' riginal
pour un bon
taux de
compression
10 dB
Formats de compression audio - Mmoire HALLET Sbastien
Poids:
337ko
Rduction:
1/5,46
Poids:
274ko
Rduction
1/6,72
Poids:
332ko
Rduction
115.55
XXVIII
Egalit entre l'OGG et le MPC, le MPC tant lgrement meilleur mais plus
lourd. Le MP3 est largement dpass.
ualit 192 kbps Stro MP3 vs OGG vs MPC:
khz stro 10 dB
Poids:
MPEG1
253ko
Commence
Rduction:
tricher
1/7,28
p ~ i r d e
16khz,
s'arrte
nette
19khz
-
OGG44khz
1
stro
Petite perte
partir de 10 dB
19khz, quasi Poids:
identique 213ko
l'original
pour un Rduction
excellent
taux de 1/8,65
compression
Ncessite le
codee vorbis
_j
ou Winamp
5
Formats de compression audio - Mmoire HALLET Sbastien XXIX
MPC44
kbzstro
p ite
p$'te
partir de
1 khz,
Ncessite
le codee
et
inamp 5
Poids:
213ko
Rduction:
118,65
Nette victoire de l'OGG face au MP3 et l'MPC tout niveau, le MPC tant
lgrement suprieur au MP3.
Qualit 128 kbps Stro MP3 vs MP3-mpg 2.5 vs OGG vs WMA vs MPC
MP3 44khz
stro
MPEG1
'arrte nette
~ 1 4 k h z .
322khz
stro MPEG
2.5 S'arrte
nette 12khz,
Donne une
impression de
gualit par
'augmentation
du volume, mais
' mixe" le
morceau et on
'loigne de la
"vrit" musicale
recherche.
Formats de compression audio - Mmoire HALLET Sbastien
Poids:
169ko
Rduction: 1
1/10,90
Poids:
169ko
Rduction:
1110,90 1
xxx
MJ>C 44
kltzstro
khz stro
Petite
perte
partir de
18khz,
s'arrte
nette 20
khz,
cessite
le codee
vorbis ou
Winamp 5
MA44
khz stro
Triche
partir de
13khz,
'arrte
nette
16khz.
Triche
aussi sur
le poids
(plus
ourd)
10 dB
Poids:
176ko
Rduction:
1/10,47
Poids:
149ko
Rduction:
1/12,36
Poids:
192ko
Rduction:
1/9,59
ouvelle victoire crasante de l'OGG face au 4 autres formats. Suit le MPC
talonn par le WMA, le MP3 est compltement dpass.
Les fichiers les plus courants sur le net, qualit dite faussement "cd"
Formats de compression audio - Mmoire HALLET Sbastien XXXI
Conclusion :
!Je FLAC et l'APE sont idales pour archiver ses CDs si vous avez beaucoup de
place sur vos disques durs ou que vous avez un graveur DVD. Il n'y a aucune
perte de qualit.
L'OGG prouve ici sa supriorit tout niveau et toute les chances de devenir
un standard cours terme. Son principal dfaut est qu'il n'est pas encore
disponible dans tous les lecteurs mp3 ... Il fait mieux que les codees propritaires
et est donc partiellement boycott par les socits ayant des intrts dans la
vente des codees (le mp3 comme le wma n'est gratuit qu' l'coute mais est
payant si vous dsirez en faire une utilisation commerciale).
Le MPC se montre d'excellente qualit en 256 kbs et y est l'gal de l'OGG, mais
est bien moins bon que celui-ci dans les autres taux de compression. Il se
rapproche fort du WMA
Le MP3 bien qu'tant le plus rpandu semble au vu de ses rsultats un codee
dpass ... Il arrive en dernire place des codees tests, et ne garde du succs que
grce son renom et aux habitudes des surfeurs. Sa trs grande compatibilit est
son point fort.
Le MP3pro malgr les promesses de Thomson ne ralise pas de bons rsultats. Il
est vrai qu'il n'a t test qu'en 64kbps, les autres taux tant payants
l'encodage.
Le WMA s'en sort plutt bien, il est bien meilleur que les mp3 mais ne tient pas
la route contre l'OGG. Son point fort est sa grande compatibilit avec les
lecteurs mp3. Il permet le streaming.
Formats de compression audio- Mmoire HALLET Sbastien XXXII
1 Compresser 1 Options 1 Ratio*
Encoding Decoding
Speed** Speed**
li
1
% x realtime x realtime
1 La 0.4b
default 55.5 2.1 2.7
1 OptimFROG 4. 509 highnew 55.8 1.1 1.5
1 Monkey's Audio 3. 99 extra high 56.4 8.8 8.7
1 OptimFROG 4. 509 default 56.7 6.0 8.9
1 Monkey's Audio 3.99 high 56.9 15.8 14.3
J Monkey's Audio 3. 99 normal 57.3 18.1 16.0
1 WavPack 4.0 high 58.0 16.0 16. 1
I WMA 9
default 58.0 9.4 10.8
RKAU 1.07 fast (Il) 58.4 8.0 9.6
LPAC Archiver 1.41 medium, JS, random access 58.8 13.5 24.6
LPAC Archiver 1.41 extra high, JS, random access 58.8 8.1 20.2
TTA 3.2 default 59.0 26.6 23 .4
WavPack 4.0 normal 59.4 26 .3 28.4
FLAC 1.1.2
18
59.6
1
4.2 44.7
FLAC 1.1.2 1 default ( 5) 59.8
1
19.9 44.7
Apple Lossless (iTunes 4. 7) 1 automatic 60.0
1
15.6 35.0
Shorten 3. 6. 0 1 default
63.7
1
33 .7 70 .9
Formats de compression audio - Mmoire HALLET Sbastien XXXII 1
Nom Taille \ T e
4 257 Ko Winamp media file
3 871 Ko Zip-Archiv
3 842 Ko Rar-Archiv
2 728 Ko Ace-Ar chi v
Compression
2 372 Ko Sonic Foundry Perf o o o
non destructive
son_ complexe opac 2 348 Ko Fichier PAC
~ son_complexeowa 2 343 Ko Fichier WA
~ son_complexeork.a 2 309 Ko Fichier RKA
~ son_complexe_320kbpsomp3 967Ko Winamp media file
J
son_complexe _256kbps o mp3 774 Ko Winamp media file
Compression
~ ,n_oomple>re_160kbp,,mp3
484 Ko Winamp media file Destructi ve
son_ complexe _128kbps o mp3 387 Ko Winamp media file
son_complexe _ vbr256kbps o mp3 358 Ko Winamp media file
Formats de compression audio - Mmoire HALLET Sbastien XXXIV