Académique Documents
Professionnel Documents
Culture Documents
FORMATS DE
COMPRESSION AUDIO
- -
2 \ 7>/o
1 NSTITU TE
Mmoire Hallet Sbastien Juin 2009
AEPS 1007
SAE Bruxelles
Formats de compression audio- Mmoire HALLET Sbastien I
SOMMAIRE
Introduction
ABR, CBR, VBR >>
Formats de compression Lossys
o Le MP3 (extension .mp3)
o Le Mp3Pro (extension .mp3)
o Le Ogg Vorbis (extension .ogg)
o Le Musepack (extension .mpc)
o Le Wma (extension . wma)
o L'AdvancedAudio Coding (AAC)
o Atrac 3
Formats de compression Lossless
o Principe de fonctionnement des formats lossless
o APE
o Flac
o WavPack
o Alac
o Shorten
Codee
Comparatif des formats audio FLAC APE MP3 MP3PRO MPC
OGGWMA
Annexes
Formats de compression audio - Mmoire HALLET Sbastien II
INTRODUCTION
Il existe de nombreux formats de compression audio tel que le mp3, le mp3 pro,
1' ogg vorbis, le mpc, le wma, 1' ape, le flac ...
Les diffrents paramtres prendre en compte lors de la compression audio sont
les suivants :
Il faut distinguer les fichiers qui compressent la musique d'origine sans
aucune perte (les lossless) et ceux qui suppriment certaines frquences et
certains chantillons, donc en dgradant 1 'original, afin de rduire la place
occupe par les donnes encodes (les lossy ).
Les fichiers audios peuvent tre encods selon deux modes, le CBR pour
Constant Bitrate et le VBR, Variable Bitrate. Le premier encodera chaque
seconde de musique de la mme faon, un taux constant, par exemple
128K, mme si c'est une seconde de silence. Le second va adapter
1' encodage de chaque seconde en fonction de la complexit des samples
rencontrs, autour d'un taux nominal donn. Il en rsultera souvent un
fichier ayant un bien meilleur rendu qu'un CBR (parce que moins lisse)
pour une taille moins importante.
La qualit de l'extraction en premier lieu, les capacits du codee servant
1' encodage des fichiers audios dans un deuxime temps, ainsi que le
soin apport par le rippeur sa ralisation ont une importance capitale
qui font qu'un fichier sera parfait ou totalement quelconque. Prfrez
donc les fichiers qui vous donnent dans leur intitul une indication sur les
conditions de ralisation.
Le point de dpart de toute bonne compression audio reste une bonne extraction.
Celle-ci se pratique par l'intermdiaire d'un programme appel rippeur. Tous
ceux prsents sur le march ne sont pas d'gale qualit.
Formats de compression audio- Mmoire HALLET Sbastien III
ABRCBRVBR
CBR (Constant BitRate): Quelque soit la difficult du signal (scne rapide ou
lente) tout moment, le dbit de 1' encodage restera constant et ne changera donc
pas. Le CBR est bien adapt au streaming sur rseau. Le CBR est bien adapt au
streaming sur rseau. Le VBR quant lui est bien adapt aux lecteurs MP3,
lecteurs de DVD et missions satellite.
VBR (Variable Bitrate ): Par rapport au CBR, le VBR est justement fait pour
faire varier le dbit de l'encodage en fonction de la difficult du signal (scne
rapide ou lente). Lorsque l'on se rfre aux codees, un taux d'chantillonnage
variable fera varier les donnes requises pour encoder chaque seconde d'un
fichier multimdia tel qu'une vido ou une piste audio, et ce, bas sur la
complexit de ces derniers. Le but est videmment de raliser le meilleur
compromis possible entre la qualit finale du fichier multimdia et sa taille, en
opposition au CBR qui garde constamment le mme taux d'chantillonnage.
Plus d'espace est allou aux scnes complexes alors qu'un cran noir dans un
fichier vido par exemple ne requiert qu'une petite quantit de donnes. De
mme, les sons complexes sont cods un dbit lev et les sons simples un
dbit plus bas. La taille fmale ne peut pas du tout tre prdite contrairement aux
CBR. Ce type d'encodage ncessite d'tre inform du bitrate minimum et
maximum et d'un bitrate moyen que l'on souhaite obtenir. Il est assez
compliqu de calculer la taille du fichier de sortie pour un encodage VBR.
ABR (Average BitRate) : voici un encodage driv du VBR qui tentera de
respecter le bitrate cible qu' on lui aura impos. La taille du fichier de sortie sera
donc plus prvisible qu'un encodage VBR. Fait rfrence au montant moyen de
donne transfr par unit de temps, habituellement mesure en seconde. On y
fait communment rfrence en musique ainsi que vido.
Formats de compression audio - Mmoire HALLET Sbastien IV
FORMATS DE COMPRESSION LOSSY
Le Mp3 (MPeg Layer 3) :
Vous connaissez tous le format Mp3 qui est le plus courant et le plus populaire.
Celui-ci existe en diffrents niveaux de qualit, mesure la fois par le bitrate
(nombre de Kbps Kilobites per second) auquel le morceau a t encod mais
galement par la qualit de l'encodeur utilis (les plus connus Lame ou Blade,
mention que 1' on voit souvent sur le rseau) ainsi que par la technique
d'encodage, CBR ou VBR. Ce format populaire de compression audio permet
une compression approximative de 1:4 1:12.
La qualit la plus banale est le 128 Kbps. C'est celle que l'on rencontre, sauf
indication contraire, pour les fichiers musicaux proposs en vrac. En dessous de
ce bitrate, la qualit est mdiocre et vous devez viter ce genre de fichier.
Quelques mp3 sont proposs en 160, 192 ou mme 256 Kbps, offrant une
meilleure qualit bien entendu mais avec un poids trs nettement suprieur.
Le codage MPEG-1/2 Layer 2 est n avec le projet Digital Audio Broadcasting
(radio numrique DAB) qui fut lanc par le Deutsche Luft und Raumfahrt. Ce
projet a t fmanc par l'Union europenne, et faisait partie du programme de
recherche EUREKA, plus connu sous le nom de EU-147.
Le projet EU-147 exista de 1987 1994. En 1991, deux formats taient
disponibles :
MUSICAM (Mas king pattern adapted Universal Subband Coding And
Multiplexing), bas sur un pur codage psycho-acoustique et un banc de
filtres adapts aux sons de type percussifs ;
ASPEC (Adaptive Spectral Perceptual Entropy Coding), qui introduisait
la technologie de codage entropique.
Le format Musicam conu par le CCETT, Philips et l'IRT fut choisi par l'ISO
MPEG Audio dirig par Hans-Georg Mussman en raison de sa structuration
modulaire en plusieurs couches de codage [Layers ], sa simplicit de mise en
uvre ct dcodeur et sa grande tolrance aux erreurs de transmission.
la demande de Hans-Georg Mussman, un groupe de travail regroupant Leon
Van de Kerkhof (Philips), Geri Gking (TDF -CCETT), Karlheinz Brandenburg
(Fraunhofer-Gesellschaft) reprit des ides de Musicam et d'ASPEC, ajouta de
Formats de compression audio - Mmoire HALLET Sbastien v
nouveaux outils technologiques et cra le format MP3 (Layer III ou couche III),
conu pour tre de mme qualit 128 kbit/s que le MP2 192 kbit/s.
La norme ISO MPEG Audio avec ses trois couches de codage Layer I, Layer II
(Musicam), Layer III (.MP3) fut acheve officiellement en 1992 et constitua la
premire partie du MPEG-1, le premier travail du groupe MPEG, groupe
l'origine de la norme internationale ISO/CEl 11172-3, publie en 1993. Le
travail sur l'audio MPEG se termina en 1994 et constitua la seconde partie
(MPEG-2) de la norme internationale ISO/CEl 13818-3, publie pour la
premire fois en 1995.
Les quipes de normalisation procdrent de nombreux tests subjectifs en
double aveugle sur de nombreux matriaux sonores pour dterminer le niveau de
compression appropri pour les diverses couches de l'algorithme. On a
notamment utilis Tom's Diner, la chanson de Suzanne Vega comme squence
de test pour l'algorithme de compression du MP3. Cette chanson a t choisie
cause de sa finesse et de sa simplicit, qui facilite la dtection des imperfections
du codee.
Qu'est ce que le MP3 ?
C' est un format de compression de fichier son qui permet de compresser les
morceaux sonores de faon trs importante. MP3 est l'abrviation de Mpeg- 1
Audio Layer 3. C'est un format de son compress par perte de donnes. En effet,
le principe du MP3 est de retirer les sons qui ne sont pas audible pour 1' oreille
humaine comme les ultrasons (aigu) ou les infrasons ainsi que 1' effet de
masque. L'oreille humaine ne discerne que les sons pris entre 0.20 khz et 20khz
mais le mp3 peut aller jusqu'a 44khz afin qu'aucun son grave ou aigu ne
puisse nous chapper. Un CD audio (16 bits, 44.1 khz, Stro) peut tre
compress jusqu' a 12 fois sa taille original au format mp3. Par exemple, une
minute de chanson au format wave prend 10 Mo alors qu'en mp3 elle ne prend
que 1 mo environ. Le principe est relativement similaire celui utilis dans la
compression d'image au format Jpeg.
Quel est son mode de fonctionnement ?
Le MP3 est divise en plusieurs paquets. Chaque paquet est divis en 3 blocs
distincts : synchronisation : Cette partie indique au logiciel ou commence la
lecture du fichier.
I.D Celle-ci contient 12 renseignements 8 sur la proprit du son 4 sur les droits
d' auteurs/reproduction, cette section indique au lecteur s'il doit jouer le morceau
Formats de compression audio - Mmoire HALLET Sbastien VI
en mono ou en stro. Elle indique aussi le dbit ("bitrate" en anglais) :Le dbit
va de 8 kbits/s 320 kbits/s.
bande usante (khz) Mode bitrate
2.5 mono 8
Radio ondes courtes 4.5 mono 16
Radio AM 7.5 mono 32
Radio FM 11 stro 56 64
Proche CD 15 stro 96
ualitCD 15 stro 112 128
L'ensemble des donnes musicales qui permettront de reproduire le son.
Le fichier MP3 peut tre complter par un TAG; celui-ci nous renseigne sur le
morceau de musique. Il y a le tag ID3 qui est le plus courant. Il nous renseigne
sur le nom de l'artiste et de l'anne du morceau de musique. TAG Lyris 3 :Plus
complet il peut en plus insrer des images et des liens internet
LeMp3PRO:
Ce codee est une volution de mp3 et prsente un meilleur ratio qualit/poids. A
qualit gale, on obtient frquemment des fichiers moiti moins lourds qu'avec
e mp3, surtout si 1' encodage se fait en VBR.
Comme pour le mp3 normal, la qualit de 1' encodage ne se rsume pas au
ombre de Kbit mais dpend aussi de la qualit du codee de dpart et des choix
CBR ou VBR qui auront t faits. Un 96 Kbps High Quality est la plus haute
qualit en CBR.
C'est un format qui est lu par les principaux programmes (winamp, sonique,
etc.) que vous pouvez donc tlcharger sans risque, mme si on trouve peu de
spcimens sur le rseau.
Thomson a annonc en 2001 1' arrive de mp3PRO, la nouvelle gnration du
mp3. Mp3PRO prsente deux avantages essentiels: une qualit sonore
suprieure et une compression amliore. Il offre des performances de 128 Kbits
par seconde avec un dbit d'encodage de 64 Kbits par seconde, pour une vraie
qualit CD, tout en permettant aux diffuseurs sur Internet de rduire leurs cots
en bande passante.
Cette technologie nouvelle a t apporte par le partenaire sudois Coding
Technologies, qui l'a mise au point lors de recherches sur un systme
d'assistance aux malentendants. Le principe est d'extraire des parties de grande
qualit du bas de la plage de frquences d'un fichier musical pour les dupliquer
Formats de compression audio - Mmoire HALLET Sbastien VII
une frquence suprieure. Coding Technologies a associ ses rsultats aux
ravaux de pionniers du codage audio de Thomson et du Fraunhofer Institute
our crer mp3PRO, qui permet de tlcharger et d'enregistrer 24 albums sur un
seul CD-R.
Le format de compression le plus rpandu au monde s'amliore
considrablement avec le nouveau format de codage-encodage mp3PRO
compatible avec le mp3 traditionnel et qui gnre des fichiers dont la taille est
rduite de moiti par rapport celle des fichiers traditionnels, tout en offrant une
excellente qualit sonore.
A propos de mp3PRO et de sa compatibilit :
Grce des techniques sophistiques de psycho-acoustique et d'analyse
musicale, mp3PRO gnre des fichiers prenant moins de place que les fichiers
mp3 traditionnels, avec une qualit sonore gale ou suprieure, tout en tant
compatible avec le format mp3. V os fichiers mp3 actuels pourront tre lus tout
ait normalement par les lecteurs mp3PRO, mais cela ne permettra pas
a' exploiter la qualit suprieure offerte par mp3PRO. Les nouveaux fichiers
mp3PRO lus sur un lecteur mp3PRO permettront de bnficier d'une qualit
onore optimale.
Comment la technologie mp3PRO fonctionne t-elle ?
Lorsqu'il gnre un fichier mp3PRO, le nouvel encodeur mp3PRO scinde les
enregistrements audio en 2 parties. La partie analyse les donnes en basse
quence et 1' encode en mp3 traditionnel, permettant ainsi 1' encodeur de se
concentrer sur moins d'information et ainsi d'effectuer un encodage de
eilleure qualit. Ce systme permet galement d'offrir une entire
compatibilit sur les lecteurs mp3 traditionnels. La seconde partie analyse les
donnes en haute frquence et les encode en donnes mp3 que les lecteurs mp3
traditionnels ne peuvent pas reconnatre. Les nouveaux lecteurs, ou ceux qui ont
t actualiss pour le format mp3PRO, permettent de combiner ces 2 parties
pour offrir, rsultant en une bande passante audio complte.
Toujours plus de musigue
e format mp3PRO rduit de moiti la place des fichiers, doublant ainsi 1' espace
disponible sur les cartes mmoires flash et les CDs. Par exemple, des CDs audio
traditionnels contiennent 15 titres, et jusqu' 150 titres encods 128 Kps.
rochainement, lorsque les lecteurs de CD mp3 seront quips du dcodeur
p3PRO, il sera possible d'encoder plus de 300 titres sur un CD encod en
p3PRO.
Formats de compression audio- Mmoire HALLET Sbastien VIII
Le Ogg Vorbis (.o2g) :
Vorbis est un algorithme de compression et de dcompression (codee) audio
numrique, sans brevet, ouvert et libre, plus performant en termes de qualit et
taux de compression que le format MP3, mais moins populaire que ce dernier.
Promu par la fondation Xiph.org, c'est un des composants de leur projet Ogg,
qui a pour but de crer un ensemble de formats et codees multimdia ouverts
(son, vido), libre de tout brevet.
Le format sonore Vorbis doit obligatoirement tre en capsul. Ill' est dans la
majorit des cas par le format Ogg, d'o l'appellation de Ogg Vorbis.
Nanmoins, Vorbis et Ogg sont diffrents (l'un tant le contenu et l'autre le
contenant, Matroska pouvant servir de contenant alternatif). Ogg Vorbis n'est
donc pas un format, mais un ensemble de formats.
Comme le MP3, V orbis est un format de compression audio destructeur ou avec
pertes, c'est--dire que le fichier compress puis dcompress ne sera pas
identique bit pour bit avec l'original. On peut le comparer au format JPEG pour
les images, d'autant qu'il utilise des techniques similaires. Comme tous les
formats de compression fonds sur ce principe, il est conu pour que l'auditeur
ne fasse pas la diffrence l'coute avec l'original, en exploitant les
caractristiques de la perception acoustique humaine, plus particulirement en
supprimant les frquences prsentes les moins audibles par rapport aux autres.
Les outils de codage exploits par le format sont plus avancs que ceux
qu'exploite le MP3, qui paie ici son anciennet. Cela explique les performances
suprieures du format, notamment pour les bas dbits, infrieurs 100 kbit/s.
Toutefois, ces algorithmes plus performants induisent une complexit de
traitement plus importante, et donc un temps de compression gnralement
suprieur un mme fichier qu'on compresserait en MP3 sur une machine de
mme puissance.
partir d'une source strophonique chantillonne 44,1 kHz en 16 bits
(chantillonnage standard d'un CD audio), le codeur V orbis produit des fichiers
dont le dbit de sortie varie entre 30 et 500 kbit/s, en fonction de la qualit de
codage choisie et du type de musique. Vorbis est un format VBR (Variable
Bitrate, ou dbit variable). Cela lui permet d'allouer plus d'informations pour
compresser des passages difficiles (gnralement, mais pas toujours, les
passages difficiles coder sont les passages trs polyphoniques contenant
beaucoup de frquences aigus, mais cela dpend aussi beaucoup du genre
musical), et d'pargner de la place sur des passages moins exigeants (par
exemple une entame de morceau o le batteur donne le tempo, ou idalement un
Formats de compression audio - Mmoire HALLET Sbastien IX
silence numrique). Ainsi, c'est la qualit sonore qui est constante (en thorie) et
non pas le dbit de donnes, ce qui semble souhaitable dans tous les cas, sauf
dans certains cas de streaming sur internet qui peut avoir des exigences de
gularit du dbit.
partir d'un flux audio stro chantillonn 44,1 kHz, le codeur produit en
sortie un flux un dbit de 45 500 kbit/s suivant la qualit choisie. Le
coefficient de qualit est une mtrique arbitraire et peut varier de -1 1 O.
Les fichiers cods la qualit 5 ( -q5), par exemple, devraient avoir la mme
qualit sonore quelle que soit la version du codeur, mais les nouvelles versions
doivent tre capables d'atteindre cette qualit avec un dbit binaire plus faible.
Les dbits binaires fournis dans le tableau le sont titre indicatif, Vorbis ayant
intrinsquement un dbit binaire variable, ce dernier peut donc changer
considrablement d'un chantillon l'autre. Il est sans doute le meilleur dans les
trs hauts niveaux d'encodage (de q5 q10). Si nous devions tablir une
quivalence avec le mp3 on aurait peu prs ceci :
Ogg q5 > Mp3 160 Kbps 1 Ogg q7 > Mp3 224 Kbps 1 Ogg q9 > Mp3 320 Kbps 1
Ogg q10 > Mp3 500 Kbps
Comparatif Ogg vorbis 1 Mp3 :
pour la mme qualit audio, le fichier Ogg Vorbis est, la plupart du temps, plus
petit que le fichier mp3, donc un meilleur taux de compression. La compression
Ogg Vorbis utilise une compression nomme compression dbit binaire
variable. Qu'est-ce que ceci? Et bien les mp3 standards ont un nombre de bits
txe pour encoder une dure fixe de son. Par exemple, une compression mp3
128 kilobits/sec occupera, comme il est indiqu, 128 kilobits d'espace disque
pour une seconde de son. Le dsavantage de cette technique est que mme le
silence sera encod en utilisant 128 kilobits pour une seconde et qu'un son plus
iche, une symphonie avec des cordes et des cuivres sera encod avec le mme
ombre de bits. En fait, si on y rflchit, il serait mieux de prendre moins de bits
our encoder un son plus pauvre et d'en prendre plus lorsque le son est plus
riche. C'est exactement ce que fait la compression Ogg Vorbis et c'est
pourquoi on nomme cette technique comme une compression dbit binaire