Vous êtes sur la page 1sur 18

Universit Abou Bekr Belkaid Facult des sciences Dpartement dinformatique

Standard de Format et de compression du son MP3


BENDAOUD FAYSSAL BENZIANE YASSINE
Enseign par : Mr. BENZIANE

Introduction :
La compression de donnes ou codage de source est l'opration informatique qui consiste transformer une suite de bits A en une suite de bits B plus courte, contenant les mmes informations, en utilisant un algorithme particulier. Il s'agit d'une opration de codage, c'est-dire changer la reprsentation de l'information, dans le but de rendre la reprsentation compresse plus courte que la reprsentation originale. La dcompression est l'opration inverse de la compression. Avec un algorithme de compression sans perte, la suite de bits obtenue aprs les oprations successives de compression et de dcompression est strictement identique l'originale. Les algorithmes de compression sans perte sont utiliss pour de nombreux types de donnes notamment des documents, des archives, des fichiers excutables ou des fichiers texte. Avec un algorithme de compression avec pertes, la suite de bits obtenue aprs les oprations de compression et de dcompression est diffrente de l'originale, mais l'information reste sensiblement la mme. Les algorithmes de compression avec perte sont utiliss pour les images, le son et la vido. Les formats de donnes tels que Zip, RAR, gzip, ADPCM, MP3 et JPEG utilisent des algorithmes de compression de donnes. La thorie de la compression de donnes est issue de la thorie de l'information.

Partie 1 : Standard de format


I .Format de fichier audio :
Un format de fichier audio est un format de donnes utilis en informatique pour stocker des sons, (de la musique, des voix, etc.) sous forme numrique. De nombreux standards existent; certains s'appliquent la production, au stockage et la diffusion, d'autres (ceux qui utilisent des algorithmes de compression de donnes ou de dbit), sont destins, en principe, uniquement la diffusion. Actuellement, le format le plus utilis est de loin le mp3, suivi du wma, et de l'aac.

II .Types de formats :
Il est important de faire le distinguo entre un format de fichier et un codec. Un codec effectue le codage et le dcodage des donnes brutes audio tandis que les donnes elles-mmes sont stockes dans un fichier avec un format spcifique fichier audio. Certains formats de fichier audio peuvent contenir des donnes obtenues avec des codecs diffrents. II .1 Les formats audio sans compression : Il existe un format audio non compress, PCM, qui est gnralement stock sous forme de .WAV sur Windows ou sous .Aiff sur Mac OS. WAV et AIFF sont des formats de fichiers flexibles conus pour stocker plus ou moins n'importe quelle combinaison de taux d'chantillonnage ou de bitrates (bit rate). Ce sont les formats de fichier appropris pour le stockage et la ralisation d'enregistrements originaux. a) RAW : RAW (Real Audio Wrapper) est un format audio utilis pour reprsenter les donnes de son en modulation d'impulsion code sans en-tte ni mtadonnes. b) WAV : Le format WAV (ou WAVE),(WAVEform audio format) est une extension de fichiers audio, il s'agit d'un conteneur capable de recevoir des formats varis. Il est bas sur le format de fichier RIFF, lequel est semblable au format IFF.Mono ou stro, il a t mis au point par Microsoft et IBM. Le suffixe des fichiers crs est .wav c) BWF : Le BWF (Broadcast Wave Format) est un format audio standard cr par l'European Broadcasting Union en tant que successeur du WAV. Le BWF permet de stocker des mtadonnes dans le fichier. Voir European Broadcasting Union : Spcification du Broadcast Wave Format (EBU Technical document 3285, juillet 1997). Il s'agit du format d'enregistrement usuel utilis dans de nombreuses stations de travail audio professionnel de la tlvision et du cinma. Les Fichiers BWF incluent une rfrence standardise Timestamp qui permet et facilite la synchronisation avec un lment d'image distincte. Stand-alone, bas sur des fichiers, multi-enregistreurs de Sound Devices 2, Zaxcom 3, HHB USA 4, (en) en:Fostex, et Aaton 5 tous utilisent BWF comme leur format prfr.
3

d) AIFF : L'AIFF est un format de stockage de sons sur les ordinateurs de Apple . C'est l'quivalent du format WAV dans le monde Windows. Les rsolutions 8, 16, 20, 24 et 32 bits ( virgule flottante) sont acceptes. Le suffixe des fichiers crs est .aif Une variante l'AIFF-C permet de compresser la taille jusqu' 6x. e) CAF : Le CAF (Core audio format) a t dvelopp par Apple pour s'affranchir des limitations de conteneur audio plus ancien comme le AIFF ou le WAV. Il est compatible avec le systme Mac OS X d'Apple depuis la version 10.3 et est lisible par Quicktime 7. f) CDA : Le CDA (Compact Disc Audio), est un format Microsoft spcifique Windows, des pistes des CD audio, telles qu'elles apparaissent lorsqu'elles sont insres dans le lecteur CD-ROM. Les CD audio du commerce rpondent la norme professionnelle "Red Book". La technique d'chantillonnage du son utilise pour les disques compacts est la modulation d'impulsion code (en anglais PCM, pour Pulse Coded Modulation). Le suffixe des fichiers crs est .cda II .2 Les formats audio compresss sans perte : La compression sans perte (lossless) signifie qu'on utilise un algorithme tel qu'on peut toujours retrouver les donnes d'origine. Dans l'absolu, il existe toujours un fichier d'origine tel que l'algorithme ne ferait pas gagner d'espace disque. Typiquement, la compression sans perte permet de diviser la taille des fichiers par deux ou trois. Elle est relativement peu utilise, car ce gain est trs faible en comparaison de ceux permis par la compression avec perte (ce qui est un gros handicap pour les changes de fichiers), et assez gourmande en temps de calcul. Aucun standard n'a donc suffisamment convaincu pour devenir universellement lisible. a) ATRAC : L'ATRAC (Adaptive Transform Acoustic Coding) est une technique de compression audio avec et sans pertes dveloppe par Sony en 1992. Ce format a subi plusieurs volutions : ATRAC3, ATRAC3plus (familirement crit ATRAC3+) et ATRAC Advanced Lossless se sont succd respectivement en 1999, 2002 et 2006. b) FLAC : Le format FLAC (Free Lossless Audio Codec), est un format libre de compression audio sans perte. Maintenu par la fondation Xiph.org, il est apprci pour conserver la qualit des fichiers sonores originaux en alternative aux formats de compression avec perte type MP3.

III. 3 Les formats audio compresss avec perte : La compression audio avec perte (lossy) se base sur des algorithmes spcialiss pour dterminer quelles transformations simplifient la reprsentation du son tout en tant perue quasiment de la mme manire par l'oreille humaine. Elle diminue la taille du fichier en liminant les nuances perues comme les moins utiles. L'limination est dfinitive, crer un fichier dans un format de haute qualit partir d'un fichier compress avec perte ne sert strictement rien. Le format le plus connu est le MPEG-1/2 Audio Layer 3, dont le suffixe est .mp3. Ce format propose une qualit sonore trs correcte pour un dbit de 128 kbit/s. C'est ce format qui a t massivement utilis pour transfrer les musiques via internet ds la fin des annes 1990. Rapidement, des baladeurs avec une mmoire renregistrable et capables de lire directement ce format sont apparus. Dans la dcennie 2000, de nouveaux formats ont t proposs. Vu les progrs des algorithmes, ils surpassent largement le MP3 en termes de qualit dbit gal, et peuvent atteindre des qualits suprieures. De plus, certains sont moins contraignants que le MP3 quant aux droits d'utilisation (le Ogg est un format libre). Mais le MP3 reste le plus utilis, car l'arrive en continu de nouveaux formats, apportant un avantage assez faible par rapport aux prcdents, ne permet pas de mettre en place un standard meilleur que le MP3 et lisible par tous les baladeurs. Pour un mme format de compression, il n'y a pas de manire unique de coder, car chaque algorithme cherche la meilleure manire de reprsenter le son d'origine suivant le langage de compression. En particulier, les codecs de MP3 ont ralis des progrs trs importants depuis le dbut de l'utilisation de ce format. Elle permet typiquement un gain d'un facteur 10 de taille du fichier. Cela a rendu possible non seulement le stockage d'un temps d'coute formidable sur les supports informatiques, mais aussi leur change par internet, souvent illgalement. a) AC3 : Officialise en 1992, la compression AC3 permet dutiliser jusqu 6 canaux sonores indpendants avec un taux dchantillonnage de 32, 44,1 ou 48 kHz et avec un taux de transfert allant de 32 640 kbit/s. Le Dolby Digital utilise ce principe de codage, c'est pourquoi on le dsigne souvent sous ce nom. Format trs courant dans les DVD. b) MP3 : MP3 est l'abrviation de MPEG-1/2 Audio Layer 3. Cet algorithme de compression prend naissance en 1987. L'ISO en fera un standard dans les annes 92-93. La couche (Layer) III est la couche la plus complexe. Elle est ddie des applications ncessitant des dbits faibles (128 kbit/s) d'o une adhsion trs rapide du monde Internet ce format de compression. Les taux de compression (ratio) sont d'ordinaire de 1 pour 10 (1:10) (1:4 1:12). Trs rapide l'encodage. Des royalties importantes sont payer pour exploiter la licence MP3. Utiliser l'encodeur MP3 LAME dernire version, encod 130 kbit/s (V5) permet d'obtenir une qualit comparable au AAC (Advanced Audio Coding) encod 48 kbit/s6.

Le suffixe des fichiers crs est .mp3 Type de compression : constant ou variable (VBR). c) mp3PRO : Le format mp3PRO, fruit de la collaboration entre Thomson Multimdia et l'Institut Fraunhofer, combine l'algorithme MP3 et un systme amliorant la qualit des fichiers comprims appel (en)SBR pour Spectral Bandwidth Replication. Ce format a t publi la fin de 2001 ; un fichier MP3pro 64 kbit/s a une qualit quivalente celle d'un MP3 128 kbit/s. Le suffixe des fichiers crs est .mp3 d) Ogg Vorbis : Le format Ogg Vorbis est un format libre, fruit de la fondation Xiph.org. Vorbis se diffrencie des MP3, WMA et autre AAC par son algorithme. Il segmente les sources audio en paquets successifs, l'algorithme de compression agissant dans un premier temps sur chaque paquet indpendamment des autres. Cela lui permet d'avoir trs peu de faiblesses sur certaines frquences et de conserver la mme qualit quel que soit le type de musique.Le suffixe des fichiers crs est .ogg ou parfois .oga. Par abus de langage, on appelle 'fichier Ogg' des fichiers musicaux compresss par l'algorithme Vorbis. Ceci peut tre particulirement drangeant l're des baladeurs numriques supportant audio et vido. En fait, Ogg est un conteneur qui peut contenir des pistes sonores (Vorbis), audio sans perte (FLAC), audio parles (Speex) et vido (Theora). Un 'fichier Ogg' peut donc contenir l'un ou l'autre (ou une combinaison) de pistes. Pour tre plus clair, nous devrions parler de fichier Ogg Vorbis lorsque nous mentionnons un fichier . ogg qui ne contient qu'une piste sonore au format Vorbis. e) VQF ou TwinVQ : Le format TwinVQ (Transform-domain Weighted Interleave Vector Quantization), a t dvelopp par NTT Cyber Space Laboratories et soutenu par Yamaha. Dans le mme esprit que le MP3, il comprime encore plus et avec une meilleure qualit. On regrettera une dure d'encodage un peu trop longue, prs de 10 fois plus lente que le MP3. De plus, arriv bien plus tard, et distribu sous une licence trs restrictive, il a eu peu d'adeptes et est plus ou moins abandonn. Le suffixe des fichiers crs est .vqf, .vql ou .vqe f) WMA : Le format WMA (Windows Media Audio), cr par Microsoft partir des recommandations MPEG-4 en 1999, est utilis par le logiciel Windows Media Player. Ce format est li une gestion pointue des droits d'auteurs (Gestion numrique des droits, en anglais Digital Right Management ou DRM) qui permet de dfinir par exemple une dure de vie limite pour les fichiers ou d'interdire les possibilits de gravure. Il existe plusieurs versions du codec (wma7.1, wma9, wma pro). Le suffixe des fichiers crs est .wma

g) AU : Le format AU est assez bien rpandu grce Unix et Linux. La frquence d'chantillonnage est comprise entre 1 kHz et 200 kHz. Mais les applications de rendu audio ne lisent principalement que trois frquences d'chantillonnage : 8012.821 (codec entr), 22050 et 44100 hertz. Le suffixe des fichiers crs est .au Les rsolutions 8, 16, 20, 24 et 32 bits (flottant) sont acceptes. h) ASF : ASF Advanced Streaming Format, est un format conteneur de Microsoft servant au streaming audio et vido. i) AA : (En)AA Audible, est un format utilis par Apple pour les audio-books. j) AAC ou MPEG-2 AAC : L'AAC (Advanced Audio Coding), est une extension du MPEG-2 et a t amlior en MPEG4, MPEG-4 Version 2 et MPEG-4 Version 3. Il a t reconnu fin avril 1997. Le suffixe des fichiers crs est .aac, .mp4, .m4a k) Apple et l'AAC : Apple a choisi l'ACC comme codec privilgi, on le retrouve dans son iPod et son logiciel iTunes. Pour la vente musicale en ligne iTunes Music Store, la norme AAC ne proposant pas de systme de gestion des droits numriques (DRMs), Apple a dvelopp son propre systme, appel FairPlay. Il est lisible sur Mac OS et Windows, uniquement avec le logiciel iTunes. Le fait que l'AAC soit le seul format de compression pertes plus performant que le MP3 qui soit support par les iPod a fortement contribu sa popularit. Insuffisamment cependant pour qu'il s'impose comme successeur du MP3, d'autres formats cits faisant largement jeu gal en performances. III. 4 Formats multipistes : Les formats multipistes sont une innovation rcente. Ils consistent encapsuler dans un fichier diffrent pistes sonores, qui peuvent alors tre combines par l'utilisateur dans les proportions qui lui conviennent. L'ide est de proposer, pour un morceau de musique, la piste correspondant chaque instrument (et la voix) de manire spare. L'utilisateur peut alors crer sa propre version. Le U-MYX avait t utilis pour inclure des parties bonus dans les albums. Ces formats ont l'inconvnient de ncessiter un ordinateur pour tre utiliss. Cependant l'apparition de Smartphones faisant office de baladeurs et capables d'excuter des applications indpendantes permet ces formats de devenir transportables, y compris pour la lecture avec mixage0
7

a) iKlax : Le format iKlax est un format numrique d'coute active dvelopp par la socit iKlax Media et le LaBRI. Ce format de fichier de type conteneur permet d'organiser la musique en diffrents groupes et de leur appliquer des contraintes. Le format a bnfici d'une parution scientifique lors de l'ICMC 2008 (Internation Computer Music Conference) Belfast. b) U-MYX : Le U-MYX est un format multipiste lisible avec une application ddie, dite par la mme entreprise qui a dvelopp le format. Ce format a t utilis pour fournir des morceaux en version multipiste titre de bonus dans les albums, l'application tant fournie en mme temps que les morceaux, le tout sur une session de CD visible uniquement si on lisait le disque sur unjordinateur. Malgr ces exemples d'utilisation, le futur de U-MYX est incertain, car l'entreprise qui le produit est assez floue sur ses projets futurs. c) MXP4 : Le MXP4 est un format multipiste dans lequel les pistes encapsules sont au format Ogg8. Produit par une socit franaise, le format a bnfici d'une forte mdiatisation dans la presse franaise, prsent comme un successeur du MP3 . Une expression qui peut sembler exagre, les formats multipistes jouant tout simplement un rle diffrent.

IV. Utilisation des formats :


Un format est dit :

De production quand le fichier est cens rester identique l'original en dehors des mtadonnes encapsules (embedded) De diffusion quand il y a compression de dbit des donnes, ce qui le rend inutilisable pour tout traitement ultrieur.

V. Les formats audiovisuels :


Ces formats contiennent, la fois des fichiers image et des fichiers audio, ainsi que du Timecode ou un pseudo-timecode (flag). Par exemple: Quicktime est multi-plateformes et utilise de nombreux standards de l'industrie gratuits, certains autres, trs orients, sont payants. Polyvalents et de structure de donnes polymorphes, certains d'entre eux sont aussi utiliss pour le streaming[10].

CD Audio partir de 1993 (QuickTime 1.6) ; MPEG-1 et MIDI partir de 1994 (QuickTime 2.0) ; DV et H.261 partir de 1998 (QuickTime 3.0) ; H.263, Macromedia Flash et SMIL partir de 1999 (QuickTime 4.0) ; MPEG-2, MPEG-4, AAC, 3GPP et 3GPP2 partir de 2002 (QuickTime 6.0) ; H.264 et intgration OpenGL partir de 2005 (QuickTime 7.0).
8

VI. Calcul du dbit et du poids d'un fichier audio :


VI. 1 Calcul du dbit : Dbit = frquence d'chantillonnage x quantification x nb de piste = Kbps Exemple avec un CD audio : dbit = 44.1 Khz x 16 bits x 2 = 1411 kbps VI. 2 Calcul du poids : Pour un format dbit constant : Taille (Ko) = temps (s) x dbit (Kbit/s) / 8 Exemple : pour un fichier MP3 encod 192 Kbit/s d'une dure de 3 minutes Taille = 3 x 60 x 192 / 8 = 4 320 Ko Pour un format dbit variable : Taille moyenne(Ko) = temps (s) x dbit moyen (Kbit/s) / 8 Taille maximale(Ko) = temps (s) x dbit maximum (Kbit/s) / 8 Les Mtadonnes augmentent la taille des fichiers audio, leur taille est ngligeable, cependant elles peuvent avoir pour consquence de ralentir la lecture du fichier en temps rel.

Partie 2 : compression du son mp3


I. Dfinition :
Le MPEG-1/2 Audio Layer 3, plus connu sous son abrviation de MP3, est la spcification sonore du standard MPEG-1/MPEG-2, du Moving Picture Experts Group (MPEG). C'est un algorithme de compression audio (voir aussi codec) capable de rduire drastiquement la quantit de donnes ncessaire pour restituer de l'audio, mais qui, pour l'auditeur, ressemble une reproduction du son original non compress : avec une bonne compression la diffrence de qualit devenant difficilement perceptible. L'extension de nom de fichier est .mp3 et le type MIME est audio/mpeg1, audio/MPA, audio/mpa-robust2. Ce type de fichier est appel fichier MP3 .

II. Historique :
Le codage MPEG-1/2 Layer 2 est n avec le projet Digital Audio Broadcasting (radio numrique DAB) qui fut lanc par le DLR [Deutsche Luft und Raumfahrt]. Ce projet a t financ par l'Union europenne, et faisait partie du programme de recherche EUREKA, connu sous le nom de EU-147. La norme ISO MPEG Audio avec ses trois couches de codage Layer I, Layer II (Musicam), Layer III (.MP3) fut acheve officiellement en 1992 et constitua la premire partie du MPEG-1, le premier travail du groupe MPEG. Le travail sur l'audio MPEG se termina en 1994 et constitua la seconde partie (MPEG-2) de la norme internationale ISO.

III. Utilisation :
Sur les CD vierges il est indiqu 80 minutes pour 737 Mo (702 Mio) soit 1,24 Mbit/s. Le format populaire de compression audio permet une rduction de 3,88 (320 kbit/s) 155 (8 kbit/s). Un fichier audio occupe souvent ainsi 3,88 19,4 (64 kbit/s) fois moins d'espace une fois compress au format MP3. La rduction de taille facilite le tlchargement et le stockage de donnes musicales sur un support numrique, tel qu'un disque dur ou une mmoire flash. Il a galement t largement mis en uvre en diffusion numrique dans les rcepteurs TDMB Radio dont la spcification a t adopte par l'ETSI en 2005 et qui est largement rpandue en Core du Sud. En effet le MP3 appartient la mme famille de norme MPEG Audio que le MP2 MUSICAM utilis en radiodiffusion numrique (TNT pour la tlvision numrique de terre et T-DMB Radio). Un simple transcodage binaire du format "MP2 audio diffus" en format "MP3 enregistr" peut ainsi tre ralis dans les terminaux T-DMB, autorisant donc la mise sur le march de baladeurs/rcepteurs audionumriques qui cumulent les fonctions de dcodage audio MP2 (MUSICAM) et MP3.

IV. Technique de codage :


Le taux de compression peut tre augment en choisissant un dbit binaire (en anglais bitrate) plus faible. On considre en gnral qu'il faut au moins 128 ou 192 kilobits par seconde (kbit/s) pour bnficier d'une qualit audio acceptable pour un morceau de musique. 8 kbit/s, le son devient fortement altr (bruits parasites non attendus, spectre sourd , ).

10

Ce format de donnes utilise un systme de compression partiellement destructif. Il ne retransmet pas intgralement le spectre des frquences audio. En revanche il tente d'annuler d'abord les sons les moins perus de faon ce que les dgradations se fassent le moins remarquer possible. Ce n'est pas une compression proprement parler, mais plutt une suppression d'informations. Compresser un fichier musical provenant d'un CD audio au format MP3 rduit la qualit. Il suffit de faire plusieurs essais diffrents taux de compression pour constater une baisse progressive de la qualit. (Plus la compression est forte, plus le son est dgrad.) Une compression correspondant 64 kbit/s donne un son enrou et 32 kbit/s, un son mdiocre de qualit grandes ondes . Les termes commerciaux de qualit CD ou qualit numrique ne veulent rien dire. Dj parce que le MP3 rduit la qualit (de faon plus ou moins perceptible) par principe mme. Ensuite, parce que numrique n'est pas un critre de qualit (en numrique comme en analogique il existe diffrentes techniques de qualits trs diffrentes). La compression au format MP3 exploite un modle psychoacoustique de l'effet dit de masque : si deux frquences d'intensits diffrentes sont prsentes en mme temps, l'une peut tre moins perue que l'autre selon que ces deux frquences sont proches ou non. La modlisation de notre audition selon ce principe est au dpart empirique, mais assez efficace. Elle exploite en outre les caractristiques psycho-acoustiques de masquage temporel du filtre en sous-bande hrit du MUSICAM dans la mesure o les sons percussifs (piano, triangle, batterie,..) n'engendrent aucun artefact perceptible de type pr-cho. Toutefois, si le taux de compression est trop important, on peut tre amen faire ressortir certaines harmoniques de faon non attendue. Cela donne alors l'impression de bruits parasites et dsagrables au milieu du son. On peut amliorer la qualit dbit moyen gal en utilisant un dbit binaire variable (VBR ou Variable Bit Rate par opposition un dbit constant Constant bit rate, CBR). Dans ce cas, les instants peu complexes (contenant peu de frquences), comme les silences par exemple, seront cods avec un dbit d'information plus faible. Par exemple 64 kbit/s au lieu de 128, rduisant ainsi la taille totale du fichier tout en gardant une trs bonne qualit lors des passages riches en harmoniques. L'amlioration apporte est variable selon le morceau cod. Le codage en VBR peut nanmoins poser des problmes de compatibilit avec certains lecteurs.l'utilisation dpend de la personne qui gre l'objet.

V. La compression MP3 :
En fait, on devrait plutt parler d'un ensemble de techniques utilises pour arriver au rsultat final. Ce rsultat final, c'est le fichier MP3 contenant le morceau de musique que l'on a compress. Parmi ces techniques, certaines sont dites destructrices d'autres non. Une compression destructrice, c'est une compression qui est ralise en perdant de l'information. Cela signifie que si l'on dcompresse (ou dcode) le signal compress (ou encod) l'aide d'une technique d'encodage destructeur (en anglais, on parle de lossy codec), on ne retrouvera pas le signal de dpart. On a perdu des donnes lors de l'encodage. Le MP3 est donc un codage destructeur. Parmi les techniques de compression destructrices, on a essentiellement des mthodes qui exploitent les proprits de l'oreille humaine. On dit que l'on utilise un modle psychoacoustique. Expliquons-nous un peu... Normalement, notre oreille entend les frquences
11

situes dans la gamme [20 Hz - 20 kHz] comme on peut le voir sur la figure ci-dessous. En fait, il faudrait moduler ce diagramme car cela dpend aussi de l'ge.

Si un morceau de musique contient des frquences hors de cette gamme, on peut purement et simplement les supprimer sans perte de qualit audio puisque l'oreille humaine ne les entend pas. Pour aller plus loin, on peut dire que l'on entend surtout correctement les frquences situes dans la gamme [2 kHz - 5 kHz]. En effet, moins de 5dB de niveau sonore suffit pour entendre les frquences situes dans cette bande alors qu'il faut plus de 20dB pour entendre les frquences situes en dessous de 100Hz ou au dessus de 10kHZ. Ces constatations peuvent tre exploites pour rduire la taille des fichiers. On peut par exemple dcider que toutes les frquences au dessus de 15kHz seront supprimes. Voil donc une technique de compression toute simple. Autre technique de compression utilise pour encoder un fichier audio en MP3, le principe des frquences masques. Si dans un groupe de frquences, certaines ont un niveau sonore beaucoup plus lev que d'autres, il n'est pas ncessaire de conserver les frquences de niveau sonore faible : on ne les entendra pas. Pour utiliser une comparaison plus marquante, imaginez que vous tes dans votre jardin et que vous entendez des oiseaux. Si un avion passe au dessus de votre tte (mme trs haut), vous n'entendrez plus les oiseaux car le son qu'ils produisent est beaucoup plus faible que celui gnr par l'avion. C'est comme si les oiseaux n'existaient plus ou avaient arrt de chanter. On voit bien qu'il n'est pas ncessaire de coder toutes les frquences prsentes dans un morceau pour que l'oreille humaine le peroive correctement quand mme. Enfin, si les deux voies d'un son stro prsentent des squences semblables, au lieu de dupliquer ces squences, on stocke une seule voie et l'information qu' ce moment l, voie droite et voie gauche sont identiques. Au rang des techniques non destructrices, que trouve-t-on ? Principalement des techniques de codage. Expliquons-nous... Un son, c'est une frquence. Une seconde de musique, c'est donc une succession de frquences. Imaginons que dans la suite d'chantillons composant une seconde de musique (rappelons qu'il y a 44100 chantillons dans une seconde de musique issue d'un CD audio), on ait plusieurs fois de suite la mme frquence, par exemple 10 fois. Si au lieu de stocker ces 10 points, on en stocke 1 seul et le nombre de fois o il se rpte, on a besoin de coder 2 nombres et non 10. Si, de plus, on applique cette mthode des frquences non plus identiques mais trs proches les unes des autres (si proches que l'oreille humaine
12

moyenne ne puisse les distinguer), on peut encore gagner en place. Attention, cette fois, la compression est destructrice puisque l'on remplace une frquence par une autre presque identique. Le MP3 utilise galement l'algorithme de Huffman (1952) comme mthode de codage des informations. Cette mthode est utilise dans tous les algorithmes de compression (compression de fichiers texte, compression d'images, compression de sons). Elle repose sur l'utilisation d'un code de longueur variable et la probabilit d'apparition d'un vnement (en l'occurrence ici d'une frquence). Plus une frquence apparat souvent, plus son code sera court (nombre de bits faible pour la reprsenter). Le fichier est lu une 1re fois et on dresse un tableau des frquences apparaissant et le nombre de fois o elles apparaissent. On en dduit le code appropri. Ce codage est utilis en dernier lieu. C'est la phase finale de la compression. C'estfunfcodagefnonfdestructeur. Le MP3 exploite en 1er lieu les proprits de l'oreille pour rduire la taille d'un morceau, puis on traite l'aspect stro et enfin on applique des codages en terminant par lefcodagefdefHuffman. L'utilisation de toutes les possibilits de rduction voques dpend de la place que l'on souhaite accorder une minute de son compress et donc du taux de compression que l'on va devoir appliquer. Pour l'encodage de fichiers son en MP3 on parle plutt en terme de bitrate que de taux de compression. Le bitrate est le nombre de bits autoriss en 1 seconde. On aura donc la relation suivante : plus on veut compresser un morceau (pour qu'il prenne le moins de place possible) plus le bitrate choisir devra tre faible.

VI. Taux de compression :


L'efficacit de la compression des codeurs avec perte est habituellement dfinie par le dbit binaire, puisque le taux de compression dpend de la taille de l'chantillon et de la frquence d'chantillonnage du signal d'origine. Toutefois, les paramtres du disque compact sont souvent utiliss comme rfrence (44,1 kHz, 216 bits). Et aussi parfois, ceux du DAT SP (48 kHz, 216 bits). Le taux de compression pour cette rfrence est plus lev, ce qui montre la complexit de la dfinition du terme taux de compression pour les codeurs avec perte. Fraunhofer-Gesellschaft publie sur son site Web officiel les taux de compression et les dbits de donnes pour le MPEG-1 Layer I, II et III :

Layer I : 384 kbit/s, compression de 3,23 Layer II : 160 256 kbit/s, compression de 7,75 4,84 Layer III : 112 128 kbit/s, compression 11,1 9,7

Ces valeurs ne disent pas grand-chose sur la qualit du rsultat obtenu, puisque la qualit ne dpend pas seulement du format de codage du fichier, mais galement de la qualit de l'algorithme psycho-acoustique utilis par le codeur. Typiquement, les codeurs layer I utilisent un algorithme trs simple, d'o un rsultat ncessitant un dbit suprieur pour un codage transparent. En considrant de bons codeurs, on obtient :

13

Layer I cod 384 kbit/s, mme avec ses algorithmes psycho-acoustiques simples, est meilleur que Layer 2 de 192 256 kbit/s Layer II cod 160 192 kbit/s Layer III cod de 112 128 kbit/s est quivalent au Layer II de 192 256 kbit/s. Les dbits prsents ne sont donc pas quivalents en termes de qualit, et les qualits ne sont pas forcment optimales. De plus, la qualit du codeur est un facteur trs important. Ainsi, avec les premiers codeurs, il tait gnralement admis que 128 kbit/s avec le Layer III n'avait pas un son excellent, mais tout juste raisonnable. La gnration de codeurs actuels permet d'obtenir un son tout fait correct 128 kbit/s avec le Layer III. Si l'on est soucieux de la qualit et pas seulement du dbit, on utilisera plutt les valeurs suivantes : Layer I : excellent 384 kbit/s Layer II : excellent de 256 384 kbit/s, trs bon de 224 256 kbit/s, bon de 160 224 kbit/s Layer III : excellent de 224 320 kbit/s, trs bon de 192 224 kbit/s, bon de 128 192 kbit/s La strophonie a un dbit exactement deux fois suprieur la monophonie si la qualit est identique pour ces deux modes d'coute. Le mode stro joint diffre de la stro simple car il ne code pas sparment les deux canaux gauche et droit si les informations sonores sont identiques, permettant un gain de qualit par rapport la stro classique avec une mme valeur de compression. Le procd de la strophonie est un codage dit diffrentiel de mme type que celui utilis pour la radiodiffusion en FM stro.

VII. Logiciels permettant de crer des MP3 : VII. 1. Sous Windows :


Lorsqu'on dispose d'un CD audio et d'un lecteur CD sur un ordinateur sous Windows, il suffit d'insrer le CD et de le lire avec le Lecteur Windows Media intgr au systme d'exploitation et de cliquer sur l'onglet Extraire pour transformer les fichiers audio du CD. Nanmoins, jusqu' la version 9, le lecteur Windows Media tait rgl par dfaut pour extraire les fichiers en WMA, il fallait alors modifier les options de codage dans Outils/Options, onglet Extraire la musique, et passer outre le message d'avertissement sur les dfauts du codage MP3. A partir de la version 10, Windows Media Player encode par dfaut en MP3. Le codeur MP3 du Lecteur Windows Media est prsent depuis la version pour Windows XP, avant il fallait installer un codeur externe. Il existe des logiciels plus spcialiss offrant plus d'options et une meilleure qualit (grce au compresseur LAME) tels que CDex, EAC et d'autres.

14

VII. 2. Sous Mac OS :


Lorsqu'on dispose d'un CD audio et d'un lecteur CD sur un ordinateur sous Mac OS X ou Mac OS 9, il suffit d'insrer le CD et de le lire avec le lecteur QuickTime intgr au systme. Le contenu du CD est visible et les fichiers peuvent trs facilement tre extraits par un glisserdposer avec la souris. Le fichier obtenu est au format AIFF et peut tre lu avec QuickTime et cod avec n'importe quel codeur MP3. Le logiciel iTunes offre des possibilits de conversion d'un format un autre, mais ne prend pas en charge les formats ouverts les plus connus. Pour un encodage LAME on pourra par exemple utiliser XLD5 ou, en interaction avec iTunes, l'application iTunes-LAME6

VII. 3. Sous Linux :


o Grip : permet de ripper un CD audio en MP3 (conu pour l'environnement graphique GNOME, d'o le G ) o k3b : permet de ripper un CD audio en mp3 (conu pour l'environnement graphique KDE, d'o le K ) o LAME : compresser mp3 en mode texte partir de fichiers audio. Peut aussi bien tre utilis simplement qu'avec ses options (tags ID3 possibles). o XCFA : capable de coder en variable bit rate

VIII. Matriels adapts sa lecture :


Les ordinateurs : via des logiciels (voir plus haut). Les baladeurs numriques : ils permettent d'couter partout des fichiers MP3 stocks en mmoire. Les lecteurs de CD MP3 : portables ou non, ils permettent d'couter des fichiers MP3 stocks sur des CD. Les disques durs multimdia : la plupart disposent de cette fonctionnalit; les autres ne le supportent pas pour ne pas payer la licence. Des lecteurs de DVD ou DVD / DivX : portables ou non, ils peuvent souvent lire des fichiers MP3 sur des CD ou DVD. Des rcepteurs de radio analogique rcents et numrique DAB : ils peuvent parfois lire (et mme de plus en plus souvent enregistrer) des fichiers MP3 sur des cartes mmoires flash et/ou priphriques de stockage USB. Des consoles de jeux rcentes : comme la PSP, PS3 ou la Xbox 360. Des tlphones portables rcents; seuls ceux se voulant trs simples ne le font pas l'heure actuelle. Des appareils de technologies des musiques amplifies rcentes. Comme les chanes HiFi et tous ses drivs via une platines CD ou DVD et/ou des cartes mmoires flash et/ou priphriques USB et/ou un rseau.

15

IX. Logiciels adapts la lecture du MP3 :

Sous Windows : VLC, Windows Media Player, iTunes, RealPlayer, Audacity, Winamp, Foobar2000, KMPlayer, Zinf, musikCube, BSplayer, Konvertor, XnView, Songbird etc. Sous Mac OS : iTunes, VLC, Audacity, Audion 3, QuickTime, RealPlayer, Amadeus II, SoundEdit, Sound Studio, Peak, etc. Sous Linux : Xmms, Audacity, Amarok, JuK, Listen, Rhythmbox, VLC, Exaile, Zinf, Mplayer, etc. Sous Palm OS : Pocket Tunes

X. Domaine d'application :
MP3 "MPEG Audio Layer 3 compression" est un format de compression de donnes audio dvelopp par l'Organisation de Standardisation Internationale (ISO). Ce format MP3 audio permet de compresser environ 12 fois les documents audio conventionnels (WAV) ou les cdroms de musique habituels. Cet algorithme de compression (ou codec) est ainsi capable de rduire drastiquement la quantit de donnes ncessaires pour restituer de l'audio, mais qui, pour l'auditeur, ressemble une reproduction du son original non compress, c'est--dire avec une perte significative mais acceptable de qualit sonore pour l'oreille humaine. Logiciels adapts sa lecture Sous Windows : Winamp, Foobar2000, Windows Media Player, iTunes, RealPlayer, Zinf . Sous Mac OS : iTunes, VLC. Sous Linux : Xmms, amaroK, JuK Sous Palm OS : Pocket Tunes. C'est donc le format idal pour raliser des compilations personnelles ou couter ses cdroms directement stocks sur son disque dur ou des cdroms de donnes en format MP3.

XI. Particularits :
a).Inconvnients : Un cdrom en format MP3 ne peut pas tre cout sur un lecteur de cdrom audio conventionnel moins que le systme de son soit connect l'ordinateur. Le format MP3 n'est pas illgal, car il reprsente uniquement une faon de compresser des donnes numriques. Par contre son utilisation peut l'tre. Lors de l'utilisation de fichiers MP3, veillez respecter les droits d'auteur : vous pouvez faire une copie (de sauvegarde) d'une chanson dont vous possdez l'original, mais vous ne pouvez pas tlcharger ou archiver une musique d'un artiste dont les droits d'utilisation ne sont pas librs. Il est ainsi fort peu probable que la chanson que vous rvez de tlcharger puisse lgalement l'tre. b).Avantages : Cette compression n'altre pas significativement le son du MP3 (aucune diffrence n'est perceptible sans comparaison fine) et conserve toutes les qualits du cdrom d'origine. Outre le fait de stocker la musique de faon trs compacte tout en conservant une qualit acceptable, le MP3 apporte une fonctionnalit rarement prsente sur les formats audio qui l'ont prcd : les mtadonnes (donnes sur les donnes). Le fichier MP3 ne contient pas seulement la musique mais peut galement apporter des informations sur celles-ci (telles que l'interprte, le titre, le nom de l'album, voire la pochette, les paroles ou du karaok). Ces informations sont stockes sous forme d'tiquettes (tag en anglais) dont il existe plusieurs versions.
16

Conclusion :

17

18

Vous aimerez peut-être aussi