Vous êtes sur la page 1sur 6

Le son et laudionumrique

1. Quest-ce que le son ?

Sous sa forme la plus simple, le son n'est qu'une vibration mcanique, c'est--dire un
mouvement de va- et-vient plus ou moins complexe de matriaux autour de leurs points
d'quilibre. Donc, si lon entend un son, c'est parce que les particules d'air proches de nos
tympans vibrent. On observe galement un phnomne de propagation de ces vibrations
dans certains matriaux ; le son atteint gnralement nos oreilles aprs avoir t transmis
par l'air depuis sa source (et sous l'eau, ce sont les particules d'eau qui transmettent le son).
Le son se propage sans dplacement de matire, mais transmet la matire environnante
une nergie vibratoire.

Un son priodique , cest- -dire


dont les ondes de pressions se
rptent
avec
une
certaine
rgularit, a la caractristique de
provoquer une impression de
hauteur loreille. La hauteur est
lie au nombre de priodes
contenues dans une seconde, ce que
lon appelle frquence . Cette
frquence se mesure en Hertz (Hz).
Cette vibration se transmet ensuite de proche en proche par l'intermdiaire du milieu (l'air,
l'eau...). Dans le vide, le son ne se propage pas puisqu'il n'y a pas de milieu matriel.

Le son priodique le plus


pur que lon puisse
trouver est trs proche du
sifflement.
Sa reprsentation est une
onde sinusodale parfaite.

La frquence dun son


dtermine donc la hauteur de
sa fondamentale, mais un son
peut
avoir
plusieurs
harmoniques.
On parle alors dun son
complexe priodique.

Un son complexe priodique obit une loi mathmatique appele loi de Fourier, cest
dire que ce signal complexe, priodique, se dcompose en un certain nombre de sinusodes
dont les valeurs sont des multiples entiers de celle dont la frquence est la plus basse.
Un exemple de son harmonique : un son de 100 Hertz dont les composantes seraient 100 ;
200 ; 300 ; 400 ; 500 ; 600 Hertz. La hauteur perue est la frquence la plus basse, c'est-dire 100 Hertz. Les composantes suivantes 2x100 , 3x100, 4x100, etc., sont bien des
frquences calcules sur des multiples entiers ( 2 ; 3 ; 4, etc.) ; ce sont les harmoniques. La
frquence la plus basse qui leur sert de base de calcul est la frquence fondamentale. Le
rang dun harmonique est le nombre entier par lequel on a multipli le fondamental. On
parlera par exemple dharmonique de rang 3, dans le cas prsent 300 Hertz (fig. a).

Mais les sons rels sont rarement aussi parfaitement


cisels et contiennent une part de bruit dans leur contenu
spectral ; droite, on peut voir un sonagramme dune note
de violon. Outre les diffrentes zones harmoniques, on
remarque au dbut une zone grise, continue verticalement,
aux frquences non dfinies, il sagit du bruit de larchet
linitiation de la note, avant que la corde ne se mette
vibrer.

2. Le son dans lordinateur

Avant de rentrer dans lordinateur le son doit tre capt (transduit) par un
microphone (transducteur) ; la sortie de ce dernier, on parle de signal analogique. C'est
ce type de signal que l'on observe immdiatement droite du graphique de pression au
cours du temps. Il est directement semblable (analogue) la pression au cours du temps
un facteur multiplicatif prs.

Pression (Pascals)

Tension (Volts)

L'information analogique est constitue de valeurs continues dans le temps, c'est--dire


qu' tout instant correspond une valeur (de pression par exemple).
La tche d'un convertisseur analogique-numrique (CAN) est de venir prlever des
chantillons de ce signal continu afin dobtenir une suite de nombres binaires ; ceci est
obtenu en "quantifiant" l'amplitude de la forme d'onde des intervalles de temps rguliers
t. Aprs chaque dure t, une valeur damplitude lectrique est code en binaire et
enregistre dans lordinateur.
Signal
Signal

Temps

Temps

La priode t est appele priode d'chantillonnage. Les chantillons peuvent tre


considrs comme des images instantanes du signal audio qui, assembles dans une
squence, donnent une reprsentation de la forme d'onde continue, de la mme manire
que la squence d'images d'un film, projete en succession rapide, donne l'illusion d'une
image en mouvement continu.

Afin de reprsenter les dtails fins du signal,


il est ncessaire de prlever un grand nombre
de ces chantillons chaque seconde.
Comme on peut le voir dans la figure
suivante, si on prlve trop peu
d'chantillons par cycle, ils peuvent alors
tre interprts comme la reprsentation
d'une forme d'onde diffrente de la forme
d'onde d'origine chantillonne.
Afin davoir une qualit suffisante, on utilisera une frquence dchantillonnage
minimum de 44100 Hz, cest--dire que lordinateur viendra rcuprer des chantillons
44100 fois par seconde (la priode t dchantillonnage sera de 1/44100 de seconde ou de
0,0000226 s). La thorie de Nyquist-Shannon (daprs les noms des scientifiques Harry
Nyquist et Claude Shannon) nonce que la frquence ncessaire un bon chantillonnage
dun signal doit tre gale ou suprieure au double de la frquence maximale contenue
dans ce signal.
On a estim (pour certaines raisons industrielles qui dpassent le cadre de ce cours) que la
frquence maximale que lhomme pouvait thoriquement entendre tait de 22050Hz (en
ralit la moyenne est autour de 16000Hz), do le standard de 44100Hz comme frquence
dchantillonnage minimale.

On a vu que sur le plan temporel (horizontal), il tait trs important de choisir une
frquence dchantillonnage de 44100 Hz pour avoir une qualit sonore suffisamment
bonne. Sur le plan de lintensit sonore (vertical), la quantification devra aussi tre
suffisante; elle correspond au nombre de bits des messages servant reprsenter le signal
audio une fois numris.
On se doute que, comme pour laspect temporel, plus on a de valeurs pour numriser les
diffrentes valeurs dintensit du signal, plus lchantillonnage sera fidle loriginal
analogique.
Sur les schmas ci-contre, on observe le haut du
courbe sinusodale reprsentant un son aprs son
chantillonnage suivant diffrents paramtres.
Les schmas (A) et (B) montrent deux
chantillonnages

la
mme
frquence
dchantillonnage
mais
aux
quantifications
diffrentes (la seconde quantification est 4 fois plus
prcise que la premire).
(C) montre une frquence dchantillonnage plus
leve avec la mme quantification.
(D) est lexemple idal dmontrant lintrt davoir
ET une bonne frquence dchantillonnage ET une
quantification leve.

3. Quelques formats de fichiers sonores


a. Sans rduction de donnes (dits non-compresss )

WAVE : Mis au point par Microsoft et IBM, le format Wave PCM est le
format son standard de Windows (galement sur Macintosh). Il est limit un
poids de 2 Go. Le format "Disque compact" 44.1 kHz, 16 bits et stro nous
servira de rfrence pour le calcul du poids et ratio des autres formats.

AIFF : format de stockage des sons sur les ordinateurs Macintosh d'Apple.
C'est l'quivalent du format WAV dans le monde Macintosh.

RAW : Format audio brut

AU : Le format AU est assez bien rpandu grce Unix et Linux. La


frquence d'chantillonnage est comprise entre 1 kHz et 200 kHz. Mais les
applications de rendu audio ne lisent principalement que trois frquences
d'chantillonnage: 8012.821Hz, 22050Hz et 44100Hz.

b. Avec rduction de donnes (dits compresss )


i. Avec perte dinformation (modles psychoacoustiques)

MP3 : MPEG-1/2 Audio Layer 3. Format de compression trs populaire


permettant d'occuper quatre douze fois moins d'espace de donn. Pour cela,
certaines frquences inaudibles par l'oreille humaine vont tre totalement
supprimes dans le fichier. La compression au format MP3 exploite aussi un
modle psycho-acoustique de l'effet dit de masque : si deux frquences
d'intensits diffrentes sont prsentes en mme temps, l'une peut tre moins
perue que l'autre par l'oreille, selon que ces deux frquences sont proches ou
non. Les informations de frquences non significatives laudition ne sont
donc pas encodes.

AAC: Amlioration du format MP3, c'est le format des fichiers audio


supports par Apple au sein de son baladeur numrique iPod et de son logiciel
iTunes. LAAC est un format de compression audio standardis par lISO
bas sur les nomes du MPEG-4, dou son nom MP4. Les frquences
dchantillonnage vont de 8 kHz 96 kHz (MP3 officiel : 16 48 kHz) et il
peut grer jusque 48 canaux.

WMA : format de compression audio propritaire dvelopp par Microsoft. Il


offre la possibilit de protger ds l'encodage les fichiers de sortie contre la
copie illgale par une technique nomme Gestion Numrique des Droits (ou
GND ; en anglais DRM : Digital Rights Management).

OGG Vorbis (ou OGA): formats et codecs multimdias ouverts, libres et


dgags de tout brevet. Le format de compression audio Vorbis est
propos par la fondation Xiph.Org. Moins populaire que le MP3, il lui est
pourtant suprieur en terme de qualit poids gal.

RA: .ra (real audio), .rv (real video), .rm (real media), .ram (real audio
metadata). Famille de codecs audio propritaires (RealNetworks). Trs ancien,
il permet de diffuser de la musique sur internet en utilisant la technique du
streaming.

ii. Sans perte dinformation


FLAC 1 (Free Lossless Audio Codec): codec libre de
compression audio sans perte. linverse de codecs tels que
MP3 ou Vorbis, il nenlve aucune information du flux audio. Cette
qualit maximale a pour consquence une quantit d'information
plus leve, qui tout en tant assez variable se trouve en moyenne
tre de l'ordre de 50 % de la taille du mme fichier au format PCM.

1
2

ALAC2 (Apple Lossless Audio Codec): le format a t dvelopp


par Apple pour combler une lacune de la norme MPEG-4, dont la
partie consacre l'encodage sans perte tarde encore tre finalise.
ALAC, qui s'adressait majoritairement aux utilisateurs d'iTunes et
de l'iPod, a t un format propritaire jusqu la fin octobre 2011,
date laquelle les sources du codec ont t rendues disponibles sous
une licence Apache1. Il est noter qu'Apple n'utilise jamais
l'abrviation ALAC, seulement le nom Apple Lossless

http://fr.wikipedia.org/wiki/Free_Lossless_Audio_Codec
http://fr.wikipedia.org/wiki/Apple_Lossless