Vous êtes sur la page 1sur 14

Traitement numrique du son

1/ - QU'EST-CE QU'UN SON?


1.1 Dfinition
D'un point de vue physique, un son est une nergie qui se propage sous forme de vibrations dans un milieu compressible (dans l'eau, dans l'air, dans les matriaux solides, mais pas dans le vide!). Lorsqu'on jette une pierre dans l'eau, on peut facilement observer le phnomne de propagation des ondes la surface:

Lors de la diffusion d'un son dans un concert, c'est l'air qui permet sa transmission jusque nos oreilles. De mme que l'exemple de l'eau illustr ci-dessus, les molcules d'air transmettent l'nergie et son donc un support pour le son.

1/ - QU'EST-CE QU'UN SON?


1.2 mission, Propagation, Rception
- Pour qu'un son soit mis, une nergie doit avant tout mettre en mouvement un corps pour produire une vibration. Ainsi, le muscle du larynx, la chute d'un objet sur le sol, ou la tension lectrique dans un haut-parleur, provoqueront l'nergie ncessaire pour produire cette vibration. - Ensuite, pour que ce son puisse se propager, il faut un milieu lastique favorable la transmission de la vibration. En crant des surpressions ou des dpressions, l'air permet la propagation de l'onde. Les matriaux solides ont aussi cette capacit de transmettre le son. Dans le vide par contre, aucun son ne peut se propager, car il n'y a aucun de support. - Enfin, pour tre perue, il doit y avoir un rcepteur sensible. Chez l'homme, l'oreille possde une membrane (le tympan) capable de transmettre les informations de vibration en signaux nerveux jusqu'au cerveau, grce au nerf auditif. De mme, le microphone possde galement une membrane permettant de transformer les dplacement de l'air en signaux lectriques.

2/ - CARACTERISTIQUE DU SON
Comme tout phnomne vibratoire, le son peut tre analys comme un signal qui varie dans le temps. Deux caractristiques essentielles sont l'amplitude et la frquence.

2.1 L'amplitude
- La premire caractristique d'un son est son amplitude. Appele aussi intensit ou volume sonore, c'est l'expression de la pression de l'air qui se mesure en dcibels (dB). 0 dB correspond au minimum que l'oreille humaine puisse percevoir (seuil d'audibilit). Attention, une augmentation de 3db multiplie la puissance par deux!

Faible

Exemple concret:
- De 0 10 dB : Seuil d'audibilit, Dsert - De 30 40 dB : fort - De 60 70 dB : sonnerie de tlphone - De 80 90 dB : tondeuse gazon, klaxon de voiture - 120 dB : seuil de la douleur, avion au dcollage - 180 dB : dcollage de la fuse Ariane, lancement d'une roquette

Fort

- L'volution de l'amplitude sonore dans le temps s'appelle l'enveloppe.

2.2 Frquence
- La frquence, exprime en Hertz (Hz), est le nombre de rptition d'une priode par seconde. Plus elle est leve et plus le son paraitra aigu, l'inverse, il paraitra grave. En musique, la frquence dfinit donc la hauteur d'un son, soit, la note. (Ex: la note LA correspond 440Hz, soit 440 vibration en une seconde).
Une seconde

Une priode 3 Hz + grave 10 Hz 30 Hz + aigu

Le spectre de frquence entendu par l'oreille humaine n'est pas infini, il s'tend environ de 20 Hz 20 000 Hz (20KHz). En dessous on parle d'infra-son et au dessus on parle d'ultra-son.
Infra son < 20Hz Basse 20 - 200Hz Bas-Mdium 200 - 2000Hz Haut-Mdium (ou aigus) 2000 - 12000Hz aigu (ou sur-aigu) 12000 - 20000Hz Ultra son >20000Hz

2/ DE L'ANALOGIQUE AU NUMERIQUE
2.1 Le son analogique : un signal continu
Lorsqu'on capte un son partir d'un microphone, ce dernier transforme l'nergie mcanique (la pression de l'air exerce sur sa membrane), en une variation de tension lectrique continue. Ce signal lectrique dit analogique pourra ensuite tre amplifi, et envoy vers un hautparleur dont la fonction est inverse: transformer nouveau le signal lectrique en une nergie mcanique (on peut observer le dplacement de la membrane d'un haut parleur en marche).

Tension lectrique

Exemple d'une chane analogique

Tension lectrique

AMPLIFICATEUR

Le son analogique est gnralement fix sur des supports comme les bandes magntiques, disques vinyles etc. Le problme rencontr par ces supports rside dans l'usure physique des informations au cours de leur utilisation (lecture/criture). A terme, le signal est affaiblie et peut disparaitre.

2.2 Le son en numrique: un signal discontinu


Avec l'informatique, lorsque ce mme signal lectrique est captur partir du micro, il est converti en une suite de nombre, on parle alors de numrisation du signal. C'est la carte son qui s'en charge, elle contient des entres (convertisseurs analogique vers numrique) et des sorties (convertisseurs numrique vers analogique). La premire phase appele numrisation consiste donc passer d'un signal continu (une variation de tension lectrique) en une suite de valeurs mesures intervalles rguliers, donc discontinu.

Exemple d'une chane numrique Carte son

Convertisseur analogique vers numrique

Convertisseur numrique vers analogique

Conversion Analogique / numrique Traitement informatique Enregistrements / effets...

L'avantage du numrique, est la possibilit de lire et de dupliquer autant de fois ce signal sans aucune dtrioration, puisqu'il a t rduit en une suite de nombres stocke dans un fichier informatique! Cela dit, la compression audio comme le MP3 peut provoquer une perte volontaire du signal afin d'conomiser de l'espace de stockage (voir plus bas).

3/ CARACTERISTIQUE DU SON NUMERIQUE


3.1 Frquence d'chantillonnage (Hz):
Lorsqu'un son est numris, le signal analogique (continu) qui entre dans l'ordinateur est mesur, un certain nombre de fois par seconde (d'ou la discontinuit). Le son est donc dcoup en "tranches", ou chantillons (en anglais samples). Le nombre d'chantillons disponibles dans une seconde d'audio s'appel la frquence d'chantillonnage exprime en hertz. Pour traduire le plus fidlement possible le signal analogique de notre micro, il faudra prendre le plus grand nombre de mesures possible par seconde. Autrement dit, plus la frquence dchantillonnage sera leve, plus la traduction numrique du signal sera proche de loriginal analogique.

Une frquence d'chantillonnage faible peut convenir pour certains sons graves.

Doubler la frquence d'chantillonnage amliore la rponse dans les frquences hautes (les sons aigus).

3/ CARACTERISTIQUES DU SON NUMERIQUE


3.2 Rsolution et quantification (bit):
Une autre caractristique importante est la rsolution numrique du son, soit le nombre de niveaux ou de paliers qu'il est possible d'enregistrer pour reproduire l'amplitude du signal. Avec une rsolution de 16bit, on dispose de 216, soit 65535 valeurs possibles pour traduire l'amplitude du son. Ainsi, plus la rsolution est leve, meilleur sera la dynamique (l'cart entre le son le plus faible et le plus fort qu'il est possible de reproduire).
65535

16 bit
0

La zone bleue montre qu'en doublant la rsolution, on est plus proche de la courbe analogique, soit le signal parfait que l'on souhaite reproduire. original quantifi original quantifi

La quantification consiste en une deuxime phase ou le chiffre de l'amplitude prlev sera arrondi l'entier le plus proche.

Quelques exemples de rsolutions frquemment utilises:


- Son qualit tlphone: 8000 Hz 8bit - Son qualit radio FM: 22050 Hz 16bit - Son qualit CD: 44100 Hz 16bit - Son qualit DVD: 48000 Hz 24bit - Son audio professionnel: 96000 et 192000 Hz 24 et 32bit

Mmoire requise pour stocker un son:


Il est simple de calculer la taille d'une squence sonore non compresse en connaissant le nombre d'chantillons par seconde (frquence d'chantillonnage), la rsolution (nombre de bits sur lequel est cod un chantillon) , le temps de la squence (en seconde) et le nombre de voies utilises : poids (octet) = Frquence d'chantillonnage (Hz) x Rsolution (octet) x Dure (seconde) x Nombre de voies

Exemple: Calcul d'une seconde d'audio qualit CD


Rappel: 1octet = 8bit et 1kilo-octet (ko) = 1024 octet => Calculer le poids d'1 minute audio en 44100Hz, 16bit, stro. On souhaite une rponse en Mega Octet (Mo). 44100(hz) x 16 (bit) x 60 (sec) x 2 (voies) 44100 x 2 x 60 x 2 = 10584000 octet Conversion de octet vers Kilo-octet (Ko): 10584000 / 1024 = 10335 Ko Conversion de octet vers Mega-octet (Mo): 10335 / 1024 = 10 Mo On sait que:1octet = 8 bit, donc 16bit = 2 octets

Rsum:
- Un son, * Est un phnomne vibratoire * Se propage dans un milieu particulier (air, eau, matire...) * 3 phases pour exister: mission / transmission / rception - Ses caractristiques sont: * L'amplitude, ou l'intensit du son exprim en dcibel (db) * La frquence, rptition d'une periode dfinissant ainsi la hauteur (grave ou aigu) * La nature de son signal: analogique (variation lectrique) ou numrique (codage binaire)
- Un son numrique est traduit par : * Sa frquence d'chantillonnage, le nombre de relevs effectus chaque seconde. * le nombre de bits des chantillons, les valeurs numriques disponibles pour traduire l'amplitude du signal (8bit = 28= 256 valeurs, 16bit = 216 65535 valeurs). * le nombre de voies utilises (Mono = une voie, Stro = 2 voies, Quadriphonie = 4 voies...)

- Mmoire requise pour stocker un son non compress en octet:


Frequence d'chantillonnage(Hz) x Nombre de bits / 8 (octet) x Dure (sec) x Nombre de voies

3/ LES FORMATS DE FICHIER SON


3.1 Principaux formats de fichier non compresss: Partie en cours de rdaction... .WAVE : Mis au point par Microsoft et IBM, le format Wave PCM est le format son standard de Windows. Il
est limit un poids de 2Go. Le format "Disque compact" 44.1 kHz, 16 bits et stro nous servira de rfrence pour le calcul du poids et ratio des autres formats.

.AIFF : format de stockage des sons sur les ordinateurs Macintosh d'Apple. C'est l'quivalent du format WAV
dans le monde Macintosh. Les rsolutions de 8, 16, 20, 24 et 32 bits ( virgule flottante) sont acceptes.

.RAW : Format audio brut .AU : Le format AU est assez bien rpandu grce Unix et Linux. La frquence d'chantillonnage est
comprise entre 1 kHz et 200 kHz. Mais les applications de rendu audio ne lisent principalement que trois frquences d'chantillonnage: 8012.821Hz (codec entr), 22050Hz et 44100Hz. Les rsolutions 8, 16, 20, 24 et 32 bits (flottant) sont acceptes.

...
Pour plus d'infos: http://wiki.univ-paris5.fr/wiki/Format_de_donn%C3%A9es#Les_formats_audio

3.2 Principaux formats de fichier compresss: Partie en cours de rdaction... .MP3 :


MPEG-1/2 Audio Layer 3, format de compression trs populaire permettant d'occuper quatre douze fois moins d'espace de donn. Pour cela, certaines frquences inaudibles par l'oreille humaine vont tre totalement supprimes dans le fichier. La compression au format MP3 exploite aussi un modle psychoacoustique de l'effet dit de masque : si deux frquences d'intensits diffrentes sont prsentes en mme temps, l'une peut tre moins perue que l'autre par l'oreille, selon que ces deux frquences sont proches ou non.

.AAC:

Amlioration du format MP3, c'est le format des fichiers audio supports par Apple au sein de son baladeur numrique iPod et de son logiciel iTunes. LAAC est un format de compression audio standardis par lISO bas sur les nomes du MPEG-4, dou son nom MP4. Les frquences dchantillonnage vont de 8 kHz 96 kHz (MP3 officiel : 16 48 kHz) et il peut grer jusque 48 canaux.

.WMA :

format de compression audio propritaire dvelopp par Microsoft. Il offre la possibilit de protger ds l'encodage les fichiers de sortie contre la copie illgale par une technique nomme gestion numrique des droits (ou GND).

.OGG Vorbis (ou OGA):

formats et codecs multimdias ouverts, libres et dgags de tout brevet. Le format de compression audio Vorbis est propos par la fondation Xiph.Org. Moins populaire que le MP3, il lui est pourtant suprieur en terme de qualit poids gal.

.RA: .ra (real audio),

.rv (real video), .rm (real media), .ram (real audio metadata). Famille de codecs audio propritaires (RealNetworks). Trs ancien, il permet de diffuser de la musique sur internet en utilisant la technique du streaming.

3.3 La compression de donne: La compression de donne consiste obtenir des fichiers plus lger, afin d'amliorer la vitesse de transfert sur internet ou limit l'espace de stockage utilis sur un disque dur. Il existe deux principaux types de compression: - La compression sans perte: .zip .cab .rar .ace .7z .tar .gzip... appele aussi compactage, cette solution consiste simplement coder les donnes binaires de manire plus concise dans un fichier. Elle permet ainsi de retrouver la totalit des informations aprs une procdure de dcompactage. - La compression avec perte: .mp3 .ogg ... Concernant essentiellement les fichiers de mdia (image, son, vido), elle consiste en une rduction de l'information base sur notre propre limite de perception. Puisque l'oreille n'est pas sensible toutes les frquences audio (seulement entre 20Hz et 20KHz), et que sa sensibilit varie selon certaines d'entre elle, il est possible de rduire la quantit de donnes de telle sorte que le rsultat soit trs ressemblant l'original, voire identique, pour l'oreille humaine.