n° 2
Codage et stockage de l’audio
Sommaire
1. Codage de l’audio
1. PCM (Pulse Coded Modulation)
2. Codage psycho-acoustique
1. MP3
2. Spatialisation
3. Formats de signaux audio
2. Stockage de l’audio
1. CD (Compact Disk)
CD-DA
CD-ROM
2. DVD (Digital Versatil Disk)
Codec (codeur-décodeur)
Matériel capable de convertir des signaux audio ou vidéo de leurs formes
analogique à numérique et vice-versa
Matériel ou logiciel capable de compresser ou de décompresser des données
audio ou vidéo.
Nom générique donné aux algorithmes de compression et de décompression
Exemples de codec :
MP3 pour l'audio
DivX pour la vidéo
Stéréophonie (1960)
Objectif : restituer un relief sonore supérieur à la monophonie
Prise de son par 2 micros diffusée sur 2 canaux affectés à 2 enceintes
Perception de profondeur (demie) et d’horizontalité
Monophonie dirigée
Consiste à placer 1 micro par source
puis à mixer le son, à gauche, à droite ou au milieu (équilibrage gauche et droit)
Production de disques
Stéréophonie (10%)
Enregistrement dans les salles concerts pour une acoustique naturelle
par positionnement (crucial) des 2 micros.
Pas de post-production
Monophonie dirigée (90%)
Radio
Stéréophonie (10% : France Musique, France Culture)
Cinéma
Système Surround (Dolby) issu de la quadriphonie/tétraphonie (1970) :
2 microphones, 4 pistes pour la perception de la profondeur,
4 enceintes (dont deux placés à l’arrière)
Ambiophonie : plusieurs micro à la prise de son et mixage sur plusieurs
canaux/pistes diffusés en pentaphonie appelée 5.1 (années 90), 7.1
Quantification linéaire
Sur B bits :2B valeurs dans [-2B-1..2B-1 –1]
avec un pas de quantification constant de 1/2B
Codage non-compressif réversible
Débit et poids
Débit (b/s) = NbCanaux x B (bit) x fe (Hz)
Monophonie : 1 canal
Stéréophonie : 2 canaux
Poids (octets) = Débit / 8 (bits)
Taille du fichier en octets
Table de conversion
Codage linéaire 12 bits (-2047…+2048)
transformé en MIC 8 bits (-128…+127)
96kb/s -> 64 kb/s
Année 2008 - 2009 M1 – Conception Audio – Marie-José Caraty / David Janiszek 14
1.1. CODAGE PCM (Pulse Coded Modulation)
Codages différentiels et adaptatifs
MPEG1
Inclut la vidéo à basse définition et, paradoxalement, le son HiFi
MP3 correspond au format MPEGMPEG--1 Audio Layer 3
MPEG2
Reprend les 3 couches audio , II et III de MPEG1
avec des possibilités de fréquences d'échantillonnage plus basses,
des débits plus faibles et un nombre de canaux augmenté
L’effort porte sur le codec vidéo
Fréquence en Hz
a) Courbe seuil d’audition
b) Modification de la courbe par la présence d’un son pur
de 500Hz de 70dB
Année 2008 - 2009 M1 – Conception Audio – Marie-José Caraty / David Janiszek 17
1.2. CODAGE PSYCHO-
PSYCHO-ACOUSTIQUE
Effet de masque (2/2)
dB
Fréquence (kHz)
Pour chaque frame, le débit après compression doit avoir une des valeurs prévues
par la norme
• CBR (Constant Bit Rate) : débit constant des trames codées
• VBR (Variable Bit Rate) : les frames constituées peuvent être de débits différents,
optimisés en fonction du contenu sonore
Enjeux commerciaux
MP3 est connu comme la référence freeware de la musique en ligne
MP3 a fait l'objet d’un dépôt de brevet (Fraunhoffer, Thalès),
les droits envisagés pour des applications commerciales
telles le DVD audio-vidéo ont conduit à l'adoption du codec concurrent
Dolby AC3
Spatialisation
Par exploitation de plusieurs canaux
5.1 : 6 canaux
7.1 : 8 canaux
Principe
Compression basée sur le masquage fréquentiel
Compression par artifices techniques :
un son à émettre sur les six enceintes à la fois,
est stocké une seule fois et marqué « global »
Découpage en fragments d’environ 5 ms,
répartis sur les différentes pistes
La concurrence
MP3 (Fraunhoffer& Thalès)
Atrac (Sony)
Ogg Vorbis (freeware)
AC2, AC3, AAC, DTS (Dolby)
Musique en ligne
MP3
MPEG1
Musique – Application
CD
CD--DA – Codec
Musique T HiFi – Standard
DVD--Audio
DVD – Support physique
SA-
SA-CD
Méthode MUSHRA MUlti Stimulus test with Hidden Reference and Anchors
Test d’écoute en double aveugle, stimulus multiples, avec référence et repères
dissimulés,
mesure absolue de la qualité audio d’un codec,
Signal de référence
Signal original en largeur de bande totale
Signaux repère
Signal original dégradé dans des conditions similaires aux systèmes testés
(limitation de la largeur de bande, image stéréo réduite)
Caractéristique physiques
Diamètre (12 cm), épaisseur (1,2 mm),
Trous (largeur 0.5 microns, longueur 0.8 à 3 microns, épaisseur 0.15 microns),
Spirale unique de 5829 m (distance inter-piste 1.6 microns),
Vitesse linéaire constante (1,3 m/s)
Division en trames
Division en secteurs
Octet Contenu
0 0000 0000
1-10 1111 1111
11 0000 0000
12 Minutes (+ hex A)
13 Secondes
14 Numéro de bloc (mise à zéro à chaque seconde)
15 Mode (0 bloc nul, 1, 2)
16-2063 Données utilisateur (2048 octets)
2064-2351 Correction d’erreur + subcode channel (mode 1)
Caractéristique physiques
Diamètre (12 cm), épaisseur (0,6 mm),
Trous (largeur 0.4 microns, longueur 0.4 à 1.87 microns, épaisseur 0.15 microns),
Spirale unique de 28269 m (distance inter-piste 0.74 microns),
Vitesse linéaire constante (3,49 m/s),
Possibilité de double face, double couche
Livre A (1996)
Spécifications du DVD-ROM (4.5 GB 8.5 GB)
Livre B (1996)
Spécifications du DVD-Vidéo (4.5 GB 8.5 GB 9.4 GB 17.1 GB)
Codage image (720x576), son 3D (jusqu’à 8 pistes audio)
Livre C (1998)
Spécifications du DVD-Audio (Audio + image fixe + texte) et du DVD-AudioV (+ vidéo)
Livre D (1999)
Spécifications du DVD-R (3.9 GB normalisé)
Livre E (2000)
Spécifications du DVD-RW (4.7 GB) - plusieurs formats en concurrence
CD-audio DVD-audio