1)INTRODUCTION
Historique
1974: Sony X-12DTC
16bit, 24 canaux
Versions HR : 24bit, 24 puis 48 canaux
Philips CD100
Sony CDP-101
Aux Fe d’origine:
-16bit
- 32 / 44,1 (Rec sur DAT Pro seulement) / 48KHz
- Liaisons numériques SPDIF cuivre et optique
- Système SCMS (Serial Copy Management System)
- Liaisons numériques AES/EBU (DAT Pro seulement)
1996: DVD-VIDEO
Un nouveau format basé sur le disque optique, appelé DVD (Digital
Vidéo Disc) fait son apparition.
Il présente un certain nombre d’avantages sur le format du CD audio
– surtout l’introduction de l’audio 5.1, connu aussi comme le son
« surround »:
-cinq canaux pour haut-parleurs pleine bande
-plus un canal LFE (effets de basses fréquences) qui doit être
reproduit par un haut-parleur à basse fréquence appelé caisson de
basse.
C’est parce que presque tous les disques DVD vidéo utilisent un
système de compression des données avec perte, comme le
Dolby AC-3 (ou Dolby Digital), MPEG-1 Audio Layer II, MPEG-2,
ou DTS, de façon à insérer tout le contenu audio sur un seul disque,
à côté de l’information vidéo.
Cette compression est produite par un algorithme qui prédit quels
éléments du signal audio vous serez incapable d’entendre parce
qu’ils seront psychoacoustiquement masqués par d’autres éléments
dans le même signal. L’algorithme décide que, puisque vous ne
pouvez pas entendre ces éléments, ils n’ont pas besoin de se
retrouver dans le signal compressé.
1999: DVD-AUDIO
Il en résulta l’introduction d’un nouveau format basé sur la plate-
forme DVD, mais limité à l’audio de haute qualité et excluant presque
entièrement la vidéo.
Après des années de discussions et de réunions de comités (plus le
« crackage » du CSS), ce DVD audio fut finalisé au printemps 1999.
- Un flux DSD est très complexe voire impossible à traiter tel quel
numériquement. Par exemple une simple atténuation en numérique
génère du PCM en sortie de l’atténuateur, qui requiert un
transcodage PCM—>DSD pour profiter des conversions N/A en DSD.
LE STREAMING
Le CD est un support audio qui permet l’écoute en le lisant, mais
aussi en le « rippant » sur un NAS par exemple, ce qui est plus
confortable mais requiert de l’espace de stockage. Il peut être
conservé indéfiniment et servir d’archive (pratique quand le
stockage informatique est défaillant, quoique long à « ripper » à
nouveau). Mais il prend de la place.
À savoir :
SD = 44,1KHz/16bit
HD = 44,1KHz/24bit
UHD = Fe>44,1KHz/24bit
Mais attention, ces gros acteurs - après avoir pris le marché des
diffuseurs et même de labels (Spotify), derniers maillons de la
chaîne de production - vont chercher à la remonter.
Théorème de Shannon
Le théorème de Shannon, également appelé théorème de
l’échantillonnage, est un des fondements du traitement numérique
des signaux :
Oversampling (Suréchantillonnage)
ANALOG ANALOG
BRICK WALL A-D D-A BRICK WALL
FILTER CONVERTOR CONVERTOR FILTER
INPUT OUTPUT
C C
Fe
CLOCK
Conventional System GENERATOR
DIGITAL DIGITAL
BRICK WALL BRICK WALL
ANALOG OVER SAMPLING OVER SAMPLING ANALOG
LOW PASS A-D FILTER FILTER D-A LOW PASS
FILTER CONVERTOR CONVERTOR FILTER
INPUT OUTPUT
C C
Fe x
Sur
CLOCK
Oversampling System GENERATOR
2 - QUANTIFICATION
16bit—>65 536Q
24bit—>16 777 216Q
Fig.3 Fig.4
- Pour obtenir la qualité 16bit en sortie d’un A/D 16bit il faut atteindre
au moins une fois 0dBfs lors de la conversion, disons le Q65 536
pour simplifier.
Et ainsi de suite.
https://www.audiocheck.net/audiotests_dithering.php
3 - STOCKAGE
atténuation en analogique :
symétrique autour du 0 V.
étendue de valeurs possibles en numérique
Les mots audio négatifs sont codés en C2 des mots audio positifs :
{mots audio négatifs} = C2( {mots audio positifs} )
0111
A +B
etc.
0101 Signal A
0100
0011
0010
0001
0000
1111
1110 Signal B
1101
1100 0001 0010 0011 0011 0010
1011 + + + + +
0010 0011 0001 1110 1101
etc. = = = = =
0011 0101 0100 0001 1111
1000
Résultat : le signe des mots audio est codé par le MSB (Most
Significant Bit = Bit de poids fort) de chaque mot.
0=+
1=-
.wav
.aiff (le .wav d’Apple)
.bwf (broadcast wave format)
Originator :
Nom de la DAW qui a crée le fichier
Date et heure de création
Coding History :
Fe et Nbit explicites
B - CONVERSION D/A
La reconstruction du signal analogique à partir du signal numérique
stocké ressemble à la chaîne A/D mais avec les étapes en sens
inverse.
Fig.5
- Plus Fe est basse, plus le filtre doit résonner longtemps. Les pré-resonnances
deviennent de plus en plus audibles.
- Même avec un filtre parfait, si les échantillons ne défilent pas parfaitement
régulièrement (Clock jitter), la reconstruction sera dépendante du signal lui-
même .
.
Fig.1 Fig.6
96k/24b —> 192k/32b (ou 192k/24b tant que le 32b n’est pas
généralisé)
On ne peut pas dire que 192k/24b n’est pas supérieur à 96k/24b,
mais il ne faut pas oublier qu’on double la charge de nos outils
numériques : si on pouvait mixer 50 pistes max en 96k/24b, on
pourra en mixer au max 25 en 192k/24b (doublement de la bande
passant d’accès aux données, et de la charge de travail des plug-
ins).
Si les mots audio font n bits, le mot P fera aussi n bits (même poids).
RECORD PLAYBACK
M0 1010 M0 1010 M0 1010
M1 1110 M1 1110 M1 1110 1010
M2 —faux“ 1100
+ (modu lo 2)
M2 0110 M2 1100 M2 1100
M3 1001 M3 1001 M3 1001 M2 —vrai“ 0110
P0 1011 P0 1011 P0 1011
1010
par première admettons que à partir de cette nouvelle
somme M2 soit mal relu nouvelle recalcule
modulo 2 somme M2 —vrai“
- Le CRCC est mal relu : on présume qu’un mot est erroné dans le
bloc, on recalcule tout ce qui est possible. L’algorithme est conçu
pour que les mots corrects recalculés restent identiques.
Mot de correction Q
On fait la somme des mots, qu’on divise par une constante K’ (autre
que pour le mot Q). Le CRCC est le reste de cette division.
La série devient
M0,M1,M2,M3,P0,Q0,CRCC,M4,M5,M6,M7,P4,Q4,CRCC,M8,M9,etc
…
Entrelacement
- BITS
organisés en
- MOTS AUDIO
organisés en
- BLOCS DE CALCUL DE PARITÉ
organisés en
- BLOCS D’ENTRELACEMENT
parfois organisés en
- TRAMES (Frames)
Notons que les blocs n’étant pas numérotés, une machine lectrice
travaille « en aveugle », mais elle les remettra en ordre sans
problème.
Camouflage d’erreur
H
bits 0 1 0 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 1 0
R.Z.
N.R.Z
N.R.Z.I
F.S.K
P.S.K
P.E.
F.M.
M.F.M
Mill er
2
HDM
1
Notions :
Modulations X à Y
Ex du CD :
Combinaisons gênantes :
- Si trop de bits 1 consécutifs —> les cuvettes et les plateaux qui
représentent l’information dans le sillon seront trop petits pour un
moulage correct.
Solution :
On découpe le train binaire audio en groupes de 8 bits, à partir
desquels on crée des groupes de 14 bits répondant aux règles
suivantes :
- Il faut au minimum 2 bits 0 entre 2 bits 1
- Il faut au maximum 10 bits 0 entre 2 bits 1
Enfin, pour pouvoir repérer les mots de 14bits, et pour éviter que
deux combinaisons 14bits consécutives ne puissent enfreindre les
deux règles, on les sépare par des mots de 3bits (abc : bits de
packing) impossibles à trouver dans les combinaisons 14bits.
Codage final NRZI du bitstream modulé en EFM du CD
5) SYNTHÈSE :
Schéma de principe d'un
Enregistreur/Lecteur Numérique
Analogique Entrée Ana logique
Etage de
conversion
A-->N S&H
H
CAN
Entrée
Numérique INT
Calcul Mo ts de
redondance
Applic ation du Sché ma
Anti -err eur s
Entrelacement
Mise en form e
P.C.M.
Electr ique
Numérique SUPPORT
Remise en forme
Décryptage
Binair e
D és entrelacement
Récupéra tion du flot
audio brut V érification de
l'intégralité des données
Sortie INT
Numérique
CNA
H
Etage de S&H
conversion
N-->A
6) INTERFACES AUDIONUMÉRIQUES :
Comment transmettre en temps réel (streamer) les données d’une
machine A vers une machine B ?
SUPPORT A SUPPORT B
signal éle ctrique véritable DUB signal éle ctrique
(vidéo)
Décodage électr. Codage électr.
message binaire message binaire
(format différent)
Différentes —
options“ pour effectuer une copie
AES3 et SPDIF :
Couche logique :
- 2 canaux —> 96KHz/24bit jusqu’à 100m
- mode 20bits + Lo-Fi Channel (16KHz/12bit)
- Horloge (norme AES-11) : Grade 1 : +/- 1ppm, Grade 2 : +/- 10ppm,
Grade 3 : Varispeed +/- 12,5%
Couche physique :
En IEC-958 1 la symétrie électronique est possible.
Couche logique :
- 2 canaux —> 96KHz/24bit jusqu’à 10m
- Gestion SCMS
- Horloge (norme AES-11) : Grade 1 : +/- 50ppm, Grade 2 : +/-
1000ppm, Grade 3 : Varispeed +/- 12,5%
Couche physique :
- Version optique : connecteur Toslink + Fibre multimode —>10m
Protocole :
The data structure of the AES/EBU protocol. The data stream is stuctured in subframes,
frames and blocks.
Structure d’une subframe
Extraction des mots de User Data et Channel Data
Format d’un mot de Channel Data 192 bits
ADAT :
Couche logique :
- Liaison Self-clocking unidirectionnelle 8 canaux —> 48KHz/24bit
jusqu’à 10m
- Modes optionnels Smux1(4ch/96K/24bit) ou Smux2(2ch/192K/24bit)
- Varispeed +/- 12,5%
Couche physique :
- Liaison optique : connecteur Toslink + Fibre multimode —>10m
- Transport :
1 liaison DATA connecteur BNC sur câble RG-59/U (coaxial 75
Ohms) —>100m
+ 1 liaison Horloge : signal WORDCLOCK connecteur BNC sur câble
RG-59/U (coaxial 75 Ohms), ou liaison AES3
- Midi over Madi
SDIF-2 :
- Transport :
1 liaison DATA par canal, connecteur BNC sur câble RG-58 (coaxial
75 Ohms) —>100m
+ 1 liaison Horloge : signal WORDCLOCK connecteur BNC sur câble
RG-58 (coaxial 75 Ohms)
Sert en DSD
Problèmes d’Horloge :
ANALOG ANALOG
BRICK WALL PR E- A-D D-A DE- BRICK WALL
FILTER EMPHASIS CONVERTOR CONVERTOR EMPHASIS FILTER
INPUT OUTPUT
C C
En entrée En sortie
Dithering :
Types de dither:
- Flat dither, le meilleur est le TPDF (Triangular Probability Density
Function)
- Noise Shaped dither
- Noise Shaped dither Program-adaptive
2 bitmetres gratuits :
- Le X-ISM de SSL (qui en plus affiche la distorsion inter sample)
- Le BITTER de Stillwell Audio (qui affiche aussi la distorsion inter
sample, mais différemment)