Vous êtes sur la page 1sur 37

Audio Numérique

1 Généralités :
Le numérique a été inventé pour avoir une meilleure qualité en :
• Dynamique
• Bande passante (NB : Le meilleur HP a une Bp ≈ 85KZ).

1.1 Comparaison Analogique / Numérique :


ANALOGIQUE NUMERIQUE
Bande ~70KHz (Magnéto) Fe = 192KHz → Bp ≈ 80KHz
Passante
Dynamique ~85dB (Neve VR) • Théorique :
Saturation Résolution = Nb de bits x 6
Nb de bits x 6 = Dyn en dB
Si 16 bits : 16x6 = 96dB
0dB
Dyn ≈ 85dB Si 24 bits : 24x6 = 144dB
• Réalité : il y a du bruit de quantification.
Si 16 bits : ~ 60dB
Si 24 bits : ~ 110dB
Souffle
Limite Max = Zéro Fullscale
-------------------------------- Ecrêtage
1111111111111111
Dyn :
Headroom
*Saturation ??? 0dBFS

n. dBFS
0dB (1,23V)
Dépend des

*Souffle ?? Bruit de quantification

* = dépend des constructeurs ØØØØØØØØØØØØØØØØ

16 bits = 216 = 65536 paliers


24 bits = 224 = 16777216 paliers
THD(à 0dB) 0,1% à 0,3% ~ 0,001% (venant des convertisseurs)
+ NdB ↗ → + THD ↗
Dégradat° Wow : c’est le pleurage Jitter (Clock Jitter) : dut à l’instabilité
de bande dut aux d’Horloge.
variations de défilements
(Pitch) • C’est l’équivalence d’un pleurage pour
une grosse instabilité d’horloge.
Flutter : c’est le
Scintillements dut à • Il y à une perte des HF pour une faible
l’effet d’archet instabilité (perte de la localisation)
(sifflement)
Diaphonie ≈ -90dB
Duplication Perte par copie • Clone : copie identique.
• Clown : Copie avec des données en ± en
raison des différents formats d’interfaces.

1
Audio Numérique

Bande passante : plus on à une bande passante élevé (passage des F aigus), plus
on est précis :
• En localisation (représentation de l’espace acoustique).
• En focalisation (précision de la position de la source).

Headroom : c’est la marge qui se trouve entre le 0dBFS est l’écrêtage.

Le bruit de quantification : est dut aux erreurs de codification des très faibles
niveaux de part le trop petit nombre de palier de résolution (4 à 5 premiers
paliers).

Exemple : si on code un signal sur 2 bits (4 paliers).

11 Signal avant C.AD

1Ø Codage

Ø1
Erreur de codification

Signal restitué après C.DA


ØØ
Fe

• Si le signal est suffisamment fort, celui-ci est codé sur un grand nombre de
paliers
• Si le signal est trop faible, celui-ci est codé sur très peu de paliers, ce qui
engendre du bruit de quantification.

Respect des références entre différentes machines : si on a une sortie de


console à +4dBU qui entre dans le convertisseur d’un magnéto numérique
multipiste référencé à -18dBFs = +4dBU dont les sortie entrent dans une console
numérique référencé à -12dBFS = +4dBU, on aura un écart de -6 dB entre les 2
machine numérique.

Magnéto numérique Magnéto numérique


Console Analog multipiste Ø11Ø1 multipiste
Out = +4dBU IN = +4dBU = -18dBFS IN = -12dBFS
= Ø11Ø1 = 11ØØ1

+4dBU = 1,23V 6dBU d’écart 0,616V = -2dBU

• Il faut que les convertisseurs AD et DA est la même référence


• En générale, les références des machines numériques est de -18dBFS pour
+4dBU (il vaut mieux se référencer aux spécifications des constructeurs).

2
Audio Numérique

2 Principe d’acquisition et de restitution de l’audio numérique :


2.1 Schéma des différentes étapes :

ACQUISITION RESTITUTION
Signal analogique Support • Signal électrique Binaire
~
Etage d’entrée
Etage conversion
• Filtre anti-aliasing
(Coupe HF) Electrique → RAM

S&H • Sample & Hold (Buffer : Décodage


échantillonneur bloqueur)
C.AD • Convertisseur A/N

Ø 1 1 Ø 1 1 Ø 1 • Audio + ECC / Forme


RAM (Condo)
Ø1Ø1Ø1 • Audio Brut / Forme
RAM (Condo)
Etage Système
Anti-erreur
Etage Système • Error Concealment Code: Désentrelacement • Validation des Données
Anti-erreur 1. Détect° d’erreur (CRCC). H Mot de Parité
H ECC 2. Correct° d’erreur (Mode
de Parité)
CRCC
si erreur
• Entrelacement audio et
Entrelacement
ECC(Ex :L14/CRCC1024/R47312/L4...)
Ø1Ø1Ø1 • Audio Brut / Forme
RAM (Condo)
Ø 1 1 Ø 1 1 Ø 1 • Audio + ECC / Forme
RAM (Condo)
Etage de sortie
C.DA • Convertisseur N/A
Etage conversion • Pulse Code Modulation:
• Sample & Hold (Buffer :
RAM → électrique passé d’un état RAM à S&H Deglitcher)
un Signal électrique • Filtre de lissage
PCM
binaire (Coupe HF)

Signal analogique
Support • Signal électrique Binaire
~

Traitement Infos
Supplémentaire
Digital IN Digital OUT
Décodage PCM

3
Audio Numérique

2.2 Etage d’entré et de Sortie :

2.2.1 Etage d’entré :

~
2.2.1.1 Le filtre anti-aliasing :
S&H C.AD

Amplitude

t

۴‫܍‬

H
Si Fe ≥ 2 x F il n’y a pas d’aliasing. Si Fe ≤ 2 x F → résultante : F < F il y a alors ce
qu’on appelle l’aliasing.

C’est un repliement spectral.

5KHz 18KHz 22KHz 35KHz


Fe/2 = Fe =
20KHz 40KHz

Il y a donc un filtre coupe haut qui joue le rôle de filtre anti-aliasing pour éviter que
les fréquences > Fe/2 ne rentre dans le convertisseur.
Les filtres utilisés en numérique sont de l’ordre du 18eme voir du 20eme ordre (Filtre
Brick Wall). Cette pente fait qu’il y a une grande excursion à la fréquence de
coupure.
On va alors faire des filtres de manière à avoir l’atténuation max à Fe/2 : c’est la
fréquence de Nyquist (FNY).

Le Filtre est responsable de la THD


FMAX
୊ୣ Fe
= FNY

4
Audio Numérique

2.2.1.2 Le Sample & Hold :


C’est un bloqueur qui fonctionne à chaque top d’horloge et qui bloque (maintien) la

tension pendant pour permettre au C.AD de trouver la valeur binaire
۴‫܍‬
correspondante à cette tension au top d’horloge.

2.2.1.3 Le Convertisseur Analogique / Numérique (C.AD) :


C’est de la RAM (Condo). Il y aura autant de Condos couplés à des transistors que
de bits de codage. La tension de chaque Condo, est 2 fois plus élevée que le
précédent :
Ø1Ø1Ø1
= UTotal = 21V
32V 16V 8V 4V 2V 1V
Entre le S&H et le C.AD il y a un comparateur qui compare la tension analogique
et la tension totale chargée dans les Condos.

S&H C.AD
Quand UAnalog = UTotal
→ Déchargement des
Comparateur Condos
UAnalog UTotal

• Les différents convertisseurs :


 A rampe de tension : UTotal
UMAX
- Il part de la plus petite tension
jusqu’à UMAX des condos.
- Il va mettre un temps variable à
trouver la tension correspondante
à la tension bloquée.
- C’est un convertisseur lent.
૚ t
 A double rampe de tension : ࡲࢋ
- C’est un simple rampe de tension X2, dont le 2 eme fonctionne à
l’envers du premier (part de UMAX pour arriver à la plus petite tension.
- Ce convertisseur mettra 2 fois moins de temps pour trouver le code.
UTotal
UMAX

૚ t
ࡲࢋ
 A approximation successive (SAR) :

5
Audio Numérique

- Les condos donnent la valeur Moyenne de départ (entre UMINI et


UMAX) du C.AD, puis le comparateur indique si la tension mesurée pour
le S&H est au dessus ou en dessous de cette valeur moyenne de
départ.
- Le C.AD élimine alors la moitié des valeurs ne correspondant pas à la
tension mesurée.
- Puis le cycle recommence jusqu’à ce que la tension des condos = à la
tension mesurée par le S&H.
11111111111

S&H 1 1 ØØØØØØØØØ

1 ØØØØØØØØØØ

ØØØØØØØØØØØ

Comparateur

 Le convertisseur flash :
- Il se basse sur le même principe que le convertisseur a approximation
successive, mais avec un nombre de condo et de comparateur = au
nombre de combinaison possible.
- Ce type de convertisseur n’est pas limité en Fe (→ 192KHz).

• Les fréquences d’échantillonnage :


 Le 44.1KHz : utilisé pour le CD.
- Cette fréquence de 44.1 a été créée pour les premiers supports
d’audio numérique (Magnétoscope PCM 1630).
- Chaque changement de ligne (pair et impair entrelacées), de trame
d’image (2 par image) et de nombre d’image par seconde pouvais servir
de top d’horloge.
- Pour être compatible entre le Pal et le NTSC, la fréquence commune
est de 44.1KHz/s :

3 x 490 x 30 = 44100 (NTSC)


3 x 588 x 25 = 44100 (PAL)
Nb de Nb
Nb de
lignes d’image
Mots
utiles /s

6
Audio Numérique

 Le 32KHz : c’est un ratio numérique correspondant à 16Khz de bande


passante.
 Le 48KHz : On est passé au 48KHz pour pouvoir faire du pitching sur les
bandes sans aliasing.
- Si on fait du pitch avec une Fe de 44.1KHz sur un magnéto numérique
on génère de l’aliasing.
- En passant à 48KHz, on couvre l’augmentation de la bande passante
créée par le pitch.
 Le 11KHz et le 22,05KHz : créés pour le multimédia.
 Le 44,056KHz et le 47,958KHz : Fe pour la vidéo NTSC couleur (29,97i/s).
 Le 88,2KHz.
 Le 96KHz : pour le DVD audio (Multi canal).
 Le 192KHz : pour le DVD audio (Stéréo).

• La résolution :
 Le 16 Bits : résolution pouvant poser des problèmes de bruit de
quantification pour les bas niveaux.
- Pour résoudre se problème, on a augmenté la résolution a 24 Bits.

• Le codage négatif : pour l’amplitude négative du signal.


 Le codage Biaisé : c’est le premier codage des valeurs négatives qui a
existé.
- Exemple : sur 3 Bits.

111 → +3V
11Ø → +2V
1Ø1 → +1V
1ØØ → 0V
Ø11 → -1V
Ø1Ø → -2V
ØØ1 → -3V
ØØØ → -4V

- Le remove DC Offset remet au 0V s’il y a un signal continu.

 Signed Magnitude : on va sacrifier 1 Bit pour indiqué ±.


- Exemple : sur 3 Bits.

Ø 11 → +3V
Ø 1Ø → +2V
Ø Ø1 → +1V
Ø ØØ → +0V Problème de 2 Bits pour le 0V
1 ØØ → -0V
1 Ø1 → -1V
1 1Ø → -2V
1 11 → -3V

7
Audio Numérique

 Le complément a 1 (C1) : pour trouver le négatif d’un chiffre, il faut


inverser les Ø et les 1 par rapport au Signed Magnitude.
- Exemple : sur 3 Bits.

Ø 11 → +3V
Ø 1Ø → +2V
Ø Ø1 → +1V
Ø ØØ → +0V Problème de 2 Bits pour le 0V
1 11 → -0V
1 1Ø → -1V
1 Ø1 → -2V
1 ØØ → -3V

 Le complément a 2 (C2) (utilisé en audio) : c’est la solution pour le double


0V. Le C2 (Chiffre -) = valeur négative C1 + 1
- Exemple : sur 3 Bits. Avec le -2V

Ø 11 → +3V
Ø 1Ø → +2V
Ø Ø1 → +1V Pour trouver -2V :
Ø ØØ → +0V -2V (C1) = 1Ø1
1 11 → -1V → -2V (C2) = 1Ø1 + 1 = 11Ø
1 1Ø → -2V
1 Ø1 → -3V
1 ØØ → -4V

2.2.2 Etage de sortie :

C.DA S&H
~
2.2.2.1 Le Convertisseur Numérique / Analogique (C.DA) :
• 2 types de convertisseurs C.DA :
 A charge de circuit (Timed Integrator DAC): c’est l’inverse d’un
convertisseur a rampe.
 Weighted Current DAC : c’est un convertisseur a somation de tension des
condos. Il est assimilable à un convertisseur Flash en sortie.
= 5V

Ø 1 Ø 1

8V 4V 2V 1V

Tension constante
des Condos

8
Audio Numérique

2.2.2.2 Le filtre de lissage :


Fe/2 + Harmonique Impaire
Composante
carré du Signal
Numérique à
F = Fe/2
8V Tension restituée par les Condos
7V
Signal analogique de sortie
6V
5V Tension des
4V Condos + filtre
3V de Lissage des
2V Harmoniques de
Fe/2 = Signal
1V
analogique
0V
Transitoire = Harmonique de Fe/2

En filtrant les harmoniques, on gomme les transitoires du signal carré.


La première harmonique de FNY est K3 = 3 x FNY
Si FNY = Fe/2 = 20KHz → Harmonique K3 = Fe/2 x 3 = 60KHz.
Il faudra que l’atténuation max soit sous 60KHz.
୊ୣ
FMAX = 18KHz = FNY = 20KHz

K3 K5 K7

F
40KHz = Fe

2.2.2.3 Améliorations :
• Le Pré-emphasis (La préaccentuation en entrée d’un C.AD) :
- La fréquence max que l’on peut coder est Fe/2

߮ = 0° → NdB Signal = Max

߮ = 90° → NdB Signal = 0

0° < ߮ < 90° → NdB Signal = ↘

- En fonction de φ on aura ± d’atténuation pour les HF.


- On mettra un filtre Shelved de pré-emphasis pour remonter le niveau
des Aigus en entrés d’un C.AD.

S&H C.AD
Filtre Anti-aliasing Filtre Shelved de
Pré-emphasis

9
Audio Numérique

10,6KHz
 Filtre de Pré-emphasis : EIAJ 50/15 +10dB

6dB/Octave
0dB
3,18KHz
1,6KHz
0dB
 Filtre de Pré-emphasis : CCITT J17

6dB/Octave
-6,5dB
800Hz
• Le Dé-emphasis (L’atténuation en sortie d’un C.DA) :
- Inversement au filtre de Pré-emphasis, c’est un filtre d’atténuation des
HF qui ont été volontairement augmentées à l’étage d’entré.

C.DA S&H
Filtre Shelved de Filtre de lissage
Dé-emphasis
• Le Dithering (surtout pour 16 Bits) :
Permet de régler le problème du bruit de quantification.
 2 types de Dither :
- Analogue Dither : c’est un générateur de fréquence. Il génère des
signaux carrés, triangulaire et gaussien pour générer un bruit de
fond au dessus des 4 à 5 pallier du bruit de quantification à une
fréquence soit très haute (~18KHz), soit très basse (~20Hz).
- Digital Dither : Post conversion, on pitch le bruit de quantification
autour de la FNY.
> Les Digital Dither :
 SBM (Super Bits Mapping): c’est 1 algorithm Sony.
 IDR: algorithm Waves.
 UV22: algorithm Apogee.
 On va utiliser un Dithering des qu’on baisse en résolution.
 De manière générale, tous les faibles niveaux s’enregistrent avec un
Dithering.

• La virgule flottante (Floating Point) :


Pour codé 1 chiffre à virgule en numérique, il faudrait énormément de Bits :
8 4 2 1 0,5 0,25 0,125 .......

24 22 21 20
, 2-1 2-2 2-4 ......
- On a donc mis en place la virgule flottante : simple précision sur 32
Bits
± 37947216 . 10 437
Signe Mantisse Mantisse Exposant

10
Audio Numérique

- On aura sur 32 Bits :

1 Bit 23 Bit 8 Bit

Signe Mantisse Exposant


Mantisse
Exemple : codage de 0,19

Ø Ø Ø Ø 1 Ø Ø 1 1 Ø 1 Ø
Signe Mantisse = 19 Exposant = -2
Mantisse
=+

Exposant biaisé sur 3 Bits


111 → +3
11Ø → +2
1Ø1 → +1
1ØØ → 0
Ø11 → -1
Ø1Ø → -2
ØØ1 → -3
ØØØ → -4

- En codant la résolution avec la virgule flottante, on arrive à ~ 900dB


de Dynamique.

• L’oversampling (OS) (Le sur-échantillonnage) :


Permet de lisser les filtres à pente raide.
 En entrée :
- Conversion normale :
Stockage
B

~ S&H
H
C.AD
A
C

D
E

- Conversion avec oversampling :


Stockage très lourd Digital filter
c d j B

~ S&H C.AD b e C
i
a A E
f h
H xOS g D

OVERSAMPLING

FMAX
FNY Fe FeNY Fe x OS
- L’oversampling permet de réduire l’excursion du filtre.
- Le digital filter re-divise les points d’échantillonnages en calculant dans
les aigus ou vont les crêtes pour les garder et évité l’aliasing.

11
Audio Numérique

 En sortie :
- Conversion normale :
Stockage
B
A
C

D
E
C.DA
H
S&H
~
- Conversion avec oversampling :

Stockage OS Interpolation
BB’ B B’ E’
B A’
C CC’ E E’ C E C.DA S&H
A E AA’ A
DD’ C’
D D’
D H

> La conversion avec oversampling en


sortie, permet d’adoucir la pente du

~ filtre de lissage pour atténuer


l’excursion de la FMAX

2.3 Etage ECC : c’est le système anti-erreurs.


Etage Système Anti-erreur
Ø1Ø1Ø1 ECC Ø11Ø11Ø1
Entrelacement

2.3.1 Les sources d’erreur :


 Poussières
 Rayure
 Jitter
 Edit
 Drop Out
 Rayonnement électromagnétique.

2.3.2 Le code de détection d’erreurs (CRCC : Cyclic Rededuncy Check Code) :


Pour le CD c’est le CIRC (Cross Interleaved Reed Solomon Code).
 Dans le CRCC, il y a 1 mot CRCC pour n mot audio.
 Principe de base :
- Lors de la lecture, l’ECC crée un CRCC’ à partir de la lecture des 16
mots audio.
> Si CRCC = CRCC’ : pas d’erreurs.
> Si CRCC ≠ CRCC’ : les 16 mots audio vont à la correction
d’erreurs (ce sont les mots de parité)
2.3.3 Le code de correction d’erreurs (mot de parité) :
Il existe 2 types de mot de parité P = parité primaire. Q = parité secondaire :
ils ont la même résolution que l’audio.

12
Audio Numérique

 Le mot P
- Il y a 1 mot P pour 4 mots audio consécutifs.
PØ → MØ ; M1 ; M2 ; M3

- A la création : on a fait 1 somme binaire modulo 2 (pas de retenue)


des 4 mots audio consécutifs pour obtenir PØ.

1 2 3 4 5 6
MØ Ø 1 1 Ø 1 Ø Si erreurs à la lecture
M1 1 1 Ø Ø Ø 1 → Ø 1 Ø Ø Ø 1
M2 1 1 Ø Ø 1 Ø
M3 1 1 Ø Ø Ø 1
PØ 1 Ø 1 Ø Ø Ø

- A la lecture : on fait 1 somme binaire modulo 2 des 4 mots audio


consécutifs + PØ pour obtenir PØ’.

1 2 3 4 5 6
MØ Ø 1 1 Ø 1 Ø
M1 Ø 1 Ø Ø Ø 1
M2 1 1 Ø Ø 1 Ø
M3 1 1 Ø Ø Ø 1 Si PØ ≠ ØØØØØØ
PØ 1 Ø 1 Ø Ø Ø Il y a erreur

PØ’ 1 Ø Ø Ø Ø Ø → 1 Ø Ø Ø Ø Ø

Colonne (N°1) ou il y a une erreur

 Le mot Q :
- Il y a 1 mot Q pour 4 mots audio consécutifs dans 1 groupe de 16
mots audio (MØ à M3 pour PØ ; M4 à M7 pour P1 ; M8 à M11 pour P2 ; M12
à M15 pour P3). QØ est calculé comme PØ.

QØ Q1 Q2 Q3
PØ MØ M1 M2 M3
P1 M4 M5 M6 M7
P2 M8 M9 M10 M11
P3 M12 M13 M14 M15

- CRCC ≠ CRCC’ : Q1 détecte une erreur sur M1 et en déduit par


recoupement avec PØ’ que c’est sur la colonne 1 qu’il y a Ø au lieu de 1.
Il corrige donc l’erreur.
2.3.4 Les types d’erreurs :
 Erreurs de petite taille : elles sont corrigées par les mots de parité (grille
P/Q).

13
Audio Numérique

 Erreurs de moyenne taille : si l’erreur < à la taille de « Buffer » du lecteur,


on à :
- correction par interpolation.

Interpolation
 Erreurs de grande taille : si l’erreur > à la taille de « Buffer » du lecteur.
- Mute du C.DA.
- Il augmente la vitesse de lecture pour trouvé une donné lisible.
- Quand il trouve un échantillon valide, il dé-mute le C.DA.

2.4 Etage de conversion RAM en signal électrique PCM :

Ø11Ø11Ø1 PCM Support

Etage conversion
RAM → électrique

2.4.1 Le PCM (Pulse Code Modulation) :


Il permet de passer de la forme RAM à 1 signal électrique carré.
 Il définit électriquement le « Bit Cell » (Laps de temps que dure 1 Bit).

1 Ø 1 Ø 1

Bit Cell

Fe x résolutions = H de Bit Cell


 Il définit le clock (passage entre 2 Bits) : Il peut être « Self Cloqué » ou
non. Le PCM est responsable de la présence ou non du clock.
 Il a 2 principales contraintes :
- Fréquence trop élevé : + la forme d’onde est complexe + la fréquence
est élevée. Cela définit la bande passante qui doit être adaptée au
support.

- Fréquence trop basse : - la forme d’onde est complexe – la fréquence


est élevée. Cela définit la bande passante qui doit être adaptée au
support.

Si la fréquence est trop basse = composante continu.

14
Audio Numérique

2.4.1.1 Le PCM RZ : Remise à Zéro


 Principe : 3 tensions possibles.
- 1 tension + = 1
- 1 tension - = Ø
- 1 état (tension 0V) = Bit Cell

Ø 1 Ø 1 1 1 Ø Ø Ø

 Problèmes du PCM RZ :
- 1 fréquence élevée.
- Le 0V : impossibilité de réenregistrer sur un magnétoscope (pas
d’effacement de l’info 0V précédemment enregistrée).

 Le RZ a été le premier inventé mais n’est pas utilisé.

2.4.1.2 Le PCM NRZ : Non Remise à Zéro


 Principe : 2 tensions positives.
- 1 tension UX = 1
- 1 tension UY = Ø

Ø 1 Ø 1 1 1 Ø Ø Ø

Run Length
 Problèmes du PCM NRZ :
- Tension continu : nécessite un haut débit.
- Non self cloqué : du fait de l’instabilité d’ H des machines.
> S’il y a entre 13 et 20T de tension continu consécutive, les
machines perdent le clock.
> Pour déterminer si le PCM est self cloqué ou non, il faut déterminer
le laps de temps pendant lequel on est en courant continu. C’est le
« Run Length » mini / maxi définit.

Run Length maxi (RLMAX) < 13T + Run Length mini connut
→ Self cloqué.

Run Length mini (RLMINI) = T (1/2 T physique) + Run Length maxi inconnu
→ Non self cloqué.

Il faut donc toujours avoir un clock présent.

15
Audio Numérique

 Utilisation du PCM NRZ pour : Magnéto (PCM 1630 ; DAT ; ADAT ; DA).
- Pour ces supports, le clock est fait avec le changement de ligne
vidéo :
> Black Burst = changement de trame.
> Top ligne = changement de ligne.
- Tous les signaux numériques à destination de support vidéo sont
automatiquement en NRZ (comme le VITC).
- Ce PCM fonctionne bien avec les bandes magnétiques, car :
> FMAX sera quand on a une succession de Ø 1 Ø 1. (~ 10MHz)
> Et dés qu’il y a une succession de Ø Ø 1 1 Ø Ø, on divise par 2
la FMAX (on descend d’une octave).
- En MIDI (Câble), le NRZ est cadencé grâce au Bit Start et au Bit Stop
(tous les 8 Bits).

2.4.1.3 Le PCM NRZI : Non Remise à Zéro Inversé


 Principe : comme le NRZ il y a 2 tensions positives.
- Changement de tension quand il y a : 1
- Pas de changement de tension quand il y a : Ø

Ø 1 Ø 1 1 1 Ø Ø Ø

T
- RLMAX = ? et RLMINI = T → PCM Non Self Cloqué.

 Utilisation du PCM NRZI pour : CD et DVD.

2.4.1.4 Le PCM FSK: Frequency Shift Keying


 Principe : c’est un sinus (partie positive et négative) composé de 2
fréquences pour faire des sauvegardes de signaux carrés numériques
sur des magnétos analogiques.
- 1 fréquence x = Ø
- 1 fréquence 2x = 1
- Le passage à 0 = T

Ø 1 Ø 1 1 1 Ø Ø Ø
0

 Utilisation du PCM FSK avec : Magnéto Analogique.

16
Audio Numérique

2.4.1.5 Le PCM PSK: Phase Shift Keying


 Principe : c’est un signal pour la transmission hertzienne de l’audio
numérique. Il fonctionne par inversion de phase :
- QPSK (Quadrature Phase Shift Keying) : adaptation du PSK en codant
les Ø et les 1.
- C’est du Group Code : codage avec 2 signaux (Bits 2 par 2)

Ø Ø (࣐ = 0°)

Ø 1 (࣐ = 90°)

1 Ø (࣐ = 180°)

1 1 (࣐ = 270°)

 Utilisation du PCM PSK pour : Transition Hertzienne.

2.4.1.6 Le PCM PE: Phase Encoding


 Principe : il est utilisé pour les transmissions GPS :
- Ø = Transition ↓ en milieu de Bit Cell.
- 1 = Transition ↑ en milieu de Bit Cell.
- Pour les suites de Ø et de 1 = Transition ↑ ou ↓ en frontière de Bit
Cell.

Ø 1 Ø 1 1 1 Ø Ø Ø

T T/2

- RLMAX = T et RLMINI = T/2 → PCM Self Cloqué.

 Utilisation du PCM PE pour : GPS.

2.4.1.7 Le PCM FM: Frequency Modulation


Il s’appelle aussi : Bi-phase Mark / Code Bi-phase / Code Manchester.
 Principe : c’est le signal audio numérique self cloqué le plus utilisé.
- Ø = pas de Transition.
- 1 = Transition en milieu de Bit Cell.
- Transition en frontière de chaque Bit Cell.

17
Audio Numérique

Ø 1 Ø 1 1 1 Ø Ø Ø

T T/2
- RLMAX = T et RLMINI = T/2 → PCM Self Cloqué.

 Utilisation du PCM FM pour : AES / EBU – SPDIF – LTC - Disque Dur (+


modulation).

2.4.1.8 Le PCM MFM: Modified Frequency Modulation


Il s’appelle aussi : Code Miller.
 Principe : utilise du NRZI (1 cloqué ; Ø non self cloqué).
- Changement de tension quand il y a : 1
- Pas de changement de tension quand il y a : Ø
- Suite de Ø = Transition en frontière de Bit Cell.

Ø 1 Ø 1 1 1 Ø Ø Ø

2T T
- RLMAX = 2T et RLMINI = T → PCM Self Cloqué. (RLMAX fait chuter la F).

 Utilisation du PCM MFM pour : Magnéto Pro-digital (+ modulation).

2.4.1.9 Le PCM Miller Square (Miller2):


 Principe : évolution du MFM.
- Changement de tension quand il y a : 1
- Pas de changement de tension quand il y a : Ø
- Suite de Ø = Transition en frontière de Bit Cell.
- Suite de 1 = Dernière Transition omise.

Ø 1 Ø 1 1 1 Ø 1 Ø Ø Ø

T 3T
- RLMAX = 3T et RLMINI = T → PCM Self Cloqué.

 Utilisation du PCM Miller2 pour : Magnéto Numérique 3M (32 pistes).

18
Audio Numérique

2.4.1.10 Le PCM HDM1: High Density Modulation


 Principe : Group Code.
- Si Ø 1 : Transition en milieu du Bit Cell 1
- Si suite de 1 :
> Par paquet de 2 : Transition en frontière de paquet
> Suite impair : dernier paquet = paquet de 3
- Suite de Ø :
> Par paquet de 4 : Transition en frontière de Paquet
> Par paquet de 4 suivi d’un 1 : transition en milieu du 3eme Bit
Cell Ø

Ø 1 Ø 1 1 1 1 1 1 1 Ø1 ØØ ØØ Ø ØØØ 1

1,5T 4,5T
- RLMAX = 4,5T et RLMINI = 1,5T → PCM Self Cloqué.

 Utilisation du PCM HDM1 pour : ??? (+ modulation).

2.4.2 Modulations X à Y :
Elles permettent d’adapter 1 PCM à 1 support (suivant les contraintes de
bande passante de se support).
2.4.2.1 Modulation 8 à 14 : modulation EFM du CD
 Problèmes du CD :
- Casse lors du pressage pour le CD : pour le NRZI les suites de
1demande une F ↗ ce qui implique de très petit détail sur la surface du
« Glass Master ». Quand on démoule ce dernier, il risque d’y avoir des
cassures sur les détails.
- Le NRZI est non Self Cloqué : suite de Ø > à 13.

La Modulation 8 à 14 est là pour résoudre ces 2 problèmes.

 Principe :
- Segmentation du NRZI en groupe de 8 Bits (256 possibilités).
- Création de combinaisons de 14 Bits correspondant aux groupes
de 8 Bits du NRZI (16384 combinaisons possibles).

Bit de poids Fort Bit de poids faible

1Ø11Ø111 Ø11Ø11Ø1 (16 Bits de départ)

1ØØØ1ØØ1ØØØ11Ø ØØ11Ø1ØØ1Ø11Ø1 (2 x 14 Bits)

19
Audio Numérique

> Sur les 16384 combinaisons possibles :

 On enlève les combinaisons de plus de 10 Ø consécutifs.


 On enlève les combinaisons de moins de 2 Ø consécutifs.

► Il reste alors : 277 combinaisons

(Quand le lecteur CD lit les combinaisons de 14 Bits, il comprend et


décode des groupes de 8 Bits des 16 Bit de départ).

- Pour éviter la suite de 10 Ø entre 2 groupes de 14 Bits à la suite, on


va mettre 3 Bits de « Packing » entre 2 groupes de 14. Ces 3 Bits de
« Packing » dépendent du groupe de 14 précédents et du groupe de
14 suivant.

> On aura au total : 17 Bits représentant un groupe de 8 Bits de


départ.

Toutes les autres modulations fonctionnent sur le même principe d’ajout et de


retrait de Bits.

2.4.2.2 Modulation 8 à 10 : modulation du DAT


 Problèmes du DAT : utilise le NRZ
- Les suites de Ø et de 1 créent des composantes continues.
- Les changements entre Ø et 1 créent une F trop élevé.

2.4.2.3 Modulation 2 à 3 : modulation du Disque Dur


 Problèmes du Disque Dur : utilise le FM
- Les suites de 1 créent des F trop élevées.
> Solution : mettre un Ø entre Chaque Bit.

2.4.2.4 Modulation 4 à 5 : modulation de l’interface MADI


 Principe du MADI : utilise le NRZI
- Besoin de véhiculer 64 canaux dans un seul câble jusqu’à 96KHz.
- Le NRZI est la F la plus faible, ce qui permet de pouvoir ↗ F pour
véhiculer 64 canaux.
> Solution : avec des statistiques, on a établie qu’elles étaient les
bonnes combinaisons pour avoir la F la plus élevé possible pour
le MADI.

2.4.2.5 Modulation 4 à 6 : modulation du Pro-Digital


 Principe du Pro-Digital : utilise le MFM
- il y a 32 pistes sur le Pro-Digital ce qui provoque une F élevé.
> Solution : faire chuter la F du signal avec une modulation.

20
Audio Numérique

3 Les interfaces : entre 2 machines audio numérique


Pour faire 1 copie entre 2 machines numériques, il y a plusieurs
possibilités :

Machine B Machine A

Signal analogique Support


~
Etage d’entrée
Etage conversion
Electrique → RAM

S&H Décodage

C.AD
Ø11Ø11Ø1
Ø1Ø1Ø1

Etage Système
Anti-erreur
Etage Système 1 Désentrelacement
Anti-erreur
3 CRCC
ECC 2
Entrelacement
Ø1Ø1Ø1

Ø11Ø11Ø1
Etage de sortie
C.DA
Etage conversion
RAM → électrique S&H
PCM

Support Signal analogique

Traitement 4 Infos
Supplémentaire
Copie Numérique
Décodage PCM
Interfaces

21
Audio Numérique

1 Faire une copie entre C.DA et C.AD est mauvais : c’est une copie
analogique.

2 Faire une copie entre 2 supports s’appelle le Dub Vidéo (c’est un Clone) :
s’il y a une erreur sur A on aura la même erreur sur B

3 Faire une copie entre 2 ECC s’appelle le Dub Numérique : c’est un transfert
entre RAM des 2 machines. Elles doivent avoir le même langage

4 Copie Numérique : c’est le transfert via une interface entre 2 machines qui
n’ont pas spécialement le même langage.

 En fonction des Interfaces (SPDIF ; AES/EBU ; ...), on pourra véhiculer :


- SPDIF : Audio +Index (CD).
- AES / EBU : Audio uniquement (CD).

 Quand on parle d’interface : on parle de la traduction du langage et du


câble qui véhicule se langage.

3.1 Généralités Techniques de l’interface

Ø 1 Ø 1 Ø ---16 Bits Audio---


A B
En série à 16 x Fe

Sérialiseur Paralléliseur

 On véhicule de l’audio + des infos supplémentaire :


- L’AES / EBU véhicule des paquets de 32 Bits par canal (32 x Fe).

 Le multiplexage permet de véhiculer dans le même câble les paquets de


2 canaux :

A L/R/L/R/L/R B

Fe

- On a donc : (32 Bits pour L + 32 Bits pour R) x Fe = 64Fe


- On ajoute ensuite : la fréquence de Modulation (et ainsi de suite) pour
arriver à une fréquence = ~ 10MHz
- Il sera donc nécessaire d’utilisé le bon câble d’interface pour ne pas
perdre en bande passante.
- En plus du multiplexage, il y a les données qui sont entrelacées : on
aura un léger ∆t (zone tampon).

22
Audio Numérique

3.2 L’AES / EBU (1983) :


(En français : AES / UER) (En terme technique : IEC 958I).
C’est l’interface audio numérique de référence professionnelle.
C’est la seule interface qui exige une certaine qualité d’ H .
3.2.1 Caractéristiques de bases :
 Interface 2 canaux multiplexés.

 Canaux transmit par 1 signal électrique véhiculé sur un câble symétrique


(XLR).

 Impédance = 110Ω.

 Liaison garantie sur 100m.

 Bande passante = 100MHz :


- Si on utilise un autre câble avec une bande passante plus faible, on
risque de perdre en HF : Perte du signal carré.
> Perte des transitoires = perte du Jitter (clock)

Perte des transitoire

 Utilisation du Bi-phase Mark EFM : Self Cloqué


- Il faut quand même configurer les H des 2 machines.

 Les 2 tensions électriques du signal carré :


- Avant 1985 : 3V (= Ø) et 10V (= 1)
- Après 1985 : 2V (= Ø) et 7V (= 1)
- ∆U de 0,2V pour détecter la transition entre Ø et 1

 Caractéristiques d’ H :
- Machine 44.1 à 48KHz : Jitter Max = 20ns
- Machine 96KHz : Jitter Max = 10ns
- Machine 192KHz : Jitter Max = 5ns

Jitter

- Caractéristiques H Possibles :
> L’AES / EBU est capable de faire toutes les résolutions existantes.
> Il existe 3 AES / EBU :
 AES / EBU 1 : 48KHz max.
 AES / EBU Speed : 96KHz max / 24 Bits.
 AES /EBU Wide : 192KHz max / 24 Bits.

23
Audio Numérique

3.2.2 Structure d’1 paquet AES / EBU :


 1 paquet AES / EBU est une Trame L ou R

 1 trame AES / EBU fait 32 Bits

 Dans ces 32 Bits il y à plusieurs paquets :


1- Paquet de Synchro : 4 Bits de début de message pouvant avoir 3 types
de viol électrique (état) :
- Etat du type de trame L
- Etat du type de trame R
- Etat du block de statu (Bit C) : toutes les 192 trames (96 L / 96 R)

2- Paquet de Bit auxiliaire : 4 Bits pour étendre les Bits audio à 24 (ou >
20). Si on est en 16 Bits, les 4 Bits auxiliaire + les 4 Bits restant (17 à 20)
permettent de faire un 3eme canal en basse définition.

3- Paquet de Bit audio pure : 20 Bits.

4- Paquet de Bit de statu : 4 Bits :


- Bit V : Bit de validité (Ø = valide ; 1 =non valide)
- Bit U : User Bit (utilisation libre pour les utilisateurs).
- Bit C : Bit de Block de statu : bufférisé à chaque trame toutes
les 192 trames = 192 Bits C = 24 Octet (Block de statu) (voir
tableau du block de statu pour détails) ►
- Bit P : Bit de parité primaire : correction de l’audio.

► 192 Bits C = 24 octet = block de statu (tableau détaillé).

N° Fonction N° Fonction du Code


Fonction Code Bits
Octet N° Octet Bit N° Bit Bits
Gestion du Ø Trame SPDIF
0
Bloc de statu 1 Trame AES / EBU
Gestion des Ø Mode Audio
1
Modes Audio 1 Mode Non audio (bloque les convertisseurs)
ØØØ Pas d’indication de PE / DE
1ØØ Pas de PE (aucune sélection manuel)
11Ø PE = EIAJ 50/15ߤs (aucune autre sélection)
Gestion des
111 PE = CCITT J17 (aucune autre sélection)
2/3/4 Bits de pré-
Données emphasis (PE) ØØ1
0 de gestion Ø1Ø
Réservé
principale Ø11
1Ø1
Gestion de la Ø Fe source verrouillée
5 fiabilité de Fe
1 Fe source non verrouillée
source
Non spécifier (48KHz / défaut ; sélect
ØØ
manuel)
Gestion du
6/7 Ø1 48KHz (uniquement)
type de Fe
1Ø 44.1KHz (uniquement)
11 32KHz (uniquement)

24
Audio Numérique

N° Fonction N° Fonction du Code


Fonction Codage Bits
Octet N° Octet Bit N° Bit Bits
ØØØØ Mode non indiqué (2 canaux / défaut)
ØØØ1 Mode 2 canaux (double mono)
ØØ1Ø Mode 1 canal mono (48KHz → 96KHz)
Mode primaire / secondaire pour archivage
de donnés (canal 1 = primaire / canal 2 =
ØØ11
Gestion de secondaire) : x 2 les donnés sur Trame A et
0/1/2
l’utilisation des B (50% de redondance)
/3
canaux audio Ø1ØØ Mode stéréo (canal 1 = L / canal 2 = R)
Ø1Ø1
Mode :
à Réservé
gestion des
1 111Ø
bits
Vecteur sur Byte 3 (Octet N°3) : indique le N°
utilisateurs 1111
de piste en multipistes
ØØØØ Aucune donné utilisateur (par défaut)
Création d’1 block U (192 Bits bufférisés
ØØØ1
toutes les 192 Trames : infos d’index)
4/5/6 Gestion de Bit ØØ1Ø Paquet HDLC (AES 18)
/7 U (User Bit) ØØ11 Définit par l’utilisateur
Ø1ØØ
à Réservé
1111
Bit auxiliaire non définit (échantillon de 20
ØØØ
Bits audio Max)
Bits auxiliaire utilisé (échantillon de 24 Bits
ØØ1
audio)
eme
Bits auxiliaire utilisé pour 3 canal basse
Gestion des Ø1Ø
0/1/2 résolution (échantillon de 20 Bits audio Max)
Bits auxiliaires
Réservé pour des applications définis par
Ø11
l’utilisateur
1ØØ
Poids du à Réservé
2 111
mot audio
Poids des Mots Poids des Mots
(Mode 24 Bits) (Mode 20 Bits)
ØØØ Non indiqué Non indiqué
Gestion du
ØØ1 23 Bits 19 Bits
3/4/5 type de
Ø1Ø 22 Bits 18 Bits
résolution
Ø11 21 Bits 17 Bits
1ØØ 20 Bits 16 Bits
1Ø1 24 bits 20 bits
6/7 Bits réservés
3 Codage du N° de piste : Cible des Bits 0/1/2/3 de l ’octet N°1
4 Identification de réf. synchro AES11 ou Réservé
5 Réservé
6/7/8/ Identification de la source : permet un Routing automatique des signaux (4 octet d’ACII 7 Bits,
9 sans parité)
10/11/ Identification de la destination : permet un Routing automatique des signaux (4 octet d’ACII 7
12/13 Bits, sans parité)
14/15/ Tachymétrie : décompte des Samples : Code d’adressage des échantillons en local
16/17 (comptage à partir d’un moment arbitraire) (mot de 32 Bits)
18/19/ Tachymétrie : décompte des Samples : Code d’adressage des échantillons Time Code
20/21 (comptage des mots audio → recalcule du TC) (mot de 32 Bits)
Drapeau de fiabilité de statu du canal : Bits de parité P du block de statu pour correction
22
d’erreur (check les octets N°0 à 21)
23 CRCC de l’AES

25
Audio Numérique

3.3 Le SPDIF (Sony Philips Digital Interface) :


(En terme technique : IEC 958II ou EIAJ CP 340).
C’est l’interface audio numérique grand public de l’AES / EBU (Platine CD).
C’est une interface qui n’a aucune exigence de qualité d’ H .
3.3.1 Caractéristiques :
 Interface 2 canaux multiplexés.

 Canaux transmit par :


- Soit 1 signal électrique véhiculé sur un câble asymétrique
(connectique RCA et câble coaxial)
> Impédance = 75 Ω.
- Soit 1 signal optique véhiculé par un câble Toslink.

 Liaison garantie sur 100m.

 Les 2 tensions électriques du signal carré :


- 200mV (= Ø)
- 500mV (= 1)
 Caractéristiques d’ H : 48KHz max (officiellement)

3.3.2 Structure d’1 paquet SPDIF :


 Identique à l’AES / EBU sauf :
- Bit N° 0 de l’octet N° 0 = Ø (indique le mode SPD IF)
- Bits de l’Octet N° 1 (User Bits) sont normalisés
3.4 Le SDIF (Sony Digital Interface) :
Existe sous 2 versions : SDIF2 (1ère version) et SDIF (2ème version)

3.4.1 SDIF2 : Interface stéréo non self cloqué.


 Canaux transmit par : 3 BNC (1 par canal + clock)

 Utilise le NRZ (0V ; 5V)

 Résolution = 20 Bits

 Fe = 44.1KHz (44.056KHz pour NTSC couleur)

3.4.2 SDIF : Interface pour multipiste Format DASH (1er DASH : PCM 3324).
 Canaux transmit par : SUB D25 (24 canaux + 1 masse) + 1 BNC pour le
Clock

 Utilise le NRZ.

 Résolution = 20 Bits

 Fe = 48KHz (47.95KHz pour NTSC couleur)

26
Audio Numérique

3.5 Le MELCO (Interface Mitsubishi):


Interface au format Pro-Digital de plusieurs familles : Dub A ; Dub B ; Dub C
 Dub A et B : Multi canal
- Canaux transmit par 1 SUB D50.
> Dub A : 16 canaux de 1 à 16.
> Dub B : 16 canaux de 17 à 32.
 Dub C : stéréo
- Canaux transmit par : SUB D25 pour les 2 canaux

 Clock véhiculé dans les SUB D25 et 50.

 Utilise le NRZ.

 Résolution = 20 Bits

 Fe = 44.1KHz et 48KHz (évolution à 96KHz pour peu de magnéto)

3.6 Le MADI (Multi Channel Audio Interface): Interface très professionnel


 Interface multi canal.

 Canaux transmit par 1 signal électrique véhiculé sur BNC coaxial

 Impédance = 75Ω.

 Liaison garantie sur 50m.

 Utilisation du PCM NRZI modulé de 4 à 5 :


- non Self Cloqué : Clock sur BNC supplémentaire

 Les 2 tensions électriques du signal carré :


- 0,4V (= Ø) et 0,6V (= 1)
- ∆U de 0,2V pour détecter la transition entre Ø et 1

 Caractéristiques :
- Dans un 1er temps : 56 canaux
> Résolution = 24 Bits
> Fe = 48KHz
- Dans un 2eme temps : 64 canaux
> Résolution = 24 Bits
> Fe = 96KHz

3.6.1 Structure d’1 paquet MADI :


 Identique à l’AES / EBU sauf :
- 3 états électriques :
> 1er état : Trame 1 (block de 56 trames = 56 canaux)
> 2eme état : Trame 2 (block de 56 trames = 56 canaux)
> 3eme état : Toutes les 192 trames = block de statu de 24 octets.
27
Audio Numérique

3.7 Le MEL 2 (Y-2) (Yamaha).


 Interface stéréo.

 Canaux transmit en 32 Bits virgule flottante par DIN 8 broches


3.8 Le D-Bus (AKAY).
 Interface stéréo.

 Canaux transmit en 24 Bits / 48KHz par DIN 9 broches


3.9 Le LDI (Lexicon Digital Interface).
 Interface stéréo 100% compatible SDIF2 (c’est du SDIF2 rebaptisé LDI)
3.10 L’ADAT DIF (ALESIS).
 Interface 8 canaux.

 Canaux transmit par 1 signal optique véhiculé par un câble Toslink.


- Il est Self cloqué (Clock vidéo)

 Caractéristiques :
- Résolution = 24 Bits Max
- Fe :
> 1ère version = 48KHz max (8 canaux)
> 2eme version = 96KHz (4 canaux) (c’est du SMUCS ADAT)
> 3eme version = 192KHz (2 canaux) (c’est du SMUCS 2 ADAT)

3.11 Le TDIF (Tascam Digital Interface).


 Interface 16 canaux. (8IN / 8OUT)

 Canaux transmit par SUB D25.


- Il est non Self cloqué

 Caractéristiques :
- Résolution = 24 Bits Max
- Fe = 48KHz à 96KHz

4 Les supports professionnels:


4.1 Le DASH (Digital Audio Stationary Head)
Magnéto divisé en 2 sous catégorie :

4.1.1 DASH Q (Quartet = ¼ de pouce):


 Magnéto stéréo dédié au Mastering.

 2 modes de fonctionnement :
- Normal : 4H d’audio
- Twin DASH : 2H d’archivage (couché en double : R1 ; R2 / L1 ; L2)

28
Audio Numérique

4.1.2 DASH H (Half = ½ de pouce):


 Magnéto multipiste (24 / 48 pistes).
- DASH H1 (3324) : 24 pistes
- DASH H2 (3348) : 48 pistes

 Fonctionnement :
- En vitesse rapide : 1H d’audio
- Bande spéciale numérique (manipulation avec précaution).
- Pistes annexes supplémentaires analogiques :
> 1 piste LTC
> 1 piste de couchage de l’audio pour pouvoir faire du montage.
> 1 piste de « Control Track » pour enregistrer l’ H audio
numérique sous forme de pattern de synchro. Il y a 2 modes :
 Mode assemble = Rec Audio + « Control Track » (lors du 1er
enregistrement).
 Mode Insert = Rec Audio + lecture de la synchro « Control
Track » (pour les enregistrements suivant).

 Nettoyage des Tête : ce sont des têtes stationnaires. Ne jamais les


nettoyer à l’alcool. (valable pour DASH et Pro-Digital)

 Entrés / Sortie :
- Interface d’Entrés / Sortie en SPDIF.
- World Clock BNC.
- XLR IN / OUT: Time Code Reshipped.
- 2 IN / OUT: Analog Track.

4.2 Le Pro-Digital (Mitsubishi)


Magnéto divisé en 3 versions:
- ¼ pouce : stéréo.
- ½ pouce : 16 pistes.
- 1 pouce : 32 pistes.

 Fonctionnement :
- Codage du signal en MFM self Cloqué avec une modulation de 4 à 5.
- Mode 3 vitesses :
> Mode 1 (Montage) : 38cm/s pour 2H en 16 Bits / 44.1KHz ou
48KHz.
> Mode 2 (Lent) : 19cm/s pour 4H (pas d’intérêt).
> Mode 3 (Rapide) : 76cm/s pour 1H en 20 Bits / 44.1KHz ou 48KHz.
- Pistes annexes :
> 1 piste Time Code.
> 1 piste « Cue Track » : Piste de repérage
 Sur ¼ pouce : Piste analogique
 Sur multipiste : Piste numérique (encodage sur 12 Bits avec un
signal PWM pour faire du Scrubbing).

29
Audio Numérique

> 8 pistes pour les Bits de parité : 4 pistes pour P + 4 pistes pour Q
(permet la correction d’erreur en cas de montage).
> 2 pistes auxiliaires numériques (Cue Track) identiques aux
autres pour coucher le Mix via une sortie en Dub C.

 Entrés / Sortie :
- Interface MELCO d’Entrés / Sortie en Dub A ; Dub B ; Dub C.
- 1 IN Time Code en XLR
- 1 OUT Time Code en XLR
- 2 IN Cue Track en XLR
- 2 OUT Cue Track en XLR

4.3 Le Nagra Numérique (fabriqué par firme Kudelski)


C’est un magnéto 2 pistes portatif de reportage. Il existe avec 2 types de
technologie :
 A bande : ¼ pouce (tête rotative).

 A disque dur : aujourd’hui avec disque dur à cartouche.

 Fonctionnement :
- Jusqu’à 4 canaux en vitesse rapide (2H en 2 canaux ; 1H en 4 canaux)
- Résolution : 24 Bits
- Fe = 96KHz
- Possibilité de mettre des metadata en RAM :
> N° de prise
> Durée
> Infos d’EDL (Edit Décision List) dans les User Bits : ce sont des
infos de montage (Point de Locator pour la playlist).
> Rapport d’erreur ECC.

5 Les supports semi-professionnels:


5.1 L’ADAT: C’est le 1er magnéto multipiste numérique.
 Fonctionnement :
- Cassette S-VHS
- 8 pistes
- Résolution = 20 Bits
- Fe = 44.1KHz ou 48KHz.

 Nettoyage de Tête : c’est une têtes rotative. Nettoyage avec un papier


type Post-It imbibé d’alcool à 90°.
5.2 Les DA (38; 88; 98) (Tascam)
 Fonctionnement :
- Cassette HI8 (sur 180m on Rec 110mn)
- Nombres de pistes dépend du type de DA
- Résolution = 16 Bits Max (24 avec carte optionnel)
- Fe = 44.1KHz ou 48KHz.

30
Audio Numérique

5.3 Le DAT (ou RDAT: Rotary Digital Audio Tape)


C’est un mini (magnétoscope) 2 pistes prévue pour le grand public.
 Fonctionnement :
- 2H en stéréo
- Résolution = 16 Bits
- Fe = 48KHz (possibilité : 44.1KHz / 32KHz)
- 33ms de ∆t entre le moment d’application de l’index et le moment
d’inscription réel.
- Vitesse de bande :
> Rembobinage à 200 x la vitesse.
> Vitesse de bande en lecture : reste fixe en fonction de Fe.
> Vitesse de rotation tête : varie en fonction de Fe.
- Pour le Rec : laisser 1mn de bande vierge.

 La Bande du DAT :
- Possède 2 pistes linéaires pour le LTC.
- Piste Vidéo pour l’audio ont 6° d’inclinaison :

5.4 Le CD :

Zone de Lead In Sillon Lead Out


Clamping (Toc) Pas Audio + Pas
(Vide) d’audio CRCC d’audio
5.4.1 Le CD DA (CD Digital Audio) :
Se fabrique par pressage. Il vient de la norme Read Book (1979) : 99 Tracks
possibles contenant chacune 99 sous Track.
 Durée Max : 74mn et 16s. (mis en place pour les audiophiles)
 Du Lead In au Lead Out : structure fixe de Trames :
 Chaque Trame fait 136ࣆs.

5.4.2 Fonctionnement :
 2 principes pour les Trames :
- Le CAV (Constant Angular Velocity) : Modifie la taille des Trames en
fonction du centre et de la périphérie du CD.
- Le CLV (Constant Linear Velocity) : pour le CD. Garde la taille des
Trames fixe, mais modifie la vitesse de rotation (au centre : 500tr/mn ; en
périphérie : 200tr/mn).
 PCM du CD : NRZI modulé EFM 8 à 14

31
Audio Numérique

 Principe de lecture :

CD Vue de dessous

PIT BUMP
Pas de sillon = 1,6ࣆ࢓
0,4ࣆ࢓ BUMP PIT Trames

BUMP PIT

CD Vue en coupe
1 Ø 1 Ø 1
Pit Pit
12ࣆ࢓
BUMP BUMP BUMP

Réflexion (0,4ࣆ࢙ de retard pour Pit)

Source LASER Prisme

- Lecture des Ø et des 1 :


> Sous le CD il y a une lentille avec une source Laser.
> Le CD renvoie la lumière sur un prisme.
> Le temps entre l’envoie et le retour est mesuré.
> Si le retard est de 0,4ࣆ࢙ = Ø

- Passage d’un sillon à l’autre :


> Il y a 3 faisceaux laser de 1,6ࣆ࢓ calibrés pour que :
 Le faisceau Amont frappe sur le pas de sillon de 1,6ࣆ࢓ avant
lecture.
 Le faisceau Central de 1,6ࣆ࢓ frappe sur la Trame de 0,4ࣆ࢓.
 Le faisceau Aval frappe sur le pas de sillon de 1,6ࣆ࢓ après
lecture.
> Amont + Aval (en opposition de phase) = 0

32
Audio Numérique

 Contenu d’une Trame dans l’ordre suivant :


- 27 Bits de pattern de synchro pour indiquer le début de Trame.
- 1 mot EFM : mot de Sub code de 8 Bits
PT
P et Q : utilisé par la norme Read Book
QU
R à W : utilisé pour texte (libre) RV
SW
- 12 mots audio multiplexés et entrelacés (L / R / L / R / ...).
- 4 mots Q (Bits de parité secondaire) (correction d’erreur de trame).
- 12 mots audio multiplexés et entrelacés (L / R / L / R / ...).
- 4 mots P (Bit de parité primaire) (correction d’erreur de trame).

NB : toutes les 98 Trames, on a pour chaque Trame P et Q qui sont


bufférisés (1 block P de 98 Bits et 1 block Q de 98 Bits)

 Structure du block P :
- 1er Rôle : changement de Track.

1 2 3 97
SØ=Ø S1=1 Soit : ØØØØØØØ...................................................Ø
Soit : 1 1 1 1 1 1 1...................................................1

Pattern de Synchro 2 combinaisons possibles :


(Début du Block P) • Combinaison de Ø pour P : change de
plage
• Combinaison de 1 pour P : va changer
de plage dans 2s.

> Les Bits N°3 à 97 indique :


 le changement de plage quand P = ØØØØ.....Ø.
 le changement de plage dans 2s quand P = 1 1 1 1 .....1.

2s
Track 1 Track 2
ØØØØØØØØØ111111ØØØØØØØØØ

- 2eme Rôle : indique le Lead Out (fin de CD).


> Le block P passe de Ø à 1 (pour plage suivante dans 2s).
> Puis il passe à Ø toutes les ½ secondes (à F = 2Hz).

NB : il y a donc au mini 3 Track dans 1 CD :


2s 2s
Toc Track 1 Lead Out
ØØØØØØØØØ111111ØØØØØØØØØ111111Ø1Ø1Ø1Ø1Ø1

33
Audio Numérique

 Structure du block Q :
1 2 3 6 7 10 11 82 83 97
SØ=Ø S1=1 (4 Bits) (4 Bits) (72 Bits) (16 Bits)

Pattern de 4 indications Mode : Mode 1 ou CIRC (CRCC du CD)


Synchro indique le Mode 2 ou
(Début du contenu Mode 3
Block Q) des 72 Bits
suivants

- Les Bits N°3 à 6 indique :


> Le nombre de canaux.
> Non utilisé.
> Copyright bit : indique qu’il y a un Copyright.
> Pré-emphasis : OUI / NON

- Les Bits N°7 à 10 indique les 3 modes des 72 Bits qui suivent.

- Les Bits N°11 à 82 indique :


> Mode 1 (99% du temps) : N° de Track / N°index / Program Time
(Temps de la piste) / Absolute Time (Temps total du CD).
> Mode 2 : Code Barre d’identification du CD (pour le Marketing).
> Mode 3 : ISRC (International Standard Recording Code) qui permet
d’identifier le Label / Maison de disque /...etc.

- Les Bits N°83 à 97 indique le CIRC qui est le CRCC du CD

6 Le DSD : C’est une autre manière de voir l’audio numérique


6.1 Le SACD :
Le DSD est lié au SACD (1996)

6.1.1 Cahier des charges doit pouvoir :


 Avoir une gestion unique du Copyright.
 Etre compatible avec le CD.
 Avoir une zone Multimédia.
 Faire du Stéréo ou 5.1
 Avoir la possibilité de faire de l’audio brut pour l’archivage.
 Etre compatible pour faire du CD texte.
 Avoir un format Disque identique au CD.
 Avoir un ECC plus robuste.
 Etre mono-face.

NB : le SACD respecte 100% du cahier des Charge du DSD

34
Audio Numérique

6.2 Codage du DSD : C’est du ∆PCM

1V
Le ∆PCM est une différence
de tension entre 2 ∆=1V
échantillons.
0V

En faisant de l’oversampling plus 1


important, Fe ↗ de manière à 1 Ø
avoir 1 échantillon tous les 1 Ø
paliers. 1 Ø
Le codage se fait de la manière 1 Ø
suivante :

- 1 = +1 (quand on ↑ d’échantillon)
- Ø = -1 (quand on ↓ d’échantillon)

 C’est du « One Bit Stream » : exploité par le DSD

 On utilise des convertisseurs qui exploitent du ∆઱ : c’est du « Flash ».

 Le DSD utilisé est le DSD64 :


- 44.1KHz oversamplé en 64 x 44.1 = 2,8224MHz
- C’est la fréquence d’oversampling.

 On a besoin d’un filtre coupe haut pour l’audio en entré :


- permet d’éviter d’échantillonné à plus FC = 100KHz
de 1 palier.
- A la sortie il y a un filtre coupe haut
avec une FC = 50KHz

 Le DSD est rétro-compatible PCM. Fe

 Compression du DSD pour le transfert d’archivage :


- On fait du DST (Digital Stream Transfert) : c’est un codec de
compression de données dans le câble
1111111111111111 = 1
16 « 1 » à la suite = 1 seul « 1 »
- Permet un débit 2 fois plus rapide
- C’est une compression « Loss Less »

35
Audio Numérique

 Problème du DSD : « Idle Tones »


- C’est du bruit de quantification à très bas niveau.
- Pour résoudre se problème, on fait :
> Soit du Dithering.
> Soit du DSD128 = ~ 6MHz

6.3 Les traitements :


 Le DXD (Direct Xtreme Digital) :
- C’est un procédé de conversion à la volé du ∆PCM en PCM à très
haute résolution (24 Bits / 352,8KHz) d’échantillonnage.
- Le DXD permet d’effectuer les traitements audio désirés puis repasse
en DSD.

6.4 Supports du DSD :


 Station « Piramix » : fichier audio DSD IFF (équivalent du 192KHz).
 Genex : GX 9000 (8 Pistes) / GX 9048 (48 Pistes).
 Tascam : DSD98 (2 Pistes DSD ou 8 Pistes PCM 192KHz)

6.5 Les 3 Interfaces du DSD :


 DSD Raw (DSD brut) : sur BNC + Clock BNC.
- Format électrique : NRZ (1Bit = 2T pour 1 canal).
 SDIF 3 : sur BNC + Clock BNC
- Format électrique : Bi-phase Mark.
 MAC DSD (Multichannel Audio Connexion DSD) : Ethernet (24 canaux full
duplex en IN et OUT).

6.6 Le Mastering du DSD :


 Mastering Piramix : en DSD du début à la fin.
 SADIE : c’est du « Pack DSD8 » qui permet l’acquisition en DSD à partir
du PCM ou Analog.
 Protools et Sonic Solution : Mastering en DSD à partir du PCM (AIFF ;
Wave ; SDII).

7 La compression audio numérique (réduction de données) :


7.1 Introduction :
C’est une réduction de flux.
On utilise des « Codec » : Co = Compresser / dec = Décompresser

 Les principales utilités :


- Avoir un temps de lecture plus rapide.
- Avoir une réduction de poids.
- Réduire la densité d’informations sur un support.
- Réduire la bande passante.
- Réduire le temps de transmission (comme le DST)

36
Audio Numérique

7.2 Principe :
 On compresse pour mettre sur le support.
 On décompresse pour lire.
 Il y a des Codec asymétrique = compression plus facile que la
décompression ou inversement.
 Il y a des Codec symétriques (+ rare) = compression et décompression
identique.
 Il existe 2 familles de Codec :
- Loss Less : compression de données mais pas d’audio.
> Taux = 50% de réduction
> Fragilité excessive (1 Bit = plusieurs Bits)
> Possibilité d’avoir une cascade de Codec.
> Codec Loss Less :
 Win Zip
 Win Rar
 DST
 APTX 100 (nouveau pour les transmissions audio sur les
réseaux informatiques en temps réel)
- Lossy : dégradation du signal audio avant la compression.
> Taux = ~ 90% de réduction
> Taux de compression variable en fonction du signal (et Audio)
> Fragilité plus relative que Loss Less.
> Impossibilité d’avoir une cascade de Codec.
> Codec Lossy :
 MPEG :

MPEG Vidéo MPEG Audio


MPGE1 (audio St/Mono) MPEG Layer 1 (petite compression)
MPEG2 (audio 5.1 rétro compatible St) MPEG Layer 2 (Broadcast numérique)
MPEG2 AAC (MPEG2 48 canaux) MPEG Layer 3 (meilleur rapport
Comp/Qualité
MPEG3 (MPEG2 DVD)
MPEG4 (MPEG1 pour
télécommunications)

 ATTRAC (pour Mini disque) : Taux = 80%


 A Law / U Law (pour télécommunications).
 IMA 4 :1 (pour jeu vidéo) : Taux = 4 :1
 Q Design Music (pour AVI musiques de jeu vidéo).
 Q Alcom Pure Voice.

37

Vous aimerez peut-être aussi