Vous êtes sur la page 1sur 48

Institut des Arts de diffusion 2022

La Norme EBU-R128

Laurent Eyen
Tables des matières

1- Introduction à la norme du niveau sonore.

2- La guerre du volume sonore (Loudness war).

3- L'état actuel des choses.

4- Un volume sonore cohérent pour la télévision.

5- L'oreille électronique.

6- Marges, headroom.

7- La radiodiffusion.

8- L'intensité sonore de la musique.

9- L'effet de la normalisation de l'intensité sonore.

10-Mastering conflictuel.

11-Pratique du mixage en tenant compte de la mesure du loudness.

12-Avantages et inconvénients.

13-Algorithme de mesure de l'intensité sonore.

14-True Peak Metering (Crètes inter-échantillons).

15-Affichages, paramètres typiques d'un loudness meter.

16-Analyse du loudness dans les logiciels audio.

17-Terminologie.

!1
1) Introduction à la necessité d’une norme actuelle pour le niveau de sonie

Le peak-mètre et le VU-mètre, bien que présent sur tous les appareils de mesure
analogiques sont des indicateurs obsolètes ! En bref, le VU-mètre qui indique un
niveau de signal moyen tente de donner une impression d'intensité sonore perçue,
tandis que le PPM indique quelque chose de plus proche de l'amplitude de crête du
signal d'entrée. Ces indicateurs sont inhérents à la mesure électrique des signaux
audio analogique, simulé dans le monde numérique, ils ne sont pas pondéré
fréquenciellement parlant.
Dans notre monde numérique moderne, à l’ere du streaming dominant, aucun de
ces deux indicateurs n'est plus vraiment adapté. Les traitements audio actuels
(brickwall look ahead limiter, “clean” distortion, antialisasing,
multibandes,...).permettent une “triche” créant des signaux paru fort, bien que leurs
mesure électrique soient en deça des anciennes “normes” (Max -9 dBfs en peak
pour les “P.A.D. Près à diffuser” pub dans les année 90). Afin d’assurer un stablité
volumique percue des diffusion (radio, tv, playlist) une nouvelle norme s’impose.
C’est la norme BS1770 de l'ITU (International Telecommunication Union) ou EBU
R-128, qui fut adoptée très rapidement dans le monde entier, dans le secteur de la
radiodiffusion et ailleurs. Il s'agit d'un excellent système de mesure qui fournit un
nouvel indicateur d'intensité sonore très précis mis à l'échelle en LUFS - qui fait un
bien meilleur travail que le VU - ainsi qu'un indicateur “true peak” suréchantillonné
mis à l'échelle en dBTP, qui fait un bien meilleur
travail que le PPM.

Pour les historiens, le VU-mètre (ou unité de


volume) a été conçu en 1939 et s'appelait à
l'origine le SVI ou Standard Volume Indicator. Il a
été développé dans le cadre d'un projet de
collaboration entre CBS, NBC et Bell Labs aux
États-Unis et, comme l'échelle du VUmètre était
calibrée en "unités de volume", c'est le nom qui
est resté ! Le compteur SVI/VU est parmi les plus
simples de tous les indicateurs audio et se
comporte essentiellement comme un simple
voltmètre à moyenne, avec un temps d'attaque
(ou "intégration") d'environ 300 ms. Le temps de
relâchement de l'aiguille est à peu près le même,
et la spécification complète de l’indicateur est
inscrite dans la norme IEC 60268-17 (1990).

!2
L'affichage d'un VU-mètre est influencé à la fois par l'amplitude et la durée du signal
appliqué. Lorsqu'un signal sinusoïdal régulier est appliqué à l'entrée, le VU-mètre
donne une lecture précise de la tension RMS (valeur quadratique moyenne) du
signal. Cependant, avec des signaux musicaux ou vocaux plus complexes, le
VUmètre indique généralement de manière sous-évaluée. Un son continu produira
une indication beaucoup plus élevée qu'un signal transitoire bref, même si les deux
ont la même tension de crête. En théorie, un VU-mètre devrait répondre à la fois aux
moitiés positives et négatives du signal audio d'entrée, mais les implémentations les
moins chères ne mesurent parfois qu'une moitié de la forme d'onde, et peuvent donc
fournir des lectures différentes avec des signaux asymétriques par rapport aux VU-
mètres complets.

La simplicité de la conception du VU-mètre le rend relativement bon marché à mettre


en œuvre, et les VU-mètres ont donc tendance à être employés dans des
équipements qui nécessitent beaucoup d’indicateurs de niveau, comme les
enregistreurs multipistes ou le tables de mixage entrée de gamme, ou lorsque
l'indication précise du niveau n'est pas essentielle.

L'indication du niveau de référence est de 0VU, mais le niveau audio requis pour
l'obtenir peut être celui que l'utilisateur souhaite. L'implémentation originale du SVI
comprenait un atténuateur réglable permettant de s'adapter à tout niveau de
fonctionnement standard jusqu'à +24dBu (les diffuseurs américains utilisent toujours
des niveaux de référence nominaux de +8dBu). Les VU-mètres modernes omettent
généralement l'atténuateur réglable par l'utilisateur et sont généralement réglés pour
donner une indication de 0VU pour un niveau d'entrée de 0dBu ou +4dBu. Ce
dernier est le "standard pro" le plus courant, mais de nombreux fabricants utilisent le
premier alignement, y compris Mackie: 0 VU = 0dBu Studer: 0VU=+4dBu. En
général, le SVI ou VU-mètre tend à montrer la tension moyenne du signal, et donne
une indication “raisonnable” de l'intensité sonore perçue. Notons tout de même que
l’aiguille monte plus facilement avec des éléments riche en fréquences basses
(énergétique) que des fréquences medium ou aiguë perçues au meme niveau ( cfr
courbe Fletcher- Munson)

Le Peak Programme Meter ou PPM est une conception beaucoup plus élaborée et
précède le VU, puisque son développement a commencé en 1932, le compteur que
nous connaissons aujourd'hui étant apparu en 1938. Malgré leur nom, les PPM
n'indiquent pas réellement la véritable crête de la tension du signal. Les premières
versions utilisaient un temps d'intégration de 10 ms (PPM de type I), tandis que les
versions ultérieures utilisent un temps d'intégration à 4 ms (PPM de type II). Ces
temps d'intégration courts ont été sélectionnés spécifiquement pour ignorer les
crêtes transitoires les plus rapides, et c'est pourquoi le PPM est souvent appelé un

!3
compteur "quasi-peak" pour le différencier des compteurs de crête réelle. En
général, les signaux transitoires très brefs sont sous-évalués d'environ 4 dB. La
raison pour laquelle on a ignoré les transitoires brefs était d'encourager les
opérateurs à fixer des niveaux légèrement plus élevés qu'ils ne l'auraient fait
autrement, en partant du principe que toute surcharge transitoire dans l'équipement
d'enregistrement ou de transmission serait inaudible, sachant que le ppm s’arrête à
+12 dBu et que les appareil audio professionnels peuvent généralement sortir du
+22 dBu. Cette marge qui est généralement suffisante pour les surcharges
analogiques de moins de 1 ms (peak).

Alors que le VU-mètre a des temps d'attaque et de relâchement relativement égaux,


le PPM se caractérise par un temps de retombée très lent, qui prend plus de 1,5
seconde pour retomber de 20 dB (les spécifications varient légèrement pour les
appareils de type I et II). La raison de cette lenteur est de réduire la fatigue oculaire
et de rendre l'indication du peak plus facile à assimiler. Les spécifications de tous les
types de PPM sont détaillées dans la norme IEC 60268-10 (1991), et l'échelle
utilisée par la BBC comprend les chiffres 1-7 en blanc sur fond noir. Il y a 4dB entre
chaque marque, et PPM 4 est le niveau de référence (0dBu). Il existe des variantes
UER, DIN et nordiques du PPM avec des échelles différentes. La version de
l'EBU(european broadcast union) remplace les chiffres de la BBC par les valeurs
équivalentes en dBu, tandis que les versions nordique et DIN s'adaptent à une
gamme dynamique beaucoup plus large.

!4
Introduction aux normes de sonie

Dans une annonce surprenante faite lors de la convention AES (audio engineering
society) à New York, le célèbre ingénieur de mastering américain Bob Katz a déclaré
dans un communiqué de presse que "la loudness war est terminée." C'est une
déclaration assez provocante - mais si la réalité n'est probablement pas aussi simple
que Katz voudrait nous le faire croire (surtout en dehors des États-Unis), il y a de
bonnes raisons de penser qu'il pourrait avoir raison au cours des prochaines
années. L'idée est que si toute la musique est lue au même volume perçu, il n'y a
plus d'intérêt pour les ingénieurs de mixage ou de mastering à s'affronter dans cette
"guerre de volume". Le cri de victoire de Bob Katz trouve son origine dans l'adoption
récente par les industries de l'audio et de la radiodiffusion d'une nouvelle mesure
standard de l'intensité sonore et, plus récemment encore, dans l'inclusion de
fonctions de normalisation automatique de l'intensité sonore dans les systèmes de
radiodiffusion et de lecture grand public.

L'ingénieur de mastering Bob Katz, qui a


longtemps milité pour la fin de
l'hypercompression dans le mastering, a
récemment déclaré que la guerre du volume
sonore avait été gagnée - par le bon côté !
Dans ce cours, j'expliquerai ce que les
nouvelles normes impliquent et j'explorerai les
implications pratiques de tout cela sur la
manière dont les artistes, les ingénieurs de
mixage et de mastering - des producteurs qui
publient leurs morceaux en ligne aux
professionnels de l'industrie musicale et de la
radiodiffusion - créeront et façonneront la
musique dans les années à venir. Certaines
nouvelles technologies sont impliquées, ainsi qu'une nouvelle terminologie.
J'explorerai donc également ces éléments, tout en suggérant des moyens d'avancer
dans ce nouveau monde de la normalisation de l'intensité sonore.

!5
2) La guerre du volume sonore (Loudness war)

Quiconque a envisagé de mettre sa propre musique sur un CD ou en ligne, ne


serait-ce que pour sa famille et ses amis, ne connaît que trop bien les "guerres du
volume sonore". Cette pratique de longue date, qui consiste à se battre pour qu'un
disque sonne plus fort que les autres, est généralement considérée comme la
conséquence d'une observation faite dans les années 1950, selon laquelle les gens
avaient tendance à passer plus souvent les disques les plus forts dans les juke-
boxes. Heureusement, il existe une limite physique à l'intensité de la gravure d'un
disque vinyle sans le rendre injouable, de sorte que même les disques gravés les
plus forts parvenaient à conserver une dynamique interne raisonnable.
Malheureusement, l'enregistrement numérique a supprimé ces contraintes - un CD,
par exemple, peut être lu quelle que soit l'amplitude des données audio codées - et
cette simple liberté technique a facilité la "guerre" qui a fait rage avec une puissance
(sans doute) toujours plus destructrice sur le plan musical au cours des 30 dernières
années.

La conséquence audible est que le "volume" de la musique pop, rock et autre


enregistrée et publiée sur des CD commerciaux n'a cessé d'augmenter depuis la fin
des années 1980, avec une réduction correspondante de la dynamique et, dans de
nombreux cas, une tendance à un caractère sonore plus agressif et fatigant - tout
cela dans le but de rendre chaque piste aussi forte ou plus forte que la concurrence.
Il est déconcertant de penser que le format audio qui offrait le plus grand potentiel de
gamme dynamique jamais mis à la disposition du consommateur est maintenant
couramment utilisé pour stocker de la musique délibérément traitée avec la gamme
dynamique la plus faible de l'histoire de la musique enregistrée !

S'il est prouvé que Bob Katz a raison, la mode actuelle de l'"hypercompression" de
la musique pourrait bien se relâcher, voire s'inverser dans les mois et les années à
venir, et l'application de la compression et de la limitation redeviendra une décision
purement artistique et musicale, plutôt qu'un processus essentiel à la fabrication d'un
produit compétitif.

La clé de l'affirmation de Katz est l'évolution actuelle de l'industrie vers un "royaume


de la normalisation de l'intensité sonore", dans lequel le niveau de lecture des pistes
individuelles est ajusté automatiquement pour garantir qu'elles ont toutes la même
intensité sonore globale perçue. Cela se produit déjà dans une certaine mesure sur

!6
les radios commerciales, par exemple, mais la nouvelle technologie permet de
l'utiliser dans les services de streaming de musique sur Internet et dans les
softwares lecteurs de musique personnels. Dans un environnement de normalisation
de l'intensité sonore, il devient impossible de faire en sorte qu'une piste semble
globalement plus forte qu'une autre, de sorte que le mastering visant à maximiser
l'intensité sonore devient totalement futile.

Un deuxième aspect de ce changement de paradigme est que le type de matériel


hyper-compressé que les guerres du loudness encouragent finit par sonner très plat,
sans vie et même ennuyeux par rapport aux pistes qui conservent une certaine
dynamique musicale - et le monde de la normalisation du loudness encourage
vraiment l'utilisation de la dynamique musicale.

Ainsi, dans les environnements dont le niveau sonore est normalisé - ce qui devrait
inclure la grande majorité des systèmes de lecture de musique d'ici un an ou deux -
l'utilisation d'une forte compression et d'une limitation pour que les pistes sonnent
fort ne fonctionnera plus. Chaque piste est automatiquement équilibrée pour avoir la
même intensité sonore globale que toutes les autres pistes, et le matériel
hypercompressé finit par paraître plat, faible et inintéressant par rapport au matériel
plus naturellement dynamique.

M. Katz affirme que l'adoption universelle du paradigme de normalisation de


l'intensité sonore sur le marché grand public aura inévitablement pour effet de
décourager fortement l'utilisation de l'hypercompression et d'encourager les
créateurs de musique à mixer et à maîtriser leur musique de manière à conserver la
dynamique et les transitoires. Si tel est le cas, la guerre du volume sonore pourrait
bien être enfin terminée... mais il faudra attendre un certain temps avant de voir une
reduction significative du niveau moyen des productions musicales actuelles !

!7
3) L'état actuel des choses

La tendance actuelle consiste à essayer de faire en sorte qu'un CD ou un


téléchargement soit le plus fort possible par rapport aux autres supports
commerciaux. Pourtant, le volume d'écoute est facilement déterminé par l'utilisateur
via le contrôle du volume - il ne s'agit donc que d'une compétition pour le volume, ce
qui est largement destructeur et nuisible.

À l'époque du tout-analogique, les consoles de mixage, les magnétophones, les


disques vinyle et autres supports de lecture grand public utilisaient tous un "niveau
de référence" nominal - essentiellement le niveau moyen du signal du programme.
Au-dessus de ce niveau de référence, un espace non mesuré appelé "headroom"
permettait d'accueillir les peaks musicaux sans écrêtage. Cette disposition
permettait d'enregistrer et de diffuser des contenus différents avec des niveaux
sonores moyens similaires, tout en conservant la possibilité de prendre en compte la
dynamique musicale.

Avec le passage à l'audio numérique, les convertisseurs des premiers systèmes de


masterisation et de lecture de CD n'étaient pas aussi performants qu'ils auraient dû
l'être, et pour maximiser la qualité audio, les niveaux de signal devaient atteindre un
peak proche de 0 dBFS (c'est-à-dire le niveau de peak numérique maximum). Par
conséquent, le "niveau de référence" est devenu le niveau d'écrêtage, et la notion de
marge de sécurité a été abandonnée ”headroom”, devenant la première victime de
cette guerre !

Les producteurs de musique (au sens le plus large du terme) ont rapidement
compris qu'ils pouvaient utiliser des techniques permettant d'extraire la plus grande
partie possible du signal audio jusqu'au niveau de crête maximal du système
numérique, simplement parce que le format CD ne se plaignait pas comme les
découpeurs de vinyle - et maintenant, beaucoup de gens semblent penser que c'est
le rôle principal d'un ingénieur de mastering ! Pour qu'un morceau sonne fort sur un
CD (ou en téléchargement), on utilise généralement une limitation et une
compression importantes, souvent associées à une mise en forme spectrale, afin
d'augmenter le niveau d'énergie moyen et de minimiser le facteur de crête, ou le
rapport crête-moyenne. Ces techniques fonctionnent parce que la façon dont nous
percevons l'intensité sonore est essentiellement basée sur le niveau d'énergie
moyen d'une piste ; plus le niveau d'énergie moyen est élevé, plus la piste est forte.
Le terme technique est "normalisation des crêtes" : il s'agit d'élever le niveau du
signal de sorte que ses crêtes atteignent un niveau maximal défini. Le revers de la
médaille est que nous perdons la marge de headroom, il n'y a donc plus de place
pour la dynamique musicale. Nous ne pouvons plus augmenter le niveau des crêtes,

!8
mais seulement le niveau moyen grâce à la limitation. Dans les cas extrêmes, le
matériel devient hypercompressé.

L'hypercompression n'est pas une mauvaise chose en soi : elle a sa place, comme
n'importe quel autre effet musical, et est devenue une partie intégrante du caractère
sonore de certains genres musicaux. C'est normal, car elle est utilisée de manière
musicalement informée. Mais lorsqu'il est utilisé dans le seul but de rendre un
morceau plus fort que la concurrence, il peut être assez dommageable, soit au sens
technique strict (par l'écrêtage, le pompage et autres distorsions), soit en
compromettant la musicalité dans une certaine mesure. L'étendue des dommages
peut varier d'à peine perceptible à flagrante, en fonction des compétences de
l'ingénieur de masterisation et des exigences du client. Mais, en règle générale,
l'abandon de cette pratique de normalisation des crêtes, établie de longue date mais
caractéristiquement destructrice, serait une bonne chose à bien des égards. C'est en
tout cas ce qu'a ressenti l'industrie de la télévision il y a quelques années, et c'est de
là que vient l'origine de la technologie de normalisation de l'intensité sonore.

!9
4) Un volume sonore cohérent pour la télévision

Ce document sans prétention présente une


mesure standard de l'intensité sonore dont
les tests montrent qu'elle est très proche de
la perception humaine de l'intensité sonore.
Au cœur du mouvement de normalisation de
l'intensité sonore se trouve un document
mystérieusement appelé ITU-R BS.1770, qui
a été élaboré en réponse à des années de
plaintes de téléspectateurs auprès des
sociétés de télévision du monde entier
concernant des publicités trop fortes. (S'il y a
quelqu'un qui n'a pas remarqué ce
phénomène, je dois encore le rencontrer !).
Donc, à ce stade, je dois vous emmener
pour une courte diversion dans la domination
de l'industrie de la radiodiffusion...

Historiquement, les opérateurs de son


formés à la radiodiffusion travaillaient dans
des 'continuity suites' ou des 'master control'
rooms (MCR), utilisant leurs oreilles et leurs
compétences en matière d'audio (avec l'aide
des appareils de mesure de leur console)
pour équilibrer et contrôler les niveaux sonores de la radiodiffusion, en faisant
correspondre instinctivement le volume sonore perçu des différentes contributions et
programmes. Il s'agissait donc d'un environnement "normalisé" en termes de volume
sonore, et cela a très bien fonctionné. Des études de consommation ont révélé que
la plupart des gens ignorent les variations modestes du volume sonore dans une
"zone de confort" de 2,4 dB au-dessus et 5,4 dB au-dessous de leur réglage de
volume préféré, ce qui est facile à maintenir avec des techniciens du son qualifiés.
Mon pere me dit souvent: "Je me souviens que lorsque mon père a acheté notre
première télévision, en 1960, nous n'avions presque jamais à devoir régler le volume
de la télévision", tant la diffusion était uniforme à l'époque.

Cependant, le personnel qualifié étant coûteux, les radiodiffuseurs ont


progressivement remplacé le personnel par des systèmes automatisés, qui
diffusaient simplement les programmes programmés directement à l'antenne. Les
ajustements du niveau audio n'étaient effectués que si le contenu dépassait un

!10
"Permitted Maximum Level (PML)" défini. Bien entendu, les annonceurs n'ont pas
mis longtemps à comprendre qu'ils pouvaient exploiter ces systèmes en utilisant une
compression et une limitation importantes pour que leurs publicités soient beaucoup
plus fortes que les autres publicités ou que les programmes qui les enveloppent, tout
en maintenant les niveaux de crête à la limite du PML. Leur objectif, bien sûr, était
de faire en sorte que les gens prêtent davantage attention à leurs publicités et donc
(espérons-le) d'augmenter les ventes.

L'industrie de la télévision avait, en effet, dérivé vers un environnement de


normalisation des peak et, malheureusement, nous en connaissons tous les
conséquences, à travers le besoin constant de régler le volume de la télévision entre
les programmes et les publicités, ainsi qu'entre les différentes chaînes. Les
publicités les plus fortes peuvent facilement être de 4 à 8 dB plus fortes - bien au-
delà de la marge de tolérance habituelle - que les programmes adjacents, d'où
l'avalanche de plaintes adressées aux radiodiffuseurs.

!11
5) L'oreille électronique

Pendant plus d'une décennie, plusieurs tentatives d'introduire une autorégulation de


l'industrie pour résoudre le problème de l'intensité sonore irrégulière de la télévision
ont échoué. Les États-Unis sont même allés jusqu'à légiférer, avec leur Commercial
Advertisement Loudness Mitigation (CALM) Act. Pendant ce temps, la recherche
d'une solution technique était bien engagée et a abouti à la publication par l'
International Telecommunication Union's (ITU) de la norme ITU-R BS.1770. Il s'agit
d'une recommandation technique qui définit un algorithme de "mesure de l'intensité
sonore" offrant un moyen normalisé, objectif et fiable de mesurer, comparer et
ajuster l'intensité sonore des programmes.

Il convient de noter qu'il s'agit de l'intensité sonore telle qu'elle est perçue par les
êtres humains, et pas simplement du "niveau". En d'autres termes, l'algorithme du
"Loudness Meter" de l'ITU-R est essentiellement une "oreille électronique" qui
perçoit l'intensité sonore de la même manière que l'auditeur humain moyen, et il
s'est avéré très précis et très fiable. L'intention première derrière son développement
était de permettre aux systèmes d'automatisation de la radiodiffusion de mesurer
l'intensité sonore perçue des programmes et des publicités fournis avant leur
diffusion, afin que leurs niveaux d'intensité sonore puissent être adaptés de manière
similaire à ce qui était réalisé par les opérateurs de continuité formés il y a 30 ans.

La norme UIT-R BS.1770 a été officiellement introduite en 2006 et a été adoptée par
la plupart des broadcasters TV du monde. Il y a eu quelques mises à jour en cours
de route, et les organismes régionaux de normalisation de la radiodiffusion ont
publié leurs propres directives d'application pour répondre aux pratiques locales. Par
exemple, en Europe, la version de EBU (European Broadcasting Union) est appelée
R-128, tandis que la variante américaine est connue sous le nom de ATSC's A/85.
Mais, pour l'essentiel, ils font tous la même chose, fonctionnent de la même manière
et ont des spécifications pratiquement identiques.

En Europe, toutes les chaines de télévision sont actuellement sur la norme EBU
R-128, grâce à un accord volontaire, et les avantages sont tout à fait audibles. Les
publicités n'assourdissent plus le public, le changement de chaîne ne nécessite pas
un ajustement du volume, et le téléspectateur bénéficie de niveaux de programmes
beaucoup plus cohérents en général. L'introduction de la normalisation du volume
sonore a constitué une amélioration positive de l'expérience télévisuelle. (Si vous
vous demandez encore ce que tout cela a à voir avec l'édition de musique sur CD,
restez avec moi - j'y arrive. Les recommandations de la norme BS.1770 ont été
mises en œuvre sur les chaînes de TVHD d'abord parce qu'elles sont toutes
numériques, et ont donc une vaste capacité de gamme dynamique, un niveau de

!12
bruit de fond très bas, et un calibrage de niveau absolu. Cela signifie qu'elles
peuvent s'accommoder de marges de headroom raisonnables sans compromettre la
qualité du son, et qu'un niveau de référence numérique a la même signification pour
tout le monde.

!13
6) Marges, headroom

Il est important de noter que la normalisation du volume sonore n'est rien d'autre
qu'un ajustement statique du volume pour chaque programme, basé sur une
évaluation du niveau sonore qualitatif du programme, mesuré sur toute sa durée. Ce
dernier point est important. La valeur sonore est déterminée sur l'ensemble de la
durée du programme, qu'il s'agisse d'une publicité de 30 secondes ou d'un long
métrage de deux heures, et non à chaque instant. Une fois la valeur d'intensité
sonore déterminée, le niveau de lecture peut être ajusté pour ce programme ou cette
publicité, afin que son intensité sonore soit conforme au "niveau d'intensité sonore
cible" défini par le système de diffusion.

La dynamique interne du programme n'est en rien modifiée ; il peut toujours y avoir


des moments calmes et des explosions fortes, si c'est ce que l'action exige.
L'équilibre spectral du programme n'est pas non plus modifié - il n'y a pas de
traitement multibande de type radio. La normalisation du volume sonore fait
simplement ce que la plupart des auditeurs font instinctivement avec leur
télécommande : elle ajuste le niveau de lecture à un volume confortable et le
maintient automatiquement entre différents programmes ou chaînes.

Cependant, les programmes d'information ou les émissions de discussion ont


généralement une plage dynamique assez réduite, alors qu'un long métrage peut
avoir une plage dynamique très étendue. Le niveau sonore cible choisi doit tenir
compte des deux, ce qui signifie qu'il faut prévoir une marge de sécurité adéquate.
La recommandation BS.1770 préconise un niveau d'intensité sonore cible pour la TV
d'environ -23LUFS( Loudness Units relative to Full Scale), bien que les différentes
mises en œuvre régionales varient légèrement (par exemple, la spécification ATSC
est inférieure de 1LU) et que les programmes mixés en direct soient autorisés à
s'écarter légèrement de l'intensité sonore cible (généralement jusqu'à ±1LU).

En pratique, cela signifie que le volume typique d'un dialogue normal (qui constitue
l'essentiel de la plupart des programmes) aura à peu près la même intensité sonore
perçue, qu'il s'agisse d'un bulletin d'informations ou d'un long métrage, et qu'elle
sera généralement d'environ -23LUFS. Cependant, alors que les crêtes du signal
dans un journal télévisé peuvent atteindre seulement 4 dB de plus que le niveau
moyen des dialogues, les explosions occasionnelles dans un long métrage peuvent
atteindre un niveau bien plus élevé de 20 dB. La beauté du paradigme de
normalisation de l'intensité sonore est qu'il ne s'en préoccupe pas, car le niveau
sonore cible a été choisi pour fournir une marge suffisante pour faire face à ces
crêtes. Il est important de noter que l'auditeur perçoit les deux programmes comme

!14
ayant la même intensité sonore globale, malgré leurs gammes dynamiques très
différentes.

Ainsi, le monde de la télévision, qui met enfin de l'ordre dans ses affaires, propose
des programmes dont l'intensité sonore globale est beaucoup plus cohérente.
Hourra ! Mais vous vous demandez encore ce que cela a à voir avec la façon dont
vous mixez votre musique. Nous nous rapprochons de cette question, mais notre
détour doit d'abord nous mener dans le monde de la radio et des services de
streaming sur Internet...

!15
7) La radiodiffusion

La télévision n'est pas le seul secteur de diffusion à avoir un problème de volume


sonore. Conformément à la 'jukebox theory' que j'ai évoquée plus haut, les stations
de radio musicales populaires s'efforcent depuis longtemps de produire un son plus
fort que celui de leurs concurrents, dans l'espoir que les auditeurs choisissent "la
station la plus forte du cadran". Comme le CD, cependant, les émetteurs radio
analogiques ont une capacité de niveau maximum limitée, et donc des techniques
complexes, automatiques, de compression multi-bandes et de limitation sont
couramment employées pour maximiser l'intensité sonore de la diffusion.

Nous avons donc ici un autre exemple de paradigme de normalisation des crêtes,
mais dans ce cas, le traitement de radiodiffusion connu sous le nom générique
d'Optimod (bien qu'il s'agisse d'une marque déposée de la société Orban) modifie
l'équilibre spectral et la dynamique de la musique source, et ce souvent de manière
assez spectaculaire. Cette méthode entraîne également une disparité de volume
lorsque les auditeurs se reconnectent à des stations de musique classique ou vocale
traitées de manière plus conservatrice. Essayez de passer de NRJ, Contact à
Musique 3 pour voir ce que je veux dire !

Alors que le secteur s'oriente de plus en plus vers la radiodiffusion numérique et le


streaming sur Internet, avec des centaines de stations accessibles par simple
pression sur un bouton, les consommateurs sont de plus en plus nombreux à vouloir
adopter le modèle de normalisation du loudness. La valeur d'intensité sonore cible
optimale pour la radio est toujours en cours de discussion (bien qu'il soit probable
qu'elle se situe quelque part entre -15 et -23LUFS), et je ne connais aucune station
de radio qui ait déjà franchi le pas de la normalisation de l'intensité sonore. Elles
attendent probablement toutes la publication d'une "norme" à l'échelle de l'industrie
pour garantir des conditions de concurrence équitables !

De nombreux services de streaming et de lecture de musique grand public, dont


iTunes, ont déjà adopté la normalisation de l'intensité sonore. En fait, Spotify en
utilise une version depuis le premier jour.
Le service de streaming musical sur Internet Spotify utilise une forme de
normalisation du volume sonore depuis le jour de son lancement, et Apple a
récemment fait le même saut avec son nouveau service de streaming musical
iTunes Radio. La fonction Sound Check d'iTunes permet de maintenir une intensité
sonore constante, quel que soit le genre musical diffusé. Bien qu'Apple n'ait pas
déclaré publiquement la valeur d'intensité sonore cible que sa fonction Sound Check
impose actuellement, Bob Katz affirme qu'il s'agit d'une valeur tout à fait crédible de

!16
-16,5 LUFS. L'adoption d'un paradigme de normalisation de l'intensité sonore dans
un service de streaming musical aussi largement utilisé va avoir une grande
influence, et pourrait potentiellement avoir une influence massive non seulement sur
le reste de l'industrie du streaming musical, mais aussi sur les créateurs de musique,
simplement parce que le consommateur va s'habituer au matériel normalisé par
l'intensité sonore et aux capacités de gamme dynamique présentées dans ce
paradigme. C'est le catalyseur du communiqué de presse de Katz, qui affirme que la
guerre du volume sonore est terminée.

!17
8) L'intensité sonore de la musique

Après avoir parcouru les méandres des pratiques de travail de l'industrie de la


radiodiffusion, nous arrivons au cœur du sujet de la normalisation du volume sonore.
Une part importante de la consommation domestique de musique se fait par le biais
de la radio et de la diffusion en continu sur Internet, et ces deux canaux adoptent la
normalisation du volume sonore. La plupart des lecteurs de musique personnels
populaires disposent également d'options de normalisation de l'intensité sonore,
comme la fonction Sound Check sur les iPods et les iPhones d'Apple, et sur les
ordinateurs lorsqu'ils utilisent leur logiciel de lecture iTunes, pour maintenir une
intensité sonore constante lorsque la musique est lue en mode aléatoire ou en
playlist. La normalisation de la sonie signifie qu'il n'y a aucun avantage à produire
des CD ou des téléchargements "bruyants", car la sonie perçue sera la même pour

tous. L'aspect le plus inquiétant de la normalisation du volume sonore est que la


musique très fortement compressée finit par paraître terne et faible par rapport à un
matériel plus naturellement dynamique.

!18
Avant que la panique ne s'installe, je pense qu'il est important de comprendre que
nous ne sommes pas confrontés à un changement radical des techniques de
production musicale telles que nous les connaissons ! De plus, personne ne force
personne à changer sa façon de mixer et de masteriser sa musique ; si vous aimez
et voulez hyper-compresser vos morceaux, vous pouvez toujours le faire.
Cependant, vous avez également la possibilité d'utiliser la dynamique musicale sans
craindre que le CD ne soit "pas assez fort".

En supposant que la normalisation du volume sonore soit adoptée - et il y a


certainement des domaines où elle ne le sera pas, comme dans le milieu de la
musique de club - l'évolution des styles de production et de mastering vers un
relâchement de l'hypercompression et l'adoption de la dynamique sera un processus
graduel. Il faudra du temps pour que les gens se familiarisent avec la nouvelle
technologie de mesure, et les pratiques de travail évolueront et se répandront
lentement dans le secteur. L'acceptation et les attentes des consommateurs
évolueront également lentement, et une nouvelle génération de lecteurs de musique
pourrait être nécessaire avant que la normalisation du volume sonore ne devienne
complètement pratique.

À cet égard, cette "loudness revolution" n'est pas vraiment différente des nombreux
autres changements radicaux dont nous avons déjà été témoins - et auxquels nous
avons survécu - dans l'industrie de la musique, comme les disques à microsillons
haute fidélité qui ont remplacé les 78 tours en gomme-laque dans les années 1950,
ou l'introduction de la stéréo dans les années 1960, du multipiste et de l'overdubbing
dans les années 1970, des synthétiseurs dans les années 1980, des séquenceurs
musicaux dans les années 1990 et de la station de travail audio numérique au début
de ce siècle. Toutes ces technologies (et bien d'autres encore) ont à la fois façonné
la façon dont la musique est faite et influencé la façon dont elle sonne. Le paradigme
de la "loudness-normalisation" exercera lui aussi sa propre influence sur le son de la
musique, dont l'élément le plus important sera de revigorer l'utilisation créative de la
dynamique.

Pour l'instant, l'important est d'être conscients des forces qui poussent à ces
changements potentiels dans les pratiques de travail établies de longue date, de
comprendre la technologie et la terminologie impliquées, de reconnaître les divers
avantages et pièges, et de réfléchir aux opportunités créatives que ce paradigme
changeant présente.

!19
9) L'effet de la normalisation de l'intensité sonore

La question la plus pressante à l'esprit de la plupart d'entre vous en ce moment est


probablement "Comment la normalisation du loudness va-t-elle affecter le son de
mes mixages ?". La réponse est que, contrairement aux processeurs de diffusion de
type Optimod, elle ne changera pas du tout le son que vous créez ; elle ne changera
que le volume. Notez cependant que ce changement de volume peut affecter de
façon spectaculaire votre perception d'un morceau ! Dans un domaine de
normalisation des crêtes, le volume sonore perçu d'une piste hyper compressée
contrebalance toute sensation de constriction dynamique. Mais lorsque cette
intensité sonore est retirée de l'équation dans un environnement normalisé par
l'intensité sonore, la constriction dynamique devient souvent évidente et indésirable.

J'ai mentionné précédemment que les systèmes normalisés en fonction du niveau


sonore utilisent généralement un niveau cible relativement bas et disposent d'une
marge de sécurité relativement importante. Cette marge est là pour s'adapter au
matériel dynamique, et elle peut être utilisée de manière créative. Alors que le
niveau d'énergie moyen d'une piste entière détermine son intensité sonore, il est tout
à fait possible d'utiliser un rapport crête-moyenne important pour introduire des
dynamiques et des transitoires sans affecter l'intensité sonore globale. Par
conséquent, les pistes dont le rapport crête/moyenne est élevé auront par nature un
son beaucoup plus percutant, dynamique et intéressant sur le plan musical et auditif
que les pistes fortement écrasées. Et les différences ne sont généralement pas
subtiles ! La normalisation de la sonie punit vraiment la musique hyper compressée,
révélant qu'il s'agit d'une "brique audio" solide, alors que la musique avec une
dynamique et des transitoires naturelles brille comme un phare en comparaison.

!20
Ces deux captures d'écran montrent deux pistes différentes côte à côte. Comme
vous pouvez le voir sur l'écran
du haut, où les deux pistes ont
été normalisées en fonction des
crêtes, la piste de droite a subi
un traitement significatif de
l'intensité sonore. Le deuxième
écran montre les deux mêmes
pistes dont l'intensité sonore est
conforme aux nouvelles normes
- et les différences auditives
sont aussi surprenantes que les
différences visuelles !

Les deux diagrammes ci-


dessous illustrent, je l'espère,
ces points mieux que mes mots.
Ce sont des captures d'écran de
Cockos Reaper comparant deux
pistes stéréo extraites
directement de CD
commerciaux. Le morceau de
gauche (coloré en rouge) est
"Devil's Eye" de Chris de Burgh,
extrait d'un CD du début des
années 1980, tandis que le
morceau de droite (en vert) est
"Samurai" de Grand Prix, extrait
d'un album "greatest hits" remasterisé beaucoup plus récent. Je m'excuse pour mon
(manque de) goût musical, mais ces morceaux mettent bien en évidence les
problèmes.

Comme vous pouvez le constater, la piste de Chris de Burgh n'est pas du tout
fortement limitée ou compressée, et elle présente une dynamique musicale assez
large, qui monte et descend tout au long de la piste. En utilisant un indicateur
compatible avec la norme BS.1770, j'ai mesuré le niveau de crête réel à -1,4 dBTP,
et la sonie intégrée à -18,8 LUFS pour l'ensemble de la piste. En revanche, la piste
du Grand Prix a un niveau de crête vrai de +0,5dBTP (en d'autres termes, il y a un
écrêtage inter-échantillon !) et une sonie intégrée de -7,8LUFS, ce qui est 11dB plus
fort que la piste de Burgh. Cette disparité de sonorité est douloureusement évidente
si vous écoutez les deux pistes dos à dos. Il est intéressant de noter que je possède

!21
également l'album CD original contenant la piste du Grand Prix (j'étais un head-
banger refoulé à l'époque !) et que cette version mesure 0dBTP et -9,6LUFS. Il est
clair que la réédition des "plus grands succès" a subi une compression destructrice
supplémentaire et une limitation des crêtes lors de sa remasterisation !

La capture d'écran du bas montre ce qui arrive à ces deux mêmes pistes dans un
environnement normalisé au niveau sonore. Dans ce cas, j'ai utilisé un volume
sonore cible de -23LUFS - la norme HDTV, et un peu plus bas que le réglage actuel
d'iTunes Radio. La piste du Grand Prix (en vert), incroyablement bruyante, a été
atténuée pour que son intensité sonore soit conforme à la valeur cible, de sorte que
son niveau de crête n'est plus que de -13,7 dBTP, avec pratiquement aucune
variation autre que l'intro et une pause vers la fin. La piste de Chris de Burgh a
nécessité moins d'atténuation pour correspondre à l'objectif d'intensité sonore et,
plus important encore, sa nature plus dynamique signifie que son niveau de crête
transitoire atteint -4,5 dBTP, soit 9 dB de plus que la piste du Grand Prix, malgré une
intensité sonore globale égale.

Ainsi, la piste qui a été remastérisée pour sonner incroyablement fort et "in your
face" a en fait un son plat, trop comprimé et inintéressant du point de vue auditif par
rapport à la piste beaucoup plus dynamique, mais initialement plus silencieuse de
11LU. Sans surprise, c'est la piste de Chris de Burgh qui apparaît comme la plus
intéressante et la plus musicale, et qui constitue une expérience d'écoute plus
agréable. J'encourage tout le monde à essayer ce genre de comparaison : entendre,
c'est croire.

Loudness level: Impression de volume d’un programme audio

Imaginez que tous ces outils sont les différents programmes. Si nous faisons une
normalisation de peak ,il y a un problème. La densité de l'intensité sonore (centre de
gravité de ces outils) est différente. Ainsi, quelque chose comme l'épée peut être un
film basé sur des dialogues avec des coups de feu occasionnellement forts qui
atteignent un pic et donc la lame s'étend autant. La lecture de ces programmes bout
à bout introduira une énorme variation. Des études ont montré que 95 % des
téléspectateurs modifient le volume de leur téléviseur ou de leur récepteur si le saut
ou la différence d'intensité sonore est une augmentation de 5 LU ou une diminution
de 8 LU. En regardant ce graphique, nous pouvons immédiatement voir que le
téléspectateur sera gêné par une telle variation de tolérance. Supposons donc que
nous rencontrions ce problème et que nous voulions maintenir cette norme
d'intensité sonore tout en effectuant une normalisation des pics.

!22
!
Normalisation des crêtes, Peak Normalisation : Une pratique par laquelle les
crêtes les plus élevées de différents programmes sont alignés sur un niveau de
référence défini, ce qui encourage les ingénieurs à utiliser la compression de la
gamme dynamique pour augmenter l'intensité sonore perçue.

! !

!23
Loudness Normalisation : Une pratique de travail dans laquelle un niveau
d'intensité sonore arbitraire définit le point de référence, et l'intensité sonore des
signaux individuels est évaluée afin qu'ils puissent ensuite être ajustés pour
correspondre à l'intensité sonore lors de la relecture. Cette approche impose une
marge de sécurité et encourage donc les variations dynamiques.

!24
10)Mastering conflictuel

Comme vous pouvez l'imaginer, pendant la transition de l'industrie de la musique


d'un flux de travail de normalisation des crêtes à un flux de travail dirigé par des
consommateurs dont le volume est normalisé, il y aura des exigences
contradictoires en matière de mastering. Un titre doit-il être masterisé pour sonner
aussi fort que la musique de l'année dernière lorsqu'il est lu sur un CD ? Ou faut-il le
mixer et le masteriser pour qu'il soit un peu plus dynamique afin qu'il s'en sorte
mieux lorsqu'il est joué sur des services de radio et de streaming normalisés en
termes de volume ? Des décisions, des décisions !

À l'heure actuelle, il n'est pas rare que les artistes de palmarès (ou leurs labels)
publient des CD et des masters de téléchargement à fort volume pour le grand
public, ainsi que des versions radio distinctes, moins écrasées, pour les diffuseurs,
qui résisteront mieux aux technologies de traitement radio actuelles. Lorsque le
matériel est également publié sur vinyle, un autre master encore moins compressé
est souvent produit également, simplement parce que le vinyle ne peut pas
supporter une compression et une limitation importantes.

Je pense qu'un arrangement similaire pour les sorties multiples va imprégner


l'industrie du mastering pendant quelques années encore, alors que la normalisation
du volume sonore devient progressivement de rigueur, peut-être avec des versions
masterisées distinctes optimisées pour les destinations normalisées en volume
sonore et normalisées en crête. Je peux également prévoir que certains artistes et
labels revisiteront leur back-catalogue et le feront remasteriser pour qu'il sonne
mieux dans des environnements normalisés en loudness. J'ai hâte d'y être !

!25
11) Pratique du mixage en tenant compte de la mesure du loudness

En ce qui concerne le mixage, il n'y a pas besoin de changer quoi que ce soit à la
façon dont vous abordez ou équilibrez vos mixages ; toutes vos compétences
existantes s'appliquent toujours. Le mixage est ce que la musique demande, comme
il l'a toujours été, qu'il s'agisse d'une variété dynamique ou d'une contrainte. Certains
genres musicaux impliquent de construire le mixage proche de zéro dB(fs),
délibérément pour obtenir un son dense et puissant, et si c'est ce qui convient au
travail en cours, continuez de la même manière. Cependant, mixer un morceau pour
qu'il sonne fort, dans le seul but de participer à la "Loudness war", sera un effort
futile si le morceau est destiné à des points de vente normalisés en termes de
volume (c'est-à-dire la plupart). La pratique consistant à mettre l'accent sur la "mid-
range energy" d'un mixage, ou à réduire les graves, qui est généralement employée
pour maximiser l'intensité sonore perçue, sera contre-productive.

Étant donné que les systèmes de lecture normalisés en fonction de l'intensité sonore
disposent d'une marge de réserve raisonnable, il est possible d'en tirer parti en
autorisant des transitoires, des montées et des descentes occasionnelles d'intensité
sonore. Tous nos sens réagissent au changement, et les transitoires sont perçus
comme excitants et intéressants. Par conséquent, les mixages auront plus d'impact
et d'intérêt si vous utilisez délibérément les transitoires tels que les breaks de
batterie emphatiques et les changements dynamiques généreux. J'insiste sur ce que
j'ai dit précédemment : la marge de progression est là pour être utilisée de manière
créative ! N'oubliez pas que l'intensité sonore est déterminée par le niveau moyen,
donc des bits forts occasionnels sont acceptables. Des bits forts en continu
donneront une valeur de sonie intégrée plus élevée. Ce qui impliquera une reduction
globale proportionelle a cette élévation du rapport crètes/moyen.

Le référencement est le seul domaine où il faudra modifier les méthodes de travail.


Dans l'idéal, les pistes de référence doivent être évaluées en termes de sonorité,
puis écoutées au même niveau de sonorité cible que le mixage en cours. Ainsi, vous
ne vous sentirez pas obligé de vous battre dans la guerre de l'intensité sonore et
vous pourrez vous concentrer sur la correspondance de la tonalité et du caractère.
Bien sûr, la plupart des pistes de référence du catalogue ont été produites pour
sonner fort et sont donc dynamiquement assez plates. Par rapport à ce type de
référence, un mixage dynamique en cours de réalisation sera inévitablement plus
intéressant sur le plan sonore. La plupart des ingénieurs de mixage et des
consommateurs trouveront cela très rafraîchissant !

Pour travailler dans un environnement où l'intensité sonore est normalisée, je


recommande vivement l'utilisation d'un plug-in de mesure compatible avec la norme

!26
BS-1770, inséré dans le canal de mixage stéréo et configuré avec un niveau cible
approprié. En l'absence d'une norme reconnue par l'industrie musicale, je suggère
que le niveau Sound Check d'iTunes d'environ -16LUFS soit approprié. Le niveau
cible absolu n'est pas particulièrement critique - c'est la correspondance de
l'intensité sonore avec votre matériel de référence qui est le but ici, avec une marge
de headroom raisonnable pour s'adapter aux transitoires et à la dynamique désirées.

Lors du mixage, l'objectif est d'obtenir une valeur de sonie intégrée pour l'ensemble
de la piste qui soit aussi proche que possible de cette valeur cible, le niveau de crête
réel ne dépassant pas -1dBTP. Si vous suivez et mixez déjà avec une marge de
headroom raisonnable - comme vous le devriez - cela ne devrait pas être trop
différent de votre pratique habituelle.
La difficulté que rencontrent la plupart des gens lorsqu'ils commencent à travailler
avec un loudness-meter est d'essayer d'atteindre immédiatement le niveau cible. Ce
n'est pas nécessaire : la seule valeur d'intensité sonore qui compte est celle qui
s'affiche lorsque vous arrivez à la toute fin du morceau. La plupart des chansons se
construisent progressivement jusqu'à un crescendo à la fin, de sorte qu'au départ, la
valeur de la sonie intégrée devrait être faible et augmenter progressivement au fur et
à mesure que le titre progresse. En fin de compte, l'appareil mesure l'intensité
sonore d'une manière très similaire à notre propre perception, donc si vos oreilles
perçoivent un équilibre dynamique, l'appareil est généralement d'accord ! De même,
ne soyez pas obsédé par la précision du niveau cible - c'est le rôle du système de
lecture du consommateur - essayez simplement de l'atteindre à quelques LU près.

La plus grande différence dans le workflow est ce qui se passe après que vous vous
soyez déclaré satisfait du mixage final. Actuellement, l'étape suivante pour la plupart
des gens est un "passage de mastering" où la marge est supprimée et où la piste est
rendue aussi forte que les mixages de référence. Il est clair que ce traitement
compétitif du volume sonore ne sera plus nécessaire ou approprié - du moins pas en
ce qui concerne les consommateurs de radio, de streaming et de téléchargement.
Au lieu de cela, le processus de masterisation peut se concentrer sur l'optimisation
de l'équilibre spectral et sur l'obtention d'un caractère sonore cohérent entre les
différentes pistes - ou, pour le dire autrement, sur un véritable polissage plutôt que
sur un ponçage intensif !

!27
12) Avantages et inconvénients

Il ne fait aucun doute qu'une grande partie de l'industrie musicale adopte la


normalisation de l'intensité sonore et, bien qu'il faille du temps pour qu'elle devienne
la méthode de travail standard partout, il semble certain que ce changement
deviendra universel. Dans un environnement normalisé par le loudness, les style de
mixes hyperlimités ne se portent pas bien du tout : l'avantage perçu du loudness est
perdu et les conséquences destructrices de l'hypercompression sur le plan sonore et
musical sont clairement exposées.

Au contraire, la normalisation du loudness encourage positivement l'utilisation de la


dynamique et des transitoires. Les pistes sont rendues plus percutantes en étant
dynamiques plutôt que simplement bruyantes, et la compression et la limitation
deviennent des effets musicaux plutôt que des traitements compétitifs essentiels. La
marge de sécurité est restaurée, l'écrêtage inter-échantillon est banni et
l'environnement numérique atteint enfin la qualité sonore et la gamme dynamique
dont il est capable.

Personne n'aime le changement, et il faudra du temps pour venir à bout des


pratiques de travail établies de longue date, mais la loudness normalisation est une
solution gagnante pour tous, tant du point de vue de la qualité musicale que de la
qualité sonore. Il y aura inévitablement quelques difficultés pratiques à court terme
pour contrôler les niveaux dans certains lecteurs de musique personnels et, jusqu'à
ce que tous les fabricants de logiciels audionumériques intègrent des indicateurs
conformes à la norme BS.1770, certains plug-ins tiers seront peut-être nécessaires.
Dans l'ensemble, cependant, les avantages l'emportent largement sur les difficultés,
et je vous invite à vous familiariser avec le nouveau système de mesure et les
possibilités de création qu'offre la loudness normalisation.

La nouvelle norme : UIT-R BS.1770


En juillet 2006, l'ITU a publié un document portant le numéro de catalogue ITU-R
BS.1770. Le "-R" indique qu'il s'agit d'un document de "recommandation", et le
préfixe "BS" signifie qu'il fait partie de la série "Broadcast service (Son)". Les
numéros de code ne signifient pas grand-chose pour tout le monde, bien sûr, mais le
titre du document est beaucoup plus informatif : "Algorithmes de mesure de
l'intensité sonore des programmes audio et du niveau audio de crête réel", en
anglais "Algorithms To Measure Audio Programme Loudness And True Peak Audio
Level'.

Le document original a été remplacé trois fois jusqu'à présent, les améliorations
étant déterminées par le groupe PLOWD, qui comprend 240 membres experts

!28
créatifs et techniques, dont des praticiens indépendants et des membres d'un certain
nombre d'organismes professionnels et de fabricants. La norme BS.1770-1 a été
publiée en septembre 2007, la BS.1770-2 en mars 2011, et l'édition actuelle BS.
1770-3 en août 2012. Les quatre versions sont disponibles sur : http://www.itu.int/
rec/R-REC-BS.1770 si vous êtes intéressé par l'évolution, mais seule la BS.1770-3
est pertinente aujourd'hui. Les différentes mises à jour reflètent de légères
évolutions de l'algorithme de sonie qui est au cœur de la recommandation,
principalement suite aux commentaires de l'EBU et d'autres parties intéressées. La
version actuelle de l'algorithme est plus sensible aux peaks sonores isolés et
accorde moins d'importance aux sons de fond de faible intensité que la version
originale. Un calcul de la "gamme d'intensité sonore",'loudness range' pour indiquer
la plage dynamique perçue a également été intégré. Évidemment, cela signifie que
toute tentative de tromper le système avec des mélanges astucieux pourra être prise
en compte dans les futures mises à jour.
La majeure partie de la norme BS1770-3 vise à définir une mesure fiable et objective
de l'intensité sonore subjective d'un matériel audio, tel qu'un programme télévisé, un
film ou une publicité. L'objectif est de permettre la comparaison impartiale (et
automatique, si nécessaire) de matériel provenant de sources disparates, afin de
faire correspondre la sonie subjective entre elles avec un haut degré de cohérence.
La recommandation détaille également, dans une annexe, l'exigence et la
méthodologie de la mesure des crêtes vraies dans le domaine numérique,
notamment pour éviter de manquer les crêtes inter-échantillons et donc l'écrêtage
par inadvertance lors du traitement ultérieur du signal ou de la conversion du format.

!29
13)Algorithme de mesure de l'intensité sonore

Ce diagramme fonctionne à la fois pour les signaux stéréo et surround.

L'algorithme de mesure de l'intensité sonore détaillé dans le dernier document BS.


1770-3 (et dans le Tech Doc 3341 de l'UER) comporte quatre étapes distinctes : le
filtrage de la réponse, le calcul de la puissance moyenne, la pondération des canaux
et la sommation.

L'étape de filtrage de la réponse est appelée " pondération K " et combine un


égaliseur à haut niveau d'amplification avec un filtre passe-haut. L'égaliseur shelf
fournit une amplification de :4dB au-dessus de 2kHz environ et est destiné à
reproduire les effets psychoacoustique de l’écoute humaine. Le filtre passe-haut
simule notre sensibilité réduite aux basses fréquences lorsqu'il s'agit d'évaluer
l'intensité sonore, avec un filtre de 12 dB/octave à environ 100 Hz.

Après ce simple filtrage, l'étape suivante consiste à déterminer la puissance


moyenne du signal à l'aide d'un calcul de moyenne quadratique (c'est-à-dire la
moyenne des valeurs au carré des amplitudes des échantillons). La puissance est
moyennée sur une période de mesure de 400 ms qui est mise à jour toutes les 100
ms, et le résultat peut ensuite être ajusté ou "pondéré" avant d'être additionné à tout
autre canal audio connexe. Dans un système stéréo, les niveaux de puissance
moyens des canaux gauche et droit sont simplement additionnés. Dans un système
surround, les trois canaux avant sont additionnés, et les deux canaux arrière sont
augmentés de 1,5 dB par rapport aux canaux avant avant d'être ajoutés à la
combinaison. Cela rend la mesure légèrement plus sensible à l'énergie du canal
arrière, ce qui correspond mieux à la perception humaine. Dans les systèmes
surround, la contribution du LFE (effets de basse fréquence) est complètement
ignorée en ce qui concerne l'évaluation de la sonie.

!30
Après cette addition des canaux, la valeur
de l'intensité sonore est donnée sous la
forme d'un nombre à échelle logarithmique
en unités d'intensité sonore par rapport à
la pleine échelle numérique - il s'agira donc
toujours d'un nombre négatif. L'EBU
préfère utiliser les unités absolues LUFS,
tandis que l'ATSC en Amérique utilise
LKFS (loudness, K-weighted, relative to full
scale), mais les calculs sont identiques et
les deux termes sont réellement
interchangeables.

Lorsqu'une échelle de sonie relative (plutôt


qu'absolue) est plus appropriée ou
pratique, l'écart de sonie par rapport à un
niveau de sonie cible donné peut être
exprimé en unités de sonie ou LU. Par
exemple, si le niveau cible est de -23LUFS
mais que le matériau mesure effectivement
-20LUFS, son décalage de sonie sera
décrit comme +3LU.

!31
!
Comme vous pouvez le voir, le filtre K appliqué au signal supprime une grande partie
de l'énergie des basses en dessous de 100 Hz, car cela n'affecte généralement pas
notre perception de l'intensité sonore.
Normalement, la valeur de l'intensité sonore de tout matériel préenregistré peut être
mesurée et le niveau de lecture ajusté pour assurer une conformité précise avec
l'intensité sonore cible, mais lorsqu'une normalisation exacte de l'intensité sonore

!32
n'est pas pratique - comme pour les diffusions en direct - la norme de diffusion
HDTV R128 de l'UER exige un écart d'intensité sonore de ±1LU maximum.

Gating & LRA : Bien que les principes de base de l'algorithme d'intensité sonore
soient assez simples, il faut ajouter une certaine complexité pour s'assurer que les
périodes calmes ne tirent pas injustement la valeur d'intensité sonore moyenne vers
le bas. Pour commencer, si le niveau du signal est inférieur à -70LUFS, il ne joue
aucun rôle dans le processus de mesure de l'intensité sonore. Cela permet de
s'assurer que les sections silencieuses au début et à la fin d'un programme
n'affectent pas la valeur d'intensité sonore.

Deuxièmement, si le niveau audio tombe 10dB en dessous de la valeur d'intensité


sonore actuelle du programme, il est également ignoré, de sorte que les pauses
dans les dialogues ou les sections silencieuses entre les séquences d'action sont
effectivement ignorées. De cette façon, l'algorithme de loudness se concentre
uniquement sur les sons de premier plan.

Une autre facette de l'algorithme d'intensité sonore est le calcul d'une "plage
d'intensité sonore"('Loudness Range') ou valeur LRA, qui indique essentiellement
dans quelle mesure la dynamique du programme est contrôlée. La valeur LRA est
dérivée de l'analyse d'une fenêtre d'évaluation de l'intensité sonore de trois
secondes qui glisse continuellement, toute valeur inférieure de plus de 20LU au
niveau d'intensité sonore actuel du programme étant éliminée. Là encore, cela
permet de s'assurer que le chiffre de LRA reflète la gamme des signaux audio de
premier plan et ignore le bruit de fond de faible niveau et le plancher de bruit du
système.
La distribution de ces niveaux d'intensité sonore à court terme est encore quantifiée
en fixant des limites de 10 et 95 pour cent de sorte que le chiffre de LRA est en fait
la différence entre les niveaux d'intensité sonore aux points de 10 et 95 pour cent de
la gamme totale mesurée. La limite inférieure de 10 pour cent empêche, par
exemple, le fondu d'une piste musicale de dominer la valeur de LRA, tandis que la
limite supérieure de 95 pour cent garantit qu'un seul son, exceptionnellement fort, tel
qu'un coup de feu, ne peut à lui seul être responsable d'une valeur de LRA
importante. Un film d'action typique peut avoir une valeur LRA de 25, alors que la
plupart des programmes télévisés normaux sont plus proches de 10 et que la
musique pop compressée peut avoir une valeur LRA de 3 ou même moins.

!33
14)True Peak Metering (Crètes inter-échantillons).

Un élément clé de la recommandation BS.1770 est l'utilisation d'un compteur de


crête réelle pour évaluer le niveau de crête réel de la forme d'onde audio
reconstruite. Ceci est important car, bien que le niveau de reproduction d'un matériel
audio soit déterminé par son intensité sonore et qu'une marge généreuse soit
généralement autorisée, le support physique a toujours un niveau d'écrêtage limité
qui doit être protégé.

L'algorithme de l'indicateur True Peak reconnaît les pointes inter-échantillons qui


sont souvent manquées par les simples indicateurs de pointe d'échantillon
généralement fournis par les logiciels DAW et le matériel numérique. Les indicateurs
de crête d'échantillon n'affichent que la valeur d'amplitude la plus élevée d'un groupe
d'échantillons consécutifs, et l'échelle est calibrée en dBFS (décibels Full Scale),
avec 0dBFS en haut. Pour différencier un compteur True Peak d'un compteur
d'échantillons conventionnel, la nouvelle échelle est marquée en dBTP (décibels
True Peak), et va généralement jusqu'à +3 ou +6dBTP. Les plug-ins Loudness meter
les plus simples n'affichent souvent pas du tout le True Peak, mais seulement un
voyant de surcharge qui s'allume lorsque le signal dépasse un seuil défini -
généralement -1dBTP.

Pour détecter les crètes inter-échantillons, un peak-mètre True Peak utilise un taux
de sur-échantillonnage relativement élevé qui lui permet de reconstruire plus
complètement la forme d'onde audio continue. La norme BS.1770 préconise un taux
de suréchantillonnage minimum de 4x, ce qui donne une erreur de sous-lecture
maximale possible légèrement inférieure à 0,7dB. C'est pourquoi l'EBU recommande
de fixer le niveau maximal autorisé (permitted maximum level,PML) à -1dBTP,
garantissant ainsi que le signal ne pourra jamais provoquer une surcharge ou un
écrêtage dans les équipements de traitement numérique ou les convertisseurs
suivants. (La recommandation ATSC A/85 fixe un PML légèrement plus conservateur
de -2dBTP).

Il n'est pas surprenant que plus le rapport de suréchantillonnage est élevé, plus la
sous-lecture inter-échantillon possible est faible. Un rapport de suréchantillonnage
de 8x donne une erreur maximale légèrement inférieure à 0,2dB, et un
suréchantillonnage de 16x est précis à 0,05dB près. Cependant, des rapports de
suréchantillonnage plus élevés impliquent une plus grande surcharge de traitement,
et en termes pratiques, l'avantage est négligeable dans la plupart des cas. La
recommandation de la norme BS.1770 préconise donc une PML de -1dBTP basée
sur le rapport 4x, plus facile à gérer, ce qui est une solution très pragmatique

!34
adoptée par la grande majorité des fabricants de plug-ins de mesure de l'intensité
sonore.

15)Affichages, paramètres typiques d'un loudness meter

Nous avons l'habitude de travailler avec des indicateurs de niveau qui partagent des
caractéristiques d'affichage très reconnaissables. Par exemple, les VU-mètres nous
sont immédiatement familiers, avec leur fond jaune typique gradué avec une
modulation de 100 pour cent sous 0VU, la section rouge de l'échelle s'arrêtant
généralement à +3dB. Les indicateurs de quasi-crête sont également
reconnaissables, avec leur fond noir typique et leurs marques blanches - en
particulier le PPM de la BBC, qui s'échelonne simplement de 1 à 7. De même, tous
les indicateurs d'échantillons numériques sont des bargraphes, avec une échelle de
0 dBFS en haut, descendant jusqu'à -50 dBFS ou plus, et souvent avec une plage
étendue sur les 6 dB supérieurs.

Cependant, aucun des documents de recommandation sur les indicateurs d'intensité


sonore ni aucune des normes de mise en œuvre régionales n'indiquent à quoi doit
ressembler un indicateur d'intensité sonore - ils précisent seulement comment les
chiffres doivent être calculés ! Je pense personnellement qu'il s'agit d'un défaut
majeur des organismes de normalisation, car la conséquence naturelle est que
chaque fabricant qui produit un appareil de mesure de l'intensité sonore conforme à
la norme BS.1770 le fait avec sa propre présentation et ses propres graphiques. Il

!35
n'est pas surprenant que la variation qui en résulte rende la plupart des utilisateurs
confus et décourage l'adoption de la mesure de l'intensité sonore parce que
personne ne sait vraiment quelle version acheter ! La bonne nouvelle, cependant,
c'est que tous les indicateurs d'intensité sonore calculent les chiffres affichés
exactement de la même manière, et qu'ils montrent tous les mêmes choses, mais à
des endroits différents et de manières différentes.

Le paramètre le plus important est la valeur "Programme Loudness" ou "Integrated


Loudness" (I), qui correspond à l'intensité sonore globale de l'ensemble du
programme. Ce paramètre est généralement mis en évidence dans l'affichage du
lecteur, souvent en étant plus grand que n'importe quel autre chiffre ou à un
emplacement privilégié. La valeur de la sonie intégrée doit être égale à la valeur de
la sonie cible à la fin du programme.

La valeur de la Loudness intégrée est toujours associée à une fonction de minuterie


de démarrage/arrêt/réinitialisation, qui détermine la durée de la mesure. Le système
doit être réinitialisé et démarré avant le début du déroulement du programme, et
arrêté à la fin, soit manuellement, soit automatiquement en étant lié aux commandes
de transport du DAW dans certains systèmes. Les temps réels de démarrage et
d'arrêt avant et après le programme ne sont pas critiques en raison de la porte
-70LUFS qui garantit que la valeur d'intensité sonore du programme n'est pas
affectée par les silences.

Outre la valeur de sonie intégrée, la plupart des loudness-mètres affichent cinq


autres paramètres d'une manière ou d'une autre, le plus souvent sous forme de
simples valeurs numériques dans des cases, mais parfois avec des graphiques à
barres. Les deux premiers sont généralement intitulés M pour Momentanée et S
pour Short. La valeur M est "momentanée" et basée sur une fenêtre coulissante de
400 ms mise à jour toutes les 100 ms, ce qui donne une indication de l'intensité
sonore instantanée. Elle est destinée à faciliter le réglage du niveau initial au début
d'un mixage et, dans de nombreux appareils de mesure, la valeur M est affichée
sous forme de graphique à barres, où elle se comporte de manière très similaire à
un VU-mètre standard.

La valeur S est la valeur d'intensité sonore "à court terme" ou " progressive ", qui est
basée sur une fenêtre coulissante de trois secondes. Lors du mixage de matériel à
la volée, la valeur S est celle qu'il faut surveiller car elle répond assez rapidement
aux ajustements de mixage et fournit une bonne indication de l'intensité sonore du
mixage par rapport à la valeur cible, à chaque instant.

Le niveau de crête réel peut également être affiché, soit sur un graphique à barres,
soit sous forme de valeur numérique, et la valeur maximale normale autorisée est de
-1dBTP (-2dBTP pour les installations ATSC A/85). Tout ce qui est supérieur à cette

!36
valeur indique la présence de crètes inter-échantillons, ce qui provoque des
surcharges internes et un écrêtage dans tout traitement numérique du signal qui
implique un suréchantillonnage, ce qui inclut tous les convertisseurs N/A modernes,
les convertisseurs de fréquence d'échantillonnage, les codecs de réduction des
données avec perte tels que MP3 et AAC, et la plupart des plug-ins d'égalisation et
de dynamique. Certains appareils de mesure n'affichent pas la valeur réelle du True
Peak, mais allument un indicateur d'avertissement si le signal dépasse un seuil PML
prédéfini.

Le dernier paramètre, que tous les appareils de mesure ne fournissent pas, est la
plage de sonie ou valeur LRA. un film d'action typique peut présenter une valeur
LRA d'environ 25dB, tandis qu'un programme télévisé typique peut être d'environ
10dB. La valeur LRA de la musique varie largement en fonction du style et du genre,
mais je dirais qu'une valeur comprise entre 3 et 15dB est acceptable pour la plupart
des styles de musique pop, et un peu plus pour la musique classique, le jazz, etc.
Pour fournir quelques points de référence, le morceau "Devil's Eye" de Chris de
Burgh utilisé dans l'illustration précédente a un LRA assez important de 14,4dB,
alors que le corps principal en "brique" du morceau "Samurai" de Grand Prix a un
LRA de seulement 1,5dB.

La plupart des systèmes de mesure de l'intensité sonore comprennent également


une forme de graphique de historique . Il s'agit souvent d'un graphique à défilement
horizontal des niveaux d'intensité sonore, qui superpose parfois les valeurs
d'intensité sonore intégrée, à court terme et momentanée au seuil d'intensité sonore
cible. Une autre méthode, utilisée par TC Electronic, consiste à afficher l'historique
sous forme d'un "écran radar" rotatif.

Étant donné qu'il n'y a pas deux fabricants qui affichent les valeurs d'intensité sonore
et les données connexes exactement de la même manière, le choix de l'appareil de
mesure se résume aux préférences personnelles du fabricant et à l'esthétique de la
présentation graphique. Les seules questions techniques à prendre en compte sont
la conformité aux dernières spécifications de l'ITU (actuellement BS.1770-3) et toute
exigence régionale telle que EBU R-128 ou ATSC A/85, cette dernière affectant les
unités d'affichage et toute limite prédéfinie de l'intensité sonore cible et de la crête
réelle.

Si vous souhaitez vérifier la précision et la conformité de l'appareil de mesure de


l'intensité sonore que vous avez choisi, Prism Sound et Qualis Audio ont créé
conjointement une suite excellente et complète de signaux de test, qui sont
disponibles sur leurs deux sites Web (voir l'encadré "Lectures complémentaires").

De nombreux plug-ins commerciaux de mesure de l'intensité sonore comprennent


une fonction permettant d'évaluer l'intensité sonore des fichiers en arrière-plan et

!37
plus rapidement qu'en temps réel. Il peut également être possible de travailler en
mode batch pour évaluer un grand groupe de fichiers.

!38
16)Analyse du loudness dans les logiciels de lecture audio.

La fonction Sound Check d'Apple a été introduite avec iTunes 3, en 2002, et elle est
incluse dans tous les appareils iOS actuels - iPods, iPhones, iPads, etc. L'idée
derrière Sound Check est essentiellement d'éviter les changements de volume
ennuyeux (et potentiellement dangereux) qui peuvent se produire si votre liste de
lecture passe, par exemple, d'une ballade de jazz tranquille à un morceau de métal
hurlant ! Il fonctionne de manière très similaire à l'algorithme BS.1770 de l'ITU-R
mais - comme le veut la politique habituelle d'Apple - les détails précis du
fonctionnement interne du système sont un secret bien gardé. Bien que l'algorithme
d'Apple ne soit pas aussi précis ou exact que l'algorithme BS.1770, il en est
suffisamment proche pour donner des résultats et des avantages très utiles.

Lorsque Sound Check est activé pour la première fois, via une case à cocher dans la
section Lecture de la boîte de dialogue Préférences d'iTunes, l'ensemble de la
bibliothèque iTunes est analysé et le volume sonore de chaque chanson ou piste
audio est mesuré et enregistré. Cette opération peut prendre un certain temps, en
fonction de la taille de votre bibliothèque musicale - comptez environ 50 à 100 pistes
numérisées par minute. Une fois numérisées, les données de sonie sont stockées
dans la balise "information de normalisation" des métadonnées ID3 associées aux
fichiers individuels MP3, AAC, AIFF ou ALAC (Apple Lossless). Les métadonnées
d'intensité sonore peuvent également être stockées dans la base de données XML
d'iTunes pour les formats de fichiers pris en charge qui n'incluent pas de
métadonnées compatibles.

Lorsqu'une piste est ensuite réécoutée avec la fonction Sound Check activée
(activée sur la plupart des appareils iOS via le menu Réglages), les informations de
normalisation stockées sont utilisées pour compenser le niveau de réécoute interne
de cette piste spécifique, de sorte qu'elle se retrouve à peu près à la même intensité
sonore perçue que toutes les autres pistes. Le système est facile à utiliser et à
configurer, et il est généralement très efficace, en particulier pour tous ceux qui
utilisent le mode "shuffle" avec une bibliothèque musicale éclectique, ou qui créent
des listes de lecture variées !

Mode album

Alors que la normalisation de l'intensité sonore de Sound Check est idéale lorsque
vous écoutez des morceaux disparates, pour maintenir des niveaux d'écoute
raisonnablement cohérents, elle n'est pas si bonne si vous voulez écouter une
œuvre musicale complète où l'intensité sonore relative des sections musicales
séquentielles est un facteur important dans l'expérience globale. Cela s'applique à
tout genre musical où les contrastes délibérés de segments calmes entre des

!39
sections plus fortes sont importants d'un point de vue esthétique - comme dans les
symphonies classiques complètes, les albums conceptuels de rock-prog, ou tout
autre album contenant une sélection variée de matériel sur des plages distinctes.

Jusqu'à récemment, si Sound Check était activé mais que vous choisissiez d'écouter
un album complet, toutes les variations de volume prévues entre les pistes étaient
supprimées, détruisant l'effet recherché et une grande partie du plaisir musical !
Heureusement, Apple a maintenant corrigé cette faiblesse : la dernière version
d'iTunes dispose désormais d'un mode Album non annoncé mais très apprécié qui
applique intelligemment la correction du volume sonore en fonction de la façon dont
vous avez choisi d'écouter votre musique.

Si la fonction Sound Check est activée pour les morceaux lus en mode aléatoire
d'iTunes, via une liste de lecture ou par le biais des écrans de recherche iTunes par
artiste ou par genre, etc. En revanche, si la musique est sélectionnée via les listes
d'albums d'iTunes, le lecteur suppose que vous souhaitez profiter des pistes avec
leurs niveaux relatifs d'origine, et le mode Sound Check est donc temporairement
modifié. Il s'agit d'une avancée utile, mais malheureusement, cela signifie également
que le passage de la sélection d'un album à la sélection d'un artiste ou d'une piste
entraîne un décalage important du niveau d'écoute, car ce dernier est normalisé en
termes de volume, alors que le premier ne l'est pas. Ce n'est donc pas encore une
solution parfaite, mais c'est bien mieux que les options d'origine et, pour la première
fois, il est tout à fait acceptable de laisser Sound Check activé. En fait, l'industrie
demande à Apple d'activer Sound Check par défaut dans les futures mises à jour
logicielles.

Pas assez fort !

Un problème un peu plus difficile à résoudre est celui du volume de lecture


insuffisant lorsque Sound Check est activé. Il est clair que pour que la normalisation
de la sonorité soit efficace, le niveau de sonorité cible doit être suffisamment bas
pour tenir compte des crètes du matériel le plus dynamique susceptible d'être
rencontré. Apple semble avoir choisi un niveau cible d'environ -16LUFS, ce qui
signifie inévitablement que le volume de lecture d'un contenu hautement compressé
sera considérablement inférieur à son niveau natif lors de l'audition avec Sound
Check désactivé - en pratique, jusqu'à 12dB de moins, ce qui représente une
atténuation considérable.

La réponse évidente est simplement d'augmenter le volume de lecture de l'appareil


pour rétablir un niveau d'écoute confortable lorsque la fonction Sound Check est
activée. Malheureusement, ce n'est pas toujours possible, en particulier pour les
utilisateurs d'appareils Apple en Europe où les préoccupations de "sécurité auditive"
ont conduit Apple et d'autres fabricants à restreindre le volume de lecture maximal

!40
des iPods, iPhones, iPads et même des ordinateurs portables ! Espérons que les
futures mises à jour du micrologiciel permettront d'augmenter le gain de lecture
lorsque la fonction Sound Check est active, mais d'ici là, les seules solutions
alternatives sont d'investir dans des écouteurs/écouteurs beaucoup plus sensibles
ou d'utiliser un amplificateur d'écouteurs externe. Ces deux solutions impliquent des
dépenses supplémentaires et dissuaderont donc de nombreux consommateurs
d'utiliser la fonction Sound Check, du moins à court terme, ce qui est regrettable.

17)le systeme K weighted

Le système K est un système de mesure et de contrôle inventé par l'ingénieur de


mastering Bob Katz, qui a remporté un Grammy Award, dans le but d'enrayer la
guerre du volume sonore. Il vous aide à répondre à l'éternelle question : "Quel doit
être le volume de mon mixage/master ?" Mais le système K est-il toujours pertinent
avec l'avènement des sonomètres standardisés ? Je pense que oui. Passons en
revue le système K pour voir quelles pépites de sagesse nous pouvons trouver...

Un sonomètre K-System comporte un crêtemètre et un compteur RMS pour chaque


canal stéréo. Le vumètre RMS mesure l'intensité "moyenne" du signal, comme un
vumètre analogique, et peut remplacer avantageusement un loudness meter. Une
idée clé du système K est que vous devez vous concentrer principalement sur les
niveaux RMS, plutôt que sur les niveaux de crête, car les niveaux RMS
correspondent plus étroitement à la façon dont nous percevons l'intensité sonore. Le
crête-mètre est utilisé principalement pour détecter l'écrêtage.

Les indicateurs de crête et de RMS du système K sont linéaires plutôt que


logarithmiques. Dans une échelle linéaire, chaque dB a la même largeur ou hauteur
(selon que l'échelle est horizontale ou verticale). Avec une échelle logarithmique, les
dB proches du "haut" de l'échelle sont plus grands que ceux proches du bas. Le
dimensionnement non linéaire d'une échelle logarithmique peut vous inciter à
"écraser" vos niveaux près du sommet de l'échelle, puisque cette région semble plus
grande que le reste de l'échelle. L'utilisation d'une échelle linéaire permet de contrer
cette tentation.

"Mesure "intégrée

Le système K est "intégré" dans le sens où la mesure est "liée" au contrôle. En


d'autres termes, les niveaux sur les indicateurs RMS correspondent aux niveaux de
pression sonore physiques. Pour que cela fonctionne, vos moniteurs doivent être
calibrés avec un décibelmetre. Cela présente quelques avantages. Premièrement,
en travaillant dans un environnement calibré, vous pouvez prendre des décisions
plus cohérentes concernant les niveaux de votre musique. Deuxièmement, les

!41
niveaux sur l'appareil de mesure renforceront ce que vous entendez et vice versa.
Au fil du temps, cela va "accorder" vos oreilles et améliorer votre jugement.

Points d'ancrage

Les appareils de
mesure du système K
diffèrent de la plupart
des autres appareils
de mesure des crêtes
et des valeurs
efficaces en ce que le
point 0 dB est décalé
vers le bas par rapport
au haut de l'échelle.
En d'autres termes, 0
dB ne correspond pas
à 0 dBFS (le niveau le
plus élevé possible
avant l'écrêtage). Au
lieu de cela, 0 dB
correspond à -12
dBFS, -14 dbFS ou
-20 dBFS (nous y
reviendrons plus tard). Ces "points d'ancrage" sont censés correspondre aux
niveaux moyens de votre musique. Cela a une implication subtile : plutôt que de
vous concentrer sur le haut de l'échelle (0 dBFS), ce qui pourrait vous inciter à
maximiser vos niveaux, vous vous concentrez plutôt sur un point d'ancrage qui
représente le niveau moyen de votre musique.

K-scale et headroom

Le système K comporte trois "échelles K" : K-12, K-14 et K-20. Elles correspondent
aux points d'ancrage mentionnés précédemment : -12 dBFS, -14 dBFS et -20 dBFS.
Chaque échelle fournit une quantité différente de marge, l'espace au-dessus de 0
dB. Par exemple, K-20 a une marge de 20 dB, tandis que K-12 a 12 dB. Plus vous
avez de marge, plus vos niveaux de crête et RMS peuvent dépasser le niveau
moyen.

K-scale

Vous choisissez l'échelle K à utiliser en fonction de la plage dynamique dont vous


avez besoin. Pour les enregistrements avec peu de plage dynamique, vous pouvez

!42
choisir K-12. Pour le rock, la pop et la country, vous pouvez choisir K-14. Pour la
musique classique, vous pouvez choisir K-20.

Les indicateurs RMS du système K comportent trois zones codées par couleur : vert,
jaune et rouge. Le vert correspond au calme, le jaune au fort et le rouge au très fort.
Les régions verte et jaune bordent le point d'ancrage de 0 dB mentionné
précédemment. Étant donné que 0 dB représente le niveau moyen de votre
musique, vous pouvez dépasser 0 dB dans la zone jaune ou rouge pendant les
passages forts, ou descendre dans la zone verte pendant les passages calmes.

Niveau de référence et étalonnage

Lorsque vos moniteurs sont calibrés avec les indicateurs du système K, 0 dB sur les
indicateurs doit correspondre à une intensité sonore réelle de 83 dBSPL (85 dBSPL
pour deux canaux), un niveau de référence utilisé dans l'industrie
cinématographique depuis des années. Cet étalonnage doit être effectué
séparément pour chaque échelle K, car le point d'ancrage de 0 dB sera de -12
dBFS, -14 dBFS ou -20 dBFS, en fonction de l'échelle K. Ce qu'il faut retenir, c'est
que quelle que soit l'échelle K choisie, 0 dB correspond à la même intensité sonore
physique. La différence entre les échelles est la marge de manœuvre qu'elles
offrent.

Pour calibrer vos moniteurs, choisissez une échelle K et jouez un signal de bruit rose
à spectre complet et à canal unique à 0 dB sur cette échelle. Depuis votre position
d'écoute, utilisez un SPL-mètre (avec une réponse lente pondérée en C) pour
mesurer l'intensité sonore. Réglez le gain de votre moniteur jusqu'à ce que le SPL-
mètre indique 83 dBSPL. Ensuite, répétez le processus pour l'autre canal. Notez le
gain de votre moniteur calibré pour référence ultérieure. Ensuite, si vous le
souhaitez, répétez ce processus pour les autres échelles K.

Conseils pratiques

Même si vous décidez de ne pas utiliser le système K, voici quelques idées que
vous pouvez intégrer dans votre flux de travail :

-Concentrez-vous principalement sur un compteur RMS, un VU-mètre ou un


sonomètre plutôt que sur un crête-mètre.
-Soyez attentif au type d'échelle de votre appareil : est-elle linéaire ou
logarithmique ?
-Un environnement d'écoute calibré peut vous aider à "accorder" vos oreilles et à
prendre des décisions plus cohérentes.
-Utilisez un point d'ancrage inférieur à 0 dBFS, afin de ne pas être tenté d'écraser
votre son.

!43
!44
18)Terminologie

Facteur de crête : Une mesure de l'amplitude de la forme d'onde d'un signal,


indiquant le rapport entre la valeur de crête et la valeur moyenne. Un facteur de
crête de 1 indique l'absence de crête (c'est-à-dire un signal continu), tandis qu'une
onde sinusoïdale a un facteur de crête de 1,414 et une onde triangulaire de 1,732.

dBTP : Niveau de crête réel en décibels, par rapport à la pleine échelle numérique. Il
s'agit de la valeur maximale de la forme d'onde du signal audio reconstruit, en tenant
compte des crêtes inter-échantillons.

I, ou Loudness intégré. La valeur d'intensité sonore indiquée sur un sonomètre, qui


est intégrée sur toute la durée du programme. Également connue sous le nom de
sonie du programme. Cette valeur doit être égale à la valeur de l'intensité sonore
cible à la fin de l'élément.

LKFS : Loudness, pondéré K, par rapport à la pleine échelle numérique. Terme


privilégié par l'ATSC pour désigner la valeur absolue de la sonie. (Voir LUFS).

LRA : Loudness Range. La distribution de l'intensité sonore dans un programme (un


indicateur de la gamme dynamique perçue du programme).

LU : Loudness Units. Une valeur d'intensité sonore relative à partir du niveau


d'intensité sonore cible.

LUFS : unités d'intensité sonore par rapport à la pleine échelle numérique. Le terme
préféré de l'UER pour la valeur absolue de la sonie. (Voir LKFS)

M, ou Loudness Momentané : Une valeur d'intensité sonore instantanée indiquée


sur un sonomètre. Elle est évaluée à partir d'une fenêtre temporelle de 400 ms, mise
à jour toutes les 100 ms. Utilisé uniquement pour le réglage initial du niveau.

Programme : Un programme audio individuel, une publicité, une piste musicale, etc.

Program Loudness : L'intensité sonore intégrée pendant la durée du programme, en


LUFS. Elle est également représentée par la valeur "I" sur les sonomètres.

Target sound level : Le niveau de normalisation de l'intensité sonore prévu.

TP, ou True Peak : La valeur de crête maximale de la forme d'onde audio


reconstruite (qui inclut les crêtes inter-échantillons).

!45
Sample Peak : Le système typique d'indicateur de crête d'échantillon numérique qui
indique la valeur d'amplitude la plus élevée représentée dans un lot d'échantillons
audio numériques. Elle est généralement inférieure à la valeur True Peak de la
forme d'onde analogique reconstruite, car elle ignore les pics inter-échantillons.

S, ou Sliding ou Short-term Loudness : Valeur d'intensité sonore à court terme


indiquée sur un loudness meter, évaluée à partir d'une fenêtre temporelle de trois
secondes mise à jour en permanence. Utilisé pour les ajustements de mixage
momentanés.

!46
References:

https://www.soundonsound.com/techniques/end-loudness-war
http://www.itu.int/rec/R-REC-BS.1770
http://www.atsc.org/cms/standards/A_85-2013.pdf
http://tech.ebu.ch/docs/r/r128.pdf
http://tech.ebu.ch/docs/tech/tech3342.pdf
http://resources.prismsound.com/tm/Loudness_Meter_Test_Signals.zip
http://www.qualisaudio.com/documents/TechNote-2-WaveFiles-5-12-2011.zip
http://www.qualisaudio.com/documents/TechNote-1-5-31-2011.pdf
http://www.qualisaudio.com/documents/TechNote-2-5-31-2011.pdf
http://www.music-loudness.com/
http://dynamicrangeday.co.uk/
https://www.soundonsound.com/sound-advice/q-whats-difference-between-ppm-and-
vu-meters
http://index-of.es/Varios-2/Mastering%20Audio%20Art%20and%20Science.pdf

!47

Vous aimerez peut-être aussi