Académique Documents
Professionnel Documents
Culture Documents
La Norme EBU-R128
Laurent Eyen
Tables des matières
5- L'oreille électronique.
6- Marges, headroom.
7- La radiodiffusion.
10-Mastering conflictuel.
12-Avantages et inconvénients.
17-Terminologie.
!1
1) Introduction à la necessité d’une norme actuelle pour le niveau de sonie
Le peak-mètre et le VU-mètre, bien que présent sur tous les appareils de mesure
analogiques sont des indicateurs obsolètes ! En bref, le VU-mètre qui indique un
niveau de signal moyen tente de donner une impression d'intensité sonore perçue,
tandis que le PPM indique quelque chose de plus proche de l'amplitude de crête du
signal d'entrée. Ces indicateurs sont inhérents à la mesure électrique des signaux
audio analogique, simulé dans le monde numérique, ils ne sont pas pondéré
fréquenciellement parlant.
Dans notre monde numérique moderne, à l’ere du streaming dominant, aucun de
ces deux indicateurs n'est plus vraiment adapté. Les traitements audio actuels
(brickwall look ahead limiter, “clean” distortion, antialisasing,
multibandes,...).permettent une “triche” créant des signaux paru fort, bien que leurs
mesure électrique soient en deça des anciennes “normes” (Max -9 dBfs en peak
pour les “P.A.D. Près à diffuser” pub dans les année 90). Afin d’assurer un stablité
volumique percue des diffusion (radio, tv, playlist) une nouvelle norme s’impose.
C’est la norme BS1770 de l'ITU (International Telecommunication Union) ou EBU
R-128, qui fut adoptée très rapidement dans le monde entier, dans le secteur de la
radiodiffusion et ailleurs. Il s'agit d'un excellent système de mesure qui fournit un
nouvel indicateur d'intensité sonore très précis mis à l'échelle en LUFS - qui fait un
bien meilleur travail que le VU - ainsi qu'un indicateur “true peak” suréchantillonné
mis à l'échelle en dBTP, qui fait un bien meilleur
travail que le PPM.
!2
L'affichage d'un VU-mètre est influencé à la fois par l'amplitude et la durée du signal
appliqué. Lorsqu'un signal sinusoïdal régulier est appliqué à l'entrée, le VU-mètre
donne une lecture précise de la tension RMS (valeur quadratique moyenne) du
signal. Cependant, avec des signaux musicaux ou vocaux plus complexes, le
VUmètre indique généralement de manière sous-évaluée. Un son continu produira
une indication beaucoup plus élevée qu'un signal transitoire bref, même si les deux
ont la même tension de crête. En théorie, un VU-mètre devrait répondre à la fois aux
moitiés positives et négatives du signal audio d'entrée, mais les implémentations les
moins chères ne mesurent parfois qu'une moitié de la forme d'onde, et peuvent donc
fournir des lectures différentes avec des signaux asymétriques par rapport aux VU-
mètres complets.
L'indication du niveau de référence est de 0VU, mais le niveau audio requis pour
l'obtenir peut être celui que l'utilisateur souhaite. L'implémentation originale du SVI
comprenait un atténuateur réglable permettant de s'adapter à tout niveau de
fonctionnement standard jusqu'à +24dBu (les diffuseurs américains utilisent toujours
des niveaux de référence nominaux de +8dBu). Les VU-mètres modernes omettent
généralement l'atténuateur réglable par l'utilisateur et sont généralement réglés pour
donner une indication de 0VU pour un niveau d'entrée de 0dBu ou +4dBu. Ce
dernier est le "standard pro" le plus courant, mais de nombreux fabricants utilisent le
premier alignement, y compris Mackie: 0 VU = 0dBu Studer: 0VU=+4dBu. En
général, le SVI ou VU-mètre tend à montrer la tension moyenne du signal, et donne
une indication “raisonnable” de l'intensité sonore perçue. Notons tout de même que
l’aiguille monte plus facilement avec des éléments riche en fréquences basses
(énergétique) que des fréquences medium ou aiguë perçues au meme niveau ( cfr
courbe Fletcher- Munson)
Le Peak Programme Meter ou PPM est une conception beaucoup plus élaborée et
précède le VU, puisque son développement a commencé en 1932, le compteur que
nous connaissons aujourd'hui étant apparu en 1938. Malgré leur nom, les PPM
n'indiquent pas réellement la véritable crête de la tension du signal. Les premières
versions utilisaient un temps d'intégration de 10 ms (PPM de type I), tandis que les
versions ultérieures utilisent un temps d'intégration à 4 ms (PPM de type II). Ces
temps d'intégration courts ont été sélectionnés spécifiquement pour ignorer les
crêtes transitoires les plus rapides, et c'est pourquoi le PPM est souvent appelé un
!3
compteur "quasi-peak" pour le différencier des compteurs de crête réelle. En
général, les signaux transitoires très brefs sont sous-évalués d'environ 4 dB. La
raison pour laquelle on a ignoré les transitoires brefs était d'encourager les
opérateurs à fixer des niveaux légèrement plus élevés qu'ils ne l'auraient fait
autrement, en partant du principe que toute surcharge transitoire dans l'équipement
d'enregistrement ou de transmission serait inaudible, sachant que le ppm s’arrête à
+12 dBu et que les appareil audio professionnels peuvent généralement sortir du
+22 dBu. Cette marge qui est généralement suffisante pour les surcharges
analogiques de moins de 1 ms (peak).
!4
Introduction aux normes de sonie
Dans une annonce surprenante faite lors de la convention AES (audio engineering
society) à New York, le célèbre ingénieur de mastering américain Bob Katz a déclaré
dans un communiqué de presse que "la loudness war est terminée." C'est une
déclaration assez provocante - mais si la réalité n'est probablement pas aussi simple
que Katz voudrait nous le faire croire (surtout en dehors des États-Unis), il y a de
bonnes raisons de penser qu'il pourrait avoir raison au cours des prochaines
années. L'idée est que si toute la musique est lue au même volume perçu, il n'y a
plus d'intérêt pour les ingénieurs de mixage ou de mastering à s'affronter dans cette
"guerre de volume". Le cri de victoire de Bob Katz trouve son origine dans l'adoption
récente par les industries de l'audio et de la radiodiffusion d'une nouvelle mesure
standard de l'intensité sonore et, plus récemment encore, dans l'inclusion de
fonctions de normalisation automatique de l'intensité sonore dans les systèmes de
radiodiffusion et de lecture grand public.
!5
2) La guerre du volume sonore (Loudness war)
S'il est prouvé que Bob Katz a raison, la mode actuelle de l'"hypercompression" de
la musique pourrait bien se relâcher, voire s'inverser dans les mois et les années à
venir, et l'application de la compression et de la limitation redeviendra une décision
purement artistique et musicale, plutôt qu'un processus essentiel à la fabrication d'un
produit compétitif.
!6
les radios commerciales, par exemple, mais la nouvelle technologie permet de
l'utiliser dans les services de streaming de musique sur Internet et dans les
softwares lecteurs de musique personnels. Dans un environnement de normalisation
de l'intensité sonore, il devient impossible de faire en sorte qu'une piste semble
globalement plus forte qu'une autre, de sorte que le mastering visant à maximiser
l'intensité sonore devient totalement futile.
Ainsi, dans les environnements dont le niveau sonore est normalisé - ce qui devrait
inclure la grande majorité des systèmes de lecture de musique d'ici un an ou deux -
l'utilisation d'une forte compression et d'une limitation pour que les pistes sonnent
fort ne fonctionnera plus. Chaque piste est automatiquement équilibrée pour avoir la
même intensité sonore globale que toutes les autres pistes, et le matériel
hypercompressé finit par paraître plat, faible et inintéressant par rapport au matériel
plus naturellement dynamique.
!7
3) L'état actuel des choses
Les producteurs de musique (au sens le plus large du terme) ont rapidement
compris qu'ils pouvaient utiliser des techniques permettant d'extraire la plus grande
partie possible du signal audio jusqu'au niveau de crête maximal du système
numérique, simplement parce que le format CD ne se plaignait pas comme les
découpeurs de vinyle - et maintenant, beaucoup de gens semblent penser que c'est
le rôle principal d'un ingénieur de mastering ! Pour qu'un morceau sonne fort sur un
CD (ou en téléchargement), on utilise généralement une limitation et une
compression importantes, souvent associées à une mise en forme spectrale, afin
d'augmenter le niveau d'énergie moyen et de minimiser le facteur de crête, ou le
rapport crête-moyenne. Ces techniques fonctionnent parce que la façon dont nous
percevons l'intensité sonore est essentiellement basée sur le niveau d'énergie
moyen d'une piste ; plus le niveau d'énergie moyen est élevé, plus la piste est forte.
Le terme technique est "normalisation des crêtes" : il s'agit d'élever le niveau du
signal de sorte que ses crêtes atteignent un niveau maximal défini. Le revers de la
médaille est que nous perdons la marge de headroom, il n'y a donc plus de place
pour la dynamique musicale. Nous ne pouvons plus augmenter le niveau des crêtes,
!8
mais seulement le niveau moyen grâce à la limitation. Dans les cas extrêmes, le
matériel devient hypercompressé.
L'hypercompression n'est pas une mauvaise chose en soi : elle a sa place, comme
n'importe quel autre effet musical, et est devenue une partie intégrante du caractère
sonore de certains genres musicaux. C'est normal, car elle est utilisée de manière
musicalement informée. Mais lorsqu'il est utilisé dans le seul but de rendre un
morceau plus fort que la concurrence, il peut être assez dommageable, soit au sens
technique strict (par l'écrêtage, le pompage et autres distorsions), soit en
compromettant la musicalité dans une certaine mesure. L'étendue des dommages
peut varier d'à peine perceptible à flagrante, en fonction des compétences de
l'ingénieur de masterisation et des exigences du client. Mais, en règle générale,
l'abandon de cette pratique de normalisation des crêtes, établie de longue date mais
caractéristiquement destructrice, serait une bonne chose à bien des égards. C'est en
tout cas ce qu'a ressenti l'industrie de la télévision il y a quelques années, et c'est de
là que vient l'origine de la technologie de normalisation de l'intensité sonore.
!9
4) Un volume sonore cohérent pour la télévision
!10
"Permitted Maximum Level (PML)" défini. Bien entendu, les annonceurs n'ont pas
mis longtemps à comprendre qu'ils pouvaient exploiter ces systèmes en utilisant une
compression et une limitation importantes pour que leurs publicités soient beaucoup
plus fortes que les autres publicités ou que les programmes qui les enveloppent, tout
en maintenant les niveaux de crête à la limite du PML. Leur objectif, bien sûr, était
de faire en sorte que les gens prêtent davantage attention à leurs publicités et donc
(espérons-le) d'augmenter les ventes.
!11
5) L'oreille électronique
Il convient de noter qu'il s'agit de l'intensité sonore telle qu'elle est perçue par les
êtres humains, et pas simplement du "niveau". En d'autres termes, l'algorithme du
"Loudness Meter" de l'ITU-R est essentiellement une "oreille électronique" qui
perçoit l'intensité sonore de la même manière que l'auditeur humain moyen, et il
s'est avéré très précis et très fiable. L'intention première derrière son développement
était de permettre aux systèmes d'automatisation de la radiodiffusion de mesurer
l'intensité sonore perçue des programmes et des publicités fournis avant leur
diffusion, afin que leurs niveaux d'intensité sonore puissent être adaptés de manière
similaire à ce qui était réalisé par les opérateurs de continuité formés il y a 30 ans.
La norme UIT-R BS.1770 a été officiellement introduite en 2006 et a été adoptée par
la plupart des broadcasters TV du monde. Il y a eu quelques mises à jour en cours
de route, et les organismes régionaux de normalisation de la radiodiffusion ont
publié leurs propres directives d'application pour répondre aux pratiques locales. Par
exemple, en Europe, la version de EBU (European Broadcasting Union) est appelée
R-128, tandis que la variante américaine est connue sous le nom de ATSC's A/85.
Mais, pour l'essentiel, ils font tous la même chose, fonctionnent de la même manière
et ont des spécifications pratiquement identiques.
En Europe, toutes les chaines de télévision sont actuellement sur la norme EBU
R-128, grâce à un accord volontaire, et les avantages sont tout à fait audibles. Les
publicités n'assourdissent plus le public, le changement de chaîne ne nécessite pas
un ajustement du volume, et le téléspectateur bénéficie de niveaux de programmes
beaucoup plus cohérents en général. L'introduction de la normalisation du volume
sonore a constitué une amélioration positive de l'expérience télévisuelle. (Si vous
vous demandez encore ce que tout cela a à voir avec l'édition de musique sur CD,
restez avec moi - j'y arrive. Les recommandations de la norme BS.1770 ont été
mises en œuvre sur les chaînes de TVHD d'abord parce qu'elles sont toutes
numériques, et ont donc une vaste capacité de gamme dynamique, un niveau de
!12
bruit de fond très bas, et un calibrage de niveau absolu. Cela signifie qu'elles
peuvent s'accommoder de marges de headroom raisonnables sans compromettre la
qualité du son, et qu'un niveau de référence numérique a la même signification pour
tout le monde.
!13
6) Marges, headroom
Il est important de noter que la normalisation du volume sonore n'est rien d'autre
qu'un ajustement statique du volume pour chaque programme, basé sur une
évaluation du niveau sonore qualitatif du programme, mesuré sur toute sa durée. Ce
dernier point est important. La valeur sonore est déterminée sur l'ensemble de la
durée du programme, qu'il s'agisse d'une publicité de 30 secondes ou d'un long
métrage de deux heures, et non à chaque instant. Une fois la valeur d'intensité
sonore déterminée, le niveau de lecture peut être ajusté pour ce programme ou cette
publicité, afin que son intensité sonore soit conforme au "niveau d'intensité sonore
cible" défini par le système de diffusion.
En pratique, cela signifie que le volume typique d'un dialogue normal (qui constitue
l'essentiel de la plupart des programmes) aura à peu près la même intensité sonore
perçue, qu'il s'agisse d'un bulletin d'informations ou d'un long métrage, et qu'elle
sera généralement d'environ -23LUFS. Cependant, alors que les crêtes du signal
dans un journal télévisé peuvent atteindre seulement 4 dB de plus que le niveau
moyen des dialogues, les explosions occasionnelles dans un long métrage peuvent
atteindre un niveau bien plus élevé de 20 dB. La beauté du paradigme de
normalisation de l'intensité sonore est qu'il ne s'en préoccupe pas, car le niveau
sonore cible a été choisi pour fournir une marge suffisante pour faire face à ces
crêtes. Il est important de noter que l'auditeur perçoit les deux programmes comme
!14
ayant la même intensité sonore globale, malgré leurs gammes dynamiques très
différentes.
Ainsi, le monde de la télévision, qui met enfin de l'ordre dans ses affaires, propose
des programmes dont l'intensité sonore globale est beaucoup plus cohérente.
Hourra ! Mais vous vous demandez encore ce que cela a à voir avec la façon dont
vous mixez votre musique. Nous nous rapprochons de cette question, mais notre
détour doit d'abord nous mener dans le monde de la radio et des services de
streaming sur Internet...
!15
7) La radiodiffusion
Nous avons donc ici un autre exemple de paradigme de normalisation des crêtes,
mais dans ce cas, le traitement de radiodiffusion connu sous le nom générique
d'Optimod (bien qu'il s'agisse d'une marque déposée de la société Orban) modifie
l'équilibre spectral et la dynamique de la musique source, et ce souvent de manière
assez spectaculaire. Cette méthode entraîne également une disparité de volume
lorsque les auditeurs se reconnectent à des stations de musique classique ou vocale
traitées de manière plus conservatrice. Essayez de passer de NRJ, Contact à
Musique 3 pour voir ce que je veux dire !
!16
-16,5 LUFS. L'adoption d'un paradigme de normalisation de l'intensité sonore dans
un service de streaming musical aussi largement utilisé va avoir une grande
influence, et pourrait potentiellement avoir une influence massive non seulement sur
le reste de l'industrie du streaming musical, mais aussi sur les créateurs de musique,
simplement parce que le consommateur va s'habituer au matériel normalisé par
l'intensité sonore et aux capacités de gamme dynamique présentées dans ce
paradigme. C'est le catalyseur du communiqué de presse de Katz, qui affirme que la
guerre du volume sonore est terminée.
!17
8) L'intensité sonore de la musique
!18
Avant que la panique ne s'installe, je pense qu'il est important de comprendre que
nous ne sommes pas confrontés à un changement radical des techniques de
production musicale telles que nous les connaissons ! De plus, personne ne force
personne à changer sa façon de mixer et de masteriser sa musique ; si vous aimez
et voulez hyper-compresser vos morceaux, vous pouvez toujours le faire.
Cependant, vous avez également la possibilité d'utiliser la dynamique musicale sans
craindre que le CD ne soit "pas assez fort".
À cet égard, cette "loudness revolution" n'est pas vraiment différente des nombreux
autres changements radicaux dont nous avons déjà été témoins - et auxquels nous
avons survécu - dans l'industrie de la musique, comme les disques à microsillons
haute fidélité qui ont remplacé les 78 tours en gomme-laque dans les années 1950,
ou l'introduction de la stéréo dans les années 1960, du multipiste et de l'overdubbing
dans les années 1970, des synthétiseurs dans les années 1980, des séquenceurs
musicaux dans les années 1990 et de la station de travail audio numérique au début
de ce siècle. Toutes ces technologies (et bien d'autres encore) ont à la fois façonné
la façon dont la musique est faite et influencé la façon dont elle sonne. Le paradigme
de la "loudness-normalisation" exercera lui aussi sa propre influence sur le son de la
musique, dont l'élément le plus important sera de revigorer l'utilisation créative de la
dynamique.
Pour l'instant, l'important est d'être conscients des forces qui poussent à ces
changements potentiels dans les pratiques de travail établies de longue date, de
comprendre la technologie et la terminologie impliquées, de reconnaître les divers
avantages et pièges, et de réfléchir aux opportunités créatives que ce paradigme
changeant présente.
!19
9) L'effet de la normalisation de l'intensité sonore
!20
Ces deux captures d'écran montrent deux pistes différentes côte à côte. Comme
vous pouvez le voir sur l'écran
du haut, où les deux pistes ont
été normalisées en fonction des
crêtes, la piste de droite a subi
un traitement significatif de
l'intensité sonore. Le deuxième
écran montre les deux mêmes
pistes dont l'intensité sonore est
conforme aux nouvelles normes
- et les différences auditives
sont aussi surprenantes que les
différences visuelles !
Comme vous pouvez le constater, la piste de Chris de Burgh n'est pas du tout
fortement limitée ou compressée, et elle présente une dynamique musicale assez
large, qui monte et descend tout au long de la piste. En utilisant un indicateur
compatible avec la norme BS.1770, j'ai mesuré le niveau de crête réel à -1,4 dBTP,
et la sonie intégrée à -18,8 LUFS pour l'ensemble de la piste. En revanche, la piste
du Grand Prix a un niveau de crête vrai de +0,5dBTP (en d'autres termes, il y a un
écrêtage inter-échantillon !) et une sonie intégrée de -7,8LUFS, ce qui est 11dB plus
fort que la piste de Burgh. Cette disparité de sonorité est douloureusement évidente
si vous écoutez les deux pistes dos à dos. Il est intéressant de noter que je possède
!21
également l'album CD original contenant la piste du Grand Prix (j'étais un head-
banger refoulé à l'époque !) et que cette version mesure 0dBTP et -9,6LUFS. Il est
clair que la réédition des "plus grands succès" a subi une compression destructrice
supplémentaire et une limitation des crêtes lors de sa remasterisation !
La capture d'écran du bas montre ce qui arrive à ces deux mêmes pistes dans un
environnement normalisé au niveau sonore. Dans ce cas, j'ai utilisé un volume
sonore cible de -23LUFS - la norme HDTV, et un peu plus bas que le réglage actuel
d'iTunes Radio. La piste du Grand Prix (en vert), incroyablement bruyante, a été
atténuée pour que son intensité sonore soit conforme à la valeur cible, de sorte que
son niveau de crête n'est plus que de -13,7 dBTP, avec pratiquement aucune
variation autre que l'intro et une pause vers la fin. La piste de Chris de Burgh a
nécessité moins d'atténuation pour correspondre à l'objectif d'intensité sonore et,
plus important encore, sa nature plus dynamique signifie que son niveau de crête
transitoire atteint -4,5 dBTP, soit 9 dB de plus que la piste du Grand Prix, malgré une
intensité sonore globale égale.
Ainsi, la piste qui a été remastérisée pour sonner incroyablement fort et "in your
face" a en fait un son plat, trop comprimé et inintéressant du point de vue auditif par
rapport à la piste beaucoup plus dynamique, mais initialement plus silencieuse de
11LU. Sans surprise, c'est la piste de Chris de Burgh qui apparaît comme la plus
intéressante et la plus musicale, et qui constitue une expérience d'écoute plus
agréable. J'encourage tout le monde à essayer ce genre de comparaison : entendre,
c'est croire.
Imaginez que tous ces outils sont les différents programmes. Si nous faisons une
normalisation de peak ,il y a un problème. La densité de l'intensité sonore (centre de
gravité de ces outils) est différente. Ainsi, quelque chose comme l'épée peut être un
film basé sur des dialogues avec des coups de feu occasionnellement forts qui
atteignent un pic et donc la lame s'étend autant. La lecture de ces programmes bout
à bout introduira une énorme variation. Des études ont montré que 95 % des
téléspectateurs modifient le volume de leur téléviseur ou de leur récepteur si le saut
ou la différence d'intensité sonore est une augmentation de 5 LU ou une diminution
de 8 LU. En regardant ce graphique, nous pouvons immédiatement voir que le
téléspectateur sera gêné par une telle variation de tolérance. Supposons donc que
nous rencontrions ce problème et que nous voulions maintenir cette norme
d'intensité sonore tout en effectuant une normalisation des pics.
!22
!
Normalisation des crêtes, Peak Normalisation : Une pratique par laquelle les
crêtes les plus élevées de différents programmes sont alignés sur un niveau de
référence défini, ce qui encourage les ingénieurs à utiliser la compression de la
gamme dynamique pour augmenter l'intensité sonore perçue.
! !
!23
Loudness Normalisation : Une pratique de travail dans laquelle un niveau
d'intensité sonore arbitraire définit le point de référence, et l'intensité sonore des
signaux individuels est évaluée afin qu'ils puissent ensuite être ajustés pour
correspondre à l'intensité sonore lors de la relecture. Cette approche impose une
marge de sécurité et encourage donc les variations dynamiques.
!24
10)Mastering conflictuel
À l'heure actuelle, il n'est pas rare que les artistes de palmarès (ou leurs labels)
publient des CD et des masters de téléchargement à fort volume pour le grand
public, ainsi que des versions radio distinctes, moins écrasées, pour les diffuseurs,
qui résisteront mieux aux technologies de traitement radio actuelles. Lorsque le
matériel est également publié sur vinyle, un autre master encore moins compressé
est souvent produit également, simplement parce que le vinyle ne peut pas
supporter une compression et une limitation importantes.
!25
11) Pratique du mixage en tenant compte de la mesure du loudness
En ce qui concerne le mixage, il n'y a pas besoin de changer quoi que ce soit à la
façon dont vous abordez ou équilibrez vos mixages ; toutes vos compétences
existantes s'appliquent toujours. Le mixage est ce que la musique demande, comme
il l'a toujours été, qu'il s'agisse d'une variété dynamique ou d'une contrainte. Certains
genres musicaux impliquent de construire le mixage proche de zéro dB(fs),
délibérément pour obtenir un son dense et puissant, et si c'est ce qui convient au
travail en cours, continuez de la même manière. Cependant, mixer un morceau pour
qu'il sonne fort, dans le seul but de participer à la "Loudness war", sera un effort
futile si le morceau est destiné à des points de vente normalisés en termes de
volume (c'est-à-dire la plupart). La pratique consistant à mettre l'accent sur la "mid-
range energy" d'un mixage, ou à réduire les graves, qui est généralement employée
pour maximiser l'intensité sonore perçue, sera contre-productive.
Étant donné que les systèmes de lecture normalisés en fonction de l'intensité sonore
disposent d'une marge de réserve raisonnable, il est possible d'en tirer parti en
autorisant des transitoires, des montées et des descentes occasionnelles d'intensité
sonore. Tous nos sens réagissent au changement, et les transitoires sont perçus
comme excitants et intéressants. Par conséquent, les mixages auront plus d'impact
et d'intérêt si vous utilisez délibérément les transitoires tels que les breaks de
batterie emphatiques et les changements dynamiques généreux. J'insiste sur ce que
j'ai dit précédemment : la marge de progression est là pour être utilisée de manière
créative ! N'oubliez pas que l'intensité sonore est déterminée par le niveau moyen,
donc des bits forts occasionnels sont acceptables. Des bits forts en continu
donneront une valeur de sonie intégrée plus élevée. Ce qui impliquera une reduction
globale proportionelle a cette élévation du rapport crètes/moyen.
!26
BS-1770, inséré dans le canal de mixage stéréo et configuré avec un niveau cible
approprié. En l'absence d'une norme reconnue par l'industrie musicale, je suggère
que le niveau Sound Check d'iTunes d'environ -16LUFS soit approprié. Le niveau
cible absolu n'est pas particulièrement critique - c'est la correspondance de
l'intensité sonore avec votre matériel de référence qui est le but ici, avec une marge
de headroom raisonnable pour s'adapter aux transitoires et à la dynamique désirées.
Lors du mixage, l'objectif est d'obtenir une valeur de sonie intégrée pour l'ensemble
de la piste qui soit aussi proche que possible de cette valeur cible, le niveau de crête
réel ne dépassant pas -1dBTP. Si vous suivez et mixez déjà avec une marge de
headroom raisonnable - comme vous le devriez - cela ne devrait pas être trop
différent de votre pratique habituelle.
La difficulté que rencontrent la plupart des gens lorsqu'ils commencent à travailler
avec un loudness-meter est d'essayer d'atteindre immédiatement le niveau cible. Ce
n'est pas nécessaire : la seule valeur d'intensité sonore qui compte est celle qui
s'affiche lorsque vous arrivez à la toute fin du morceau. La plupart des chansons se
construisent progressivement jusqu'à un crescendo à la fin, de sorte qu'au départ, la
valeur de la sonie intégrée devrait être faible et augmenter progressivement au fur et
à mesure que le titre progresse. En fin de compte, l'appareil mesure l'intensité
sonore d'une manière très similaire à notre propre perception, donc si vos oreilles
perçoivent un équilibre dynamique, l'appareil est généralement d'accord ! De même,
ne soyez pas obsédé par la précision du niveau cible - c'est le rôle du système de
lecture du consommateur - essayez simplement de l'atteindre à quelques LU près.
La plus grande différence dans le workflow est ce qui se passe après que vous vous
soyez déclaré satisfait du mixage final. Actuellement, l'étape suivante pour la plupart
des gens est un "passage de mastering" où la marge est supprimée et où la piste est
rendue aussi forte que les mixages de référence. Il est clair que ce traitement
compétitif du volume sonore ne sera plus nécessaire ou approprié - du moins pas en
ce qui concerne les consommateurs de radio, de streaming et de téléchargement.
Au lieu de cela, le processus de masterisation peut se concentrer sur l'optimisation
de l'équilibre spectral et sur l'obtention d'un caractère sonore cohérent entre les
différentes pistes - ou, pour le dire autrement, sur un véritable polissage plutôt que
sur un ponçage intensif !
!27
12) Avantages et inconvénients
Le document original a été remplacé trois fois jusqu'à présent, les améliorations
étant déterminées par le groupe PLOWD, qui comprend 240 membres experts
!28
créatifs et techniques, dont des praticiens indépendants et des membres d'un certain
nombre d'organismes professionnels et de fabricants. La norme BS.1770-1 a été
publiée en septembre 2007, la BS.1770-2 en mars 2011, et l'édition actuelle BS.
1770-3 en août 2012. Les quatre versions sont disponibles sur : http://www.itu.int/
rec/R-REC-BS.1770 si vous êtes intéressé par l'évolution, mais seule la BS.1770-3
est pertinente aujourd'hui. Les différentes mises à jour reflètent de légères
évolutions de l'algorithme de sonie qui est au cœur de la recommandation,
principalement suite aux commentaires de l'EBU et d'autres parties intéressées. La
version actuelle de l'algorithme est plus sensible aux peaks sonores isolés et
accorde moins d'importance aux sons de fond de faible intensité que la version
originale. Un calcul de la "gamme d'intensité sonore",'loudness range' pour indiquer
la plage dynamique perçue a également été intégré. Évidemment, cela signifie que
toute tentative de tromper le système avec des mélanges astucieux pourra être prise
en compte dans les futures mises à jour.
La majeure partie de la norme BS1770-3 vise à définir une mesure fiable et objective
de l'intensité sonore subjective d'un matériel audio, tel qu'un programme télévisé, un
film ou une publicité. L'objectif est de permettre la comparaison impartiale (et
automatique, si nécessaire) de matériel provenant de sources disparates, afin de
faire correspondre la sonie subjective entre elles avec un haut degré de cohérence.
La recommandation détaille également, dans une annexe, l'exigence et la
méthodologie de la mesure des crêtes vraies dans le domaine numérique,
notamment pour éviter de manquer les crêtes inter-échantillons et donc l'écrêtage
par inadvertance lors du traitement ultérieur du signal ou de la conversion du format.
!29
13)Algorithme de mesure de l'intensité sonore
!30
Après cette addition des canaux, la valeur
de l'intensité sonore est donnée sous la
forme d'un nombre à échelle logarithmique
en unités d'intensité sonore par rapport à
la pleine échelle numérique - il s'agira donc
toujours d'un nombre négatif. L'EBU
préfère utiliser les unités absolues LUFS,
tandis que l'ATSC en Amérique utilise
LKFS (loudness, K-weighted, relative to full
scale), mais les calculs sont identiques et
les deux termes sont réellement
interchangeables.
!31
!
Comme vous pouvez le voir, le filtre K appliqué au signal supprime une grande partie
de l'énergie des basses en dessous de 100 Hz, car cela n'affecte généralement pas
notre perception de l'intensité sonore.
Normalement, la valeur de l'intensité sonore de tout matériel préenregistré peut être
mesurée et le niveau de lecture ajusté pour assurer une conformité précise avec
l'intensité sonore cible, mais lorsqu'une normalisation exacte de l'intensité sonore
!32
n'est pas pratique - comme pour les diffusions en direct - la norme de diffusion
HDTV R128 de l'UER exige un écart d'intensité sonore de ±1LU maximum.
Gating & LRA : Bien que les principes de base de l'algorithme d'intensité sonore
soient assez simples, il faut ajouter une certaine complexité pour s'assurer que les
périodes calmes ne tirent pas injustement la valeur d'intensité sonore moyenne vers
le bas. Pour commencer, si le niveau du signal est inférieur à -70LUFS, il ne joue
aucun rôle dans le processus de mesure de l'intensité sonore. Cela permet de
s'assurer que les sections silencieuses au début et à la fin d'un programme
n'affectent pas la valeur d'intensité sonore.
Une autre facette de l'algorithme d'intensité sonore est le calcul d'une "plage
d'intensité sonore"('Loudness Range') ou valeur LRA, qui indique essentiellement
dans quelle mesure la dynamique du programme est contrôlée. La valeur LRA est
dérivée de l'analyse d'une fenêtre d'évaluation de l'intensité sonore de trois
secondes qui glisse continuellement, toute valeur inférieure de plus de 20LU au
niveau d'intensité sonore actuel du programme étant éliminée. Là encore, cela
permet de s'assurer que le chiffre de LRA reflète la gamme des signaux audio de
premier plan et ignore le bruit de fond de faible niveau et le plancher de bruit du
système.
La distribution de ces niveaux d'intensité sonore à court terme est encore quantifiée
en fixant des limites de 10 et 95 pour cent de sorte que le chiffre de LRA est en fait
la différence entre les niveaux d'intensité sonore aux points de 10 et 95 pour cent de
la gamme totale mesurée. La limite inférieure de 10 pour cent empêche, par
exemple, le fondu d'une piste musicale de dominer la valeur de LRA, tandis que la
limite supérieure de 95 pour cent garantit qu'un seul son, exceptionnellement fort, tel
qu'un coup de feu, ne peut à lui seul être responsable d'une valeur de LRA
importante. Un film d'action typique peut avoir une valeur LRA de 25, alors que la
plupart des programmes télévisés normaux sont plus proches de 10 et que la
musique pop compressée peut avoir une valeur LRA de 3 ou même moins.
!33
14)True Peak Metering (Crètes inter-échantillons).
Pour détecter les crètes inter-échantillons, un peak-mètre True Peak utilise un taux
de sur-échantillonnage relativement élevé qui lui permet de reconstruire plus
complètement la forme d'onde audio continue. La norme BS.1770 préconise un taux
de suréchantillonnage minimum de 4x, ce qui donne une erreur de sous-lecture
maximale possible légèrement inférieure à 0,7dB. C'est pourquoi l'EBU recommande
de fixer le niveau maximal autorisé (permitted maximum level,PML) à -1dBTP,
garantissant ainsi que le signal ne pourra jamais provoquer une surcharge ou un
écrêtage dans les équipements de traitement numérique ou les convertisseurs
suivants. (La recommandation ATSC A/85 fixe un PML légèrement plus conservateur
de -2dBTP).
Il n'est pas surprenant que plus le rapport de suréchantillonnage est élevé, plus la
sous-lecture inter-échantillon possible est faible. Un rapport de suréchantillonnage
de 8x donne une erreur maximale légèrement inférieure à 0,2dB, et un
suréchantillonnage de 16x est précis à 0,05dB près. Cependant, des rapports de
suréchantillonnage plus élevés impliquent une plus grande surcharge de traitement,
et en termes pratiques, l'avantage est négligeable dans la plupart des cas. La
recommandation de la norme BS.1770 préconise donc une PML de -1dBTP basée
sur le rapport 4x, plus facile à gérer, ce qui est une solution très pragmatique
!34
adoptée par la grande majorité des fabricants de plug-ins de mesure de l'intensité
sonore.
Nous avons l'habitude de travailler avec des indicateurs de niveau qui partagent des
caractéristiques d'affichage très reconnaissables. Par exemple, les VU-mètres nous
sont immédiatement familiers, avec leur fond jaune typique gradué avec une
modulation de 100 pour cent sous 0VU, la section rouge de l'échelle s'arrêtant
généralement à +3dB. Les indicateurs de quasi-crête sont également
reconnaissables, avec leur fond noir typique et leurs marques blanches - en
particulier le PPM de la BBC, qui s'échelonne simplement de 1 à 7. De même, tous
les indicateurs d'échantillons numériques sont des bargraphes, avec une échelle de
0 dBFS en haut, descendant jusqu'à -50 dBFS ou plus, et souvent avec une plage
étendue sur les 6 dB supérieurs.
!35
n'est pas surprenant que la variation qui en résulte rende la plupart des utilisateurs
confus et décourage l'adoption de la mesure de l'intensité sonore parce que
personne ne sait vraiment quelle version acheter ! La bonne nouvelle, cependant,
c'est que tous les indicateurs d'intensité sonore calculent les chiffres affichés
exactement de la même manière, et qu'ils montrent tous les mêmes choses, mais à
des endroits différents et de manières différentes.
La valeur S est la valeur d'intensité sonore "à court terme" ou " progressive ", qui est
basée sur une fenêtre coulissante de trois secondes. Lors du mixage de matériel à
la volée, la valeur S est celle qu'il faut surveiller car elle répond assez rapidement
aux ajustements de mixage et fournit une bonne indication de l'intensité sonore du
mixage par rapport à la valeur cible, à chaque instant.
Le niveau de crête réel peut également être affiché, soit sur un graphique à barres,
soit sous forme de valeur numérique, et la valeur maximale normale autorisée est de
-1dBTP (-2dBTP pour les installations ATSC A/85). Tout ce qui est supérieur à cette
!36
valeur indique la présence de crètes inter-échantillons, ce qui provoque des
surcharges internes et un écrêtage dans tout traitement numérique du signal qui
implique un suréchantillonnage, ce qui inclut tous les convertisseurs N/A modernes,
les convertisseurs de fréquence d'échantillonnage, les codecs de réduction des
données avec perte tels que MP3 et AAC, et la plupart des plug-ins d'égalisation et
de dynamique. Certains appareils de mesure n'affichent pas la valeur réelle du True
Peak, mais allument un indicateur d'avertissement si le signal dépasse un seuil PML
prédéfini.
Le dernier paramètre, que tous les appareils de mesure ne fournissent pas, est la
plage de sonie ou valeur LRA. un film d'action typique peut présenter une valeur
LRA d'environ 25dB, tandis qu'un programme télévisé typique peut être d'environ
10dB. La valeur LRA de la musique varie largement en fonction du style et du genre,
mais je dirais qu'une valeur comprise entre 3 et 15dB est acceptable pour la plupart
des styles de musique pop, et un peu plus pour la musique classique, le jazz, etc.
Pour fournir quelques points de référence, le morceau "Devil's Eye" de Chris de
Burgh utilisé dans l'illustration précédente a un LRA assez important de 14,4dB,
alors que le corps principal en "brique" du morceau "Samurai" de Grand Prix a un
LRA de seulement 1,5dB.
Étant donné qu'il n'y a pas deux fabricants qui affichent les valeurs d'intensité sonore
et les données connexes exactement de la même manière, le choix de l'appareil de
mesure se résume aux préférences personnelles du fabricant et à l'esthétique de la
présentation graphique. Les seules questions techniques à prendre en compte sont
la conformité aux dernières spécifications de l'ITU (actuellement BS.1770-3) et toute
exigence régionale telle que EBU R-128 ou ATSC A/85, cette dernière affectant les
unités d'affichage et toute limite prédéfinie de l'intensité sonore cible et de la crête
réelle.
!37
plus rapidement qu'en temps réel. Il peut également être possible de travailler en
mode batch pour évaluer un grand groupe de fichiers.
!38
16)Analyse du loudness dans les logiciels de lecture audio.
La fonction Sound Check d'Apple a été introduite avec iTunes 3, en 2002, et elle est
incluse dans tous les appareils iOS actuels - iPods, iPhones, iPads, etc. L'idée
derrière Sound Check est essentiellement d'éviter les changements de volume
ennuyeux (et potentiellement dangereux) qui peuvent se produire si votre liste de
lecture passe, par exemple, d'une ballade de jazz tranquille à un morceau de métal
hurlant ! Il fonctionne de manière très similaire à l'algorithme BS.1770 de l'ITU-R
mais - comme le veut la politique habituelle d'Apple - les détails précis du
fonctionnement interne du système sont un secret bien gardé. Bien que l'algorithme
d'Apple ne soit pas aussi précis ou exact que l'algorithme BS.1770, il en est
suffisamment proche pour donner des résultats et des avantages très utiles.
Lorsque Sound Check est activé pour la première fois, via une case à cocher dans la
section Lecture de la boîte de dialogue Préférences d'iTunes, l'ensemble de la
bibliothèque iTunes est analysé et le volume sonore de chaque chanson ou piste
audio est mesuré et enregistré. Cette opération peut prendre un certain temps, en
fonction de la taille de votre bibliothèque musicale - comptez environ 50 à 100 pistes
numérisées par minute. Une fois numérisées, les données de sonie sont stockées
dans la balise "information de normalisation" des métadonnées ID3 associées aux
fichiers individuels MP3, AAC, AIFF ou ALAC (Apple Lossless). Les métadonnées
d'intensité sonore peuvent également être stockées dans la base de données XML
d'iTunes pour les formats de fichiers pris en charge qui n'incluent pas de
métadonnées compatibles.
Lorsqu'une piste est ensuite réécoutée avec la fonction Sound Check activée
(activée sur la plupart des appareils iOS via le menu Réglages), les informations de
normalisation stockées sont utilisées pour compenser le niveau de réécoute interne
de cette piste spécifique, de sorte qu'elle se retrouve à peu près à la même intensité
sonore perçue que toutes les autres pistes. Le système est facile à utiliser et à
configurer, et il est généralement très efficace, en particulier pour tous ceux qui
utilisent le mode "shuffle" avec une bibliothèque musicale éclectique, ou qui créent
des listes de lecture variées !
Mode album
Alors que la normalisation de l'intensité sonore de Sound Check est idéale lorsque
vous écoutez des morceaux disparates, pour maintenir des niveaux d'écoute
raisonnablement cohérents, elle n'est pas si bonne si vous voulez écouter une
œuvre musicale complète où l'intensité sonore relative des sections musicales
séquentielles est un facteur important dans l'expérience globale. Cela s'applique à
tout genre musical où les contrastes délibérés de segments calmes entre des
!39
sections plus fortes sont importants d'un point de vue esthétique - comme dans les
symphonies classiques complètes, les albums conceptuels de rock-prog, ou tout
autre album contenant une sélection variée de matériel sur des plages distinctes.
Jusqu'à récemment, si Sound Check était activé mais que vous choisissiez d'écouter
un album complet, toutes les variations de volume prévues entre les pistes étaient
supprimées, détruisant l'effet recherché et une grande partie du plaisir musical !
Heureusement, Apple a maintenant corrigé cette faiblesse : la dernière version
d'iTunes dispose désormais d'un mode Album non annoncé mais très apprécié qui
applique intelligemment la correction du volume sonore en fonction de la façon dont
vous avez choisi d'écouter votre musique.
Si la fonction Sound Check est activée pour les morceaux lus en mode aléatoire
d'iTunes, via une liste de lecture ou par le biais des écrans de recherche iTunes par
artiste ou par genre, etc. En revanche, si la musique est sélectionnée via les listes
d'albums d'iTunes, le lecteur suppose que vous souhaitez profiter des pistes avec
leurs niveaux relatifs d'origine, et le mode Sound Check est donc temporairement
modifié. Il s'agit d'une avancée utile, mais malheureusement, cela signifie également
que le passage de la sélection d'un album à la sélection d'un artiste ou d'une piste
entraîne un décalage important du niveau d'écoute, car ce dernier est normalisé en
termes de volume, alors que le premier ne l'est pas. Ce n'est donc pas encore une
solution parfaite, mais c'est bien mieux que les options d'origine et, pour la première
fois, il est tout à fait acceptable de laisser Sound Check activé. En fait, l'industrie
demande à Apple d'activer Sound Check par défaut dans les futures mises à jour
logicielles.
!40
des iPods, iPhones, iPads et même des ordinateurs portables ! Espérons que les
futures mises à jour du micrologiciel permettront d'augmenter le gain de lecture
lorsque la fonction Sound Check est active, mais d'ici là, les seules solutions
alternatives sont d'investir dans des écouteurs/écouteurs beaucoup plus sensibles
ou d'utiliser un amplificateur d'écouteurs externe. Ces deux solutions impliquent des
dépenses supplémentaires et dissuaderont donc de nombreux consommateurs
d'utiliser la fonction Sound Check, du moins à court terme, ce qui est regrettable.
"Mesure "intégrée
!41
niveaux sur l'appareil de mesure renforceront ce que vous entendez et vice versa.
Au fil du temps, cela va "accorder" vos oreilles et améliorer votre jugement.
Points d'ancrage
Les appareils de
mesure du système K
diffèrent de la plupart
des autres appareils
de mesure des crêtes
et des valeurs
efficaces en ce que le
point 0 dB est décalé
vers le bas par rapport
au haut de l'échelle.
En d'autres termes, 0
dB ne correspond pas
à 0 dBFS (le niveau le
plus élevé possible
avant l'écrêtage). Au
lieu de cela, 0 dB
correspond à -12
dBFS, -14 dbFS ou
-20 dBFS (nous y
reviendrons plus tard). Ces "points d'ancrage" sont censés correspondre aux
niveaux moyens de votre musique. Cela a une implication subtile : plutôt que de
vous concentrer sur le haut de l'échelle (0 dBFS), ce qui pourrait vous inciter à
maximiser vos niveaux, vous vous concentrez plutôt sur un point d'ancrage qui
représente le niveau moyen de votre musique.
K-scale et headroom
Le système K comporte trois "échelles K" : K-12, K-14 et K-20. Elles correspondent
aux points d'ancrage mentionnés précédemment : -12 dBFS, -14 dBFS et -20 dBFS.
Chaque échelle fournit une quantité différente de marge, l'espace au-dessus de 0
dB. Par exemple, K-20 a une marge de 20 dB, tandis que K-12 a 12 dB. Plus vous
avez de marge, plus vos niveaux de crête et RMS peuvent dépasser le niveau
moyen.
K-scale
!42
choisir K-12. Pour le rock, la pop et la country, vous pouvez choisir K-14. Pour la
musique classique, vous pouvez choisir K-20.
Les indicateurs RMS du système K comportent trois zones codées par couleur : vert,
jaune et rouge. Le vert correspond au calme, le jaune au fort et le rouge au très fort.
Les régions verte et jaune bordent le point d'ancrage de 0 dB mentionné
précédemment. Étant donné que 0 dB représente le niveau moyen de votre
musique, vous pouvez dépasser 0 dB dans la zone jaune ou rouge pendant les
passages forts, ou descendre dans la zone verte pendant les passages calmes.
Lorsque vos moniteurs sont calibrés avec les indicateurs du système K, 0 dB sur les
indicateurs doit correspondre à une intensité sonore réelle de 83 dBSPL (85 dBSPL
pour deux canaux), un niveau de référence utilisé dans l'industrie
cinématographique depuis des années. Cet étalonnage doit être effectué
séparément pour chaque échelle K, car le point d'ancrage de 0 dB sera de -12
dBFS, -14 dBFS ou -20 dBFS, en fonction de l'échelle K. Ce qu'il faut retenir, c'est
que quelle que soit l'échelle K choisie, 0 dB correspond à la même intensité sonore
physique. La différence entre les échelles est la marge de manœuvre qu'elles
offrent.
Pour calibrer vos moniteurs, choisissez une échelle K et jouez un signal de bruit rose
à spectre complet et à canal unique à 0 dB sur cette échelle. Depuis votre position
d'écoute, utilisez un SPL-mètre (avec une réponse lente pondérée en C) pour
mesurer l'intensité sonore. Réglez le gain de votre moniteur jusqu'à ce que le SPL-
mètre indique 83 dBSPL. Ensuite, répétez le processus pour l'autre canal. Notez le
gain de votre moniteur calibré pour référence ultérieure. Ensuite, si vous le
souhaitez, répétez ce processus pour les autres échelles K.
Conseils pratiques
Même si vous décidez de ne pas utiliser le système K, voici quelques idées que
vous pouvez intégrer dans votre flux de travail :
!43
!44
18)Terminologie
dBTP : Niveau de crête réel en décibels, par rapport à la pleine échelle numérique. Il
s'agit de la valeur maximale de la forme d'onde du signal audio reconstruit, en tenant
compte des crêtes inter-échantillons.
LUFS : unités d'intensité sonore par rapport à la pleine échelle numérique. Le terme
préféré de l'UER pour la valeur absolue de la sonie. (Voir LKFS)
Programme : Un programme audio individuel, une publicité, une piste musicale, etc.
!45
Sample Peak : Le système typique d'indicateur de crête d'échantillon numérique qui
indique la valeur d'amplitude la plus élevée représentée dans un lot d'échantillons
audio numériques. Elle est généralement inférieure à la valeur True Peak de la
forme d'onde analogique reconstruite, car elle ignore les pics inter-échantillons.
!46
References:
https://www.soundonsound.com/techniques/end-loudness-war
http://www.itu.int/rec/R-REC-BS.1770
http://www.atsc.org/cms/standards/A_85-2013.pdf
http://tech.ebu.ch/docs/r/r128.pdf
http://tech.ebu.ch/docs/tech/tech3342.pdf
http://resources.prismsound.com/tm/Loudness_Meter_Test_Signals.zip
http://www.qualisaudio.com/documents/TechNote-2-WaveFiles-5-12-2011.zip
http://www.qualisaudio.com/documents/TechNote-1-5-31-2011.pdf
http://www.qualisaudio.com/documents/TechNote-2-5-31-2011.pdf
http://www.music-loudness.com/
http://dynamicrangeday.co.uk/
https://www.soundonsound.com/sound-advice/q-whats-difference-between-ppm-and-
vu-meters
http://index-of.es/Varios-2/Mastering%20Audio%20Art%20and%20Science.pdf
!47