Vous êtes sur la page 1sur 12

Perception de l’intensité,

de la hauteur et du timbre des sons

par Paul AVAN


Professeur
Laboratoire de biophysique sensorielle
Faculté de médecine. Université d’Auvergne (Clermont-Ferrand)

1. Sonie............................................................................................................. E 5 120 - 3
1.1 Seuil différentiel d’intensité......................................................................... — 3
1.2 Influence de la fréquence............................................................................. — 3
1.2.1 Seuils auditifs ...................................................................................... — 3
1.2.2 Courbes isosoniques........................................................................... — 3
1.3 Croissance de la sensation de sonie en fonction du niveau physique .... — 4
1.4 Sonie et pathologie cochléaire : le recrutement ........................................ — 4
1.5 Sonie et audition binaurale ......................................................................... — 5
1.6 Facteurs temporels influant sur la sonie .................................................... — 5
1.7 Codage de la sonie dans le système nerveux auditif ................................ — 6
1.8 Sonie des sons complexes. Notion de bande critique .............................. — 7
1.8.1 Seuil auditif et contenu spectral......................................................... — 7
1.8.2 Sonie et contenu spectral ................................................................... — 7
2. Notion de hauteur..................................................................................... — 8
2.1 Codage(s) de la fréquence dans le nerf auditif
et dans les voies auditives........................................................................... — 8
2.2 Seuil différentiel de fréquence .................................................................... — 9
2.3 Propriétés de la hauteur selon la nature du son considéré ...................... — 9
2.3.1 Sons purs ............................................................................................. — 9
2.3.2 Sons complexes périodiques ............................................................. — 10
2.3.3 Conséquences pour le codage de la hauteur.................................... — 10
2.4 Cas des sons harmoniques avec fondamentale absente.......................... — 10
2.5 Cas des sons inharmoniques ...................................................................... — 10
3. Notion de timbre....................................................................................... — 11
3.1 Définition....................................................................................................... — 11
3.2 Rôle du profil énergétique du spectre ........................................................ — 11
3.3 Rôle des fluctuations temporelles............................................................... — 11
4. Conclusion .................................................................................................. — 11
Références bibliographiques .......................................................................... — 12

P our caractériser physiquement un son pur, il suffit de préciser trois paramè-


tres de l'onde de pression associée : l'amplitude de celle-ci (dont dépendent
sa puissance acoustique surfacique et son niveau en décibels), sa fréquence ou
sa période et, enfin, sa phase, dans le référentiel temporel choisi. Un son pério-
dique nécessite une description un peu plus complexe dans le domaine tempo-
rel, mais l'analyse de Fourier permet aisément de décomposer, de manière
unique, l'onde de pression en une somme de composantes harmoniques, dont
les fréquences sont toutes multiples de la fréquence fondamentale ; l'amplitude
et la phase de chacune d'elles permettent de caractériser, complètement et de

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Électronique E 5 120 - 1
PERCEPTION DE L’INTENSITÉ, DE LA HAUTEUR ET DU TIMBRE DES SONS _________________________________________________________________________

manière unique, le son considéré. Enfin, il est possible de généraliser la


méthode de décomposition par transformée de Fourier, à un son complexe quel-
conque, en obtenant des composantes qui ne sont plus nécessairement à des
fréquences discrètes, ni multiples d'une fondamentale donnée.
Cette analyse de type spectral a depuis longtemps semblé pertinente lorsque
l'on s'intéresse à la perception des sons par l'intermédiaire du système nerveux
auditif. En effet, avant de mener à bien l'étape de transduction qui permet au
nerf auditif de véhiculer des influx nerveux organisés en fonction de la structure
physique du son excitateur, la cochlée effectue une analyse des sons qui aboutit
à trier les excitations mécaniques selon un principe de tonotopie : les composan-
tes du son à différentes fréquences font entrer en résonance, selon des mécanis-
mes complexes, des sections différentes de la membrane basilaire le long de
laquelle sont réparties les cellules sensorielles. La tonotopie, qui fournit une
sorte de spectre du signal sonore parvenu à la cochlée, est ensuite respectée
tout au long des voies auditives jusqu'au cortex.
Pour un son pur, l'intuition permet aisément de relier les sensations associées
à la perception et les grandeurs physiques qui leur ont donné naissance : la sen-
sation de force sonore, encore appelée sonie ou sonorie (qui fait dire qu'un son
est plus ou moins fort) semble naturellement liée à l'amplitude, à la puissance
ou au niveau du son ; la sensation de hauteur (que l'on exprime par les adjectifs
« grave » ou « aigu ») apparaît étroitement liée à la fréquence. Il est plus délicat
de donner une description subjective d'un son complexe, même périodique, et
l'on est rapidement amené à introduire des notions tournant notamment autour
de ce que l'on appelle le timbre du son. Enfin, le système nerveux central pos-
sède une certaine aptitude à pousser l'analyse d'un son jusqu'à des tentatives
d'identification de sa source, à partir des caractéristiques perçues : c'est une ten-
dance naturelle de tenter de remonter du timbre d'un son à la nature de l'instru-
ment qui l'a produit. Néanmoins, l'établissement de relations générales entre les
caractères physiques et perceptifs des sons a été une tâche fort laborieuse pour
les psychoacousticiens, depuis la première moitié du XIX e siècle. Elle est impar-
faitement achevée, et l'on ignore encore de nombreux détails cruciaux en ce qui
concerne les bases physiologiques sous-jacentes à ces relations : les câblages
intermédiaires entre la cochlée, en périphérie, et les centres supérieurs ont été
élucidés anatomiquement assez récemment, et leur physiologie reste d'une
complexité qui défie vite l'analyse.
Pourquoi s'intéresser à ces paramètres psychoacoustiques : principalement
parce que leur connaissance permet de définir les caractéristiques que doivent
présenter les sons pour servir de support à la communication et véhiculer de
l'information acoustique intelligible. C'est la raison pour laquelle la psycho-
acoustique a, de tous temps, été un carrefour pour des scientifiques issus de la
physique, des télécommunications et du traitement du signal (von Helmholtz,
Graham Bell, Barkhausen, von Bekesy, Stevens, Zwicker, Blauert, etc.).
Nous nous proposons d'examiner dans cet article quelques-unes des proprié-
tés les plus importantes des sensations de sonie, de hauteur et de timbre, au
moins dans le cas de sons relativement simples, purs ou périodiques en parti-
culier, et nous ne tenterons d'aborder que prudemment quelques hypothèses
concernant les modèles physiologiques à visée explicative. Nous détaillerons
quelques conséquences perceptives des pathologies auditives les plus couran-
tes et aborderons à cette occasion quelques problèmes liés à l'appareillage audi-
tif.

Pour de plus amples renseignements sur les mécanismes auditifs, le lecteur pourra
consulter les références [1] [2].

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
E 5 120 - 2 © Techniques de l’Ingénieur, traité Électronique
_________________________________________________________________________ PERCEPTION DE L’INTENSITÉ, DE LA HAUTEUR ET DU TIMBRE DES SONS

1. Sonie
Seuil différentiel (dB)

10
Par définition, la sonie est l'intensité subjective d'un son,
autrement dit, elle correspond à la sensation de force sonore.

Pour un son pur de fréquence donnée, située dans l'intervalle de


2
fréquences audibles bien sûr (20 - 20 000 Hz chez l'homme), le sys-
tème auditif normal présente une large dynamique, entre le seuil de Bruit blanc
perception du son et le seuil de douleur, niveau au-dessus duquel 1
non seulement la perception est douloureuse, mais le son est poten- Son pur 1 kHz
tiellement dangereux pour la cochlée quelle que soit la durée
d'exposition. Entre ces deux limites, le système auditif évolue dans 0 20 40 60 80 100
son élément normal, ce qui est très étonnant lorsque l'on considère Niveau acoustique (dB SPL)
qu'il existe une différence d'un facteur 106 entre les pressions (ou
1012 entre les puissances acoustiques surfaciques) correspondant
aux deux seuils cités plus haut, soit encore de 120 décibels (dB). En Figure 1 – Seuil différentiel d’intensité
fait, l'échelle physique linéaire de pressions (en pascals) ou de puis- en fonction du niveau de référence
sances (en W/m2) est très mal appropriée à la description de
l'échelle des sensations de force sonore. L'introduction de l'échelle
des décibels est devenue systématique en acoustique en partie pour le seuil différentiel d'intensité varie très peu autour de 1 dB. L'exis-
cette raison. tence d'un rapport de Weber constant déborde du cadre de la per-
Rappelons que le niveau en décibels d'un son pur de pression p et ception de la force sonore et s'applique à d'autres perceptions ; pour
de puissance acoustique surfacique W est : rester dans le domaine auditif, une loi analogue régit le seuil diffé-
rentiel de fréquence (cf. § 2).
L = 20 lg p ¤ p 0 = 10 lg W ¤ W 0

avec p0 et W0 références arbitraires. 1.2 Influence de la fréquence


L'échelle est dite en dB SPL (sound pressure level ), lorsque l'on
prend, comme référence pour p0, une pression de 2 ´ 10 Ð5 Pa, ce
qui correspond à une valeur de W0 égale à 10–12 W/m2. Ces valeurs 1.2.1 Seuils auditifs
de référence sont proches du seuil auditif moyen normal de
l'homme à 1 000 Hz, dans l'intervalle de fréquence où l'audition est Le seuil auditif fournit un premier exemple de sonie fixée facile à
la plus sensible. manipuler (il correspond à la transition entre l'absence de sensation
et l'existence d'une sensation liminaire). La détermination du seuil
auditif est un test de routine en clinique, l'audiométrie tonale limi-
naire. Ce test utilise un audiomètre avec un casque calibré, permet-
1.1 Seuil différentiel d’intensité tant la présentation de sons purs dont on choisit la fréquence (en
général, graduée par octaves, 62, 125, 250, 500 Hz, etc, et parfois par
Avant d'aborder les tentatives de quantification de la sensation de demi-octaves, notamment autour de 4 000 Hz, pour une analyse
sonie, il est intéressant de commencer par caractériser la plus petite moins grossière des seuils), et dont on fait varier le niveau par pas
différence de niveau physique entre deux stimulus, capable de don- de 5 dB, par exemple, dans le sens croissant à partir d'un niveau
ner lieu à une variation de la sensation de force sonore. Ce problème inaudible. Le son est envoyé dans l'un des écouteurs du casque, et
correspond à la recherche du seuil différentiel d'intensité. Notons le seuil est défini comme le premier niveau ayant fait répondre le
qu'en résolvant ce problème on reste dans le domaine du stimulus sujet, qui a pour consigne de signaler la détection du son dès le
physique. La sensation n'intervient que dans la mesure où elle subit niveau le plus faible où il le perçoit. En dB SPL, le seuil moyen
la plus petite variation dont un sujet puisse se rendre compte. obtenu entre 1 000 et 4 000 Hz dans un échantillon de sujets normo-
entendants est proche de 0. En revanche, les seuils aux autres fré-
La loi mise en évidence, dite loi de Weber (1846), possède un quences diffèrent nettement de cette valeur. Ils dépassent 0 aux fré-
énoncé très simple, bien que légèrement approximatif : quences plus élevées, ainsi qu'au-dessous de 1 000 Hz, pour
lorsque le seuil différentiel d'intensité D I, autour d'une intensité atteindre par exemple 11 dB SPL à 500 Hz, ou encore 45 dB SPL à
de référence I, est exprimé en unités linéaires, le rapport de Weber, 125 Hz, 13 dB SPL à 8 000 Hz (écouteur TDH 39 Telephonics). Cette
D I/I, est constant. dépendance illustre notamment la dépendance fréquentielle des
Il en résulte qu'en utilisant le décibel comme unité de niveau contributions de l'oreille externe et moyenne à la transmission des
acoustique, le seuil différentiel d'intensité est constant et égal à : sons vers la cochlée.
Pour faciliter les relevés et la lecture des audiogrammes tonaux
10 lg ( I + DI ) ¤ I = Cte liminaires, on exprime le plus souvent le niveau d'audition par rap-
port aux valeurs normatives établies pour chaque fréquence audio-
Ce résultat apporte une légitimité supplémentaire à l'échelle des
métrique, sur des échantillons contrôlés de grande taille, en dB dits
décibels en montrant qu'elle est adéquate à la description de l'inten-
HL (Hearing Level ). Les audiomètres cliniques sont toujours calibrés
sité du stimulus physique, dans la perspective de sa détection par le
en dB HL, et les seuils normaux sont donc toujours 0 quelle que soit
système auditif et en tenant compte de ses propriétés psychophy-
la fréquence.
siologiques.
La figure 1 représente une détermination expérimentale récente
de ce seuil en fonction de la pression acoustique en dB SPL [3]. On 1.2.2 Courbes isosoniques
voit que, pour un son pur, le seuil différentiel d'intensité diminue en
fait régulièrement avec le niveau acoustique, passant d'environ 2 dB La notion d'isosonie est plus générale. Elle apparaît lorsque l'on
autour de 20 dB SPL, à 0,4 dB aux forts niveaux. Pour un bruit blanc, compare deux sons de fréquence différente, par exemple 1 000 Hz et

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Électronique E 5 120 - 3
PERCEPTION DE L’INTENSITÉ, DE LA HAUTEUR ET DU TIMBRE DES SONS _________________________________________________________________________

une autre fréquence f, que l'on fixe le niveau acoustique à 1 000 Hz


et que l'on recherche le niveau à f donnant la même sensation de

Niveau de pression acoustique (dB)


force sonore. On obtient une ligne isosonique en faisant varier f
d'une extrémité à l'autre de l'intervalle audible. Deux sons placés 140
sur une même ligne isosonique sont perçus comme de forces sono-
120 phon
res identiques. La figure 2 représente les lignes isosoniques obte- 120 es
nues en écoute binaurale et en champ libre (de sorte que la
diffraction par la tête, l'action des pavillons, du conduit auditif et de 100
100
l'oreille moyenne modèlent la courbe obtenue). Ces lignes ont,
quelle que soit la référence de force sonore de départ, une allure 80
80
générale voisine, avec un minimum autour de 4 000 Hz, et une
remontée au-dessus de 4 000 Hz ainsi qu'au-dessous de 1 000 Hz. Il 60
faut noter que le passage d'une ligne isosonique à l'autre ne repose 60
pas sur une quantification de l'augmentation de sensation, mais
seulement sur un paramétrage à partir d'un niveau d'intensité phy- 40 40
sique de référence, par exemple à 1 000 Hz. Suivant cette méthode
de paramétrage, l'étiquetage de chaque ligne isosonique se fait en 20
20
phones, unité introduite par le physicien Barkhausen. Seuil audi
ti f
La valeur en phones est la valeur du niveau en dB SPL à 1 000 Hz 0
donnant la même sensation de sonie. Ainsi, la ligne isosonique
70 phones correspond à tous les sons purs de même sonie que --20
70 dB SPL à 1 000 Hz, sans préjuger en rien de la valeur de cette 20 50 100 200 500 1 000 5 000 20 000
sonie. Fréquence (Hz)
Lorsque le niveau en phones augmente, un caractère important se
n phones correspondent à n dB SPL à 1 kHz
manifeste : les courbes isosoniques s'aplatissent progressivement.
Par exemple, à 100 Hz, il faut 20 dB de plus qu'à 1 000 Hz à un stimu-
lus pour donner la même sensation de sonie, sur la ligne isosonique Figure 2 – Réseau de lignes isosoniques
10 phones, donc près du seuil auditif, alors qu'à 100 phones
(100 dB SPL à 1 000 Hz), la différence n'est plus que de 3 dB.
çue. La fonction obtenue est tracée en prenant pour référence, le
Les lignes isosoniques sont beaucoup utilisées pour pondérer les long de l'axe des abscisses, le niveau en phones (ou en dB SPL, si on
niveaux des différentes composantes fréquentielles dans un son travaille à 1 000 Hz), et en ordonnées l'échelle de nombres indiqués,
complexe ou un bruit, pour avoir une idée de la participation relative en prenant arbitrairement pour référence 1 la sensation donnée par
de chacune à la sensation de sonie ; cette pondération doit donc un son de niveau d'isosonie 40 phones. Suivant cette échelle (qui est
dépendre du niveau. Ainsi, les appareils de mesure acoustique utili- alors graduée en sones), la sonie S varie selon la loi (dite de Ste-
sant la pondération A ont un filtre d'entrée qui atténue les basses vens, figure 3):
fréquences et les très hautes fréquences avec une courbe de
réponse reproduisant les lignes isosoniques à faible niveau S = kp 0, 6
(40 phones). Ils défavorisent ces composantes basse ou haute fré- avec p pression acoustique en mPa,
quence par rapport aux médiums, dont la sonie domine à niveau
SPL donné. La pondération C filtre les sons d'entrée selon le profil k = 0,01.
correspondant à la ligne isosonique 100 phones. Elle est donc mieux En d'autres termes, cette loi indique que la sonie double à chaque
adaptée à la prise en compte des sonies des diverses composantes fois que la pression acoustique augmente de 10 dB, si bien que la
spectrales, pour les sons intenses. De manière assez paradoxale, sonie passe seulement de 1 à 256 lorsque le niveau physique passe
c'est en fait la pondération A qui est largement utilisée pour les de 40 à 120 dB à 1 000 Hz (tandis que la puissance acoustique varie
mesures sonométriques ou dosimétriques des bruits intenses, car il alors d'un facteur 108 et la pression d'un facteur 104).
se trouve que c'est elle qui permet la meilleure évaluation des La loi de Stevens est de forme moins simple au-dessous de
dégâts ou de la fatigue auditive due aux sons forts (sensations et 30 phones et l'on voit sur la figure 3 que la pente de la fonction de
effets physiologiques ne sont pas nécessairement corrélés !). L'ajus- sonie devient plus forte, la loi étant de la forme :
tement des réglages des égaliseurs de chaînes haute-fidélité pour
l'écoute de la musique amplifiée découle de l'observation des lignes S = k ( p Ð p 0 ) 0, 6
isosoniques : ce réglage doit être modifié lorsque l'on désire écouter
de la musique à bas niveau, par rapport à une écoute normale. Pour La référence p0 est la valeur 45 mPa (ou 8 dB SPL à 1 000 Hz) au-
que les composantes spectrales de basse fréquence conservent une dessous de laquelle la sonie ne diminue plus (le son est juste consi-
sonie équilibrée par rapport aux médiums, il faut les rehausser par déré comme audible ou inaudible).
la mise en jeu d'une fonction parfois baptisée loudness qui permet Nota : on lit encore souvent que la loi de croissance de la sensation de sonie avec
de contribuer au rééquilibrage requis. l'intensité est logarithmique, ou encore que l'on peut appliquer la loi de Weber-Fechner,
prévoyant que la croissance de la sonie est logarithmique. Cette loi repose sur l'hypothèse
que la variation de sonie correspondant à une variation d'intensité juste détectable est
constante. Pour obtenir la sonie en fonction du niveau physique, il suffit alors d'intégrer les
échelons différentiels d'intensité. Nous avons vu que D I / I est à peu près constant, ce qui
1.3 Croissance de la sensation de sonie constitue la loi de Weber. Si cette dernière est relativement bien vérifiée, la loi de Weber-
en fonction du niveau physique Fechner, de la forme S = k lg I/ I0, est expérimentalement inexacte. Toutefois, l'usage bien
établi en électroacoustique qui consiste à se servir de potentiomètres logarithmiques
repose sur cette loi.

L'établissement de cette fonction de croissance est beaucoup plus


délicat que celui des lignes isosoniques, car il nécessite une évalua- 1.4 Sonie et pathologie cochléaire :
tion subjective directe au lieu de reposer sur des comparaisons.
C'est Stevens [4] qui a le premier procédé à l'estimation de la sensa- le recrutement
tion de force sonore pour des sons purs de niveau assez élevé, en
demandant à ses sujets d'expérience de chiffrer leur sensation au Lorsqu'une pathologie cochléaire est présente et, en particulier,
moyen de nombres qu'ils estimaient proportionnels à la sonie per- lorsqu'elle s'accompagne de lésions des cellules ciliées externes [1],

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
E 5 120 - 4 © Techniques de l’Ingénieur, traité Électronique
_________________________________________________________________________ PERCEPTION DE L’INTENSITÉ, DE LA HAUTEUR ET DU TIMBRE DES SONS

Niveau oreille saine (dB HL)


Sonie (sones)

80
200
100
50 S = k p 0,6 60

20
10 40

5
20
2
1
0,5 0
0 20 40 60 80
0,2 Niveau oreille sourde (dB HL)
0,1 Le test de Fowler consiste à tracer un diagramme dans lequel l’abscisse
0,05 et l’ordonnée de chaque point représentent les niveaux nécessaires,
respectivement dans chacune des deux oreilles, pour obtenir la même
sonie. Un sujet normal présente un diagramme diagonal (tireté).
0,02 Un sujet porteur d’une surdité cochléaire unilatérale donne une courbe
00,1 sous la diagonale : pour le niveau seuil dans l’oreille saine, le niveau
correspondant du côté sourd est décalé d’une valeur égale à la perte
0 20 40 60 80 100 120
auditive (ici 40 dB). Pour des niveaux de plus en plus supraliminaires,
Niveau (phones) le niveau du côté sourd se rapproche de celui du côté normal, de sorte
qu’ici, à 80 dB HL, les sonies sont identiques des deux côtés.
1 sone correspond à 40 phones et une augmentation de niveau Ce phénomène illustre le fait que la sonie du côté sourd augmente
de 10 phones entraîne un doublement de la sonie. anormalement rapidement, témoignant d’un recrutement.
Au-dessous de 30 phones, la sonie décroît plus rapidement.

Figure 4 – Test de Fowler


Figure 3 – Croissance de la sonie en fonction du niveau d’un son pur
(en phones, c’est-à-dire produisant la même sonie qu’un son de 1 kHz
de niveau équivalent en dB SPL)
nuer automatiquement le gain prothétique à chaque fois que le
niveau d'entrée dépasse un certain seuil. Les prothèses numériques
de nouvelle génération permettent théoriquement des possibilités
on observe une distorsion de la sensation de sonie tout à fait carac- très sophistiquées d'ajustement des niveaux de sortie, de manière à
téristique, appelée recrutement. Tout d'abord, l'existence d'une sur- obtenir une sonie satisfaisante en cas de recrutement, mais il faut
dité se traduit, comme l'on s'y attend, par un décalage de la courbe souligner que les protocoles d'évaluation et d'ajustement sont loin
sonie/intensité vers les intensités plus élevées, et le décalage aux d'être établis au-delà d'un certain empirisme (d'ailleurs efficace,
faibles intensités est égal à celui du seuil auditif à la fréquence con- mais gourmand en temps et en soin).
sidérée. Lorsque le niveau augmente, la sensation augmente plus
vite que la normale en présence de recrutement. Chez un sujet por- La physiopathologie du recrutement sera traitée plus loin, ainsi
teur d'une surdité cochléaire unilatérale, il est aisé de mettre en évi- que ses relations avec le codage (hypothétique) de la sonie dans le
dence le recrutement, par comparaison des sonies des deux côtés système nerveux auditif.
en présence d'un son de niveau progressivement croissant (test de
Fowler, figure 4). On constate que la sonie du côté atteint finit par
rattraper celle du côté sain, quelques dizaines de dB au-dessus du 1.5 Sonie et audition binaurale
seuil. Il faut noter que bien que la sonie se soit normalisée en appa-
rence, la perception du côté pathologique est tout à fait anormale,
avec en particulier une mauvaise intelligibilité. Le recrutement pré- Lorsqu'une stimulation acoustique de niveau supérieur à
sente en outre l'inconvénient d'entraîner le franchissement précoce 40 dB SPL est présentée de manière binaurale au lieu de monaurale,
du seuil d'inconfort, puis de douleur. la sonie double. Il est important de prendre cette règle en considéra-
À cause du recrutement, l'appareillage d'une surdité cochléaire tion lorsque l'on procède à l'appareillage d'une surdité : un appa-
est délicat, sous deux aspects. Tout d'abord, il n'est pas satisfaisant reillage binaural (qui, pour plusieurs raisons, devrait être la règle
d'apporter une amplification de n dB pour corriger une perte audi- impérative) permet d'obtenir un doublement de sonie (équivalant à
tive de n dB. Une telle correction serait appropriée au seuil auditif une augmentation monaurale de niveau de 10 dB, nous l'avons vu
(dans la mesure où elle permettrait de le normaliser), mais pas dans précédemment) pour un gain prothétique donné. On peut noter
l'intervalle de niveaux réellement utile dans la vie courante, pour la qu'au voisinage du seuil de perception, où la loi de Stevens présente
perception de la parole ou, de manière plus générale, des signaux une pente différente, la sommation binaurale de sonie n'équivaut
contribuant à la communication. L'amplification qui permet à la sen- qu'à une augmentation monaurale de 3 dB.
sation de sonie d'être raisonnable dans la plupart des situations est
plutôt de l'ordre de n /2. On peut difficilement donner une règle
générale en la matière, tant le recrutement peut varier d'une oreille 1.6 Facteurs temporels
à l'autre, même à degrés de perte auditifs égaux. Le deuxième influant sur la sonie
aspect difficile concerne le franchissement précoce du seuil d'incon-
fort dans le cas de sons légèrement plus intenses que ceux pour les-
quels le réglage d'une aide auditive est optimisé. Il est nécessaire Lorsque les temps de présentation des stimulus sont soit très
d'utiliser des systèmes électroniques de compression pour dimi- brefs, soit très prolongés, deux phénomènes se manifestent. Pour

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Électronique E 5 120 - 5
PERCEPTION DE L’INTENSITÉ, DE LA HAUTEUR ET DU TIMBRE DES SONS _________________________________________________________________________

une durée inférieure à 500 ms et à niveau physique donné, la sonie


diminue lorsque la présentation se raccourcit, ce qui a conduit à

Taux de PA par seconde


introduire la notion d'intégration temporelle. À l'opposé, pour des
présentations de longue durée et des faibles niveaux (entre 0 et
30 dB au-dessus du seuil subjectif du sujet testé), la sonie diminue 200 Saturation
progressivement : il s'agit du phénomène d'adaptation, assez géné-
ral dans le domaine de la perception (qui se traduit aussi par une
baisse des taux de potentiels d'action dans les neurones excités trop
longtemps par une stimulation stationnaire). 100

Seuil
0
1.7 Codage de la sonie dans le système 0 20 40 60 80 100
nerveux auditif Niveau (dB SPL)
PA : potentiel d’action
Les données actuelles sur la physiologie de la cochlée et du nerf Deux catégories de neurones apparaissent, ceux à bas seuil (qui ont
auditif permettent de proposer quelques éléments en ce qui con- aussi un taux d’activité spontanée assez élevé), et ceux à haut seuil (qui
cerne la manière dont les paramètres physiques du son sont codés saturent plus tard, et ont un taux d’activité spontanée assez bas).
dans les neurones auditifs. Un neurone, quel qu'il soit, véhicule
l'information sous forme de potentiels d'action, de forme stéréoty- Figure 5 – Neurones auditifs répondant à une excitation d’intensité
pée, obéissant à la loi du tout ou rien. Par exemple, le fait qu'un neu- croissante (en abscisse) en augmentant leur taux de potentiels
rone du nerf auditif réponde à une excitation sonore signifie que le d’action par unité de temps (en ordonnée)
niveau d'excitation dont a bénéficié la cellule ciliée interne
cochléaire reliée à ce neurone a dépassé un certain seuil. Celui-ci est
fonction de propriétés, notamment membranaires, propres à cette
cellule ciliée et à ce neurone. Au point de vue du codage, la tonoto- des informations exploitables pour déterminer la sonie: celle-ci
pie cochléaire, qui associe à chaque endroit le long de la cochlée pourrait alors être codée par les neurones hors résonance.
une fréquence de résonance différente, joue un rôle déterminant
dans l'identité des neurones franchissant leur seuil de réponse : un Deuxièmement, les neurones issus de la région accordée à f0 sont
codage tonotopique de la fréquence est envisageable. nombreux : environ 10 par cellule ciliée interne. Chacun de ces neu-
rones possède un seuil d'entrée en action différent. Ceux qui possè-
En revanche, la cadence des potentiels d'action ne représente en dent un taux spontané de décharges élevé sont plutôt groupés du
rien la périodicité des vibrations acoustiques, lorsque la fréquence côté interne de la base de leur cellule ciliée interne d'origine, et leur
associée dépasse une limite de l'ordre de 1 kHz environ : les neuro- seuil de réponse est bas (proche de 0 dB HL). À l'inverse, ceux qui
nes présentent toujours une période dite réfractaire qui interdit à possèdent un faible taux spontané de décharges sont plutôt grou-
deux potentiels d'action de se succéder en moins de quelques milli- pés du côté externe de la base de leur cellule ciliée interne d'origine,
secondes. (Cela est à nuancer pour les basses fréquences, nous le et leur seuil de réponse est élevé (entre 40 et 80 dB HL). Alors que
reverrons dans le paragraphe 2.1.) En fait, on constate que la chacun des neurones peut coder pour une dynamique réduite, la
cadence des potentiels d'action des neurones auditifs primaires prise en compte de l'ensemble du groupe de neurones issus d'une
augmente régulièrement avec le niveau acoustique, selon les cour- zone de la cochlée devrait permettre de coder sans ambiguïté la
bes représentées sur la figure 5. Au-dessous du seuil, les neurones sonie pour un son de niveau compris entre 0 et 120 dB : les neuro-
présentent une activité dite spontanée, variable, et l'on distingue les nes de seuil bas informeraient sur les sonies faibles, puis devien-
neurones à faible et fort taux spontané (dans le silence) de déchar- draient saturés ; les neurones de moindre sensibilité prendraient
ges. Au-dessus du seuil, l'augmentation de cadence des potentiels alors le relais pour coder les sonies supérieures (figure 6).
d'action est de forme sensiblement linéaire (en fonction du niveau
en dB), et une saturation est finalement observée, lorsque le niveau Sur chaque diagramme de la figure 6, les traits gras bleus repré-
acoustique dépasse le niveau seuil d'environ 40 dB : à plus forts sentent l'enveloppe des vibrations de la membrane basilaire en
niveaux, le taux de décharge du neurone devient indépendant du réponse à un son pur de fréquence donnée (à gauche, la base de la
niveau. cochlée, à droite, l'apex). L'amplitude de cette enveloppe augmente
de haut en bas, au fur et à mesure que le niveau de stimulation (indi-
Ces observations conduisent à proposer que la sensation de force qué à droite) augmente. Les deux traits fins marqués « seuil BS » et
sonore peut être codée par la cadence des potentiels d'action dans « seuil HS » représentent l'amplitude locale de vibration minimale
les neurones auxquels la loi de tonotopie permet de répondre, susceptible d'activer les neurones auditifs de bas seuil et de haut
compte tenu de la fréquence du stimulus. Toutefois, il est également seuil, respectivement. À l'intérieur des deux cartouches est repré-
très clair qu'un neurone donné ne peut coder pour la sonie qu'avec sentée l'activité éventuelle des neurones de bas seuil et de haut
une dynamique restreinte. Il est donc nécessaire d'envisager un seuil, respectivement. L'activité des neurones de bas seuil est
codage de la sonie, certes par la cadence des potentiels d'action, d'abord limitée à la zone accordée à la fréquence utilisée, et elle est
non pas d'un neurone mais plutôt par un ensemble de neurones. non saturée (zone en bleu). Lorsque l'intensité de stimulation aug-
Une observation de nature physiologique, jointe à une autre, de mente, les neurones de bas seuil de fréquence caractéristique pro-
nature neuroanatomique, permet d'apporter des éléments supplé- che de la fréquence utilisée saturent les premiers (zone en gris),
mentaires de débat. tandis que le profil d'excitation neurale s'étale, surtout vers la base
Premièrement, l'augmentation de niveau acoustique d'un son, à de la cochlée (zones en bleu). Aux plus hautes intensités, les neuro-
fréquence fixée f0, se traduit non seulement par une augmentation nes de haut seuil entrent en action, sans saturation au début, au voi-
de l'excitation à l'endroit tonotopiquement associé à f0, mais aussi sinage de la zone accordée à la fréquence utilisée (en blanc).
par un étalement de l'excitation qui intéresse une largeur de mem- Étalement du profil, saturation des neurones de bas seuil et entrée
brane basilaire de plus en plus large, pouvant dépasser plusieurs en action des neurones de haut seuil sont des indices utilisables
octaves. Des neurones de fréquence caractéristique différente de f 0, pour coder la sonie, continûment de 0 à 120 dB.
non excités à bas niveau, se mettent à répondre avec des taux de La première hypothèse a été affaiblie par une observation de
potentiels d'action moindres que ceux accordés à f0. On a pu émet- Moore et Raab [5] qui ont encadré, dans le domaine spectral, un
tre l'hypothèse que la manière dont cet étalement se produit fournit bruit à bande étroite, centré sur une fréquence donnée f0 et de

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
E 5 120 - 6 © Techniques de l’Ingénieur, traité Électronique
_________________________________________________________________________ PERCEPTION DE L’INTENSITÉ, DE LA HAUTEUR ET DU TIMBRE DES SONS

Un son de fréquence f donne alors, sur la membrane basilaire, un


Seuil HS profil d'excitation étalé, avec un pic beaucoup moins marqué à
l'endroit codant pour f ; la hauteur du pic croît de 1 dB par dB d'aug-
mentation du stimulus ; elle finit donc par rattraper la hauteur obser-
vée dans une cochlée normale. Le recrutement défini plus haut, et
Seuil BS qui se traduit par une augmentation excessivement rapide de la
sonie avec le niveau de stimulation, pourrait provenir de l'interpré-
tation erronée, au niveau des centres auditifs, d'une mise en action
30 dB SPL neuronale anormalement rapide lorsque le niveau de stimulation
augmente, à cause de la disparition de la compression cochléaire
HS naturelle. En particulier, la mise en jeu quasi normale à haut niveau
de la catégorie des neurones de seuil élevé expliquerait que la sonie
BS
rattrape alors la sonie normale.
Nota : comme nous l'avons mentionné plus haut, la loi de Fechner est inexacte, et l'on
ne peut relier simplement seuil différentiel d'intensité et croissance de la sonie. Plusieurs
tests cliniques ont néanmoins tenté de mettre en évidence le recrutement en recherchant
Seuil HS
une diminution associée du seuil différentiel d'intensité. Le raisonnement sous-jacent était
le même que celui de la loi de Fechner, à savoir que la sonie augmente trop vite parce que
les échelons élémentaires de sensation, tous égaux et proportionnels au seuil différentiel
d'intensité, sont franchis trop vite, donc parce que le seuil différentiel d'intensité a dimi-
Seuil BS nué. Ce raisonnement est faux et l'on peut très bien observer, dans une surdité cochléaire
recrutante, un seuil différentiel d'intensité inchangé ou augmenté [7].

50 dB SPL

HS
1.8 Sonie des sons complexes.
Notion de bande critique
BS

L'une des fonctions de base de la cochlée consiste à séparer les


sons en leurs différentes composantes fréquentielles, de sorte que,
au moins à bas niveau, les composantes spectrales d'un son com-
Seuil HS plexe excitent des cellules ciliées et des groupes de neurones audi-
tifs différents, de manière largement indépendante, à condition
d'être assez éloignées. Il est donc raisonnable de s'attendre à une
Seuil BS analyse et à des codages séparés pour chacune de ces composan-
tes. C'est effectivement le cas, et cette propriété influe aussi bien sur
l'analyse de la sonie que sur la détection de composantes spectrales
80 dB SPL en l'absence, mais aussi en présence, de sons interférents.

HS
1.8.1 Seuil auditif et contenu spectral
BS
Pour aborder l'influence de la composition spectrale d'un son sur
sa détection, on peut procéder de la manière suivante (figure 7). Le
Figure 6 – Groupe de trois diagrammes illustrant les façons seuil auditif est d'abord déterminé pour un son pur de fréquence f0
dont la sonie pourrait être codée dans les neurones auditifs donnée. Supposons qu'il corresponde à une puissance acoustique
surfacique W0 W/m2, ou à un niveau L0 en dB SPL. Évaluons alors le
seuil auditif d'un doublet de composantes de mêmes niveaux, espa-
cées de Df autour de la fréquence moyenne f0. Le seuil est alors
niveau variable, par des bandes latérales de bruit continu. Celles-ci obtenu pour une puissance individuelle W0/2 (soit L0 – 3 dB). De
jouent un rôle de « masques », interdisant donc aux neurones non même, un n-uplet de composantes de mêmes niveaux, espacées de
accordés à f0 d'être activés grâce à l'étalement de l'excitation à f 0 Df autour de la fréquence moyenne f0, donnera un seuil pour une
lorsque son niveau augmente. Or, la sonie du son f0 reste correcte- puissance individuelle W0/n, donc une puissance totale toujours
ment codée en fonction du niveau. La deuxième hypothèse a été égale à W0, tant que la largeur spectrale totale du complexe, n Df,
renforcée par les observations de Yates et coll. [6] montrant qu'entre reste assez petite. Lorsque celle-ci finit par dépasser une largeur dite
les neurones de bas et de haut taux spontanés de décharge existent largeur de bande critique, tout se passe comme si seule la puissance
de nombreux intermédiaires dont les dynamiques de codage recou- contenue dans cette largeur, donc dans la bande critique centrée sur
vrent largement l'intervalle de niveaux utile. Il semble que l'élargis- f0, comptait pour déterminer le franchissement du seuil, et non la
sement du profil d'excitations sur la membrane basilaire, lorsque le puissance totale du complexe. Les composantes extrêmes du com-
niveau de stimulation augmente, donne des indices supplémentai- plexe, sorties de la bande critique f0, sont prises en compte dans les
res qui aident à identifier la sonie, mais ne sont pas indispensables. bandes critiques voisines, mais ne possèdent pas une puissance
Dans la perspective d'un codage de la sonie par l'entrée en action totale suffisante au sein de ces bandes pour donner lieu à la percep-
progressive de neurones de seuils différents, il est particulièrement tion d'une sensation (figure 7). La largeur des bandes critiques est
important que la variation d'excitation mécanique avec le niveau suffisamment fixe d'un sujet à l'autre pour faire l'objet de normes.
soit elle-même assez progressive. Cela est assuré par le fonctionne- Elle est de 160 Hz à 1 000 Hz, et de largeur sensiblement proportion-
ment de l'organe de Corti qui, à l'état normal, présente une caracté- nelle à la fréquence centrale au-dessus de 1 000 Hz.
ristique fondamentale : un comportement mécanique compressif.
Au-dessous de 60 à 70 dB SPL, les mouvements de la membrane
basilaire, au voisinage de la résonance, n'augmentent que de 0,2 à 1.8.2 Sonie et contenu spectral
0,3 dB par dB d'augmentation du stimulus, grâce au jeu de certaines
cellules sensorielles, les cellules ciliées externes (cf. [1]). Lorsque la On retrouve la même notion de bande critique lorsque l'on évalue
cochlée est pathologique, cette compression disparaît. la sensation de force sonore produite par un complexe de deux sons

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Électronique E 5 120 - 7
PERCEPTION DE L’INTENSITÉ, DE LA HAUTEUR ET DU TIMBRE DES SONS _________________________________________________________________________

À partir des lois de croissance de la sonie et de la connaissance de


la répartition spectrale d'un son donné dans les différentes bandes
Énergie Bande Bande Bande
critique n -- 1 critique n critique n + 1 critiques du système auditif, plusieurs auteurs (notamment Stevens
et Zwicker [4] [8] [9] [10]) ont tenté d'établir des méthodes quantita-
tives dans le but d'estimer finement et quantitativement la sonie
d'un son quelconque. Il faut cependant relativiser la portée de telles
lois. En effet, leur établissement part toujours d'expériences dans
lesquelles les sujets testés portent un jugement de sonie selon une
échelle de nombres en partie arbitraire. Selon le protocole exact uti-
lisé, les résultats peuvent différer nettement et, même, pour un indi-
vidu donné, leur reproductibilité est assez faible. Comme le souligne
Moore [7], « un jugement tel que : le Concorde fait deux fois plus de
bruit qu'un Boeing 747, laissera toujours extrêmement sceptique ».
Fréquence C'est pourquoi, dans ce qui précède, nous nous sommes surtout
attachés à décrire les aspects qualitatifs, mais bien validés en prati-
Lorsque l’énergie acoustique est répartie équitablement entre des
composantes spectrales voisines de plus en plus nombreuses (zones
que, de la sonie.
bleues), l’énergie totale nécessaire pour atteindre le seuil de détection
est d’abord constante. Lorsque le nombre de composantes augmente,
l’énergie requise pour chacune d’elles diminue donc (zones de plus en
plus petites). Cependant, lorsque certaines composantes commencent
à déborder en dehors de l’intervalle appelé bande critique, leur énergie
2. Notion de hauteur
devient inefficace (zones blanches). L’énergie par composante,
nécessaire pour atteindre le seuil, se stabilise donc.
Cette notion est relativement aisée à définir dans le cas d'un son
pur, pour lequel un classement peut être établi sans ambiguïté entre
Figure 7 – Largeur de bande critique et détection d’énergie des sons différant par leur fréquence. La définition de l'ANSI (1960)
est alors claire :

« la hauteur est l'attribut de la sensation auditive selon lequel


de niveaux égaux nettement supraliminaires (supérieurs à les sons peuvent être rangés sur une échelle, telle qu'une
40 phones) et de fréquences proches, mais dont l'écartement Df échelle musicale, des graves vers les aigus », selon que leur fré-
varie. Tant que Df ne dépasse pas la largeur de bande critique, la quence est basse ou haute, précise la définition de l'Afnor en
sonie reste fixe. Lorsque Df dépasse cette largeur, la sonie augmente 1977.
avec Df. L'interprétation de cette expérience est que la sonie a été
déterminée par sommation de toute la puissance contenue au sein Dans la situation plus générale de sons complexes présentant un
d'une bande critique. Lorsqu'une puissance acoustique donnée se spectre étendu, la définition ci-dessus crée des difficultés dans nom-
disperse entre deux bandes critiques, la sonie change (ici, elle aug- bre de cas.
mente au lieu de diminuer comme elle le faisait dans l'expérience du
paragraphe précédent, mais il ne faut pas oublier que la loi de Ste- Exemple : on sait, en musique, que l'appariement de sons dont les
vens ne présente pas la même pente aux niveaux proches du seuil fréquences diffèrent d'un facteur 2 (une octave) est nettement plus
auditif et aux niveaux supérieurs à 30 phones). Les sonies des com- facile que celui de sons pourtant beaucoup plus proches en fréquence.
posantes situées dans plusieurs bandes critiques différentes s'ajou- Nous examinerons d'abord les propriétés de la hauteur perçue
tent. pour des sons purs. Dans ces cas simples, l'attribut de hauteur appa-
Les bandes critiques rappellent l'existence de filtres dans le sys- raît comme complémentaire de la sonie, puisque deux sons d'inten-
tème auditif périphérique (filtres dont la présence est notamment sité différente peuvent quand même être appariés du point de vue
reflétée par les courbes d'accord des neurones auditifs [1]). Elles ont perceptif, si leurs fréquences sont égales, parce que les hauteurs
la particularité d'avoir une largeur relativement indépendante du perçues sont alors identiques : sonie et hauteur apparaissent
niveau utilisé. En pratique, on peut considérer qu'elles illustrent la comme deux dimensions indépendantes d'un son pur ([11]). Sur le
manière dont l'audition est sélective en fréquences : la notion de plan physiologique, cela va nous conduire, à titre de préliminaire, à
sélectivité fréquentielle repose sur l'idée d'un traitement en paral- examiner quels mécanismes permettent de coder pour la fréquence,
lèle des composantes spectrales simultanément présentes (qu'elles car l'on peut penser qu'ils sont impliqués dans l'émergence de la
soient liées au signal à détecter ou au bruit) lorsque ces composan- sensation de hauteur. Le cas des sons complexes périodiques, puis
tes passent dans des filtres différents. Le fait que des composantes non périodiques, sera ensuite examiné brièvement.
spectrales coexistent dans un même filtre expose à des phénomè-
nes d'interférence ou de masquage : le système auditif peut être
empêché d'identifier une composante importante (le signal) parce 2.1 Codage(s) de la fréquence
que les autres composantes contenues dans le même filtre (le bruit,
au sens du traitement du signal) sont trop intenses et masquent dans le nerf auditif
l'activité neuronale liée au signal. On peut dire que la possibilité ou et dans les voies auditives
non de masquage et la notion de bande critique reposent sur les
mêmes bases. Comme cela a été détaillé dans le paragraphe précédent, l'exis-
En cas de pathologie cochléaire, le plus souvent, les cellules tence de la tonotopie cochléaire implique qu'au moins à bas niveaux
ciliées externes n'effectuent plus correctement leur rôle de filtres de stimulation les régions de la membrane basilaire donnant lieu à
amplificateurs ; la surdité résultante s'accompagne d'une perte de des vibrations suffisamment amples pour induire l'excitation de
sélectivité fréquentielle et d'un élargissement des filtres cochléaires. neurones auditifs sont celles dont la fréquence de résonance coïn-
Les bandes critiques sont élargies et l'on retrouve, par ce biais, une cide avec celle de la ou des composantes spectrales de la stimula-
cause supplémentaire de distorsion de la sensation de sonie chez tion. Le profil de réponse des neurones primaires auditifs, identifiés
les sujets porteurs de telles surdités. Bien sûr, d'autres troubles de la selon leur fréquence caractéristique, reflète donc celui du spectre
perception des sons complexes, liés à la difficulté de reconnaître fréquentiel de stimulation. À plus fort niveau, la correspondance
leur spectre, s'ajoutent à la distorsion de la sensation de sonie entre profil et spectre s'atténue en raison de l'étalement de l'excita-
(cf. paragraphes précédents). tion mécanique le long de la membrane basilaire cochléaire, et sur-

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
E 5 120 - 8 © Techniques de l’Ingénieur, traité Électronique
_________________________________________________________________________ PERCEPTION DE L’INTENSITÉ, DE LA HAUTEUR ET DU TIMBRE DES SONS

tout parce que les fibres nerveuses connectées aux endroits proches
de la résonance saturent, tandis que leurs voisines finissent par être

Seuil (dB SPL)


excitées suffisamment pour répondre, puis saturer à leur tour, 40 dB
environ au-dessus de leur seuil de réponse. Toutefois, les fibres ner- 100
80
veuses de bas taux spontané de décharge, donc de seuil élevé, gar-
60
dent plus longtemps un profil de réponses fidèle au spectre du
40
stimulus [12]. Pour les fréquences nettement supérieures à 1 kHz, il
20
est exclu que la cadence des potentiels d'action dans les neurones 0
reflète la périodicité des ondes acoustiques, en raison de la limita- --20
tion de cette cadence à quelques centaines par seconde, par le 0,1 1 0,1 1 0,1 1 10 0,1 1 10
temps de réponse des membranes des cellules excitatrices, ainsi
Fréquence (kHz)
que par l'existence d'une période réfractaire de plusieurs millisecon-
des, qui interdit à un neurone qui vient de donner un potentiel a courbes d’accord de quatre neurones auditifs, représentant
d'action de redevenir aussitôt excitable. Le respect de la tonotopie le niveau seuil requis pour faire répondre chaque neurone,
cochléaire, constaté au niveau des voies nerveuses plus centrales et en fonction de la fréquence utilisée
jusqu'au cortex auditif primaire, où chaque groupe de neurones
code pour un intervalle de fréquences donné et où ces groupes sont
rangés topographiquement de manière très régulière, illustre indi-
rectement l'importance de la tonotopie.
Il est important de noter que cette tonotopie devient nettement
moins précise au-dessous de 1 kHz qu'au-dessus, les courbes
d'accord des fibres nerveuses étant très élargies (figure 8a à gau-
che). Sur cette figure 8a, les deux neurones de droite ont une courbe
d'accord très fine, et le seuil de réponse à la meilleure fréquence,
dite fréquence caractéristique (8 et 3 kHz, de droite à gauche), est
proche de 0 dB SPL ; les autres fréquences sont beaucoup moins
efficaces. Les neurones de basse fréquence caractéristique (1 et 0,3
kHz, à gauche) ont des courbes d'accord assez larges, qui traduisent
le fait que ces neurones franchissent le seuil pour des sons de fré- Les neurones codant pour les basses fréquences, dont l’activité est
quences assez différentes de la fréquence caractéristique, même à représentée (par des barres en trait gras) le long d’axes temporels
bas niveau (autrement dit, la tonotopie est moins précise). Or, pour superposés, donnent des potentiels d’action bien synchrones de l’onde
l'audition humaine, cet intervalle de fréquences basses et médiums acoustique (ici, sinusoïdale) qui leur a donné naissance. Cette
possède une grande efficacité, notamment pour l'identification de synchronisation est partielle, car on peut ne pas observer de potentiel
d’action à chaque période du stimulus.
sons de musique ou de parole. Nous verrons par la suite que les per- Toutefois, l’activité globale des neurones fait nettement apparaître
formances en termes de discrimination des fréquences restent la périodicité du stimulus.
excellentes, ce qui laisse à penser que la tonotopie déficiente est
suppléée par d'autres indices. D'autre part, l'observation du dérou- b potentiels d’action des neurones codant pour les basses fréquences
lement temporel des potentiels d'action révèle l'apparition d'une
synchronisation partielle de ceux-ci avec les ondes acoustiques
(figure 8b) : ils apparaissent préférentiellement pour une phase Figure 8 – Synchronisation temporelle des potentiels d’action
donnée de l'onde de pression acoustique (correspondant au maxi- avec les stimulus de basse fréquence
mum de déflexion des stéréocils des cellules ciliées internes vers
l'extérieur, par rapport à l'axe de la cochlée, donc au maximum de
dépolarisation de ces cellules). On peut ne pas trouver systémati- séquentiellement diffèrent par leur fréquence. Du fait de la présen-
quement un potentiel d'action à chaque période du stimulus, mais il tation séquentielle, aucune interférence ne peut se produire au sein
ne faut pas oublier qu'en général plusieurs neurones répondent des filtres auditifs mis en jeu, le système n'a donc à juger, de
simultanément à un stimulus, dès que son niveau est nettement mémoire, que l'identité ou non des profils d'excitation obtenus.
supraliminaire ; l'histogramme de période des potentiels d'action L'expérience de base consiste à utiliser des sons purs, stables et
du groupe de neurones actifs peut permettre de reconstituer de d'assez longue durée, présentés successivement, mais certains
manière complète la périodicité du stimulus. Une synchronisation auteurs remplacent ce protocole par la présentation d'une modula-
temporelle des potentiels d'action avec les stimulus de basse fré- tion périodique de fréquence assez lente et obtiennent des résultats
quence est retrouvée à tous les niveaux des voies et centres auditifs. similaires avec un protocole d'apprentissage moins difficile. Il faut
en effet souligner que les performances publiées, et qui, nous allons
Bien que les analyses qui sont faites au niveau des centres auditifs le voir, dévoilent une capacité de discrimination considérable, ne le
des influx en provenance des neurones primaires auditifs soient très sont obtenues qu'au prix d'un entraînement long de plusieurs heu-
imparfaitement connues, il est raisonnable de penser que tonotopie res.
(au-dessus de 1 kHz) et synchronisation (au-dessous de 1 kHz) four-
nissent des indices assez précis pour renseigner sur les fréquences Le seuil différentiel de fréquence, soit Df /f, varie différemment
présentes dans les stimulations acoustiques. Une dualité est même selon que la fréquence de référence est inférieure ou supérieure à
probable dans le (large) intervalle de fréquences intermédiaires. 500 Hz. Au-dessous, Df /f est à peu près constant et égal à 1,8 Hz,
tandis qu'au-dessus, Df /f = 3,5/1000.

2.2 Seuil différentiel de fréquence 2.3 Propriétés de la hauteur


selon la nature du son considéré
Comme pour l'intensité, la notion de plus petit écart de fréquence
perceptible offre un premier aperçu intéressant des performances
du système auditif en matière de discrimination de fréquences, tout 2.3.1 Sons purs
en restant dans le domaine des paramètres physiques du stimulus.
Par définition, la capacité de discrimination fréquentielle concerne Deux méthodes permettent d'établir une échelle de hauteur, de
l'aptitude d'un système à reconnaître que deux sons présentés manière à classer des sons de sonie semblable selon la différence

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Électronique E 5 120 - 9
PERCEPTION DE L’INTENSITÉ, DE LA HAUTEUR ET DU TIMBRE DES SONS _________________________________________________________________________

de perception qu'ils entraînent. Tout d'abord, l'échelle musicale dans la zone normale de l'audiogramme, la sensibilité de ces der-
occidentale considère que le même intervalle de hauteur existe niers pouvant être meilleure, même pour la fréquence f inférieure à
entre deux sons purs de fréquences f1 et f2, et deux autres sons purs leur meilleure fréquence ; ces neurones répondent alors par la partie
de fréquences f3 et f4, lorsque f1/f2 = f3/f4, ce qui revient à dire que la basse fréquence de leur courbe d'accord. Un codage tonotopique
hauteur varie comme le logarithme de la fréquence. L'octave est un exclusif de la hauteur donnerait au son f une hauteur, correspondant
intervalle particulièrement privilégié correspondant à f1/f2 = 2. La à F, trop aiguë. Or, ce n'est pas ce qui est observé ; la hauteur corres-
précision des ajustements entre deux notes distantes d'une octave pond bien à f. Cette observation privilégie donc le principe d'un
est élevée, aussi bien chez des musiciens que chez des auditeurs codage de hauteur en fonction de la synchronisation temporelle des
quelconques. neurones qui répondent à la fréquence du stimulus.
Une autre méthode repose sur la recherche d'un ajustement arbi- ■ A l'opposé, Zwicker [10] a présenté de manière prolongée un
traire entre un son pur de référence et un son de hauteur moitié. La bruit à spectre encoché, c'est-à-dire comportant de l'énergie dans
notion de moitié est ici aussi arbitraire que pour la sonie présentée les intervalles de fréquences inférieurs à une certaine limite fmin et
au paragraphe précédent. Cependant, une échelle de hauteur peut
supérieurs à une autre limite fmax, susceptible d'induire une fatigue
être définie de proche en proche et représentée en fonction de la fré-
quence. Cette échelle, graduée en mels, ne coïncide pas avec auditive dans ces intervalles. À l'arrêt de ce son et en l'absence de
l'échelle musicale. Cela a alors conduit à introduire deux notions toute stimulation auditive, il a observé qu'un son résiduel fantôme
apparemment séparées pour décrire la hauteur tonale, celle de est perçu avec une hauteur tonale correspondant à une fréquence
chroma en relation avec la capacité d'apparier des sons lorsque le intermédiaire entre fmin et fmax, sans doute en relation avec une
rapport de leurs fréquences est égal à deux, et celle liée au classe- cadence spontanée de décharge plus élevée dans les neurones
ment selon une échelle grave/aigu. accordés aux fréquences non stimulées précédemment, les autres
neurones étant l'objet d'une fatigue ou d'une adaptation. On ne peut
expliquer cette perception fantôme par une activité neuronale syn-
2.3.2 Sons complexes périodiques chrone puisque le stimulus inducteur n'a aucune structure tempo-
relle ordonnée. Seul un principe tonotopique peut donc être
impliqué ici.
Le théorème de Fourier permet de montrer que ces sons ont un
spectre constitué d'une fréquence fondamentale f0 et d'harmoni- Au vu de ces observations, il semble donc qu'une synthèse entre
ques aux fréquences nf0 multiples entiers de la fréquence fonda- principes de codage temporel et tonotopique doive être recherchée.
mentale. Les notes de musique jouées par un instrument de On retrouve d'ailleurs une semblable dualité lorsque l'on s'intéresse
manière soutenue, ainsi que les voyelles dans les sons de parole, à la localisation des sources sonores [13].
constituent une bonne approximation de sons périodiques. Dès le
milieu du XIXe siècle, Helmholtz a mis en évidence le fait que
l'écoute la plus naturelle de tels sons est synthétique, c'est-à-dire
consiste à percevoir globalement l'ensemble des harmoniques et 2.4 Cas des sons harmoniques avec
permet d'apparier sans difficulté un son complexe harmonique de
fondamental f0 et un son pur f0 sur la base de hauteurs identiques. fondamentale absente
En réalité, quelques erreurs peuvent se produire lorsque l'énergie
de la composante f0 du son complexe est très faible, et ces erreurs
conduisent à une erreur d'appariement à une octave près, cet inter- L'utilisation pour la transmission de la parole par téléphone met
valle se retrouvant dans un rôle privilégié. en évidence un phénomène curieux : bien que la bande passante
Toutefois, la sonorité de sons complexes périodiques de même utilisée soit limitée à un intervalle de 300 à 3 000 Hz, éliminant ainsi
fréquence fondamentale mais de profils spectraux différents est per- la fréquence fondamentale de la voix des hommes et de la plupart
çue comme différant par le timbre, et nous reverrons cette notion au des femmes, qui varie entre 100 et 250 Hz, la hauteur de la voix
paragraphe suivant. Dans les tentatives pour donner une définition transmise est perçue comme strictement normale (bien que le tim-
plus spécifique du timbre, le terme hauteur brute a été introduit bre soit modifié, cf. § 3). Cela illustre le paradoxe dit de la fondamen-
pour décrire une telle différence lorsqu'elle est basée sur le centre tale absente, connu depuis longtemps. Helmholtz avait tenté
de gravité du spectre fréquentiel d'un son. d'expliquer ce paradoxe de manière ingénieuse en proposant que,
lorsqu'un son complexe comporte des harmoniques 2f, 3f, etc, mais
pas la fondamentale f, celle-ci peut être reconstituée dans l'oreille
moyenne grâce à l'existence de distorsions qui engendrent des sons
2.3.3 Conséquences pour le codage de la hauteur de combinaison (par exemple, à la fréquence 3f – 2f). En fait, l'oreille
moyenne ne distord pas dans les conditions normales. Bien que la
Comme nous l'avons vu au paragraphe 2.1, il existe deux princi- cochlée, pour sa part, engendre bien ce type de distorsions quand
pes donnant chacun une possibilité de codage de la hauteur dans le elle est normale, elle n'est pas non plus à l'origine du phénomène. Il
nerf auditif. a été montré que l'intégrité du cortex auditif est nécessaire à la per-
ception de la hauteur correcte [14] et que la présentation dichotique
■ Le premier repose sur la tonotopie et est à coup sûr le seul dispo- de composantes harmoniques de f permettait l'émergence d'une
nible pour des fréquences dépassant quelques kHz. Le deuxième perception de hauteur associée à f.
exploite la synchronisation partielle des fibres nerveuses auditives
avec les vibrations acoustiques pour les fréquences inférieures à
quelques kHz. Chez l'homme, l'intervalle intermédiaire où les deux
principes de codage sont théoriquement possibles est particulière- 2.5 Cas des sons inharmoniques
ment pertinent pour la perception de nombreux stimulus utiles à la
communication. Des arguments expérimentaux susceptibles de
trancher en faveur de l'un ou l'autre principe ont donc été recher- Enfin, mentionnons brièvement qu'une sensation de hauteur plus
chés. Par exemple, on peut étudier la perception de la hauteur chez ou moins nette peut être présente à l'écoute de sons complexes,
des sujets porteurs d'une surdité touchant préférentiellement les même lorsqu'ils sont constitués de composantes spectrales non
basses fréquences. Un son pur de fréquence f, dans l'intervalle de multiples d'une fondamentale f : par exemple, nf + Df (avec n entier
fréquences affecté par la surdité, devrait être d'abord détecté, non variable) engendrent une sensation de hauteur proche de f. Certains
pas par les neurones accordés à f, parce que leur seuil de réponse types de bruits peuvent également donner lieu à une sensation de
est élevé, mais par ceux codant pour des fréquences plus élevées F, hauteur assez bien définie.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
E 5 120 - 10 © Techniques de l’Ingénieur, traité Électronique
_________________________________________________________________________ PERCEPTION DE L’INTENSITÉ, DE LA HAUTEUR ET DU TIMBRE DES SONS

3. Notion de timbre timbre des voyelles, montre que la prise en compte de trois dimen-
sions suffit pour permettre, d'après Plomp, d'englober environ 82 %
de la variance des jugements de timbre portés sur ce type de sons.

3.1 Définition
3.3 Rôle des fluctuations temporelles

La définition du timbre repose sur une sorte de constatation par Les fluctuations temporelles d'un son non stationnaire permet-
défaut. Lorsque l'on tente d'effectuer la comparaison de deux sons, tent de définir certains aspects liés au timbre. Par exemple, on peut
on peut aisément juger qu'il sont différents lorsque leurs sonies dif- attribuer une qualité tonale ou de bruit selon l'existence ou non
fèrent ou lorsque leurs hauteurs diffèrent, même si les conditions de d'une périodicité même approximative. Les fluctuations de l'enve-
présentation sont par ailleurs identiques. En termes de paramètres loppe influent aussi sur la perception du timbre, comme l'illustre
physiques des stimulus, ces différences ont une signification sim- l'expérience consistant à jouer à l'envers une note de musique
ple, comme nous l'avons vu dans les paragraphes précédents. enregistrée : en dépit de caractéristiques temporelles et spectrales
moyennes inchangées, le timbre en est totalement altéré. Les chan-
gements intervenant dans le spectre à court terme sont également
Lorsque conditions de présentation, sonie et hauteur sont essentiels. Les progrès en synthèse musicale ont permis, par exem-
identiques mais que les sensations auditives produites diffèrent, ple, d'identifier clairement le rôle des transitoires d'attaque. Une
on dit que le timbre diffère. note de trompette présente un timbre brillant très particulier car,
dans son spectre fréquentiel, les harmoniques élevés ont une éner-
gie qui augmente très rapidement à l'attaque, au détriment des har-
Cette définition pèche par beaucoup de côtés, puisque des sons moniques plus bas initialement présents. Un son de synthèse de
dépourvus de hauteur peuvent aussi avoir des timbres différents ou même spectre à long terme qu'un son de trompette, mais ayant subi
similaires, et que la notion de conditions de présentation est très la suppression de cette caractéristique d'attaque, perd son timbre de
floue. Pour éviter ce dernier écueil, une autre définition plus restric- trompette, pour éventuellement sonner comme un hautbois ou une
tive est proposée par Plomp [15] : clarinette [17]. Par ailleurs, on a bien acquis la notion que, pour
reproduire correctement le timbre d'un instrument par synthèse, il
est souvent nécessaire de tenir compte de l'existence dans le son
Le timbre est cet attribut de la sensation permettant de juger naturel d'irrégularités ou bruits transitoires coexistant avec des
que deux sons complexes stables de mêmes sonie, hauteur et composantes plus stationnaires, dont la reproduction seule condui-
durée de présentation, sont dissemblables. rait à des résultats médiocres et à des sonorités plates. Enfin, on sait
que le timbre d'un son n'est pas totalement indépendant de la
nature des sons qui le précèdent, et aussi de ceux qui le suivent.
Les conditions requises pour appliquer cette dernière définition L'enregistrement de neurones auditifs corticaux permet effective-
ne permettent guère de préciser pourquoi la même note jouée avec ment d'objectiver l'existence de réponses dépendantes du contexte,
la même force par un piano, un violon et une trompette n'ont pas le qui sont vraisemblablement à la base de cette dernière observation
même timbre, ce qui lui fait perdre beaucoup d'intérêt pratique. perceptive quelque peu surprenante.
En fin de compte, la définition proposée par Bregman [16] résume Il faut noter que, lorsqu'il s'avère que la caractéristique de timbre
ces difficultés de manière humoristique : considérée est associée à une manière particulière de jouer d'une
« On ne sait pas définir le timbre, mais on sait que ce n'est ni la catégorie d'instruments de musique, on aura tendance à lui attri-
sonie, ni la hauteur ». buer un nom précis, par exemple le vibrato, distinguant ainsi cette
caractéristique de la notion plus floue ou plus globale de timbre.
Quelques idées semblent cependant émerger à ce sujet, de
manière indiscutable : le timbre attribué à un son dépend du spectre
fréquentiel, éventuellement de la manière dont celui-ci varie avec le
temps, et le timbre est une notion associée de manière multidimen-
sionnelle à la nature physique du son considéré : les comparaisons 4. Conclusion
de sons de timbres différents ne peuvent se faire en utilisant une
seule échelle, comme c'était le cas lorsque la différence portait sur
la sonie ou la hauteur. L'analyse psychoacoustique de sons simples ou complexes per-
met de mettre en évidence plusieurs dimensions perceptives, en
relation avec les paramètres physiques de ces sons (intensité, spec-
tre et enveloppe temporelle, notamment). Celles basées sur l'inten-
sité et la fréquence (au moins pour les sons purs ou complexes
3.2 Rôle du profil énergétique du spectre périodiques) aboutissent à définir les notions de force sonore et de
hauteur, de type unidimensionnel, et dont les relations avec inten-
sité et fréquence sont relativement simples. Les données physiolo-
Le profil d'énergie d'un spectre en fonction de la fréquence joue giques actuelles suggèrent certaines grandes lignes des principes
un rôle majeur dans la définition d'un timbre. Deux sons stationnai- neurologiques de codage de la sonie et de la hauteur ; toutefois, les
res, par exemple complexes périodiques, de même fréquence fonda- détails de ces codages restent inconnus. Les progrès récents des
mentale et de même énergie totale, se distinguent perceptuellement connaissances en matière de physiopathologie permettent de
par leur timbre selon le profil de leur spectre. On peut préciser par mieux comprendre les troubles perceptifs dus à une surdité et de
exemple que, lorsque les harmoniques élevés (d'ordre supérieur à 6) tenter de mieux y remédier. Toutefois, la plupart des tests quantita-
sont riches en énergie, cela contribue à donner un timbre qualifié de tifs susceptibles de fournir une évaluation de ces troubles restent
brillant, tandis qu'une augmentation d'énergie dans les harmoni- cantonnés au laboratoire, car ils demandent un temps et une con-
ques plus bas donne un timbre plus sourd ou plus doux. Pour décrire centration qui excluent leur utilisation clinique. Les développements
le timbre selon le profil spectral, on peut théoriquement faire entrer technologiques actuels en matière d'aides auditives devraient sti-
en ligne de compte autant de dimensions qu'il existe de bandes cri- muler durablement cette branche de recherches à la fois fondamen-
tiques dans le système auditif (cf. § 1.8). Cependant, l'application tales et appliquées, née il y a plus d'un siècle et encore loin de son
d'analyses de type factoriel à ce problème, dans le cas particulier du terme.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Électronique E 5 120 - 11
PERCEPTION DE L’INTENSITÉ, DE LA HAUTEUR ET DU TIMBRE DES SONS _________________________________________________________________________

Références bibliographiques

[1] LOTH (D.). – Biophysique sensorielle, acous- mines auditory nerve rate-intensity functions Science. College Hill, San Diego, p. 263-308
tique physiologique. Techn. Ing. E 5 110, p. 1- and cochlear dynamic range. Hear. Res. 45, p. (1984).
5 (1997). 203-219 (1990).
[13] CANÉVET (G.). – La psychoacoustique,
[2] ROMAND (R.) (éd). – Le système auditif cen- [7] MOORE (B.C.J.). – An introduction to the psy-
aspects fondamentaux et exemples d’appli-
tral, anatomie et physiologie. EM Inter, chology of hearing (2e éd), Academic Press,
cations. Acoustique et Techniques, 5, p. 7-13
INSERM/SFA/CNET (1992). Londres, (1982).
(1997).
[8] ZWICKER (E.) et FELDTKELLER (R.). – Psy-
[3] HOUTSMA (A.J.M.), DURLACH (N.L.) et [14] ZATORRE (R.J.). – Pitch perception of com-
choacoustique, l’oreille, récepteur d’informa-
BRAIDA (L.D.). – Intensity perception. XI. plex tones and human temporal-lobe func-
tion (trad : C. Sorin), Masson (1981).
Experimental results ont the relation of inten- tion. J. Acoust. Soc. Am. 84, p. 566-572
sity perception to loudness matching. J. [9] ZWICKER (E.) et FASTL (H.). – Psychoacous-
tics, facts and models, Springer Verlag, Ber- (1988).
Acoust. Soc. Am. 68, p. 807-813 (1980).
lin (1990). [15] PLOMP (R.). – Aspects of tone sensation.
[4] STEVENS (S.S.). – The direct estimation of [10] ZWICKER (E.). – Negative after-image in hea-
sensory magnitudes–loudness. Am. J. Psy- Academic Press, Londres (1976).
ring. J. Acoust. Soc. Am. 36, p. 2413-2415
chol. 69, p. 1-25 (1956). [16] BREGMAN (A.S.). – Auditory scene analysis,
(1964).
[5] MOORE (B.C.J.) et RAAB (D.H.). – Pure-tone [11] BOTTE (M.C.), CANÉVET (G.), DEMANY (L.) the perceptual organization of sound. MIT
intensity discrimination : some experiments et SORIN (C.). – Psychoacoustique et percep- Press, Cambridge (1990).
relating to the “near-miss“ to Weber’s law. J. tion auditive. EM Inter, INSERM/SFA/CNET [17] RISSET (J.C.) et WESSEL (D.). – Exploration
Acoust. Soc. Am. 55, p. 1049-1054 (1974). (1989). of timbre by analysis and synthesis, in The
[6] YATES (G.K.), WINTER (I.M.) et ROBERTSON [12] SACHS (M.B.). – Speech encoding in the Psychology of Music, D. Deutsch (éd). Acade-
(D.). – Basilar membrane nonlinearity deter- auditory nerve, in : C. Berlin (éd) Hearing mic Press, New York, p. 26-54 (1982).

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
E 5 120 - 12 © Techniques de l’Ingénieur, traité Électronique

Vous aimerez peut-être aussi