Faculté de Génie

Département de Génie Mécanique
SYNTHÈSE DE CHAMPS SONORES
ADAPTATIVE
Thèse de doctorat es sciences appliquées
Spécialité : génie mécanique
Philippe-Aubert GAUTHIER
Sherbrooke (Québec), CANADA Septembre 2007
La prolifération des théories est bénéfique à la science, tandis que
l’uniformité affaiblit son pouvoir critique.
Paul Feyerabend
i
RÉSUMÉ
La reproduction de champs acoustiques est une approche physique au problème technolo-
gique de la spatialisation sonore. Cette thèse concerne l’aspect physique de la reproduction de
champs acoustiques. L’objectif principal est l’amélioration de la reproduction de champs acous-
tiques par «synthèse de champs acoustiques» («Wave Field Synthesis», WFS), une approche
connue, basée sur des hypothèses de champ libre, à l’aide du contrôle actif par l’ajout de cap-
teurs de l’erreur de reproduction et d’une boucle fermée.
Un premier chapitre technique (chapitre 4) expose les résultats d’appréciation objective de la
WFS par simulations et mesures expérimentales. L’effet indésirable de la salle de reproduction
sur les qualités objectives de la WFS fut illustré. Une première question de recherche fut ensuite
abordée (chapitre 5), à savoir s’il est possible de reproduire des champs progressifs en salle dans
un paradigme physique de contrôle actif : cette possibilité fut prouvée.
L’approche technique privilégiée, «synthèse de champs adaptative» («Adaptive Wave Field
Synthesis» [AWFS]), fut définie, puis simulée (chapitre 6). Cette approche d’AWFS comporte
une originalité en contrôle actif et en reproduction de champs acoustiques : la fonction coût
quadratique représentant la minimisation des erreurs de reproduction inclut une régularisation
de Tikhonov avec solution a priori qui vient de la WFS. L’étude de l’AWFS à l’aide de la dé-
composition en valeurs singulières (chapitre 7) a permis de comprendre les mécanismes propres
à l’AWFS. C’est la deuxième principale originalité de la thèse.
L’algorithme FXLMS (LMS et référence filtrée) est modifié pour l’AWFS (chapitre 8). Le
découplage du système par décomposition en valeurs singulières est illustré dans le domaine du
traitement de signal et l’AWFS basée sur le contrôle indépendant des modes de rayonnement est
simulée (chapitre 8). Ce qui constitue la troisième originalité principale de cette thèse. Ces si-
mulations du traitement de signal montrent l’efficacité des algorithmes et la capacité de l’AWFS
à atténuer les erreurs attribuables à des réflexions acoustiques.
Le neuvième chapitre présente des résultats expérimentaux d’AWFS. L’objectif était de va-
lider la méthode et d’évaluer les performances de l’AWFS. Un autre algorithme prometteur
est aussi testé. Les résultats démontrent la bonne marche de l’AWFS et des algorithmes testés.
Autant dans le cas de la reproduction de champs harmoniques que dans le cas de la reproduc-
tion de champs à large bande, l’AWFS réduit l’erreur de reproduction de la WFS et les effets
indésirables causés par les lieux de reproduction.
ii
REMERCIEMENTS
Au terme de mes études doctorales, je tiens à remercier ceux et celles qui ont supporté cette
démarche d’importance. Ainsi, je souligne d’abord le support d’Alain Berry, mon directeur de
recherche qui, de par ses remarquables qualités scientifiques et humaines a su transformer cette
expérience en aventure stimulante et formatrice. Je le remercie plus spécialement pour avoir su
tenir compte de mes propres objectifs de carrière tout en me guidant efficacement pour l’atteinte
des objectifs du doctorat.
Au-delà du travail quotidien impliqué par la réalisation de cette thèse, je tiens à remercier
ma compagne, Tanya St-Pierre, pour son support moral : passant de l’encouragament lors des
temps sombres et de l’incitation au divertissement et au détachement lors des moments de travail
intenses, parfois trop. Pour cela, je la remercie infiniement et je suis immensément reconnaissant
de sa tolérance envers les exigences doctorales qui débordent fréquemment sur la définition
courante d’une vie équilibrée.
Je tiens à remercier ma mère, Marcelle Fournier, et mon père, Jean-Marie Gauthier, qui,
après avoir corrigé les écrits d’un mémoire de maîtrise, ont tenté cette expérience une seconde
fois. Un travail de correction grandement apprécié, voire nécessaire. Je remercie aussi mes pa-
rents pour leur support moral ; mon père, qui sait toujours offrir de l’aide et du support, et ma
mère, pour son perpétuel encouragement.
Tout au long de mes études doctorales, de nombreuses discussions avec des collègues et
amis étudiants au GAUS ont aussi contribué à rendre l’expérience agréable par la création d’un
environnement de travail stimulant, autant sur le plan technique qu’humain. C’est ainsi que je
remercie tous les étudiants avec qui j’ai passé ces années au sein du GAUS. Je profite aussi
de l’occasion pour remercier tous les membres du GAUS qui directement ou indirectement ont
contribués à ces travaux.
Cette thèse et tous les travaux qu’elle résume ici n’auraient pu être faits sans le support finan-
cier du CRSNG (Conseil de Recherche en Sciences Naturelles et en Génie), du FQRNT (Fonds
Québecois de Recherche sur la Nature et les Technologiques) et l’Université de Sherbrooke que
je remercie pour le support financier apporté au projet.
iii
TABLE DES MATIÈRES
1 Introduction 1
1.1 Structure de la thèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2 Notions préliminaires et état de la situation 7
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Notions préliminaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2.1 La perception spatiale du sonore . . . . . . . . . . . . . . . . . . . . . 7
2.2.2 Deux approches distinctes pour la reproduction spatiale du son . . . . . 10
2.3 Aperçu de l’historique de la reproduction audio . . . . . . . . . . . . . . . . . 12
2.4 Les techniques récentes et novatrices . . . . . . . . . . . . . . . . . . . . . . . 16
2.4.1 Techniques binaurales et réduction de la diaphonie . . . . . . . . . . . 16
2.4.2 Reproduction de champs acoustiques par synthèse de champs acous-
tiques (WFS) pour le problème intérieur . . . . . . . . . . . . . . . . . 17
2.4.3 Applications issues du contrôle actif et du filtrage adaptatif . . . . . . . 20
2.4.4 Ambisonie, quelques autres méthodes et hybridations possibles . . . . 27
2.5 Les travaux récents les plus révélateurs par rapport aux objectifs de recherche . 29
2.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3 Objectifs et méthodes 36
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.2 Contexte de réalisation de la recherche . . . . . . . . . . . . . . . . . . . . . . 36
3.3 Objectifs de la recherche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.4 Méthodologie proposée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4 Expérimentations préliminaires avec un système de WFS conventionnel 42
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.2 Réseau de sources acoustiques en phase . . . . . . . . . . . . . . . . . . . . . 43
4.2.1 Distribution de la réponse en fréquence dans un espace infini . . . . . . 44
4.2.2 Multi-tracés des réponses à l’impulsion dans l’espace . . . . . . . . . . 49
4.3 Simulations et études de la WFS en champ libre . . . . . . . . . . . . . . . . . 51
iv
4.3.1 Distribution de la réponse en fréquence dans l’espace et effet de la po-
sition de la source virtuelle pour un réseau linéaire de sources de repro-
duction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.3.2 Multi-tracés des réponses impulsionnelles dans l’espace infini . . . . . 55
4.4 Atténuation des effets de bord en WFS et choix de la ligne de référence . . . . 59
4.5 Évaluation objective de la WFS en situation expérimentale . . . . . . . . . . . 63
4.5.1 La procédure expérimentale en résumé . . . . . . . . . . . . . . . . . 63
4.5.2 Configurations étudiées . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.5.3 Au sujet de la cohérence et de la validité des mesures . . . . . . . . . . 66
4.5.4 Réponses en fréquence . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.5.5 Réponses à l’impulsion . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5 Modélisation acoustique de la reproduction de champs acoustiques en salle : ana-
lyses théoriques et simulations 79
5.1 Résumé français . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.2 Sound field reproduction in-room using optimal control techniques : Simula-
tions in the frequency domain . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.3 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.3.1 Recent advances in spatial sound reproduction . . . . . . . . . . . . . 82
5.4 Theoretical model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
5.4.1 Radiation modelling . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
5.4.2 Control modelling . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
5.5 Results of numerical simulations . . . . . . . . . . . . . . . . . . . . . . . . . 92
5.5.1 Feasibility study . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
5.5.2 Comparison with WFS in free field . . . . . . . . . . . . . . . . . . . 95
5.5.3 In-room reproduction, comparison with WFS and control mechanisms . 96
5.5.4 Investigation of practical sensing configuration . . . . . . . . . . . . . 101
5.5.5 Conditioning of the reproduction system . . . . . . . . . . . . . . . . . 105
5.6 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
5.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
6 Étude comparative de la WFS, de la minimisation régularisée de l’erreur et de
l’AWFS 113
6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
6.2 Formulation théorique d’une approche d’AWFS . . . . . . . . . . . . . . . . . 115
v
6.3 Comparaisons en champ libre entre WFS, AWFS et minimisation régularisée
des erreurs de reproduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
6.3.1 Configuration circulaire des sources et configurations centrées pour les
capteurs de l’erreur . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
6.4 Effet de la distance de séparation des capteurs . . . . . . . . . . . . . . . . . . 129
6.5 Antenne de sources en «U» . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
6.6 Effet d’une seule réflexion causée par une surface rigide infinie . . . . . . . . . 133
6.7 Discussion et configuration choisie . . . . . . . . . . . . . . . . . . . . . . . . 136
6.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
7 WFS adaptative avec contrôle indépendent des modes de rayonnement 139
7.1 Résumé français . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
7.2 Adaptive wave field synthesis with independent radiation mode control for ac-
tive sound field reproduction : Theory . . . . . . . . . . . . . . . . . . . . . . 140
7.3 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
7.4 Radiation, WFS and control models for AWFS . . . . . . . . . . . . . . . . . 142
7.4.1 WFS operators . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
7.4.2 Definition of AWFS . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
7.5 Interpretation of AWFS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
7.6 Simulation results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
7.7 AWFS and singular value decomposition of Z . . . . . . . . . . . . . . . . . . 152
7.7.1 Nature of the under-determined set of equations Zq = p
(im)
. . . . . . 154
7.7.2 Independent radiation mode control for AWFS . . . . . . . . . . . . . 155
7.8 Analysis of simulation results with SVD . . . . . . . . . . . . . . . . . . . . . 157
7.8.1 AWFS and “Ambisonics” . . . . . . . . . . . . . . . . . . . . . . . . . 160
7.8.2 Including reflections and room effects . . . . . . . . . . . . . . . . . . 164
7.9 Implementation of AWFS by independent feedforward control of radiation modes165
7.10 Conclusion and perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
7.11 Acknowledgments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
7.12 APPENDIX : “Ambisonics” review . . . . . . . . . . . . . . . . . . . . . . . 170
8 Traitement de signal numérique pour la WFS adaptative 173
8.1 Résumé français . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
8.2 Adaptive wave field synthesis and independent radiation mode control for broad-
band active sound field reproduction : Signal processing . . . . . . . . . . . . . 174
8.3 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
8.3.1 Sound field reproduction . . . . . . . . . . . . . . . . . . . . . . . . . 176
vi
8.3.2 Multichannel filters for adaptive sound reproduction . . . . . . . . . . 177
8.3.3 Wave Field Synthesis (WFS) . . . . . . . . . . . . . . . . . . . . . . . 177
8.3.4 Adaptive wave field synthesis (AWFS) . . . . . . . . . . . . . . . . . . 179
8.4 Signal processing for adaptive wave field synthesis . . . . . . . . . . . . . . . 179
8.4.1 Review of WFS operators for AWFS . . . . . . . . . . . . . . . . . . . 180
8.4.2 FXLMS for AWFS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
8.4.3 AWFS with independent radiation mode control using singular value
decomposition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
8.5 Simulations results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
8.5.1 Free field . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
8.5.2 Semi-infinite space delimited by a rigid floor and two hard walls . . . . 202
8.6 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208
8.7 Conclusion and perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
8.8 Acknowledgments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
9 Résultats d’expérimentations de synthèse de champs sonores adaptative 212
9.1 Adaptive wave field synthesis and independent radiation mode control for active
sound field reproduction : Experimental results . . . . . . . . . . . . . . . . . 213
9.2 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
9.2.1 Sound field reproduction . . . . . . . . . . . . . . . . . . . . . . . . . 215
9.2.2 Wave field synthesis (WFS) . . . . . . . . . . . . . . . . . . . . . . . 216
9.2.3 Adaptive wave field synthesis (AWFS) and independent radiation mode
control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
9.3 Signal processing for AWFS . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
9.3.1 Broadband AWFS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220
9.3.2 Harmonic AWFS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
9.4 Experimental protocol . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
9.4.1 Experimental setups . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
9.4.2 Methods of experiments . . . . . . . . . . . . . . . . . . . . . . . . . 224
9.5 AWFS experiments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
9.5.1 Acoustical characteristics of the reproduction rooms . . . . . . . . . . 225
9.5.2 Hemi-anechoic space . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
9.5.3 Standard laboratory space and reverberation chamber . . . . . . . . . . 237
9.5.4 Importance of the higher order radiation modes . . . . . . . . . . . . . 244
9.5.5 Modification of the FXLMS algorihtm for AWFS . . . . . . . . . . . . 244
9.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
vii
Conclusion 251
10.1 Structure de la conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
10.2 Discussion et rappel des résultats . . . . . . . . . . . . . . . . . . . . . . . . . 254
10.3 Résumé du processus et des originalités de la recherche . . . . . . . . . . . . . 260
10.4 Intégration des résultats de recherche aux pratiques actuelles en reproduction
spatiale du son, considérations pratiques et ouvertures diverses . . . . . . . . . 261
10.4.1 De la WFS vers la AWFS . . . . . . . . . . . . . . . . . . . . . . . . 261
10.4.2 Utilisation de plusieurs antennes de microphones compactes en AWFS
et encombrement de la zone d’écoute . . . . . . . . . . . . . . . . . . 262
10.4.3 Murs de haut-parleurs et acoustique des salles variable . . . . . . . . . 264
10.4.4 Reproduction de champs acoustiques par réduction de la diaphonie et
modification de l’AWFS . . . . . . . . . . . . . . . . . . . . . . . . . 265
10.4.5 Simplifications pour des usages Ambisoniques courants . . . . . . . . 265
10.4.6 Type de sources de reproduction . . . . . . . . . . . . . . . . . . . . . 266
10.4.7 Application à la stéréophonie et à la réduction de la diaphonie . . . . . 266
10.4.8 Aspects de recherche divers . . . . . . . . . . . . . . . . . . . . . . . 267
10.5 Perspectives de recherches futures . . . . . . . . . . . . . . . . . . . . . . . . 269
10.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
A Développements théoriques complémentaires 298
A.1 Modes propres d’une salle légèrement amortie aux surfaces . . . . . . . . . . . 298
A.2 Signification du nombre de conditionnement . . . . . . . . . . . . . . . . . . . 301
A.3 Contrôle optimal et AWFS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302
A.3.1 Interprétation mathématique du problème physique de l’AWFS à partir
d’un problème inverse . . . . . . . . . . . . . . . . . . . . . . . . . . 305
A.3.2 Démonstration de l’équivalence de l’AWFS et d’un problème classique
des moindres-carrés . . . . . . . . . . . . . . . . . . . . . . . . . . . 308
A.3.3 AWFS basée sur le contrôle indépendant des modes de rayonnement par
décomposition en valeurs singulières . . . . . . . . . . . . . . . . . . 308
A.3.4 Facteurs de filtrage pour l’AWFS . . . . . . . . . . . . . . . . . . . . 311
A.4 La théorie derrière l’ambisonie . . . . . . . . . . . . . . . . . . . . . . . . . . 313
A.4.1 Ambisonie comme un cas particulier du contrôle optimal de la repro-
duction spatiale du son . . . . . . . . . . . . . . . . . . . . . . . . . . 325
A.5 Développement des opérateurs de synthèse de la WFS dans le domaine fréquentiel327
A.5.1 Reproduction d’ondes planes . . . . . . . . . . . . . . . . . . . . . . . 342
A.6 L’ambisonie à partir des équations générales de la WFS . . . . . . . . . . . . . 343
A.7 Les opérateurs de synthèse de la WFS dans le domaine temporel . . . . . . . . 347
viii
A.7.1 Passage du domaine fréquentiel au domaine temporel pour un système
incluant un retard temporel fractionnaire . . . . . . . . . . . . . . . . . 348
A.7.2 Les opérateurs de synthèse en pratique pour l’AWFS . . . . . . . . . . 351
A.8 Décomposition en valeurs singulières : aspects théoriques, considérations nu-
mériques et algorithmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354
A.8.1 Propriétés numériques de la SVD . . . . . . . . . . . . . . . . . . . . 355
A.8.2 Algorithmes de la SVD . . . . . . . . . . . . . . . . . . . . . . . . . . 356
A.8.3 Relation théorique entre la décomposition en valeurs singulières (SVD)
et l’expansion en valeurs singulières (SVE) . . . . . . . . . . . . . . . 358
A.9 Traitement du signal pour l’AWFS . . . . . . . . . . . . . . . . . . . . . . . . 360
A.9.1 AWFS pour des tons purs . . . . . . . . . . . . . . . . . . . . . . . . . 360
A.9.2 AWFS basée sur le contrôle indépendant des modes de rayonnement et
les algorithmes FXLMS et de Newton modifiés . . . . . . . . . . . . . 361
B Compléments de simulations 364
B.1 Recommandations de l’AES quant aux salles d’écoute pour systèmes à plusieurs
voies. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 364
B.2 Importance des modes de rayonnement d’ordre supérieur sur la taille de la zone
de contrôle effective de l’AWFS. . . . . . . . . . . . . . . . . . . . . . . . . . 365
B.2.1 Reproduction de champs harmoniques . . . . . . . . . . . . . . . . . . 366
B.2.2 Reproduction d’impulsions . . . . . . . . . . . . . . . . . . . . . . . . 369
C Compléments d’expérimentations 374
C.1 Expérimentations préliminaires avec un système de WFS conventionnel : me-
sures de champs reproduits . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374
C.1.1 Informations complémentaires sur la salle de reproduction . . . . . . . 374
C.1.2 Informations complémentaires sur le système de WFS . . . . . . . . . 376
C.1.3 Informations complémentaires au sujet du montage expérimental . . . . 379
C.1.4 Informations et preuves supplémentaires au sujet de la récupération et
de la manipulation des données expérimentales . . . . . . . . . . . . . 380
C.2 Identification des réponses en fréquences de huit microphones en situation semi-
anéchoïque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 381
C.3 Construction d’un système de WFS approximatif . . . . . . . . . . . . . . . . 386
C.3.1 Description du système . . . . . . . . . . . . . . . . . . . . . . . . . . 387
C.3.2 Résumé des observations . . . . . . . . . . . . . . . . . . . . . . . . . 388
C.4 Description du système expérimental d’AWFS et des lieux utilisés pour les ex-
périmentations avec un système d’AWFS complet . . . . . . . . . . . . . . . . 390
ix
C.4.1 Conception et construction du système d’AWFS . . . . . . . . . . . . 390
C.4.2 Caractérisation des haut-parleurs DX4 . . . . . . . . . . . . . . . . . . 394
C.4.3 Caractérisation et description acoustiques des lieux utilisés pour les es-
sais en AWFS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401
C.5 Compensation en phase des microphones de l’erreur pour l’AWFS harmonique 413
C.5.1 Filtres de compensation de phase . . . . . . . . . . . . . . . . . . . . 414
C.6 Résultats supplémentaires d’AWFS harmonique . . . . . . . . . . . . . . . . . 414
C.6.1 Effet de la position de la source virtuelle en salle semi-anéchoïque . . . 415
C.6.2 Champs acoustiques reproduits . . . . . . . . . . . . . . . . . . . . . . 417
x
LISTE DES TABLEAUX
2.1 Taxonomie des approches et des technologies de reproduction du caractère spa-
tial de l’audition. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
6.1 Points distinctifs pour les antennes de sources circulaires et celles en «U». . . . 131
9.1 Convergence coefficients and regularization parameters for harmonic AWFS ba-
sed on independent radiation mode control in hemi-anechoic space. . . . . . . 234
9.2 Convergence coefficients and regularization parameters for harmonic AWFS ba-
sed on independent radiation mode control in laboratory space. . . . . . . . . . 242
A.1 Opérateurs de synthèse de la WFS dans le domaine des fréquences . . . . . . . 338
A.2 Variation de l’algorithme de PC-LMS pour l’AWFS selon les coefficients de
convergence et les paramètres de pénalisation. . . . . . . . . . . . . . . . . . . 363
B.1 Caractéristiques de la salle utilisée pour les simulations . . . . . . . . . . . . . 365
C.1 Spécifications techniques pour les moniteurs de studio DX4. . . . . . . . . . . 390
C.2 Spécifications techniques pour les supports ES-300. . . . . . . . . . . . . . . . 391
C.3 Spécifications techniques pour les microphones 130D10. . . . . . . . . . . . . 391
C.4 Spécifications techniques pour les préamplificateurs 130P10. . . . . . . . . . . 391
C.5 Spécifications techniques pour la carte de son 24IO. . . . . . . . . . . . . . . . 394
xi
LISTE DES FIGURES
2.1 Schéma fonctionnel générique d’un système de reproduction audio adaptif . . . 21
4.1 Configuration en champ libre utilisée pour la simulation du filtre en peigne. . . 45
4.2 Deuxième configuration en champ libre utilisée pour la simulation du filtre en
peigne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.3 Gains des réponses en fréquence pour la configuration présentée à la figure 4.1
(p. 45) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.4 Gain des réponses en fréquence pour la configuration présentée à la figure 4.2
(p. 45) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.5 Gain de la réponse en fréquence du capteur central pour la configuration de la
figure 4.2 (p. 45). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.6 Gain de la réponse en fréquence du capteur central pour une configuration sem-
blable à celle de la figure 4.2 (p. 45) avec 100 sources. . . . . . . . . . . . . . 47
4.7 éponse impulsionnelle évaluée pour le capteur central. . . . . . . . . . . . . . 50
4.8 Réponses impulsionnelles évaluées pour tous les capteurs et les sources de la
configuration présentée à la figure 4.2 (p. 45) . . . . . . . . . . . . . . . . . . 50
4.9 Configuration utilisée pour la simulation de la WFS en champ libre avec trois
positions de sources virtuelles. . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.10 Gain de la réponse en fréquence aux capteurs pour la configuration de la figure
4.9 (p. 52) avec une source virtuelle en (a). . . . . . . . . . . . . . . . . . . . . 52
4.11 Gain de la réponse en fréquence aux capteurs pour la configuration de la figure
4.9 (p. 52) avec une source virtuelle en (b). . . . . . . . . . . . . . . . . . . . 53
4.12 Gain de la réponse en fréquence aux capteurs pour la configuration de la figure
4.9 (p. 52) avec une source virtuelle en (c). . . . . . . . . . . . . . . . . . . . . 54
4.13 Gain de la réponse en fréquence au capteur central pour la configuration de la
figure 4.9 (p. 52) avec des sources virtuelles en (a), (b), (c) et (0,2.025,0) [m]. . 54
4.14 Réponses impulsionnelles virtuelles (de la source monopolaire virtuelle, posi-
tion virtuelle (a) à la figure 4.9 (p. 52). . . . . . . . . . . . . . . . . . . . . . . 54
4.15 Réponses impulsionnelles pour la WFS lors de la reproduction du front d’onde
de la figure 4.14 (p. 54). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
xii
4.16 Comparaison des réponses impulsionnelles (dans la plage de fréquences de 0 à
976 Hz environ) reproduites et virtuelles. . . . . . . . . . . . . . . . . . . . . . 56
4.17 Réponses impulsionnelles pour la WFS lors de la reproduction du front d’onde
de la figure 4.14 (p. 54). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.18 Comparaison des réponses impulsionnelles (dans la plage de fréquences de 0 à
940 Hz) reproduites et virtuelles. . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.19 Comparaison des réponses en fréquence sans (en haut) et avec fenêtre (en bas)
d’atténuation des effets de bord . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.20 Amplitudes des sources de reproduction et amplitude de la pondération spatiale. 61
4.21 Configuration d’un système de WFS avec une ligne de référence linéaire. . . . 62
4.22 Configuration d’un système de WFS avec une ligne de référence circulaire. . . 62
4.23 Photographie principale du système de WFS installé à l’Université McGill. . . 64
4.24 Configuration dans le plan horizontal des haut-parleurs et des microphones uti-
lisés pour la mesure objective de la reproduction de champs acoustiques par
WFS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.25 Configuration des sources virtuelles étudiées dans le plan horizontal. . . . . . . 65
4.26 Estimations des fonctions de cohérence pour différents nombres de moyennes. . 65
4.27 FRF mesurées et simulées pour la position virtuelle (a). . . . . . . . . . . . . . 69
4.28 FRF mesurées et simulées pour la position virtuelle (b). . . . . . . . . . . . . . 69
4.29 FRF mesurées et simulées pour la position virtuelle (c). . . . . . . . . . . . . . 71
4.30 FRF mesurées et simulées pour la position virtuelle (a) avec une part des rideaux
acoustiques en moins. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.31 RI mesurées et simulées pour la position virtuelle (a). . . . . . . . . . . . . . . 73
4.32 RI mesurées et simulées pour la position virtuelle (b). . . . . . . . . . . . . . . 73
4.33 RI mesurées et simulées pour la position virtuelle (c). . . . . . . . . . . . . . . 74
4.34 RI mesurées pour la position virtuelle (a) avec une part des rideaux acoustiques
en moins. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.35 Réponses impulsionnelles mesurées pour la WFS en fonction du temps et de
l’espace. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.36 Zoom sur les réponses impulsionnelles mesurées pour la WFS en fonction du
temps et de l’espace. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.1 Signs and symbols convention for the rectangular room. . . . . . . . . . . . . . 86
5.2 First investigated configuration in free field. . . . . . . . . . . . . . . . . . . . 86
5.3 E
LS
and [q
opt
[ variation as a function of γ for the free-field case of Fig. 5.2 (p. 86). 91
5.4 Relation between [q
opt
[ and E
LS
. . . . . . . . . . . . . . . . . . . . . . . . . . 91
xiii
5.5 Variation of E
LS
and [q
opt
[ =
_
q
H
opt
q
opt
. . . . . . . . . . . . . . . . . . . . . . 93
5.6 On left, real part of the target wave field (plane wave) and, on right, the repro-
duced wave field at 220 Hz in free field. . . . . . . . . . . . . . . . . . . . . . 93
5.7 Variation of E
LS
(a) and [q
opt
[ (b) with frequency and angle θ, for plane wave
reproduction in free field. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
5.8 Variation of E
LS
with frequency and angle θ, for plane wave reproduction in
free field. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
5.9 Variation of E
LS
and [q
opt
[ for spherical wave reproduction in free field, see
configuration on Fig. 5.2 (p. 86). . . . . . . . . . . . . . . . . . . . . . . . . . 96
5.10 (a) Real part of the target wave field at 220 Hz in free field. (b) Real part of the
reproduced wave field at 220 Hz in free field using optimal control and using
WFS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
5.11 Acoustical power output for : (a) optimal control and (b) WFS while reprodu-
cing a spherical wave at 220 Hz in free field, see Fig. 5.9 (p. 96) and 5.10 (p.
97). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
5.12 Second investigated configuration : a room of 139 m
3
with a reverberation time
of 0.28 s. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
5.13 Variation of E
LS
and [q
opt
[ for spherical wave reproduction in room. . . . . . . 98
5.14 Real and imaginary part of : (a) the target wave field at 220 Hz in room (T
60

0.28 s), (b) the corresponding reproduced wave field using optimal control, (c)
the reproduced wave field in room using WFS, and (d) the reproduced wave
field using optimal control in room for a larger sensor array. . . . . . . . . . . . 99
5.15 Acoustical power output for : (a) optimal control and (b) WFS while reprodu-
cing a spherical wave at 220 Hz, in room (T
60
≈ 0.28 s). . . . . . . . . . . . . . 100
5.16 Acoustical power output for : (a) optimal control and (b) WFS while reprodu-
cing a spherical wave at 70.5 Hz, in room (T
60
≈ 0.28 s). (c) Acoustical power
output for optimal control while reproducing a spherical wave at 220 Hz, in
room with a lower admittance (T
60
≈ 2.8 s). . . . . . . . . . . . . . . . . . . . 100
5.17 (a) A linear sensor array in free field superposed to the real part of the target
wave field at 220 Hz. (b) Real part of the corresponding reproduced wave fields
in free field with optimal control and WFS. . . . . . . . . . . . . . . . . . . . 103
5.18 Acoustical power output while reproducing a spherical wave at 220 Hz, in free
field with (a) optimal control and (b) WFS. . . . . . . . . . . . . . . . . . . . 103
5.19 Condition number of [Z
(m)H
Z
(m)
+ γI] (see configurations in Figs. 5.2 (p. 86),
5.14(d) and 5.12 (p. 98)). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
5.20 Condition number of Z
(m)
for various configurations. . . . . . . . . . . . . . . 106
xiv
5.21 E
LS
values for the various cases presented in Fig. 5.20 (p. 106) while reprodu-
cing a spherical wave originating from x
o
= [−2, −2, 1.2]
T
expressed in meters. 109
5.22 [q
opt
[ values for the various cases presented in Fig. 5.20 (p. 106). . . . . . . . . 109
6.1 Configuration pour le cas (a). . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
6.2 E
LS
et [q
opt
[ par WFS pour le cas (a) . . . . . . . . . . . . . . . . . . . . . . . 117
6.3 Pression acoustique réelle reproduite pour le cas (a) par WFS à 220 Hz. . . . . 117
6.4 Pression acoustique imaginaire reproduite pour le cas (a) par WFS à 220 Hz. . . 117
6.5 Puissance acoustique acoustique de sortie pour le cas (a) par WFS à 220 Hz. . . 118
6.6 E
LS
et [q
opt
[ par minimisation régularisée de l’erreur pour le cas (a) . . . . . . 118
6.7 Pression acoustique réelle reproduite pour le cas (a) par minimisation régulari-
sée de l’erreur à 220 Hz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
6.8 Pression acoustique imaginaire reproduite pour le cas (a) par minimisation ré-
gularisée de l’erreur à 220 Hz. . . . . . . . . . . . . . . . . . . . . . . . . . . 119
6.9 Puissance acoustique de sortie pour le cas (a) par minimisation régularisée de
l’erreur à 220 Hz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
6.10 E
LS
et [q
opt
[ avec l’AWFS pour le cas (a) . . . . . . . . . . . . . . . . . . . . 120
6.11 Pression acoustique réelle reproduite pour le cas (a) par AWFS à 220 Hz. . . . . 120
6.12 Pression acoustique imaginaire reproduite pour le cas (a) par AWFS à 220 Hz. . 120
6.13 Puissance acoustique de sortie pour le cas (a) par AWFS à 220 Hz. . . . . . . . 121
6.14 E
LS
et [q
opt
[ pour la minimisation régularisée de l’erreur pour le cas (b) . . . . 121
6.15 Pression acoustique réelle reproduite pour le cas (b) par minimisation régulari-
sée de l’erreur à 220 Hz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
6.16 Pression acoustique imaginaire reproduite pour le cas (b) par minimisation ré-
gularisée à 220 Hz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
6.17 E
LS
et [q
opt
[ pour l’AWFS le cas (b) . . . . . . . . . . . . . . . . . . . . . . . 122
6.18 Pression acoustique réelle reproduite pour le cas (b) par AWFS à 220 Hz. . . . 123
6.19 Pression acoustique imaginaire reproduite pour le cas (b) par par minimisation
régularisée de l’erreur à 220 Hz. . . . . . . . . . . . . . . . . . . . . . . . . . 123
6.20 Pression acoustique réelle reproduite pour le cas (c) par minimisation régulari-
sée de l’erreur à 220 Hz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
6.21 Pression acoustique imaginaire reproduite pour le cas (c) par minimisation ré-
gularisée de l’erreur à 220 Hz. . . . . . . . . . . . . . . . . . . . . . . . . . . 124
6.22 Pression acoustique réelle reproduite pour le cas (c) par minimisation régulari-
sée de l’erreur à 600 Hz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
xv
6.23 Pression acoustique imaginaire reproduite pour le cas (c) par minimisation ré-
gularisée de l’erreur à 600 Hz. . . . . . . . . . . . . . . . . . . . . . . . . . . 125
6.24 E
LS
et [q
opt
[ pour l’AWFS pour le cas (c) . . . . . . . . . . . . . . . . . . . . 125
6.25 E
LS
et [q
opt
[ pour la minimisation régularisée de l’erreur pour le cas (d) . . . . 126
6.26 E
LS
et [q
opt
[ pour l’AWFS pour le cas (d) . . . . . . . . . . . . . . . . . . . . 126
6.27 Pression acoustique réelle reproduite pour le cas (d) par contrôle. . . . . . . . . 127
6.28 Pression acoustique imaginaire reproduite pour le cas (d) par minimisation ré-
gularisée de l’erreur à 600 Hz. . . . . . . . . . . . . . . . . . . . . . . . . . . 127
6.29 Pression acoustique réelle reproduite pour le cas (d) par AWFS à 220 Hz. . . . 127
6.30 Pression acoustique imaginaire reproduite pour le cas (d) par AWFS à 220 Hz. . 127
6.31 E
LS
aux capteurs de l’erreur pour les quatre cas. . . . . . . . . . . . . . . . . . 129
6.32 E
LS
aux moniteurs de l’erreur pour les quatre cas. . . . . . . . . . . . . . . . . 129
6.33 E
LS
aux capteurs de l’erreur pour le cas (b) avec un variation de la distance
entre les capteurs selon les deux axes. . . . . . . . . . . . . . . . . . . . . . . 130
6.34 E
LS
aux moniteurs de l’erreur pour le cas (b) avec un variation de la distance
entre les capteurs selon les deux axes. . . . . . . . . . . . . . . . . . . . . . . 130
6.35 Pression acoustique réelle reproduite pour le cas (b) par AWFS avec une confi-
guration de sources en «U» à 220 Hz. . . . . . . . . . . . . . . . . . . . . . . 132
6.36 Pression acoustique imaginaire reproduite pour le cas (b) par AWFS avec une
configuration de sources en «U» à 220 Hz. . . . . . . . . . . . . . . . . . . . . 132
6.37 E
LS
aux capteurs de l’erreur par WFS, AWFS et minimisation régularisée de
l’erreur pour le cas (b) avec des configurations de sources circulaires et en «U». 132
6.38 E
LS
et [q
opt
[ par AWFS pour le cas (b) avec une configuration de sources en «U». 132
6.39 E
LS
par WFS pour le cas (b) avec une configuration de sources circulaire avec
une surface rigide formée par le plan x
1
−x
3
. . . . . . . . . . . . . . . . . . . 135
6.40 E
LS
par minimisation régularisée de l’erreur pour le cas (b) avec une configu-
ration de sources circulaire avec une surface rigide formée par le plan x
1
−x
3
. . 135
6.41 E
LS
par AWFS pour le cas (b) avec une configuration de sources circulaire et
avec une surface rigide formée par le plan x
1
−x
3
. . . . . . . . . . . . . . . . 135
6.42 Pression acoustique reproduite à 220 Hz par WFS pour le cas (b) avec une confi-
guration de sources circulaire et avec une surface rigide formée par le plan x
1
−x
3
.136
6.43 Pression acoustique reproduite à 220 Hz par AWFS pour le cas (b) avec une
configuration de sources circulaire et avec une surface rigide formée par le plan
x
1
−x
3
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
6.44 RI des sources pour la reproduction avec une surface rigide formée par le plan
x
1
−x
3
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
xvi
6.45 E
LS
par WFS pour le cas (b) avec une configuration de sources circulaire avec
une surface rigide formée par un plan horizontal à deux mètres au-dessus de
x
1
−x
2
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
6.46 E
LS
par AWFS pour le cas (b) avec une configuration de sources circulaire avec
une surface rigide formée par un plan horizontal à deux mètres au-dessus de
x
1
−x
2
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
7.1 Symbol convention for the WFS operators definition. . . . . . . . . . . . . . . 144
7.2 System configuration in free field and real part of the target wave field at 220 Hz. 148
7.3 E
LS
at the error sensors for various approaches (WFS and AWFS) and error
sensor configurations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
7.4 E
LS
at the monitoring sensors. . . . . . . . . . . . . . . . . . . . . . . . . . . 150
7.5 Reproduced sound field at 220 Hz in free field by WFS. . . . . . . . . . . . . . 151
7.6 Reproduced sound field at 220 Hz in free field by AWFS with λ = 50. . . . . . 151
7.7 Reproduced sound field in free field at 220 Hz by reproduction error minimiza-
tion with λ = 50 and q
WFS
=

0. . . . . . . . . . . . . . . . . . . . . . . . . . 153
7.8 E
LS
at the error sensors (thick line) and at the monitoring sensors (thin line) and
[q
(opt)
[ =
_
q
(opt)
H
q
(opt)
(dashed line) at 220 Hz as a function of the regulariza-
tion parameter λ. E
LS
values for λ = σ
2
i
are shown as circles. . . . . . . . . . . 153
7.9 Source modes v
i
at 220 Hz on the left-hand side and corresponding pressure
modes u
i
on the right-hand side right. . . . . . . . . . . . . . . . . . . . . . . 157
7.10 The null space source modes v
i
at 220 Hz. . . . . . . . . . . . . . . . . . . . . 157
7.11 Sound field radiated by the first six source modes. Source modes (a)-(d) generate
the range of the transfer impedance matrix. . . . . . . . . . . . . . . . . . . . 159
7.12 Multipole representations of the first M = 4 pressure modes and corresponding
free field directivity. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
7.13 Complex source strengths for (a) WFS and (b) AWFS. . . . . . . . . . . . . . 161
7.14 Complex source strengths for optimal control (a) q
(opt)
with λ = 1 10
−4
and
q
WFS
=

0, (b) q
(opt)
with λ = 1 10
−4
and q
WFS
,= 0). . . . . . . . . . . . . 161
7.15 Reproduction source amplitudes for plane wave reproduction with first order
“Ambisonics” and truncated modified AWFS. . . . . . . . . . . . . . . . . . . 164
7.16 First four source modes and singular values. (a) with a rigid plane in x
2
− x
3
.
(b) in a room of 6.05 5.2 2m with a reverberation time of approximately
0.28 s. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
7.17 Multipole representations of the first M = 4 pressure modes and corresponding
free field directivity for the source modes in Fig. 7.16 (a). . . . . . . . . . . . . 166
xvii
7.18 Multipole representations of the first M = 4 pressure modes and corresponding
free field directivity for the source modes in Fig. 7.16 (b). . . . . . . . . . . . . 166
7.19 Block diagram of a possible AWFS least-mean-square adaptive digital proces-
sing implementation using FXLMS multichannel algorithm. . . . . . . . . . . 167
7.20 Block diagram of a possible AWFS least-mean-square adaptive digital proces-
sing implementation based on independent radiation mode control. . . . . . . . 167
8.1 Generalized cross-talk system using adaptive filtering. . . . . . . . . . . . . . . 178
8.2 Generalized sound field reproduction using adaptive filtering. . . . . . . . . . . 178
8.3 Symbol convention for the WFS operators definition. . . . . . . . . . . . . . . 181
8.4 Block diagram of the AWFS least-mean-square adaptive digital processing im-
plementation based on independent radiation mode control. . . . . . . . . . . . 187
8.5 Plant decoupling with first and second synthesis filter matrices, and with analy-
sis filter matrix. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
8.6 Configuration of the reproduction source, error sensor and monitor sensor arrays. 192
8.7 Free-field theoretical synthesis filters in the time domain for the source modes 1
to 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
8.8 Free-field theoretical analysis filters in the time domain for the pressure modes
1 to 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
8.9 Impulse responses of individual components of the 44 matrix
(a)
G(e

)G(e

)
(s)
G

(e

)
using the synthesis and analysis filters shown in Figs. 8.7 and 8.8. . . . . . . . 194
8.10 Figure 8.9 (p. 194) continued. . . . . . . . . . . . . . . . . . . . . . . . . . . 194
8.11 Learning curves for the error sensors and for the monitor sensors using FXLMS
and independent radiation mode control algorithms in free field. . . . . . . . . 201
8.12 Examples of the L resulting control filters for AWFS by FXLMS and by inde-
pendent radiation mode control in free field. . . . . . . . . . . . . . . . . . . . 201
8.13 Circular reproduction source array in three dimensional semi-infinite space. . . 203
8.14 Left : Spectrum of the singular values (σ
i
, i = 1...4) for the system with a rigid
floor (at x
3
= 0 [m]) and two hard walls (at x
2
= −2 [m] and x
3
= −6 [m]).
Right : FRF gain from source #1 to sensor #1. . . . . . . . . . . . . . . . . . . 203
8.15 Synthesis filters in the time domain for the source modes 1 to 4 for the system
with a rigid floor and two hard walls. . . . . . . . . . . . . . . . . . . . . . . . 204
8.16 Analysis filters in the time domain for the pressure modes 1 to 4 for the system
with a rigid floor and two hard walls. . . . . . . . . . . . . . . . . . . . . . . . 204
xviii
8.17 Learning curves for the error sensors and for the monitor sensors using FXLMS
and independent radiation mode control algorithms with the system with a rigid
floor and two hard walls. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
8.18 Reproduced and virtual impulse responses at the monitor sensor array for WFS
with the system with a rigid floor and two hard walls. . . . . . . . . . . . . . . 205
8.19 Reproduced and virtual impulse responses at the monitor sensor array for AWFS
by FXLMS with the system with a rigid floor and two hard walls. . . . . . . . . 206
8.20 Reproduced and virtual impulse responses at the monitor sensor array for AWFS
based on independent radiation mode control with the system with a rigid floor
and two hard walls. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
8.21 Reproduced sound field at different times by WFS for the system with a rigid
floor and two hard walls. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207
8.22 Reproduced sound field at different times by AWFS based on modified FXLMS
for the system with a rigid floor and two hard walls. . . . . . . . . . . . . . . . 207
8.23 Reproduced sound field at different times by AWFS based on independent ra-
diation mode control for the system with a rigid floor and two hard walls. . . . 208
9.1 Symbol convention for the WFS operators definition. . . . . . . . . . . . . . . 218
9.2 Block diagram of the AWFS least-mean-square adaptive digital processing im-
plementation based on independent radiation mode control. . . . . . . . . . . . 221
9.3 Block diagram of the AWFS least-mean-square adaptive digital processing im-
plementation based on the modification of the FXLMS algorithm for AWFS. . . 222
9.4 Schematic AWFS setup made of 24 reproduction sources, 4 reproduction error
sensors and 8 monitoring sensors. . . . . . . . . . . . . . . . . . . . . . . . . 224
9.5 Schematic representation of the AWFS instrumentations, (a) : broadband, (b) :
harmonic. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
9.6 Experimental AWFS setup in the hemi-anechoic chamber. . . . . . . . . . . . 226
9.7 Typical identified FRFs (from a reproduction source to an error microphone) in
the hemi-anechoic chamber, standard laboratory space and reverberant chamber. 226
9.8 First synthesis filters
(s)
G

(z) in the time domain for the source modes #1 to
#4 in the hemi-anechoic chamber. . . . . . . . . . . . . . . . . . . . . . . . . 229
9.9 Analysis filters
(a)
G

(z) in the time domain for the pressure modes #1 to #4 in
the hemi-anechoic chamber. . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
9.10 Reproduced and virtual impulse responses at the monitoring sensor array (shown
in Fig. 9.4) for WFS with the system in the hemi-anechoic chamber. . . . . . . 230
xix
9.11 Learning curves for the error sensors using FXLMS and independent radiation
mode control algorithms with the system in the hemi-anechoic chamber. . . . . 230
9.12 Reproduced and virtual impulse responses at the monitoring sensor array for
AWFS ((a) : FXLMS algorithm with λ = 20, (b) : independent radiation mode
control) with the system in the hemi-anechoic chamber. . . . . . . . . . . . . . 231
9.13 Normalized energies of the error signals at each monitoring microphone for four
virtual source positions in the hemi-anechoic chamber. . . . . . . . . . . . . . 231
9.14 First four measured source modes at 220Hz in the the hemi-anechoic chamber. 234
9.15 Measured pressure modes at 220Hz in the hemi-anechoic chamber. . . . . . . 234
9.16 Normalized E
LS
criterion at the monitoring sensors for various frequencies
and harmonic reproduction algorithms after convergence in the hemi-anechoic
chamber. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236
9.17 Experimental AWFS setup in the laboratory space. . . . . . . . . . . . . . . . 236
9.18 First synthesis filters
(s)
G

(z) in the time domain for the source modes #1 to
#4 in the laboratory space. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
9.19 Analysis filters
(a)
G(z) in the time domain for the pressure modes #1 to #4 in
the laboratory space. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
9.20 Reproduced and virtual impulse responses at the monitoring sensor array for
WFS with the system in the laboratory space. . . . . . . . . . . . . . . . . . . 239
9.21 Reproduced and virtual impulse responses at the monitoring sensor array for
WFS with the system in the reverberant chamber. . . . . . . . . . . . . . . . . 239
9.22 Reproduced and virtual impulse responses at the monitoring sensor array for
AWFS in the laboratory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240
9.23 Reproduced and virtual impulse responses at the monitoring sensor array for
AWFS in the reverberant chamber. . . . . . . . . . . . . . . . . . . . . . . . . 240
9.24 Normalized energies of the error signals at each monitoring microphone for four
virtual source positions in the laboratory space. . . . . . . . . . . . . . . . . . 241
9.25 Normalized energies of the error signals at each monitoring microphone for four
virtual source positions in the reverberant chamber. . . . . . . . . . . . . . . . 241
9.26 Measured pressure modes at 220Hz in the laboratory. . . . . . . . . . . . . . . 243
9.27 Normalized E
LS
criterion at the monitoring sensors for various frequencies and
harmonic algorithms after convergence in the laboratory. . . . . . . . . . . . . 243
9.28 Normalized energies of the error signals at each monitoring microphone for
different AWFS realizations. . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
9.29 Normalized E
LS
criterion at the monitoring sensors for harmonic algorithms at
400Hz after convergence in the laboratory space using AWFS. . . . . . . . . . 245
xx
9.30 Normalized energies of the error signals for the modified FXLMS in the rever-
berant chamber. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
10.31Modèle dynamique du couplage entre recherche, développement technologique
et innovation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
A.1 Facteur de filtrage f
i
générique en fonction de a
i
= λ
i

2
i
. . . . . . . . . . . . 313
A.2 Motifs de directivité attribuables aux cinq premiers harmoniques cylindriques
de l’ambisonie en deux dimensions. . . . . . . . . . . . . . . . . . . . . . . . 319
A.3 Partie réelle et partie imaginaire d’une onde progressive plane représentée par
une série de Fourier-Bessel limitée à N = 4. . . . . . . . . . . . . . . . . . . . 319
A.4 Partie réelle et partie imaginaire d’une onde progressive plane représentée par
une série de Fourier-Bessel limitée à N = 8. . . . . . . . . . . . . . . . . . . . 320
A.5 Partie réelle et partie imaginaire d’une onde progressive plane. . . . . . . . . . 320
A.6 Gains panoramiques, champ acoustique à reproduire et champ reproduit pour
un système ambisonique du premier ordre avec 12 sources de reproduction. . . 322
A.7 Gains panoramiques, champ acoustique à reproduire et champ reproduit pour
un système ambisonique du second ordre avec 12 sources de reproduction. . . . 323
A.8 Gains panoramiques, champ acoustique à reproduire et champ reproduit pour
un système ambisonique du troisième ordre avec 12 sources de reproduction. . 324
A.9 Notation utilisée pour l’équation (A.100). . . . . . . . . . . . . . . . . . . . . 328
A.10 Notation utilisée pour l’obtention des intégrales de Rayleigh. . . . . . . . . . . 328
A.11 Notation précisée pour l’obtention des opérateurs de synthèse de la WFS. . . . 332
A.12 Simulation de la reproduction par WFS en champ libre (selon le développement
de la section A.5). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337
A.13 Notation précisée pour l’obtention des opérateurs de synthèse de la WFS dans le
cas d’une image à reproduire qui inclut une source virtuelle à l’avant des sources
de reproduction. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339
A.14 Notation précisée pour l’obtention des opérateurs de synthèse de la WFS dans
le cas d’une ligne de sources (monopôles ou dipôles quelconques). . . . . . . . 339
A.15 Simulation de la reproduction par WFS en champ libre avec l’utilisation de di-
pôles comme sources de reproduction. . . . . . . . . . . . . . . . . . . . . . . 340
A.16 Simulation de la reproduction par WFS en champ libre avec l’utilisation de mo-
nopôles pour la création d’une source virtuelle devant les sources de reproduction.340
A.17 Simulation de la reproduction par WFS en champ libre avec l’utilisation de mo-
nopôles (distribués sur une ligne quelconque) comme sources de reproduction. . 341
xxi
A.18 Simulation de la reproduction par WFS en champ libre avec l’utilisation de di-
pôles (distribués sur une ligne quelconque) comme sources de reproduction. . . 341
A.19 Simulation de la reproduction par WFS en champ libre avec l’utilisation de mo-
nopôles (distribués sur une ligne) comme sources de reproduction d’ondes planes.344
A.20 Simulation de la reproduction par WFS en champ libre avec l’utilisation de
dipôles (distribués sur une ligne quelconque) comme sources de reproduction
d’ondes planes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344
A.21 Notation modifiée pour l’obtention de la solution ambisonique à partir de la
formulation de Kirchhoff-Helmholtz à l’origine de la WFS. . . . . . . . . . . . 345
A.22 Réponses à l’impulsion par transformées de Fourier rapides inverses pour diffé-
rents retards temporels. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 349
A.23 Réponses à l’impulsion pour différents retards temporels (128, 128.25, 125.5,
128.66, 128.9 et 129 échantillons). . . . . . . . . . . . . . . . . . . . . . . . . 351
A.24 RI d’un opérateur de synthèse typique selon quatre approches possibles. . . . . 353
A.25 FRF d’un opérateur de synthèse typique selon quatre approches possibles. . . . 353
A.26 RI reproduites par la WFS selon les quatre approches possibles de la figure A.24
(p. 353). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354
B.1 Charte graphique des contraintes imposées sur la géométrie d’une salle d’écoute. 366
B.2 Charte graphique des contraintes imposées sur la géométrie d’une salle d’écoute,
un autre exemple. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 366
B.3 Erreur résiduelle moyenne pour l’AWFS en champ libre alors qu’un seul mode
de rayonnement est inclus dans la solution. . . . . . . . . . . . . . . . . . . . . 367
B.4 Erreur résiduelle moyenne pour l’AWFS en champ libre alors que les deux pre-
miers modes de rayonnement sont inclus dans la solution. . . . . . . . . . . . . 367
B.5 Erreur résiduelle moyenne pour l’AWFS en champ libre alors que les trois pre-
miers modes de rayonnement sont inclus dans la solution. . . . . . . . . . . . . 368
B.6 Erreur résiduelle moyenne pour l’AWFS en champ libre alors que les quatre
premiers modes de rayonnement sont inclus dans la solution. . . . . . . . . . . 368
B.7 Erreur résiduelle moyenne pour l’AWFS en présence de deux plans rigides alors
qu’un seul mode de rayonnement est inclus dans la solution. . . . . . . . . . . 369
B.8 Erreur résiduelle moyenne pour l’AWFS en présence de deux plans rigides alors
que les deux premiers modes de rayonnement sont inclus dans la solution. . . . 369
B.9 Erreur résiduelle moyenne pour l’AWFS en présence de deux plans rigides alors
que les trois premiers modes de rayonnement sont inclus dans la solution. . . . 370
xxii
B.10 Erreur résiduelle moyenne pour l’AWFS en présence de deux plans rigides alors
que les quatre premiers modes de rayonnement sont inclus dans la solution. . . 370
B.11 Erreur résiduelle moyenne pour l’AWFS à 400 Hz en champ libre alors qu’un
seul mode de rayonnement est inclus dans la solution. . . . . . . . . . . . . . . 371
B.12 Erreur résiduelle moyenne pour l’AWFS à 400 Hz en champ libre alors que les
deux premiers modes de rayonnement sont inclus dans la solution. . . . . . . . 371
B.13 Erreur résiduelle moyenne pour l’AWFS à 400 Hz en champ libre alors que les
trois premiers modes de rayonnement sont inclus dans la solution. . . . . . . . 372
B.14 Erreur résiduelle moyenne pour l’AWFS à 400 Hz en champ libre alors que les
quatre premiers modes de rayonnement sont inclus dans la solution. . . . . . . 372
B.15 Champ acoustique reproduit par AWFS basée sur le FXLMS. . . . . . . . . . . 373
B.16 Champ acoustique reproduit par AWFS basée sur le contrôle indépendant des
modes de rayonnement. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373
B.17 Courbes d’apprentissage pour les champs reproduits présentés aux figures B.15
(p. 373) et B.16 (p. 373). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373
C.1 Géométrie du lieu où les mesures objectives de la WFS ont pris place. . . . . . 375
C.2 Les haut-parleurs à deux voies utilisés pour la WFS. . . . . . . . . . . . . . . . 375
C.3 Le système informatique derrière la WFS. . . . . . . . . . . . . . . . . . . . . 377
C.4 L’antenne de micophones utilisée pour les mesures de champs acoustiques. . . 378
C.5 Un microphone de l’antenne de capteurs. . . . . . . . . . . . . . . . . . . . . . 378
C.6 L’antenne de micophones est positionnée par rapport au centre du réseau de
sources par le biais de marques au sol. . . . . . . . . . . . . . . . . . . . . . . 378
C.7 Enregistreur DAT et oscilloscope dans l’entrée isolée de la pièce (voir la figure
C.1 (p. 375)). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 379
C.8 Représentation schématique de la chaîne d’acquisition utilisée pour les mesures
de champs acoustiques reproduits par WFS. . . . . . . . . . . . . . . . . . . . 379
C.9 Convergence de l’erreur résiduelle de l’identification de réponses impulsion-
nelles par filtrage adaptatif pour l’identification d’un microphone. . . . . . . . 382
C.10 Validation de l’identification des microphones. . . . . . . . . . . . . . . . . . . 383
C.11 Erreurs de validation de la figure C.10 (p. 383). . . . . . . . . . . . . . . . . . 383
C.12 Fonctions de réponse en fréquence des microphones. . . . . . . . . . . . . . . 384
C.13 Réponses impulsionnelles des huit microphones de mesure. . . . . . . . . . . . 385
C.14 Réponses impulsionnelles corrigées des huit microphones de mesure. . . . . . 385
C.15 Fonctions de réponse en fréquence corrigées des microphones. . . . . . . . . . 386
C.16 Gains [dBref1] des FRF de correction des réponses des microphones. . . . . . 387
xxiii
C.17 Phase [rad] des FRF de correction des réponses des microphones. . . . . . . . 387
C.18 Photographie du système de WFS approximatif. . . . . . . . . . . . . . . . . . 388
C.19 Détails du réseau de sources du système de WFS approximatif. . . . . . . . . . 389
C.20 Vue en plongée d’une représentation schématique de l’antenne circulaire de
haut-parleurs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392
C.21 Vues générales et détaillées du montage expérimental d’AWFS en salle semi-
anéchoïque. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393
C.22 Vue de l’arrière d’un haut-parleur. . . . . . . . . . . . . . . . . . . . . . . . . 394
C.23 Vue rapprochée des microphones de l’erreur pour le système d’AWFS. . . . . . 394
C.24 Configuration expérimentale du système d’AWFS à large bande . . . . . . . . 395
C.25 Configuration expérimentale du système d’AWFS pour des tons purs . . . . . . 395
C.26 Impédance électrique du woofer des DX4 posé sur une table. . . . . . . . . . . 397
C.27 Impédance électrique du woofer des DX4 posé sur une table et impédance élec-
trique du woofer, du tweeter et du circuit d’aiguillage de fréquences dans un des
cabinets sans amplificateur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397
C.28 Impédance électrique du woofer des DX4 avec amortissement de l’évent. . . . 398
C.29 Fonctions de réponse en fréquences théoriques entre le débit volumique de la
membrane (q
m
) et le débit volumique de l’évent (q
e
). . . . . . . . . . . . . . . 398
C.30 Niveaux de puissance acoustique de l’évent et de la membrane pour une mem-
brane à débit volumique unitaire pour un cabinet DX4 sans amplificateur. . . . 399
C.31 Fonction de directivité en pression h(θ) (entre 0 et 1) pour un piston de 4 po de
diamètre. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401
C.32 Mesure de la décroissance spatiale en salle semi-anéchoïque . . . . . . . . . . 402
C.33 Mesure de la décroissance spatiale en salle réverbérante . . . . . . . . . . . . . 402
C.34 Courbe de décroissance spatiale moyenne mesurée et théorique dans la chambre
semi-anéchoïque pour quatre trajectoires différentes. . . . . . . . . . . . . . . 404
C.35 Réponse à l’impulsion moyenne en énergie [dB ref 1] en chambre semi-anéchoïque
et en laboratoire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 405
C.36 Fonctions de réponse en fréquence typiques pour la salle semi-anéchoïque. . . . 405
C.37 Courbe de décroissance spatiale moyenne mesurée et théorique dans l’espace
de laboratoire pour quatre trajectoires différentes. . . . . . . . . . . . . . . . . 407
C.38 Fonctions de réponse en fréquences typiques pour le laboratoire. . . . . . . . . 407
C.39 Réponses à l’impulsion au niveau de l’antenne de moniteurs dans le laboratoire. 408
C.40 Réponse à l’impulsion moyenne en énergie [dB ref 1] en laboratoire. . . . . . . 408
C.41 Vues générales et détaillées du montage expérimental d’AWFS au laboratoire
du GAUS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 409
xxiv
C.42 Courbe de décroissance spatiale moyenne mesurée dans la chambre réverbé-
rante pour quatre trajectoires différentes. . . . . . . . . . . . . . . . . . . . . . 410
C.43 Fonctions de réponse en fréquences typiques pour la chambre réverbérante. . . 411
C.44 Vues générales et détaillées du montage expérimental d’AWFS en salle réver-
bérante. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412
C.45 Filtres de compensation de phase pour l’AWFS harmonique. . . . . . . . . . . 415
C.46 E
LS
normalisé pour chaque moniteur et différents algorithmes d’AWFS harmo-
nique (220 Hz) avec une source virtuelle en x
o
= [0, 4, 0] m. . . . . . . . . . . 416
C.47 E
LS
normalisé pour chaque moniteur et différents algorithmes d’AWFS harmo-
nique (220 Hz) avec une source virtuelle en x
o
= [−4, 0, 0] m. . . . . . . . . . 416
C.48 E
LS
normalisé pour chaque moniteur et différents algorithmes d’AWFS harmo-
nique (220 Hz) avec une source virtuelle en x
o
= [−1.19, 0.91, 0] m. . . . . . . 417
C.49 E
LS
normalisé pour chaque moniteur et différents algorithmes d’AWFS harmo-
nique (400 Hz) avec une source virtuelle en x
o
= [0, 4, 0] m. . . . . . . . . . . 417
C.50 Champs acoustiques harmoniques reproduits par WFS en salle semi-anéchoïque. 418
C.51 Champs acoustiques harmoniques reproduits par AWFS en salle semi-anéchoïque.418
C.52 Champs acoustiques harmoniques reproduits par AWFS basée sur le contrôle
indépendant des modes de rayonnement en salle semi-anéchoïque. . . . . . . . 420
xxv
CHAPITRE 1
INTRODUCTION
D’un simple regard sur l’histoire humaine, il est possible de constater l’importance de la
représentation chez l’homme. Que celle-ci prenne une forme visuelle, textuelle, symbolique ou
auditive, qu’elle relève de la communication technique ou artistique, assurément construite de
différents langages, tournée vers une foule de sujets distincts ; la représentation jalonne l’histoire
humaine.
Ainsi, de la même façon que, par exemple, l’édification progressive des règles de la pers-
pective
1
correspond à un effort de représentation – de reproduction – d’une réalité visuelle
spatiale avec les instruments de l’époque [Damisch, 1987; Panofsky, 1975; de Vinci, 1987], il
est envisageable d’entreprendre, et de poursuivre, aujourd’hui – à l’aide des techniques et des
connaissances actuelles – la représentation, la reproduction de champs acoustiques afin de re-
produire par exemple une situation auditive (auralisation
2
de lieux ou de véhicules ; musique
ou trame sonore ; enregistrée ou synthétisée) dont les qualités spatiales sont reproduites sur une
zone étendue. La principale intention du projet de recherche introduit dans cette thèse s’inscrit
dans ces possibilités plus générales. On note, par contre, que l’aspect spatial de la reproduction
audio est évidemment un ouvrage considérable dont les fruits et les applications commerciales
ne verront le jour que par l’accumulation d’ouvrages tel celui qui est introduit en ces pages.
Dans ce contexte, l’ensemble de cette thèse est exclusivement dédié à la dimension physique de
la reproduction de champs acoustiques.
Les motivations de tels efforts de reproduction sont tout aussi multiples que les obstacles qui
1
On parle ici de perspective graphique, perspective que l’on pourrait définir comme suit : «la science qui ap-
prend à représenter les objets tridimensionnels sur une surface bidimensionnelle, de façon que l’image perspective
coïncide avec celle que fournit la vision directe»[Panofsky, 1975].
2
L’auralisation désigne tout processus technologique qui cherche à rendre audible un champ acoustique imagi-
naire, virtuel ou simulé. On utilise ce terme de la même façon que l’on parle de visualisation pour la vision [Kleiner
et al., 1993].
1
caractérisent la technicité de la tâche. Considérons quelques exemples historiques qui sauront,
d’un point de vue général, mettre en valeur les dites motivations.
Il semble en fait que la première démonstration publique d’une tentative de s’affranchir de
la reproduction monophonique
3
puisse être attribuée à Ader [Audio Engineering Society, 1981;
Malham et Myatt, 1995; Torick, 1998; Sterne, 2003; Davis, 2003; Rumsey, 2002] qui, en 1881,
lors de l’exposition d’électricité de Paris, disposa deux microphones de téléphone dans une salle
de concert et achemina les signaux vers des hôtels environnants l’exposition jusqu’à une paire
de récepteurs téléphoniques. Les gens étaient alors invités à placer un récepteur sur chacune
de leurs oreilles. Vraisemblablement, l’intérêt principal d’Ader – en cette démonstration – était
bel et bien la transmission d’une impression auditive spatiale [Rumsey, 2002]. Cette première
démonstration de Ader donne ensuite la vie à une série de diffusions téléphoniques connue sous
le nom du «Théâtrophon» [Sterne, 2003].
Depuis ce premier balbutiement technique, des prototypes expérimentaux, des techniques,
des écrits et des compositions musicales n’ont cessé d’influer et d’habiter les préoccupations
et les agissements des chercheurs concernés par cette dimension de la reproduction audio
4
.
3
La reproduction monophonique n’inclut qu’un seul capteur, une seule ligne de transmission (ou une seule
piste d’enregistrement) et une seule source acoustique au bout de la chaîne électroacoustique. La reproduction
monophonique ne rend pas, évidemment, le caractère intrinséquement spatial de l’audition naturelle [Bradley et
Souldore, 1995].
4
[Garas et Sommen, sans date; Evans et al., sans date; Steinke, 1996; Davis, 2003; Williams, 2003; Giomi
et al., 2003; Wilson, 2003; Glasgal, 2003; Zmolnig et al., 2003; de Vries et Boone, 2003; Melchor et al., 2003;
Theile et al., 2003; Plegsties et al., 2003; Strauss et al., 2003; Spors et al., 2003a; Zieli ´ nski et al., 2003; Jin et al.,
2003; Kutschbach, 2003; Soulodre et al., 2003; Neher et al., 2003; Barbour, 2003; Cabrera et Tilley, 2003; Usher et
Woszczyk, 2003; Ford et al., 2003; Berg et Rumsey, 2003; Noisternig et al., 2003; Chun et al., 2003; Ródenas et al.,
2003; Yang et al., 2003; van der Heide, 2002; Hiyama et al., 2002; Rumsey, 2002; Nelson, 2002; Austin, 2001;
Brix et al., 2001; Boone, 2001; Malham, 2001; Trochimczyk, 2001; Rumsey, 2001; Cheng et Wakefield, 2001;
Clozier, 2001; Sherburne, 2002; Lennox et al., 1999; Lokki et al., 1999; Kahana et al., 1999; Kirkeby et al., 1999;
Horbach et Boone, 1999; Nicol et Emerit, 1999; Norris, 1999; Dapelo et Macelloni, 1999; Varla et al., 1999; Farina
et Ugolotti, 1999; Garas, 1999; Honda et Hamada, 1999; Watanabe et al., 1999; de Vries et Boone, 1999; Kirkeby
et Nelson, 1999; Blauert, 1999; Hartmann et Wittenberg, 1999; Daniel et al., 1999; Gardner, 1998; Verheijen, 1998;
Kirkeby et al., 1998; Boone et Ouweltjes, 1997; Griesinger, 1997; Druyvesteyn et Garas, 1997; Nelson et al., 1997;
Uto et Hamada, 1995; Kendall, 1995a; Kirkeby et al., 1996; Roads, 1996; Nelson et al., 1996b,a; Kirkeby et al.,
1995; Berkhout et al., 1992, 1995; Griesinger, 1995; Orduña et al., 1995; Boone et al., 1995; Bradley et Souldore,
1995; Malham et Myatt, 1995; Nelson, 1994; Begault, 1994; Elliott et al., 1994; Schlegel, 1994; Berkhout et al.,
1993; Kleiner et al., 1993; Korenaga et Ando, 1993; Kirkeby et Nelson, 1993; Nielsen, 1993; Nelson et Elliot,
1992; Wightman, 1992; Wightman et Kistler, 1989a,b; Elliott et Nelson, 1989; Cooper et Bauck, 1989; Tohyama
et Suzuki, 1989; Berkhout, 1988; Romano, 1987; Ahnert, 1987; Veit et Sander, 1987; Meyer, 1984; Hartmann,
1983; Stern Jr. et Colburn, 1978; Nakanayashi, 1975; Gerzon, 1973; Camras, 1968; Crowhurst, 1957; Steinberg et
2
Quelques exemples de création en musique contemporaine, expérimentale ou électroacoustique
démontrent l’existence indéniable du même intérêt chez les créateurs. Pensons, par exemple,
aux concerts de haut-parleurs des compositeurs dits électroacousticiens qui utilisent dès les an-
nées soixante de la spatialisation tel un élément esthétique de composition et de dynamisme
[Clozier, 2001; Austin, 2001; Malham et Myatt, 1995]. Cet intérêt musical des années soixante
et soixante-dix n’a, en aucun temps, perdu son souffle. Encore aujourd’hui, des oeuvres récentes
exploitent, comme principal sujet, le caractère spatial de l’audition [Malham et Myatt, 1995].
Ainsi, Cardiff présenta des installations audio au Musée des Arts Contemporains de Montréal
en 2002
5
. Dans plusieurs des oeuvres de Cardiff, l’exploitation du caractère spatial de la repro-
duction auditive est explicitement identifiée comme préoccupation centrale dans ses réflexions
et ses productions artistiques
6
. Dans le même ordre d’idées, c’est lors d’un événement multi-
disciplinaire, Le Mois Multi (édition 2003) dans le complexe Méduse à Québec, qu’un artiste
Hollandais présente, A World Beyond The Loudspeaker [Méduse, Québec, 2003; van der Heide,
2002], une installation sonore qui récupère des notions introduites dans la littérature scienti-
fique par Steinberg et Snow [Steinberg et Snow, 1934; Snow, 1953; Rumsey, 2002] en 1934 et
– beaucoup plus tard, avec les technologies de la WFS («Wave Field Synthesis») plus récentes
et fortement liées à cette thèse – par Berkhout, à la fin des années 1980 et au début des années
1990 [Berkhout et al., 1992, 1993].
Les quelques exemples d’actions autonomes cités plus haut, hors de tous standards tech-
niques de spatialisation et s’étalant sur pratiquement un siècle, constituent un exemple récurrent,
et indépendant d’impératifs commerciaux, de la manifestation de l’intérêt de la reproduction du
caractère spatial de l’expérience auditive.
Snow, 1934; Snow, 1953; Begault, 1999; Savioja et al., 1999; Berkhout et al., 1984; Bregman, 1990; Theile, 1993;
Blumlein, 1933; Hulsebos et de Vries, 2002; Hulsebos et al., 2003; Hulsebos, 2004; de Vries, 1996; Spors et al.,
2005a; Betlehem et Abhayapala, 2005; Takeuchi et Nelson, 2002; Nelson et Rose, 2005; Asano et Swanson, 1995;
Ise, 1999; Santilla´ n, 2001; Kim et al., 2002; Epain et al., 2004; Choi et Kim, 2004a; Gerzon, 1985; Poletti, 2000,
2005; Bai et Elliott, 2004; Tokuno et al., 1997; Corteel et al., 2002; Woszczyk et al., 2005; Poulin, 1957; Schobben
et Aarts, 2005; Fuster et al., 2005; Nelson, 2001; Daniel, 2001; Start et al., 1999; Lopez et Gonzalez, 2001; Rose
et al., 2002; Pulkki et Merimaa, 2006; Merimaa et Pulkki, 2005; AES, 2003; Bouchard et Quednau, 2000; Scheirer,
1999; Camurri et Ferrentino, 1999; Berkhout et al., 1997; de Vries et al., 2002; Kuhn et al., 2003; Passella et al.,
2001; Bleda et al., 2005; López et al., 2005; Escolano et al., 2005; Pueo et al., 2005; Takane et al., 1999; Choi et
Kim, 2002; Bai et Lin, 2005; Bai et al., 2005; Puddie Rodgers, 1981; Riederer, 1998]
5
Dans le cadre de l’exposition Janet Cardiff : un bilan de l’oeuvre incluant des collaborations avec George
Bures Miller, du 25 mai au 8 septembre 2002, Musée des Arts Contemporains de Montréal.
6
L’artiste utilise même des techniques de reproduction plus ou moins récentes, comme le filtrage par des HRTFs
(«Head Related Transfer Function») et l’éparpillement de sources acoustiques (et de capteurs, pour l’enregistrement
initial).
3
En dehors d’un contexte exclusivement défini par des intérêts propres à un univers audio
ou musical, qu’il soit basé sur la fidélité de la reproduction ou sur l’innovation créative, on re-
marque évidemment l’importance plus générale de l’immersion multimédia auquelle peut faci-
lement souscrire cette recherche sur la reproduction physique de champs acoustiques. Par contre,
quoique la notion d’environnement virtuel soit trop souvent, voire malheureusement, attribuée
à une caractéristique très représentative, pratiquement exclusive ou complétement nouvelle, des
temps technologiques actuels, Grau [Grau, 2003]
7
, avec un ouvrage historique, fait le bilan du
rôle dominant de l’immersion dans diverses formes d’art ou de représentation à partir de l’An-
tiquité, démontrant ainsi une continuité remarquable des recherches scientifiques et artistiques
actuelles avec celles qui trouvent leurs fondements sur de plus anciennes pratiques de l’illusion.
Une continuité historique (qu’il fut tenté, plus tôt, de faire valoir par l’exemple de la perspective
graphique) trop peu visible et insuffisamment reconnue dans l’effervescence des activités de
recherche en réalité virtuelle.
Au-delà des exemples présentés (soit des exemples plus ou moins marginaux ou essentiel-
lement historiques) d’intérêts, d’actualités et de curiosités envers la reproduction du caractère
naturellement spatial de l’audition, les applications potentielles et pratiques de masse, de l’étude
ici introduite, répondent à des besoins et tendances de l’actualité. Ainsi la technique de repro-
duction de champs acoustiques présentée dans cette thèse s’approche des applications pratiques
suivantes [Malham et Myatt, 1995] :
1. système d’auralisation de lieux ou d’intérieurs de véhicules, d’environnements sonores ou
de champs acoustiques stationnaires [Kleiner et al., 1993]
2. système de reproduction pour salles de cinémas ou toutes autres salles pour lesquelles le
rendu audio comporte une importance[Rumsey, 2001; Kuttruff, 1999; Berkhout, 1988],
3. partie terminale d’une chaîne de transmission audio haute-fidélité en temps réel ou différé
(téléreproduction multimédia de concerts ou d’événements) [Boone, 2001; Rumsey, 2001;
Ahnert, 1987],
4. systèmes de communication et de navigation [Begault, 1994, 1999],
5. partie acoustique de systèmes de réalité virtuelle [Boone, 2001; Wilson, 2003; Lokki et al.,
1999; Begault, 1994, 1999; Savioja et al., 1999], de téléprésence, de jeux vidéos, d’ensei-
gnement à distance et de téléconférence, [Zieli ´ nski et al., 2003],
6. application potentielle pour des essais en psychoacoustique, psychoacoustique de la loca-
lisation spatiale [Blauert, 1999] ou en auralisation [Boone, 2001],
7
L’ouvrage de Grau [Grau, 2003] se consacre essentiellement à l’immersion visuelle. Son ouvrage peut, par
contre, être aisément transposé vers l’histoire et les actualités de la reproduction du son.
4
7. application potentielle pour des mesures expérimentales acoustiques [Bravo et Elliott,
2004],
8. intégration aux systèmes de vidéoconférence [Boone, 2001; Schaphorst, 1996; Evans
et al., sans date],
9. système de reproduction pour les systèmes de cinéma maison [Rumsey, 2001; Boone,
2001].
Comme il est possible de s’en convaincre par le biais de cette brève introduction, les re-
cherches sur la reproduction de champs acoustiques – soit une démarche spécifique dans le
contexte de la reproduction du caractère spatial de l’audition – sont justifiées et trouvent échos
autant dans les besoins de développement de l’industrie et du savoir en reproduction du son
que dans l’intérêt créatif musical. Ces quelques observations confirment nettement l’intérêt de
la présente recherche en relation avec l’état actuel de la situation. Le caractère novateur de la
recherche se présentera plus clairement dans les prochains chapitres dont la teneur s’apparente
plus à la technicité du projet.
On note aussi que, malgré la portée très générale de cette introduction, le problème et l’ob-
jectif principal considérés dans cette thèse sont avant tout physiques ; c’est la reproduction ob-
jective, et non pas subjective ou perceptible, de champs acoustiques qui est étudiée. Plus spé-
cialement, des bases d’hybridation entre des technologies existantes et connues, la «Wave Field
Synthesis», l’Ambisonie et les applications dérivées du contrôle actif du son, seront établies dans
cette thèse. On cherche donc à investiguer cette possibilité technologique précise. Les travaux
présentés dans cette thèse contribuent en fait à l’avancement du savoir technologique théorique
et pratique sur des bases actuelles issues de la pratique et du savoir théorique. C’est ainsi que des
théories mathématiques connues sont, par exemple, nouvellement appliquées, dans cette thèse,
au contrôle actif de la reproduction spatiale du son.
1.1 Structure de la thèse
Cette thèse est divisée en neuf chapitres. Au prochain chapitre, un certain nombre de notions
préliminaires sont introduites ; elles concernent la perception spatiale du son et les techniques
de reproduction spatiale de l’expérience du son. Au sein de ce même chapitre, l’état de l’art, en
terme de reproduction du caractère spatial de l’audition et, plus spécialement, de champs acous-
tiques, est présenté selon une progression chronologique générale puis – pour les recherches plus
récentes et révélatrices à la présente recherche – selon les types de solutions technologiques dé-
5
crites. Le troisième chapitre est consacré à la description des objectifs de la présente recherche
ainsi qu’à la formulation de la méthodologie utilisée. C’est du quatrième au neuvième chapitre
que les travaux de recherches sont explicitement présentés. La division de ces chapitres sera
exposée lors de la formulation de la méthodologie utilisée (chapitre 3). Finalement, la conclu-
sion comporte une discussion de l’ensemble des résultats de recherche et la formulation des
recommandations pour des travaux futurs sur le sujet dans la suite des exercices de recherche ici
rapportés. Les annexes présentent des informations supplémentaires. L’annexe A rassemble des
développements théoriques complémentaires aux développements principaux présentés dans le
texte principal. L’annexe B regroupe les données utilisées lors des simulations présentées dans
le corps de la thèse. En ce qui concerne les aspects expérimentaux de la recherche, c’est dans
l’annexe C que les données et les schémas complémentaires sont regroupés.
6
CHAPITRE 2
NOTIONS PRÉLIMINAIRES ET ÉTAT DE LA SITUATION
2.1 Introduction
Ce chapitre présente un aperçu de l’historique de la reproduction audio en relation avec les
intérêts et les développements de la reproduction du caractère spatial de l’audition. D’abord
générale et consacrée à l’aspect audio, cette revue de notions et de littérature donne, par la
suite, plus de poids aux techniques récentes de reproduction physique de champs acoustiques.
Avant de retracer les travaux majeurs reliés au rendu des qualités spatiales d’un enregistrement
ou d’une synthèse de champs acoustiques, il est néanmoins impératif de présenter rapidement
quelques concepts.
2.2 Notions préliminaires
Seuls certains aspects relatifs à la problématique de cette recherche sont ici introduits. C’est
ainsi que la description de la perception spatiale du sonore et la classification générique des
méthodes de reproduction du caractère spatial de l’audition seront sommairement introduites.
2.2.1 La perception spatiale du sonore
L’ensemble des mécanismes impliqués dans la perception auditive d’événements acous-
tiques
1
forme une chaîne de traitement particulièrement complexe dont l’expression du détail
1
La perception auditive d’événements acoustiques (dans le domaine physique) est aussi nommée événements
auditifs (dans un domaine perceptif) [Blauert, 1999].
7
va au-delà de la fonction du présent document. Quelques concepts doivent être néanmoins in-
troduits.
Pour se convaincre de la complexité de la sensation auditive, il suffit de retracer les phé-
nomènes acoustiques (rayonnement, propagation, réflexion, diffraction, etc.)
2
, physiologiques
(oreille humaine)
3
, et cognitifs
4
tous impliqués et influents dans cette chaîne de la perception
spatiale du sonore. Pour le chercheur qui souhaiterait améliorer la qualité de la reproduction spa-
tiale, l’ampleur considérable de ces phénomènes regroupés constitue une problématique com-
plexe et, conséquemment, favorise une approche spécialisée, voire une concentration, sur l’une
des mailles de la chaîne. Ainsi, considérant notre bagage technique, les travaux de recherche
sont dédiés à, et se concentrent sur, l’aspect acoustique et électroacoustique de la reproduction
audio. Le tout sera supporté par une mise en oeuvre grâce au traitement numérique de signal. Les
lieux de reproduction, la transduction et le traitement des signaux seront donc pris en compte
dans une démarche résolument tournée vers l’aspect physique de la reproduction de champs
acoustiques. Cette approche s’inscrit, par exemple, aisément dans une démarche plus générale
d’auralisation de champs acoustiques obtenus par simulations numériques.
La connaissance a priori de la complexité de cette chaîne demeure tout de même utile pour
expliquer certains phénomènes dont l’un est d’une importance notable et exemplaire. Ainsi, un
problème inhérent à la reproduction de champs acoustiques pour des applications audio est celui
de l’influence de la perception visuelle. Habituellement, le visuel prédomine sur l’auditif et in-
flue considérablement l’exercice auditif. Pour nous en convaincre, Griesinger
5
projette la vidéo
d’un concert et son enregistrement audio sur un système «Surround 5.1»
6
. En plus de l’orchestre,
2
[Elmore et Heald, 1969; Kinsler et al., 2000; Dickason, 2000; Jouhaneau, 2000; Brüel, 1951; Blauert, 1999;
Kuttruff, 1999; Morse, 1995; Bleinstein, 1984; Crocker, 1998; Bruneau, 1983; Borwick, 1988; Verschuur et al.,
1988; Berkhout et al., 1984; Meyer, 1984; Allison, 1976; Beranek, 1954]
3
[Puddie Rodgers, 1981; Blauert, 1999; Zwicker et Fastl, 1999; Nielsen, 1993; Denes et Pinson, 1963; Burkhard
et Sachs, 1975; Stern Jr. et Colburn, 1978; Hartmann, 1983; Raatgever et Bilsen, 1986; Tohyama et Suzuki, 1989;
Wightman et Kistler, 1989a; Moore, 1989; Wightman et Kistler, 1989b; Wightman, 1992; Schlegel, 1994; Bradley
et Souldore, 1995; Hartmann et Wittenberg, 1999; Blauert, 1999; Griesinger, 1997; Daniel et al., 1999; Rumsey,
2001, 2002; Chun et al., 2003]
4
[Denes et Pinson, 1963; Bregman, 1990; Zwicker et Fastl, 1999; Blauert, 1999]
5
Lors d’un atelier dans le cadre de Multichannel Audio : The New Reality (AES 24
th
International Conference,
2003)
6
La nomenclature audio est telle que x.y signifie x canaux avec y canaux supplémentaires pour les basses fré-
quences. Pour préciser la configuration, on parle parfois de système stéréophonique x−y. Dans ce cas, x correspond
au nombre de canaux «directs» alors que y réfère au nombre de canaux d’ambiance (des canaux «Surround»). Se-
lon cette nomenclature, le «Surround 5.1» (le format actuel utilisé dans les cinémas-maisons) peut être identifié
comme un système 3-2.1 [Theile, 1993] : trois sources à l’avant de l’audience se chargent de projeter le programme
8
des chanteurs sont en arrière-plan et légèrement surélevés. Alors que la caméra zoome vers les
chanteurs, l’auditeur ressent habituellement l’impression de se rapprocher auditivement : le vo-
lume sonore des chanteurs semble augmenter en comparaison avec le niveau de l’orchestre. Lors
du zoom, le système de prise de son ne bouge pourtant pas ; cette sensation de focus n’est donc
qu’une pure impression. Cet exemple simple formule une mise en garde envers l’usage abusif
de l’expression : «reproduction parfaite de l’impression auditive» qui pourrait découler d’une
approche physique.
On parlera donc, pour cette recherche, de reproduction de champs acoustiques selon des
critères physiques agrémentés de commentaires et remarques au sujet des correspondances dans
le domaine de la perception. Dans le même ordre d’idée, les études plus récentes – depuis
1982 – en psychoacoustique spatiale confirment la forte présence, et l’influence, de mécanismes
cognitifs dans le processus de localisation [Blauert, 1999; Kendall, 1995a]. Le détail de ces
notions dépasse le cadre du présent document, c’est la précédente mise en garde que l’on doit
garder en mémoire.
Parmi les mécanismes de localisation les plus importants, on trouve l’effet de précédence
qui est aisément relié au problème de reproduction de champs acoustiques dans des lieux réels.
En bref, l’effet de précédence est observable lors de la localisation d’un événement auditif
causé par plus d’une source acoustique alors que ces sources acoustiques rayonnent des signaux
cohérents
7
. Un exemple simple serait donc un système de son stéréophonique à deux canaux
qui diffuserait le son d’un instrument. Dans ce cas, l’effet de précédence intervient en fonction
des retards temporels, perçus par le système auditif, entre chacun des fronts d’onde cohérents.
Pour un délai nul, ou très faible (de 0 à 1 ms pour des sources séparées par 80 degrés), l’effet
de précédence n’intervient pas et c’est plutôt par localisation additive que l’attribution d’une
position perçue à la source est effectuée : l’événement auditif perçu sera localisé entre les deux
sources. La position angulaire perçue dépendra du retard temporel entre les arrivées des deux
fronts d’onde. Au-delà d’un certain retard temporel (1 ms environ pour une séparation de 80 de-
grés), la localisation additive est supplantée par l’effet de précédence. Ce dernier est caractérisé
par le fait que seule l’incidence du premier front d’onde influe la localisation. Les autres fronts,
cohérents avec le premier, mais décalés dans le temps n’interviennent pas dans la localisation
général, deux sources arrière se chargent de l’atmosphère et un dernier transducteur produit les basses fréquences
(habituellement sous 150Hz).
7
On suppose des conditions parfaites, alors qu’il n’y a pas d’informations contradictoires entre les diverses
modalités sensorielles.
9
auditive, ils ne contribuent qu’à l’augmentation du niveau sonore perçu. Au-delà du seuil de
l’écho (de 30 ms à 40 ms pour une séparation de 80 degrés), l’effet de précédence n’est plus
effectif et des évènements auditifs distincts sont perçus et localisés en des positions différentes.
L’effet de précédence explique donc la capacité de localisation en salle : les réflexions discrètes
n’interviennent pas dans le mécanisme de localisation d’une seule source en salle.
L’effet de précédence est très important dans le cadre de la discussion de l’ensemble des ré-
sultats de recherche qui suit puisque cet effet indique une certaine consigne pour la reproduction
de champs acoustiques potentiellement appliquée à l’audio. Ainsi, un système de reproduction
de champs acoustiques donné doit fonctionner, objectivement, tout autant en espace infini qu’en
salle. Plus simplement : le système doit reproduire le premier passage d’un front d’onde exac-
tement comme en champ direct. Pour cette raison, le système proposé doit recevoir des consi-
dérations en champ libre et en salle réelle. La compensation pourra par contre être appliquée
pour réduire l’effet de la salle. Cette exigence pratique issue de l’audio est explicitement prise
en compte dans la définition de la technologie présentée dans cette thèse.
2.2.2 Deux approches distinctes pour la reproduction spatiale du son
Parmi les recherches effectuées sur le sujet, il est possible d’introduire une première dicho-
tomie quant aux principales approches. La première classe de méthodes est la simulation de la
perception et la seconde, selon une école de pensée opposée qui répond à l’intérêt de repro-
duire un champ acoustique sur une zone plus ou moins étendue, est la simulation de champs
acoustiques [Evans et al., sans date; Lennox et al., 1999]. Cette première distinction de deux
approches générales est représentée au tableau 2.1 et est illustrée par quelques exemples pra-
tiques.
Ainsi, l’ensemble de ce qui est couramment identifié comme des technologies binaurales
appartient à la simulation de la perception. De telles technologies supposent, avec raison, que
la seule reproduction de la pression acoustique aux tympans de l’auditeur peut être efficace lors
de la reproduction d’une impression spatiale auditive. La validité de cette hypothèse repose sur
un fait maintenant bien connu et vérifié. On sait en effet qu’un filtrage opère selon la direction
d’arrivée (par rapport à l’oreille externe qui inclut le buste, la tête et le pavillon de l’oreille) des
fronts d’onde [Puddie Rodgers, 1981]. Ce filtrage procure des indications binaurales qui per-
mettent la localisation auditive des sources acoustiques puisque les signaux auditifs binauraux
sont légèrement colorés selon la direction d’arrivée des fronts d’onde et la distance des sources
10
OBJECTIF : REPRODUCTION ARTIFICIELLE DU CARACTÈRE SPATIAL DE L’AUDITION
Approche : simulation de la perception Approche : simulation de champs acoustiques
STÉRÉOPHONIE TRADITION-
NELLE : basée sur une connais-
sance de la localisation audi-
tive, elle implique des méca-
nismes de perception différents
de ceux de l’écoute naturelle.
La stéréophonie inclut : la re-
production sur deux canaux,
sur plusieurs canaux et même
sur écouteurs. La stéréophonie
est caractérisée par la création
de l’illusion d’une «image fan-
tôme». L’illusion dépend de la
fusion, par l’audittion, d’im-
pulsions décalées dans le temps
[Snow, 1953]. Avec un accrois-
sement du nombre de canaux,
on tend vers la simulation de
champs acoustiques.
TECHNIQUES BINAURALES :
basées sur l’inclusion du fil-
trage acoustique des oreilles
externes dans la reproduction.
Ces techniques incluent : l’en-
registrement avec tête factice
ou manequin, l’enregistrement
binaural sur une tête d’humain,
la synthèse binaurale (filtrage
a posteriori par des HRTFs),
la reproduction binaurale sur
casque ou sur haut-parleurs
(avec réduction de la diapho-
nie). Les mécanismes de per-
ception solicités par ces tech-
niques correspondent à ceux
rencontrés en écoute naturelle
avec tête fixe.
PROBLÈME INTÉRIEUR :
approche physique basée sur
la reproduction de champs
à l’intérieur d’une région
entourée de sources élec-
troacoustiques. Ce qui inclut
principalement : la WFS et
l’«Ambisonie». Le problème
intérieur est confronté à l’effet
du lieu de reproduction. Si
la simulation de champs
acoustiques est effective, les
mécanismes de localisation
correspondent à ceux de
l’écoute naturelle [Snow,
1953]. Avec l’augmentation de
la région d’écoute jusqu’à un
espace semi-infini, le problème
intérieur peut rejoindre le
problème extérieur : c’est
l’extrapolation de champs.
PROBLÈME EXTÉRIEUR : ap-
proche physique basée sur la
reproduction de champs acous-
tiques à l’extérieur d’une sur-
face ou d’un volume constitué
de sources électroacoustiques.
Ce qui inclut essentiellement la
synthèse de la directivité, la re-
production de directivités élé-
mentaires comme un rayonne-
ment omnidirectionnel, etc. Si
la simulation de champs acous-
tiques est effective, les méca-
nismes de localisation corres-
pondent à ceux de l’écoute na-
turelle.
Tableau 2.1 Taxonomie des approches et des technologies de reproduction du caractère spatial
de l’audition.
correspondantes. Cette légère coloration suffit à nous permettre de localiser inconsciemment,
sur la base d’un apprentissage aussi inconscient, les sources acoustiques. L’approche technolo-
gique binaurale (qui peut inclure les enregistrements binauraux avec mannequins, la synthèse
binaurale ou même le filtrage binaural des prises de sons directes par les réponses impulsion-
nelles des oreilles externes) de la reproduction spatiale du son appartient donc à la simulation
de la perception puisque cette solution technologique inclut une partie de la chaîne de la percep-
tion auditive, l’oreille externe dans ce cas. Les techniques de prises de sons et de stéréophonie
conventionnelles se basent quant à elles sur l’observation et conséquemment sur la connaissance
des phénomènes de la perception auditive pour établir des règles de mixage (images fantômes
par le biais de la stéréophonie d’intensité ou de délai, pseudo-stéréo par distribution fréquen-
tielle, sensation diffuse en fonction de la cohérence, etc.). Encore une fois, une part de la chaîne
de la perception spatiale du son est prise en compte par le biais d’expériences et d’observations
des perceptions résultant de certaines actions typiquement «audio» réalisées à la prise de son ou
en studio. Ce qui motive également l’appartenance des techniques de stéréophonies convention-
nelles (peu importe le nombre de canaux) à la classe de la simulation de la perception.
Peu de systèmes sont fondés sur une approche dite de simulation de champs acoustiques,
11
quoique les quelques dernières années ont donné naissance à plusieurs recherches qui abondent
en cette voie. Le nombre de sources de reproduction et le traitement de signal impliqués en simu-
lation de champs sonores sont, tous deux, plus importants que ceux évoqués par une approche
de simulation de la perception. Tel que mentionné brièvement plus tôt, l’hypothèse propre à la
simulation de champs acoustiques est la suivante : en reproduisant un champ acoustique dans
l’espace (ou dans une partie plus ou moins grande de l’espace) avec une fidèle distribution
spatiale de la pression, le système auditif complet (ce qui inclut le filtrage naturel par l’oreille
externe) sera excité par un stimulus physique qui correspondra au stimulus virtuel, soit celui
que l’on cherche à reproduire. Clairement, la tâche est plus de type physique et ne peut plus être
atteinte par la seule compréhension théorique ou intuitive de la perception spatiale du son. La
«Wave Field Synthesis» (WFS) [Verheijen, 1998], comme son appellation le suggère, est une
méthode de simulation de champs acoustiques puisque le système tente de reproduire un champ
acoustique donné dans une zone entourée par des haut-parleurs. La création d’un motif de di-
rectivité synthétique autour d’une source qui peut inclure plusieurs transducteurs électroacous-
tiques est aussi un exemple de technologie qui appartient à la simulation de champs acoustiques.
Ces deux problèmes présentent une certaine dualité. Le premier type (reproduction d’un champ
acoustique à l’intérieur d’un réseau de sources comme pour la WFS) est un problème intérieur
et le deuxième type (reproduction d’une directivité synthétique autour d’une source complexe)
est un problème que l’on pourrait qualifier d’extérieur (voir tableau 2.1). Cette nouvelle division
a d’importantes répercussions sur les enjeux physiques et technologiques propres à ces deux
objectifs complémentaires. On note par exemple que le problème extérieur est plus simple que
le problème intérieur puisque dans le cas du problème extérieur, l’objectif est formulé dans des
conditions de champ infini. Pour le problème intérieur, l’objectif est formulé pour une salle
réelle et le couplage entre le système de reproduction et la salle doit donc être pris en compte,
ce qui introduit la principale difficulté du problème intérieur auquel nous ferons face. La tech-
nologie ici introduite est principalement reliée à la WFS. Il sera par contre démontré que cette
même technologie peut aussi fournir une approximation à l’Ambisonie.
2.3 Aperçu de l’historique de la reproduction audio
Dès son origine, le problème de la reproduction audio migre, d’année en année et de pro-
grès en progrès, vers de nouvelles préoccupations sans cesse renaissantes. Alors qu’aux ori-
gines, la seule idée de projeter acoustiquement un enregistrement représentait une utopie aux
aspects presque spécieux ou farfelus [Borwick, 1988; Ballou et al., 1991] ; il en est tout au-
12
trement actuellement. Le ferme désir d’améliorer la qualité, ou l’approximation du réalisme,
de la représentation, auditive dans ce cas, presse chercheurs et développeurs vers de nouveaux
achoppements à surpasser pour transcender l’état présent de la reproduction audio.
Au départ, les problèmes et défis technologiques concernent principalement la transduction
électroacoustique. Des efforts sont alors déployés pour minimiser la présence de distortions non-
linéaires dans l’opération de transduction de signaux électriques vers des signaux acoustiques.
C’est plutôt à partir du moment où Ader réalisa sa démonstration à Paris en 1881, soit le premier
exemple connu de transmission multipiste [Malham et Myatt, 1995; Sterne, 2003], que l’histoire
de l’audio nous concerne.
Suivant la tentative d’Ader, des travaux sont entamés aux laboratoires du téléphone Bell en
1931 [Davis, 2003; Malham et Myatt, 1995]. L’objectif est alors d’étendre la zone d’écoute
à une audience formée de plusieurs auditeurs en recréant un front d’onde, ce qui n’était pas
le cas avec l’exemple d’Ader (assurément plus proche de la simulation de la perception). Le
principe exploré est simple, les chercheurs alimentent directement un réseau de haut-parleurs à
partir des signaux provenant d’un réseau de microphones semblable au réseau de haut-parleurs.
À l’époque, les chercheurs concluent qu’il est possible d’obtenir une reproduction satisfaisante
avec trois capteurs et trois haut-parleurs. Il est intéressant de noter que cette configuration cor-
respond de près à la disposition actuelle des trois canaux frontaux des systèmes «Surround 5.1»
qui, encore aujourd’hui, soit plus de 70 ans plus tard, suscitent, entre les ingénieurs du son, de
nombreux débats au sujet des méthodes de mixage et d’enregistrement qui devraient être privi-
légiées avec de tels systèmes [Rumsey, 2001; Williams, 2003]. Avant d’en arriver à un certain
niveau de satisfaction subjective avec un nombre réduit d’éléments de transduction, les cher-
cheurs avaient commencé la reproduction de fronts d’onde avec plusieurs transducteurs : sur
la base du principe de construction de Huygens. Ces expériences illustrent la dégénération du
problème de reproduction de champs acoustiques par WFS vers le problème de reproduction
stéréophonique.
Dans la même période, Blumlein élabore des lois de panoramisation (découlant d’une défini-
tion de méthodes de prise de son avec deux microphones) et une quantité considérable d’autres
techniques audio [Snow, 1953; Blumlein, 1933; Davis, 2003]. Par le biais de ces règles de
panoramisation empiriques, il cherche à produire une bonne illusion quant à la présence de
sources fantômes entre les haut-parleurs de systèmes stéréophoniques à deux canaux [Malham
et Myatt, 1995]. Ces importantes règles de panoramisation et d’enregistrement (comme la po-
pulaire paire de microphones coïncidents qui mise sur une stéréophonie d’intensité [Rumsey,
13
2001]) sont encore massivement utilisées aujourd’hui [Rumsey, 2001] malgré un lancement dif-
ficile à l’époque. Les travaux de Blumlein restent peu connus jusque dans les années cinquante.
C’est au début des années cinquante que les compositeurs des écoles dites de musique
concrète et d’elektronische musik s’intéressent fortement au principe de la reproduction sur
support multipiste [Malham et Myatt, 1995; Blesser et Salter, 2007]. Une bonne part d’entre eux
construisent leurs propres systèmes avec, parfois, leurs propres lois de panoramisation et poten-
tiomètres de panoramisation. Cette décennie semble d’ailleurs prolifique en terme de musique
spatiale, comme l’identifie Pierre Schaeffer [Malham et Myatt, 1995]. C’est en cette même pé-
riode, en 1958, que Varèse produit Poème Électronique avec l’expertise de Philips Corporation.
Le système comporte jusqu’à 400 haut-parleurs et près de deux millions de visiteurs ont eu l’oc-
casion d’assister à la diffusion de la pièce sur ce système. Ce dernier, le plus important construit
à l’époque, comporte deux lacunes : son utilisation est complexe, voire singulière, et ne repose
pas sur une compréhension de la localisation du son par l’humain [Malham et Myatt, 1995]. Fait
intéressant à ce sujet, les applications commerciales de la reproduction se limitent initialement
à la reproduction monophonique (ce qui représente donc une réduction du caractère spatial de
la musique auparavant naturellement spatiale) alors que les compositeurs oeuvrant avec l’enre-
gistrement sur support fixe incluent dès le départ des considérations au sujet du caractère spatial
de la reproduction, aussi simples soient elles [Bayles, 1992].
Pendant ce temps, la stéréophonie à deux canaux pénètre la sphère commerciale, parvient
ainsi aux salons des auditeurs [Davis, 2003] et atteint une acceptation massive dès les années
soixante.
Tout au long de cette vaste période d’avancements relativement lents et ponctuels, les efforts
sont limités par les technologies analogiques de l’époque. Avec l’avènement des représentations
numériques des signaux et de leurs traitements [Zölzer, 1997], les possibilités s’étendent en une
foule de directions, laissant – entre autres – place à une nouvelle effervescence dans la reproduc-
tion spatiale des enregistrements audio. De nouvelles solutions au problème de la reproduction
spatiale voient le jour.
Les exemples précédents, dont l’importance historique est considérable, ne sont que des
avancées ponctuelles, en dehors d’efforts de standardisation. C’est l’industrie audio qui a le
mérite de proposer certains standards au sujet de la reproduction sur des systèmes à plusieurs
canaux. Nous ne ferons mention que des systèmes «Surround 5.1» (soient les systèmes multi-
pistes les plus populaires à l’heure actuelle, ils incluent trois sources à l’avant pour la diffusion
14
du matériel principal, deux sources à l’arrière pour l’ambiance et un transducteur pour les ex-
trêmes graves). Le format 5.1 – qui, grâce à la vague de popularité des systèmes de cinéma-
maison, s’installe de plus en plus solidement dans le marché des consommateurs domestiques –
présente trois désavantages importants du point de vue de la perception spatiale : (1) une zone
d’écoute optimale limitée à un seul auditeur, (2) l’impossibilité de créer des sources fantômes
latérales situées entre les haut-parleurs avant et arrière (3) l’impérative nécessité de respecter
assez rigoureusement la configuration prescrite par les standards afin d’obtenir une image audi-
tive optimale
8
. D’autres systèmes tel le 7.1 ou le 10.2 furent proposés plus ou moins récemment
pour des applications en salles de cinéma. Les principes qui supportent cette façon de faire sont
les mêmes que dans le cas du 5.1. D’un autre côté, ces systèmes complexifient la tâche des
ingénieurs du son en charge du mixage puisque le nombre de pistes formant la copie maîtresse
de l’enregistrement devient passablement important. Même si les systèmes «Surround» com-
portent un nombre plus important de canaux, les approches se basent plus souvent qu’autrement
sur des stéréophonies d’intensités et temporelles issues des expertises en stéréophonie à deux
pistes. Avec l’accroissement du nombre de canaux en stéréophonie, on se dirige vers la WFS où
les méthodes doivent changer complètement.
D’autres types de systèmes, souvent propriétés de compagnies, existent ; on pense aux dif-
férents systèmes d’encodage matriciel et à quelques formats numériques particuliers
9
. Malgré
la simplicité relative de tels systèmes – soit un simple accroissement du nombre de canaux –
un bon nombre de recherches et de publications traitent de ce sujet [Rumsey, 2001; Nakanaya-
shi, 1975]. Ces technologies restent dans le domaine de la stéréophonie : la création de sources
fantômes entre les sources réelles sur la base de la simulation de la perception. Dans ce cas,
l’espace des sources virtuelles perçues est limité à la ligne ou à la surface reliant la position
des sources réelles. C’est l’effet de dôme sur lequel on projette des sources virtuelles. Dans un
contexte de reproduction de champs acoustiques, on peut potentiellement quitter cet effet de
dôme pour produire des sources virtuelles devant et derrière cette surface imaginaire.
Cette brève section dédiée à l’historique de la reproduction audio s’achève ici. La prochaine
section aborde plus en détail d’autres méthodes qui furent – et demeurent – proposées à titre de
solutions pouvant remplacer celles qui se parent du qualificatif multipiste dans sa forme la plus
simple. Ainsi, l’ensemble des systèmes présentés dans le cadre historique de la présente section
8
Un système de reproduction 5.1 doit en effet respecter le standard ITU-R BS.775 [Rumsey, 2001] qui prescrit
la position angulaire des haut-parleurs.
9
Considérons «Dolby Stereo», «Dolby EX», «Dolby Digital», «DTS», «Sony SDDS» «Prologic», «Circle Sur-
round» et «Lexicon Logic 7» pour n’en nommer que quelques-uns [Rumsey, 2001].
15
n’utilise rien d’autre que l’accumulation de canaux sans technique particulière ou automatique
(sauf dans de rares cas). Seul l’ingénieur de son, préposé au mixage, et les producteurs sont
responsables de la détermination manuelle de ce qui est envoyé comme signal à chacun des haut-
parleurs [Davis, 2003]. Ce n’est pas le cas des méthodes introduites dans la section suivante.
2.4 Les techniques récentes et novatrices
Sur une période qui couvrirait, disons les quelques dernières décennies, plusieurs applica-
tions aux caractères novateurs sont présentées par les chercheurs. Tel qu’il fut indiqué plus haut,
le caractère novateur est principalement caractérisé par la rupture avec des méthodes pour les-
quelles les haut-parleurs sont simplement alimentés par des signaux préparés à l’étape de la
production suivant une tradition stéréophonique. Les techniques de reproduction ci-après intro-
duites se distinguent grandement de cette façon de faire dont une part s’approche plus de notre
propre intention. Les systèmes ne sont pas considérés selon un ordre chronologique général,
mais plutôt selon la classification des méthodes telle qu’introduite au tableau 2.1 à la page 11.
L’accent est placé sur les techniques binaurales et, plus particulièrement, sur la reproduction de
champs acoustiques pour le problème intérieur. La dernière section de ce chapitre est dédiée aux
quelques publications qui touchent de très près la présente recherche.
2.4.1 Techniques binaurales et réduction de la diaphonie
La souplesse, la légèreté et la popularité de la stéréophonie à deux canaux sont telles que
le développement des techniques binaurales a précédé celui des autres méthodes à plusieurs ca-
naux. La première reproduction binaurale basée sur un enregistrement avec mannequin et tête
factice remonte à 1933 [Davis, 2003]. Les techniques binaurales regroupent l’ensemble des mé-
thodes de reproduction – sur casque d’écoute ou avec haut-parleurs – qui tentent de reproduire
fidèlement la pression acoustique aux tympans de l’auditeur, on parle donc de simulation de la
perception (voir le tableau 2.1 à la page 11) puisque l’oreille externe est prise en compte dans
le processus de reproduction. Les exemples d’applications les plus connus, et beaucoup plus
récents, sont le filtrage par HRTF («Head-Related Transfer Function») reproduit sur casque
d’écoute [Noisternig et al., 2003; Cheng et Wakefield, 2001; Boulanger, 2000; Gardner, 1998;
Kendall, 1995a; Begault, 1994], la transauralisation (une des traductions de «cross-talk cancel-
lation» ; nous utiliserons systématiquement par contre, au lieu de cette expression, l’expression
16
«réduction de la diaphonie») [Cooper et Bauck, 1989] et l’auralisation [Kleiner et al., 1993] sur
écouteur (reproduction d’un environnement acoustique virtuel avec simulation des réflexions).
Le peu de ressources physiques nécessaires à l’édification de tels systèmes a favorisé le dévelop-
pement d’une foule de plugiciels, et d’applications. L’usage de ces techniques est habituellement
efficace – dans l’optique de la perception – mais limité, par contre, à un seul auditeur et affiche
certaines variations des sensations selon les auditeurs, soit une conséquence du caractère indivi-
duel des HRTF [Kleiner et al., 1993]. Il est aussi admis que beaucoup de gens n’apprécient pas
spécialement les écouteurs parce qu’ils sont dérangeants, inconfortables et parce qu’ils favo-
risent une situation d’écoute antisociale [Camras, 1968]. De plus, les systèmes binauraux qui ne
disposent pas d’adaptation en fonction du mouvement de la tête de l’auditeur génèrent souvent
des impressions et des événements auditifs intracrâniens.
2.4.2 Reproduction de champs acoustiques par synthèse de champs acoustiques (WFS) pour
le problème intérieur
Dans un autre ordre d’idées, qui correspond plus à la présente recherche, des travaux de
recherche furent entamés par Berkhout en 1988 [Berkhout, 1988]. À ce moment, Berkhout pro-
pose le contrôle des champs acoustiques à l’aide de l’holographie («holographic ACS : Acoustic
Control System»)
10
. Les applications présentées par l’auteur concernent alors principalement
la sonorisation (spectacles, concerts ou conférences). Cette première publication de Berkhout
reprend plus rigoureusement, en incluant une analyse théorique, les premiers essais expérimen-
taux de Steinberg et Snowdes années 30 qui furent réalisés aux laboratoires Bell [Rumsey, 2002]
(voir section 2.3). Les travaux de Berkhout à ce sujet peuvent être aussi reliés à une précédente
proposition de Camras en 1968 [Camras, 1968] – principalement intuitive, mais néanmoins
basée partiellement, elle aussi, sur le principe de Huygens. Il semble que la problématique à
l’origine du développement initial de l’ACS soit simplement l’amplification des champs acous-
tiques directs. Le système ACS se base sur la formulation intégrale de Kirchhoff-Helmholtz.
Selon une des interprétations de cette formulation intégrale, un champ de pression acoustique
contenu dans un volume V – volume dont la limite serait une surface S – est uniquement dé-
fini par la pression et le gradient de pression (normal à S) évalués sur S lorsqu’il n’y a pas de
sources acoustiques dans V [Williams, 1999]. Considérant ce concept typique des phénomènes
ondulatoires, Berkhout remplace la version bidimensionnelle de S par une ligne L de sources
10
Même si la terminologie avancée par Berkhout utilise le terme «contrôle», il faut noter que le système ne
comporte pas de contrôle comme on l’entend habituellement : le système de Berkhout est un système en boucle
ouverte.
17
dont chacune des alimentations est définie par des opérateurs de synthèse évalués à partir de la
formulation de Kirchhoff-Helmholtz pour la configuration de sources considérée. L’inclusion
de la reproduction des réflexions et de la réverbération a suivi afin de proposer une méthode, à
moindres coûts, de modification de l’acoustique des salles [de Vries et Boone, 1999]. De tels
systèmes ont été installés avec succès, au moins à l’Université de Delft (Delft, Hollande) et à
l’Université York (Toronto, Canada) [Berkhout, 1988] dès les années quatre-vingt. Depuis les
quelques dernières années, plusieurs installations de WFS ont été construites dans le monde.
D’autres parutions de Berkhout suivent plus tard [Berkhout et al., 1992, 1993].
Progressivement, cette ébauche de Berkhout devient ce qui est maintenant identifié comme
la WFS («Wave Field Synthesis»)
11
[Verheijen, 1998]. Les premières définitions de la WFS
s’appliquent à l’acoustique des salles, soit comment modifier certains paramètres tel le son
pseudo-direct, les premières réflexions et la réverbération [Berkhout et al., 1993]. Le groupe
de recherche met l’accent sur une «solution de volume», afin de couvrir une certaine audience,
et tente de reproduire, dans les domaines temporel et spatial, les fronts d’ondes dans la zone
d’écoute. Les méthodes proposées, qui ont évolué avec les années, incluent quelquefois des
hypothèses relatives à la perception auditive, mais la base de solution repose toujours sur la
formulation intégrale de Kirchhoff-Helmholtz. Tel qu’introduit plus tôt, le système typique de
WFS comporte une importante quantité de haut-parleurs et l’usage d’opérateurs de synthèse
en boucle ouverte qui permettent de déterminer les signaux à fournir à l’ensemble des haut-
parleurs selon la position, et le type, de sources virtuelles alimentées par des enregistrements
numériques monophoniques. Les opérateurs de synthèse découlent de certaines simplifications
de la formulation de Kirchhoff-Helmholtz. Ces simplifications progressent comme suit : d’un
volume V fini vers un volume V semi-infini, d’une intégration de surface vers une intégration
de ligne – à l’aide de la méthode d’approximation de la phase stationnaire – puis, finalement,
d’une représentation continue vers une représentation discrète [Verheijen, 1998]. La section A.5
à la page 327 introduit le développement des opérateurs de synthèse de la WFS. On note aussi
que le développement de la WFS assume que les espaces virtuels et de reproduction sont des
espaces infinis. Les systèmes WFS, dans leur forme fondamentale, ne tiennent donc pas compte
du lieu de reproduction. C’est une limitation considérable.
Les sources virtuelles, planes ou sphériques, doivent être agencées dans un espace virtuel,
11
La traduction littérale de WFS (synthèse de champs acoustiques) peut être prise avec un sens générique, soit
toute reproduction synthétique de champs acoustiques. D’un autre côté, les travaux de Berkhout et de ses collabo-
rateurs s’approprient l’appellation WFS pour décrire une technique bien spécifique de reproduction. Le lecteur est
donc prié de conserver ces subtilités à l’esprit tout au long de la lecture de cette thèse.
18
celui que le système tente de reproduire dans la zone de reproduction. L’utilisateur doit compo-
ser manuellement une scène (position des sources directes, création des premières réflexions et
imitation de la réverbération [de Vries et al., 1994a]). En comparaison avec les système stéréo-
phoniques usuels, le gain en réalisme et flexibilité est des plus remarquables. Certains recherches
récentes sur la WFS concernent l’utilisation d’antennes de microphones pour la prise de son et
l’extrapolation de champs acoustiques pour WFS [Hulsebos et de Vries, 2002; Hulsebos et al.,
2003; Hulsebos, 2004], ce qui accroît la correspondance entre champ virtuel et un champ réel
capté qui devient un champ virtuel à reproduire. Avec une telle approche, il est possible d’ef-
fectuer une prise de son de type WFS. Le passage de cette prise de son jusqu’à des sources
de reproduction pour WFS est direct et l’étape de description d’une scène virtuelle est alors
escamotée.
Les chercheurs impliqués dans le développement des systèmes de type WFS se penchent sur
différents problèmes au cours des années. Des exemples d’études et d’avancements, théoriques
ou expérimentaux, peuvent être cités : effet de la discrétisation de la formulation intégrale [Ve-
rheijen, 1998; Boone et al., 1995; Berkhout et al., 1993; Start et al., 1995], effet de l’espace de
séparation des sources de reproduction [de Vries et al., 1994b; Verheijen, 1998; Boone et al.,
1995; Berkhout et al., 1993; Corteel, 2006b; Spors et Rabenstein, 2006], effet du caractère fini
des sources [de Vries et al., 1994b; Verheijen, 1998; Boone et al., 1995; Berkhout et al., 1993],
effet et correction de la directivité des sources de reproduction [Berkhout et al., 1995], création
distincte de champs directs, des premières réflexions et de la réverbération d’un lieu synthétique
ou d’une salle réelle couplée à un système électroacoustique [Boone, 2001; de Vries et Boone,
1999; Verheijen, 1998; Berkhout et al., 1993; de Vries et al., 1994a; Berkhout et al., 1995;
Pelligrini, 2002], différents types d’opérateurs de synthèse en relation avec le type de source
(monopôle ou dipôle) utilisé pour la reproduction [Berkhout et al., 1995], effet de la distance de
la source virtuelle par rapport aux sources de reproduction [Apel et al., 2004], effet et erreurs
d’amplitude [Sonke et al., 1998], prise en compte des motifs de directivité des sources de re-
production et des sources virtuelles [de Vries, 1996; Jacques et al., 2005], analyse de champs
par WFA («Wave Field Analysis») [de Vries et Boone, 1999], techniques d’enregistrement et
de composition de scène pour WFS [Boone, 2001], transmission multipiste [Horbach et Boone,
1999], utilisation de DSP [Boone, 2001], prise de son WFS avec antennes circulaires de capteurs
[Hulsebos, 2004], évaluation de la performance de la WFS en salle réelle [Boone et Verheijen,
1997; Klehs et Sporer, 2003; Sporer et Klehs, 2004], inclusion de la compensation des salles
de reproduction par inversion des transmissions électroacoustiques en aval des opérateurs de
synthèse [Spors et al., 2003a, 2004; Petrausch et Rabenstein, 2006; Spors et al., 2005a; Fuster
et al., 2005], utilisation de panneaux-actionneurs ou de haut-parleurs électrostatiques pour rem-
19
placer les haut-parleurs électrodynamiques [Verheijen, 1995; Boone, 2001; Kuster et al., 2005;
Spors et al., 2005b], effet de la perception et compatibilité vers des formats stéréophoniques 2-0
[Boone et al., 1995; Berkhout et al., 1995]. Certaines de ces références sont publiées en même
temps que cette thèse est produite.
À l’origine, les travaux fondamentaux de Berkhout prennent place à l’Université Technique
de Delft (Hollande), la formation du groupe de recherche européen CARROUSO multiplie les
recherches et la convergence des travaux vers des applications commerciales [Fraunhofer, Insti-
tut Integrierte Schaltungen, 2003; Brix et al., 2001; Väänänen et al., 2002]. L’Université McGill
à Montréal (Canada) a récemment (en 2003-04) reçu un système de WFS (de Fraunhaufer)
pour un an. Les résultats d’expérimentation avec ce système sont présentés au chapitre 4 de
cette thèse. Le projet CARROUSO s’est achevé tout récemment, de nouveaux développements
pratiques et fondamentaux sont effectués au sein des anciens protagonistes du CARROUSO.
Considérant l’accroissement de la popularité de ce sujet depuis 2000, un bon nombre d’autres
chercheurs en dehors de CARROUSO se penchent sur le sujet.
Même si cette section a couvert la WFS seule, d’autres liens théoriques importants entre
WFS et Ambisonie sont cités à la section 2.4.4. La section A.5, à la page 327, présente, quant à
elle, tout le développement théorique de la WFS nécessaire à sa réalisation pratique.
2.4.3 Applications issues du contrôle actif et du filtrage adaptatif
Considérons maintenant les travaux qui abordent la reproduction de champs avec une ap-
proche plus près du contrôle actif et du filtrage adaptatif, soit une façon de faire plus proche des
intentions à l’origine de cette thèse. Le concept, dans toute sa généralité, est illustré à la figure
2.1 (p. 21). Cette figure présente un schéma fonctionnel générique d’un système de reproduction
de champs de pression adaptatif. Sur cette illustration, on peut identifier le contrôleur adaptatif
(W), le système électroacoustique (C), les pressions acoustiques à reproduire, la pression re-
produite, l’erreur de reproduction (évaluée aux points d’égalisation
12
), les commandes envoyées
aux actionneurs du système et les références utilisées en amont du contrôleur. Selon la définition
des signaux de référence, des pressions à reproduire et de la structure du contrôleur, différents
problèmes peuvent être représentés, y compris l’égalisation temporelle et fréquentielle en plus
12
On note au passage qu’il est possible de travailler avec des points d’égalisation dans un espace transformé.
Ainsi, il est pensable d’égaliser les amplitudes complexes des coefficients d’une représentation transformée d’un
champ acoustique réel [Spors et al., 2003a; Betlehem et Abhayapala, 2005].
20
Figure 2.1 Schéma fonctionnel générique d’un système de reproduction audio adaptif
du contrôle actif classique utilisé dans l’atténuation du bruit ou des vibrations. Selon la struc-
ture de la prescription des pressions à reproduire, on pourra considérer un problème adaptatif de
reproduction spatiale de champs acoustiques.
En 1989, les premiers travaux d’Elliott et de Nelson [Elliott et Nelson, 1989] sur le su-
jet portent sur l’égalisation en des points multiples à l’aide du filtrage adaptatif dans une salle
d’écoute. L’objectif de ces travaux est d’obtenir une égalisation fréquentielle désirée en plu-
sieurs points de la salle de reproduction à l’aide de filtres adaptatifs (récursifs [IIR – «Infinite
Impulse Response»] et non récursifs [FIR – «Finite Impulse Response»]) en amont des haut-
parleurs. On parle alors de décoloration. Le problème considéré par Nelson en est un de fidélité
temporelle (soit reproduire, le plus adéquatement possible, un seul signal audio en plusieurs
lieux d’un espace fermé), ce type de problème est typique de l’époque alors que la fidélité tem-
porelle et fréquentielle prime sur la fidélité spatiale. Dans le cas de l’égalisation en plusieurs
points, les auteurs démontrent que la meilleure égalisation temporelle et fréquentielle est obte-
nue en recréant ce qui ressemble à une onde progressive plane dans la cavité. Les chercheurs
notent en fait que l’égalisation fréquentielle – pour la reproduction d’un seul et unique signal
en plusieurs points distincts – est de meilleure qualité si des délais sont introduits entre les si-
gnaux désirés aux capteurs d’erreur, les délais en question correspondent sommairement à ceux
qui sont associés à la progression d’une onde acoustique plane. Déjà, l’importance et l’utilité
de la fidélité spatiale laissent présager sa relation avec la fidélité temporelle et fréquentielle :
21
reproduire une certaine spatialité peut faciliter l’égalisation fréquentielle
13
.
D’autres articles sur l’égalisation, l’inversion des parcours acoustiques et le filtrage adaptatif
furent publiés par ces mêmes auteurs et coauteurs [Nelson et Elliot, 1992; Elliott et al., 1994;
Kirkeby et al., 1995; Uto et Hamada, 1995; Nelson et al., 1996b].
Seules les conclusions importantes de ces ouvrages seront citées. En 1992, ces chercheurs
publient, avec Hamada, un nouvel article sur l’égalisation multipiste mais les chercheurs in-
cluent aussi un objectif d’affaiblissement de la diaphonie («crosstalk cancellation») [Nelson et
Elliot, 1992]. Les signaux d’origine sont, par exemple, des enregistrements réalisés avec un
mannequin à tête factice. Cette fois, l’adaptation – réalisée par un contrôle par anticipation
(«feedforward») – est utilisée initialement pour déterminer les filtres inverses qui minimisent
la coloration du système et de la salle en plus de réduire l’effet des deux parcours controlaté-
raux
14
. C’est donc une solution locale. Une fois l’adaptation réalisée, les capteurs peuvent être
soustraits du système qui, en mode de reproduction, n’est plus adaptatif. Des essais expérimen-
taux sont réalisés dans la suite de cette étude théorique. Une deuxième partie de l’article traite
théoriquement du cas multipiste générique alors qu’un système de contrôle adaptatif tente de
minimiser la somme des erreurs de reproduction (entre pression reproduite et pression à repro-
duire toutes deux évaluées aux capteurs) quadratiques en plusieurs points dans le but d’étendre
la zone d’égalisation ; la solution est donc, pour ce nouveau cas, une solution de volume.
En 1994, Elliott et al. [Elliott et al., 1994] publient leurs résultats de recherche expérimentale
sur le même sujet appliqué à l’égalisation à piste unique dans une voiture. En 1995, Nelson et ses
collaborateurs présentent la suite de leurs recherches théoriques sur l’égalisation [Kirkeby et al.,
1995]. Les auteurs démontrent dans quelles conditions, et de quelle façon, il est possible d’inver-
ser exactement la fonction de transfert qui représente la transmission électroacoustique d’un sys-
tème de reproduction (soit des commandes aux transducteurs jusqu’aux pressions acoustiques
aux points d’écoute) qui comporte habituellement des composantes à déphasage non-minimal
15
13
Ce point est qualitativement cité par les auteurs mais ne fait pas, en cet article [Elliott et Nelson, 1989], l’objet
de simulations spécifiques.
14
Le qualificatif controlatéral réfère, dans ce cas, aux parcours présents du haut-parleur de gauche à l’oreille
droite et vice versa. La présence de parcours controlatéraux engendre la diaphonie.
15
Ce genre de composantes appartient à des systèmes dits «non-minimumphase» qui, en représentation discrète,
comportent des zéros à l’extérieur du cercle unitaire du plan complexe des z. Un tel système est dit à déphasage
non-minimal parce qu’il existe toujours un système similaire qui offrira le même gain de fonction de réponse
en fréquence mais un déphasage moindre que le système à déphasage non-minimal. Cet autre système est un
système à déphasage minimal pour lequel tous les pôles et les zéros sont à l’intérieur du cercle unitaire. Les
zéros de ce système sont les réciproques et conjugués complexes des zéros du système à déphasage non-minimal
22
partiellement dues à la présence de délai de propagation inhérent aux phénomènes acoustiques
[Neely et Allen, 1979]. L’introduction d’un délai de modélisation permet l’inversion adaptative
d’un système à déphasage non-minimal
16
. Encore une fois, le filtrage adaptatif est utilisé.
En 1996, Nelson et ses collaborateurs publient leurs travaux, toujours sur l’égalisation adap-
tative en plusieurs points, pour des applications pratiques et proposent, entre autre, un système
de compensation pour la position non idéale des haut-parleurs [Nelson et al., 1996b]. En cette
publication, les auteurs remarquent que la minimisation d’un écart quadratique de reproduction
(fidélité temporelle et fréquentielle) ne garantit pas les meilleurs résultats en terme de percep-
tion. Ces travaux abordent aussi la possibilité de créer un environnement virtuel avec cette ap-
proche. On note aussi qu’une thèse de doctorat, par Orduña-Bustamante à l’ISVR, concerne
le développement d’une méthode de traitement de signal pour des hautes fréquences d’échan-
tillonnage (tel 44.1kHz, le standard audio actuel le plus courant) [Nelson et al., 1996b], ce que
l’auteur identifie comme «sparse update algorithms» ou «sparse adaptation» [Elliott, 2001]. Ces
techniques offrent, comme principal avantage, la possibilité d’effectuer l’ajustement des coef-
ficients de filtres, à un échantillon donné, avec un temps de calcul indépendant de la longueur
du filtre [Nelson et al., 1996b; Elliott, 2001]. Deux autres articles sont publiés par Kirkeby et
Nelson en 1999 [Kirkeby et Nelson, 1999; Kirkeby et al., 1999]. On y remarque d’abord l’uti-
lité d’une régularisation (d’une pénalisation de la commande) filtrée pour le problème audio du
filtrage optimal [Kirkeby et Nelson, 1999]. Les auteurs utilisent aussi des filtres WFIR (pour
«Warped Finite Impulse Response». Dans le cadre de cette thèse, des algorithmes de traitement
de signal adaptatif simples et appliqués à des filtres non-récursifs FIR sont modifiés et mis en
oeuvre pour la reproduction de champs acoustiques tout en proposant une hybridation entre
contrôle et WFS. C’est l’aspect principal de la partie de la thèse dédié au traitement adaptatif
des signaux.
Suivant ces recherches sur l’égalisation, d’autres travaux réalisés à l’ISVR (Institute of
correspondant. Un système à déphasage non-minimal peut toujours être représenté par une cascade du système à
déphasage minimal équivalent et un déphaseur pur («all-pass») [Oppenheim et Schafer, 1989].
16
Cette réalité est démontrée par Widrow dans le contexte général du contrôle inverse adaptatif [Widrow et
Walach, 1995]. L’introduction d’un délai de modélisation permet la réalisation – adaptative – d’un filtre causal
et stable. L’inversion directe d’un système à déphasage non-minimal produisant deux solutions possibles (une
séquence discrète causale mais instable et une séquence discrète non-causale mais stable), il est démontré que
la solution adaptive approche la séquence non-causale, mais stable, dans la mesure où la présence d’un délai
de modélisation pousse la partie non-causale dans la région réalisable d’un filtre adaptatif. Dans le cadre de cette
thèse, on utilise un délai de modélisation variable. Selon Widrow, les meilleures inversions réalisables sont obtenues
lorsque le délai de modélisation correspond au nombre de coefficients du filtre adaptatif divisé par deux.
23
Sound and Vibration Research), sous le nom de projet «Virtual Acoustics Project», sont réali-
sés par Nelson, Elliott et leurs collaborateurs. Ces recherches concernent le caractère spatial de
la reproduction audio, soit la reproduction de champs acoustiques ou d’environnements acous-
tiques virtuels. Ces mêmes travaux entamés par Kirkeby et Nelson relient plus fortement le
caractère spatial de la reproduction haute-fidélité avec les techniques de contrôle actif du son.
Le premier article des auteurs sur ce sujet semble être publié en 1993 [Kirkeby et Nelson, 1993].
Dans cet article à teneur exclusivement théorique, les chercheurs étudient la possibilité de re-
créer en champ libre une onde harmonique progressive plane avec des systèmes de reproduction
à deux ou quatre sources. Le problème est formulé avec une approche typique en contrôle actif,
soit la minimisation d’une fonction coût. Il est intéressant de noter que pour ces simulations,
les auteurs considèrent la reproduction d’un champ sur une zone limitée à un carré de 0.5 m de
côté, qui correspondrait à la position d’un seul auditeur. En conclusion, les auteurs proposent
un système à quatre voies centrales afin de recréer plus efficacement des fronts d’ondes plans
jusqu’à des plus hautes fréquences. L’approche de Kikerby est développée plus profondément
au chapitre 5. En 1994, Nelson [Nelson, 1994] publie des résultats similaires avec de nouvelles
considérations, toujours à l’aide de minimisations, au sujet de la reproduction directionnelle, de
la réalisation de filtres optimaux – dans le domaine des fréquences – procurant le champ acous-
tique désiré, de la réalisation de filtres non récursifs, ou récursifs, optimaux dans le domaine
temporel, de l’échantillonnage spatial et de l’amélioration des systèmes de reproduction stéréo-
phoniques actuels par le biais de la création de sources virtuelles. La méthode proposée pour
construire des sources virtuelles est soumise à une évaluation subjective en 1995 [Orduña et al.,
1995]. Selon cette évaluation la localisation des sources virtuelles suit passablement la locali-
sation de sources réelles (sauf pour quelques exceptions, notamment au sujet de la confusion
«devant-derrière»).
Un nouvel article est présenté par Kirkeby, Nelson, Orduña-Bustamante et Hamada en 1996
[Kirkeby et al., 1996]. La publication porte principalement sur la reproduction locale des fronts
d’ondes à l’aide du traitement de signal numérique. Cette fois, l’analyse est entièrement réali-
sée dans le domaine temporel afin d’assurer le caractère réalisable de l’inversion et du filtrage.
Les auteurs proposent notamment une règle approximative pour fixer la pondération de la pé-
nalisation de la commande dans le problème d’optimisation. L’importance de l’étude du condi-
tionnement du problème est aussi mentionnée. Ce système de synthèse locale est aussi évalué
subjectivement en 1996 par Nelson [Nelson et al., 1996a], les conditions d’écoute varient d’un
espace anéchoïque à un intérieur de voiture. Les résultats sont convaincants mais limités à une
certaine plage de direction angulaire.
24
Progressivement, les publications de Nelson de la fin des années 90 traitent du «dipôle sté-
réo» un système de reproduction local des fronts d’onde. Le système, constitué de deux haut-
parleurs rapprochés est principalement utilisé pour créer un son à une seule oreille de l’auditeur.
Il semble que cette possibilité fut introduite une première fois en 1996 par Nelson [Nelson et al.,
1997]. Un tel arrangement de sources est réputé pour simuler discrètement la combinaison d’un
monopôle et d’un dipôle acoustiques [Nelson et al., 1997]. Cette combinaison offre la possibi-
lité de créer une pression non nulle, de la forme d’une pulsation par exemple, à un seul point
(une seule oreille) en injectant une seule pulsation aux deux sources. Des sources monopolaires
éloignées devraient générer un champ de pression spatial plus complexe pour atteindre cet ob-
jectif. Connaissant les pressions acoustiques aux oreilles représentatives d’un champ produit
par une source virtuelle (dont la position ne correspond pas aux deux sources du système de
reproduction), il est possible de recréer adéquatement les pressions aux environs des tympans
avec le «dipôle stéréo». Un article sur le «dipôle stéréo» est publié par Kirkeby en 1998 dans le
journal de l’AES [Kirkeby et al., 1998], cet article rapporte plus de simulations et soutient les
mêmes avantages au sujet de la proximité de deux sources pour reproduire localement un champ
prescrit. D’autres articles sont par la suite publiés [Watanabe et al., 1999; Kirkeby et Nelson,
1999; Nelson, 2002] en 1999 et 2002, ils considèrent le «dipôle stéréo» (DS) avec différentes
intentions. Ils traitent principalement d’applications au système de téléconférence [Watanabe
et al., 1999], d’évaluation objective des impressions auditives [Watanabe et al., 1999], de la
conception de filtres numériques pour le DS [Kirkeby et Nelson, 1999], de la signification et de
l’importance du nombre de conditionnement du problème inverse de la reproduction en relation
avec l’OSD («Optimal Source Distribution» pour la reproduction audio : distribution spatiale
optimale des sources en fonction des fréquences) [Nelson, 2002; Takeuchi et Nelson, 2002;
Nelson et Rose, 2005]. Des travaux plus récents de l’ISVR portent sur la distribution optimale
des sources pour la synthèse binaurale, soit sur l’OSD
17
.
En 1995, Asano et al. présentent des résultats théoriques issus de la simulation de l’éga-
lisation fréquentielle en salle [Asano et Swanson, 1995]. Les auteurs démontrent l’égalisation
possible de la réponse en différents points d’un espace fermé sur la base d’un réarrangement
modal, le modèle de cavité est celui d’une cavité rigide. Tel que présenté au chapitre 5, les si-
mulations présentées en cette thèse utilisent un modèle de salle plus complet de telle sorte qu’il
soit possible d’évaluer l’effet de l’amortissement sur la problématique. De plus, le chapitre 5
présente des résultats supplémentaires au niveau des mécanismes de contrôle et du condition-
nement du système. Asano considérait le rang des matrices de transfert pour évaluer la qualité
17
D’autres publications de Nelson, entre 2000 et 2001, au sujet des problèmes inverses en acoustique, sont aussi
reliées au projet de reproduction de champs acoustiques ici décrit tout autant qu’à l’OSD.
25
objective de la position des sources et des capteurs.
En 1999, Ise publie un texte à teneur théorique au sujet de la reproduction de champs acous-
tiques par la reconstruction de la pression et du gradient de pression sur une surface couverte
de capteurs de pression et de gradient de pression [Ise, 1999]. Cette solution, issue, comme la
WFS, de la formulation intégrale de Kirchhoff-Helmholtz, n’est évidemment pas pratique étant
donné le nombre de capteurs nécessaire pour couvrir une surface tout en évitant le repliement
spatial. Les travaux de Ise sont aussi très proches de la suggestion de Camras [Camras, 1968]
en 1968. Spors [Spors et al., 2003a] utilise une approche similaire mais remplace la surface de
contrôle par une ligne de contrôle, ce qui, tel que démontré au chapitre 5, ne peut pas vraiment
apporter les résultats escomptés en salle.
En 2001, Santillán introduit une configuration particulière pour l’égalisation de la réponse
en fréquence dans une salle [Santilla´ n, 2001]. Ces travaux sont par contre très spécifiques. En
créant une onde progressive plane dans une cavité rectangulaire, les auteurs démontrent la possi-
bilité d’obtenir une bonne égalisation de la réponse, dans tout le volume, en plaçant des capteurs
d’erreur de reproduction sur les surfaces de la pièce. L’originalité de ces travaux vient donc de
l’égalisation de la réponse fréquentielle en produisant une onde plane selon un des axes de la
pièce, des haut-parleurs couvrent les deux extrémités de la pièce desquelles émergent et abou-
tissent les ondes planes, respectivement. Ainsi, même si Santillán touche à la reproduction de
champs progressifs par contrôle, il sollicite cette approche pour seule fin d’égalisation fréquen-
tielle.
D’autres parutions, reliées à la reproduction du son ou de champs acoustiques, par contrôle
actif sont citées dans la bibliographie. Sous forme de liste, on note l’utilisation d’égalisation
moyenne par centroïdes de groupes de réponses impulsionnelles similaires [Brix et al., 2001],
usage de filtres propres pour l’annulation de signaux [Bharitkar et Kyriakakis, sans date], inver-
sion directe pour la réduction de la diaphonie [Kim et al., 2002], étude de robustesse [Radlovi ´ c
et al., 2000], effets subjectifs [Radlovi´ c et Kennedy, 2000], contraintes dans le domaine fré-
quentiel [Tam et Rafaely, 2002], reproduction de booms supersoniques [Epain et al., 2004],
égalisation du champ direct de la WFS [Corteel, 2006a] et méthode active pour rehausser ou at-
ténuer les niveaux de champs produits selon les régions d’écoute [Choi et Kim, 2002, 2004a,b].
Quoique seulement présentés sous forme de liste, certains de ces ouvrages sont cités dans le
corps du document afin de soutenir certains arguments en cours de route.
Clairement, selon la précédente revue de recherches, l’application des méthodes dites du
26
contrôle actif du son peuvent être appliquées aux problématiques de la reproduction du son
dans un contexte purement audio. Des hybridations entre les systèmes sont à prévoir afin de
consolider l’avancement des connaissances avec des compromis pratiques qui permettront l’im-
plantation d’un système réel.
Si les précédents paragraphes ont su présenter les recherches les plus influentes en repro-
duction adaptative du son, la dernière section de la revue de littérature (section 2.5) présente le
détail des quelques ouvrages plus actuels et même parfois publiés pendant la réalisation de cette
thèse qui sont les plus proches de la recherche présentée en ces pages.
2.4.4 Ambisonie, quelques autres méthodes et hybridations possibles
Quelques autres techniques et méthodes connues (Ambisonie, «Ambiophonics», etc.), ne
seront pas toutes présentées ici puisqu’elles sont trop éloignées de la présente recherche
18
. Par
contre, parmi ces travaux, on remarque une hybridation entre l’«holophonie» (un principe très
proche de la WFS)
19
et l’Ambisonie [Nicol et Emerit, 1999] présentée en 1999. Les auteurs
dressent des parallèles entre ces techniques et leurs représentations théoriques respectives : Ni-
col, en présentant une approche unifiée, démontre que la reconstruction Ambisonique est un
cas particulier de l’«holophonie» (lire aussi de la WFS). Holophonie et Ambisonie de base sont
toutes deux des systèmes en boucle ouverte.
Parmi ces méthodes alternatives, l’Ambisonie est reliée à l’approche privilégiée dans cette
thèse. Dans sa formulation la plus simple, le principe est abordable. Les équations Ambisoniques
sont en fait développées afin de fournir des lois de panoramisation
20
. Une fois les équations ré-
solues, on trouve des lois de panoramisation qui sont utilisées directement – invariantes – en
pratique. Le développement des équations Ambisoniques de base s’explique comme suit (il est
présenté à la section d’annexe A.4 à la page 313). Le champ à reproduire est une onde plane
dans le plan horizontal. Décrite en coordonnées cylindriques, elle est représentée par une série
18
[Gerzon, 1985; Glasgal, 2003; Zmolnig et al., 2003; Strauss et al., 2003; Noisternig et al., 2003; Ródenas
et al., 2003; Yon et al., 2003; Yang et al., 2003; Cooper et Bauck, 1989; Nicol et Emerit, 1999; Malham et Myatt,
1995; Korenaga et Ando, 1993; Kleiner et al., 1993; Romano, 1987; Ahnert, 1987; Meyer, 1984; Gerzon, 1973]
19
L’holophonie est le concept de reproduction de champs acoustiques le plus général qui n’est rien d’autre que
la réalisation de la reproduction de champs à partir directement de l’intégrale de Kirchhoff-Helmholtz ou à partir
de sa formulation par simple source [Williams, 1999].
20
C’est-à-dire des fonctions de distribution d’amplitude – de gain – aux sources réelles de reproduction pour
différentes positions angulaires d’incidence à reproduire.
27
de Fourier-Bessel pour laquelle les coefficients correspondent à des directivités harmoniques
de microphones coincidents (harmoniques cylindriques) et à l’origine du repère cylindrique.
L’espace de reproduction est supposé libre et infini dans lequel on trouve des sources d’ondes
planes distribuées uniformément sur 2π radians pour la reproduction. Ces deux hypothèses sont
sévères. Chaque onde plane de reproduction est représentée par une série de Fourier-Bessel.
L’objectif est donc de trouver les amplitudes de chaque onde plane de reproduction en égalisant
les coefficients de la série de Fourier-Bessel qui représentent la contribution interférentielle de
toutes les sources de reproduction aux coefficients prescrits par l’onde plane à reproduire. Pour
des sources de reproduction discrètes et des séries de Fourier-Bessel tronquées, on trouve un sys-
tème algébrique d’équations à résoudre par la pseudo-inversion puisque le système d’équation
peut être sous-déterminé, sur-déterminé ou déterminé. En pratique, les systèmes Ambisoniques
sont pratiquement toujours sous-déterminés. Les amplitudes des ondes planes de reproduction
en fonction de l’angle du champ plan à reproduire forment les lois de panoramisation [Poletti,
2000].
Typiquement, les lois de panoramisation de l’Ambisonie donnent des fonctions sinusoïdales
cardinales circulaires (une fonction sinc périodique sur 2π) dont la largeur du lobe central est
déterminée par l’ordre de troncature des séries de Fourier-Bessel utilisées pour la représentation
des champs [Poletti, 2000]. Fait important à noter, plus l’ordre des séries est important, plus
la fonction sinc circulaire approche un train d’impulsion périodique (toujours sur 2π) et plus
la solution Ambisonique s’approche d’une solution holophonique (ou WFS) pour laquelle les
sources de reproduction exposent le centre du repère cylindrique à leurs zones de rayonnement
de Fraunhofer. C’est le lien théorique qui unit holophonie, WFS et Ambisonie [Poletti, 2000].
Remarque tout aussi notable, la troncature d’une série de Fourier-Bessel correspond exacte-
ment à la troncature du spectre discret (obtenu par série de Fourier) qui représente le spectre
angulaire périodique des ondes planes produisant un champ acoustique quelconque. En d’autres
mots, puisque tout champ de pression acoustique p(r, θ, ω)
21
en deux dimensions peut-être re-
présenté (par transformées de Fourier spatiales) en une somme d’ondes planes, il est possible
de décrire ce champ p(r, θ, ω) en terme d’une distribution angulaire d’ondes planes S(θ, ω).
Cette distribution étant périodique en 2π, il est possible de la représenter par une série de Fou-
rier discrète qui donne le spectre angulaire discret de la distribution angulaire des ondes planes
S(θ, ω).
En retournant sur les résultats de l’Ambisonie et puisque l’utilisation du pseudo-inverse
correspond exactement à la solution d’un problème de contrôle optimal générique par minimi-
21
r est le rayon, θ l’angle et ω la pulsation d’intérêt.
28
sation de la somme d’erreurs quadratiques, on note que l’Ambisonie est une théorie issue du
contrôle optimal qui minimise l’erreur de reproduction évaluée sur les coefficients d’une série
de Fourier-Bessel. La réalisation pratique de l’Ambisonie est par contre fait en boucle ouverte
avec les solutions idéales trouvées a priori ; c’est une approche dite «mode-matching», [Poletti,
2005]. Ce parallèle motive certains aspects de cette recherche sur la reproduction de champs
acoustiques par contrôle actif. Le chapitre 7 présente en fait une réalisation pratique de l’Am-
bisonie en boucle fermée, plusieurs liens avec les précédentes remarques seront explicitement
observables. Cette dimension, et toute la compréhension du problème correspondant, forme une
des originalités de l’approche avancée dans cette thèse.
2.5 Les travaux récents les plus révélateurs par rapport aux objectifs de recherche
Parmis les travaux les plus reliés à la présente thèse, seuls quelques auteurs sont considérés
en détail dans cette revue de littérature. On note que certaines publications, ici revues, furent
publiées pendant la réalisation de cette recherche.
L’un des travaux les plus intéressants dans le cadre de cette revue est celui de Garas [Garas
et Sommen, sans date; Garas, 1999; Druyvesteyn et Garas, 1997] dont la part la plus importante
fut compilée dans un livre en 1999 [Garas, 1999]. Le chercheur étudie la problématique du point
de vue du traitement de signal. Les propositions concernent l’usage d’une stratégie d’adaptation
de type «LMS adjoint», l’implantation de l’adaptation dans le domaine fréquentiel et les amé-
liorations possibles, en terme de performance de l’adaptation dans le contexte audio. Un des
points importants de l’étude concerne la robustesse, aux mouvements des auditeurs, des sys-
tèmes de reproduction adaptatifs. Les autres aspects considérés sont : l’utilisation de différents
types de «warped filter» (avec résolution fréquentielle non uniforme)
22
, la généralisation du pro-
blème de contrôle (formulation unique pour l’affaiblissement de la diaphonie, la réalisation de
sources virtuelles, la simulation d’environnements réverbérants, la correction de la coloration
des haut-parleurs et le contrôle actif du bruit), l’amélioration de la robustesse aux mouvements
par l’élargissement des zones d’égalisation (robustesse aux petits mouvements), l’amélioration
de la robustesse aux mouvements par mesure et rétroaction de la position de l’auditeur (robus-
tesse aux grands déplacements), l’utilisation et la comparaison de différents filtres invariants à
résolution fréquentielle non uniforme
23
. Les travaux sont principalement théoriques, sous forme
22
Cette dimension du problème fut déjà abordée par Kirkeby en 1999 [Kirkeby et Nelson, 1999].
23
Il semble que l’usage de tels filtres – dont la résolution spectrale varie en fonction de la fréquence – procure de
meilleurs résultats pour les applications audios puisque l’oreille humaine suit cette même tendance [Garas, 1999;
29
de simulations, et proposent des solutions locales : la reproduction de la pression acoustique aux
tympans des auditeurs qui devraient, conséquemment, porter des microphones en leurs conduits
auditifs pour mesurer l’erreur de reproduction [Garas, 1999]. Cette contrainte n’est peut-être pas
la plus pratique. Un bon nombre de considérations électroacoustiques peuvent être ajoutées à ces
idées de systèmes adaptatifs avancées par Garas. C’est, entre autres, ce qui est caractéristique
de la présente thèse qui n’est pas exclusivement dédiée au traitement du signal.
Au sujet de la compensation active en salle pour la WFS, Spors [Spors et al., 2003a, 2004;
Petrausch et Rabenstein, 2006; Spors et al., 2005a] valorise l’intérêt du contrôle dans un do-
maine transformé qui est, supposément, plus représentatif des champs acoustiques sur une ré-
gion spatiale plus étendue que la région couverte par les capteurs utilisés. Spors se base en fait
sur la décomposition de champs acoustiques en ondes planes pour effectuer des extrapolations
de champs [Williams, 1999] et pour, aussi, travailler dans un espace transformé qui découple le
système sous contrôle. Le découplage est donc partiellement basé sur un modèle théorique de
propagation. Le problème avec la méthode présentée tient du fait que Spors suppose que la me-
sure de la pression et de la vitesse particulaire normale sur une antenne de capteurs circulaire est
suffisante pour décrire le champ acoustique, en salle, dans la surface fermée par l’antenne circu-
laire de capteurs
24
, il effectue ensuite une transformée en ondes planes sur la surface encerclée
par l’antenne de capteurs. Ce problème au niveau de la concordance des hypothèses avec la réa-
lité pratique se manifeste par une réduction de l’erreur de reproduction bien moindre que prévue
en dehors de l’antenne de capteurs [Spors et al., 2003a] ; ce qui est clairement relié aux aspects
mentionnés plus haut [Spors et al., 2005a] et qui, indirectement, rend le problème pratiquement
identique à un problème d’égalisation en plusieurs points. Les premiers résultats de Spors sont
publiés en 2003 [Spors et al., 2003a]. Les considérations au sujet de la tridimensionalité du pro-
blème sont publiées en 2005 [Spors et al., 2005a]. Les expérimentations de Spors ne sont pas
effectuées en temps réel étant donnée la charge de calcul impliquée. Une des distinctions de la
synthèse de champs sonores adaptatives (l’AWFS, «Adaptive Wave Field Synthesis») présentée
dans cette thèse avec l’approche découplée présentée par Spors vient du fait que l’AWFS ne se
base pas sur l’extrapolation de champs mais sur l’usage d’une antenne de capteurs compacte et
sur un découplage numérique du système identifié.
En 2005, Betlehem [Betlehem et Abhayapala, 2005] publie quant à lui une théorie de re-
production de champs acoustiques en salle. Pour illustrer la méthode, l’auteur se base sur une
Blauert, 1999].
24
Ce passage se base sur l’intrégrale de Kichoff-Helmholtz avec des fonctions de Green cylindriques pour des
problèmes en deux dimensions.
30
salle à deux dimensions (plafonds et plancher parfaitement absorbants). Le choix du problème à
deux dimensions est simplement motivé par le fait que le même problème en trois dimensions,
avec une théorie parfaitement similaire, implique un nombre trop important de capteurs et de
sources de reproduction qui doivent alors couvrir des surfaces. Comme point de départ, Betle-
hem décrit les champs à reproduire et les champs reproduits par des séries de Fourier-Bessel
(harmoniques cylindriques), aucune hypothèse a priori n’est effectuée sur les coefficients de
ces séries à l’exception de ceux qui représentent le champ acoustique à reproduire. En se ba-
sant sur des évaluations (théoriques dans cet article, elles seraient identifiées en pratique) des
fonctions de réponse en fréquence entre les sources de reproduction et une antenne circulaire
de capteurs, l’auteur décompose par la suite ces fonctions de réponse en fréquence sur la base
d’une série de Fourier-Bessel à l’antenne de capteurs utilisée. Le problème de reproduction est
ensuite formulé comme un problème de minimisation de la somme des erreurs quadratiques
entre les coefficients de la série (tronquée en pratique) à reproduire et les coefficients de la série
reproduite. Puisque Betlehem se base sur des séries de Fourier-Bessel, son approche (réalisée
en boucle ouverte, après identification des réponses en fréquence maintenant basées sur des
séries de Fourier-Bessel) correspond donc à une approche Ambisonique en boucle ouverte ; la
seule différence tient du fait que Betlehem remplace le modèle de rayonnement Ambisonique
(qui correspond typiquement à un modèle de champ libre) par un modèle identifié. L’utilisation,
en pratique de fonctions orthogonales de champs (ondes planes [Spors et al., 2003a], harmo-
niques cylindriques, harmoniques sphériques) connues a priori implique un certain problème.
Par exemple, dans le cas de Betlehem, une application pratique de reproduction par décomposi-
tion de champs en harmoniques cylindriques avec une antenne de capteurs circulaire nécessite
une absorption totale et parfaite du plafond et du plancher, faute de quoi l’antenne circulaire de
capteurs ne peut plus être utilisée pour la décomposition en harmoniques cylindriques puisque
tout le champ acoustique reproduit ne peut plus être décomposé en harmoniques cylindriques.
Cette particularité rejoint les travaux de Spors [Spors et al., 2003a]. Dans le cas de l’AWFS, on
évite se problème en utilisant des fonctions orthogonales qui découlent du système identitifié,
soit par décomposition en valeurs singulières. Aussi, la théorie avancée par Betlehem suppose
que les sources de reproduction sont des sources d’ondes cylindriques. Une autre lacune de l’ap-
proche de Betlehm est très reliée à la pratique : si plafonds et planchers doivent être parfaitement
amortissants, pourquoi se priver de le faire pour les autres surfaces et fonctionner entièrement
en champ libre.
Entre 2000 et 2005, Poleti publie sur l’enregistrement et la reproduction de champs acous-
tiques en deux, puis en trois, dimensions [Poletti, 2000, 2005]. Dans tous les cas, l’auteur se
concentre sur la reproduction en champ libre sur la base de l’expansion de champs acoustiques
31
à partir des fonctions orthogonales de l’équation d’onde acoustique homogène. Son plus récent
article [Poletti, 2005]
25
approche certaines aspects de cette thèse et doit être résumé. Poleti [Po-
letti, 2005] effectue une revue des techniques de reproduction de champs acoustiques en trois
dimensions. Une des bases du développement théorique de l’auteur réside sur le fait que tout
champ acoustique peut être décrit par une double série, tronquée on non, d’harmoniques sphé-
riques et de fonctions de Bessel sphériques [Williams, 1999; Poletti, 2005]. Dans cette optique,
on note, selon l’auteur, trois approches typiques d’enregistrement (c’est-à-dire d’identification
des coefficients de la double série) de champs acoustiques en trois dimensions : (1) avec une
sphère de capteurs en champ libre (le volume de la sphère est libre), (2) avec une sphère de
capteurs sur une sphère rigide (le volume de la sphère est plein et rigide) et (3) avec une grille
quelconque de capteurs [Poletti, 2005]. Pour ce qui est de la reproduction de champs acous-
tiques en champ libre, l’auteur propose deux principales méthodes qui concernent, toutes deux,
la présente thèse.
Approche par coïncidence de modes («mode-matching») : Pour ce type d’approche, on tente
d’approximer (par inversion directe ou par minimisation des moindres-carés) les coeffi-
cients des harmoniques sphériques (ou cylindriques pour les cas en deux dimensions) à
reproduire par ceux reproduits. L’Ambisonie telle que décrite en annexe est, par exemple,
une telle approche en deux dimensions.
Approche par formulation par simple source. Dans ce cas – assez proche de la WFS puis-
qu’elle se base sur la formulation intégrale de Kirchhoff-Helmholtz (KH) –, l’intégrale
KH est résolue pour le problème intérieur ou le problème extérieur (et non les deux à la
fois) avec un terme de rayonnement qui correspond seulement à une rayonnement mono-
polaire. C’est la formulation par simple source de l’intégrale KH [Williams, 1999]. On
note que cette approche est en fait une forme de WFS, en trois dimensions, développée
sur la base des harmoniques sphériques et qui exclut donc l’approximation de la phase
stationnaire propre à la WFS en deux dimensions sollicitée dans cette thèse (voir annexe
A).
En ce qui concerne l’AWFS, on note d’abord des liens avec l’approche par coïncidence
de modes puisque l’AWFS, en pratique, réalise une telle approximation, non pas sur la base
d’harmoniques cylindriques (puisque l’AWFS implique la WFS en deux dimensions), mais
sur la base de fonctions orthogonales provenant de la décomposition de matrices en valeurs
singulières (SVD, «Singular Value Decomposition»)
26
. Cette parenté avec les théories de Po-
leti est renforcée par le lien qu’entretient la SVD avec l’expansion, de fonctions continues,
en valeurs singulières (SVE, «Singular Value Expansion») puisque la SVD est une version
25
Article publié en 2005, soit lors de la troisième année de la réalisation de cette thèse.
26
Pour l’AWFS, on parle de modes de rayonnement lorsqu’il est temps de nommer ces fonctions orthogonales.
32
discrète de la SVE [Hansen, 1998]. Sachant que pour une intégration très générale de type
_
V
G(x[y)Q(y)dV = p(x)
27
, la SVE (et donc la SVD) offre des fonctions singulières qui cor-
respondent aux solutions propres orthogonales du noyau de l’intrégrale
28
. On ne doit pas se
surprendre si la SVD appliquée à l’AWFS donne des fonctions orthogonales qui correspondent
de près à des harmoniques cylindriques aux sources de reproduction et aux capteurs de l’erreur
de reproduction. L’avantage de l’obtention de fonctions orthogonales par SVD plutôt que par
connaissance a priori des solutions orthogonales de l’équation d’onde homogène, tient du fait
que les fonctions en question seront toujours orthogonales, même dans des lieux réels. Cette
approche par SVD permet dont la réalisation de transformations et de filtres sur la base d’un
algorithme numérique de SVD sans connaissance a priori de fonctions orthogonales théoriques.
Même si la théorie de Poleti est intéressante en champ libre, elle est peu pratique pour
des applications expérimentales : les simulations présentées par l’auteur implique 100 ou 256
sources de reproduction [Poletti, 2005]. Dans le cadre de cette thèse, c’est la WFS qui est à
la base de la AWFS et on ne touche pas aux aspects tridimensionels de la reproduction de
champs acoustiques parce que, justement, le nombre de sources est trop élevé et peu commode
en pratique. Pour ce qui est de la reproduction tridimensionelle de champs acoustiques en salle,
Poleti considère l’approche par coïncidence de modes qui donne de bon résultats [Poletti, 2005]
et qui correspond à la version tridimensionnelle de la théorie présentée par Betlehem [Betlehem
et Abhayapala, 2005] en 2005
29
. Dans tous les cas, Poleti se limite à des considérations purement
théoriques et ne fournit aucune considération pratique, que ce soit au niveau du traitement du
signal ou au niveau de résultats expérimentaux [Poletti, 2000, 2005].
Bai et Elliott [Bai et Elliott, 2004] s’intéressent en 2004 au préconditionnement du FXLMS
pour la réduction de la diaphonie. Avec la décomposition en valeurs singulières (SVD), les au-
teurs découplent et blanchissent au préalable le système sous contrôle. Un algorithme adaptatif
de type LMS est par la suite branché aux bornes de ce nouveau système découplé et blanchi. Des
simulations en champs libres sont introduites et démontrent le bon fonctionnement du décou-
plage par SVD. Dans le cadre de cette thèse, le même type d’algorithme est sollicité mais modi-
fié, notamment pour inclure la solution WFS dans l’algorithme d’adaptation. D’autres aspects,
passés sous silence par Bai, comme les problèmes d’ordre des vecteurs singuliers en fonction de
la fréquence sont aussi considérés dans cette thèse (au chapitre 8, sur le traitement du signal). De
plus, la SVD est utilisée pour élucider des propriétés et des mécanismes physiques fondamen-
27
Dans cette équation, G(x|y) est par exemple une fonction de Green et Q(y), une distribution de source.
28
En acoustique, ce noyau correspond par exemple aux fonctions de Green de l’intégrale KH.
29
Tout juste après notre publication du chapitre 5 dans le «Journal of the Acoustical Society of America», Bet-
lehem publie l’article en question [Betlehem et Abhayapala, 2005].
33
taux de l’AWFS (chapitre 7). Qui plus est, cette thèse inclut une démonstration expérimentale
du découplage à large bande d’un système de synthèse de champs sonore adaptatif. Une telle
démonstration expérimentale constitue aussi une originalité.
2.6 Conclusion
Ce chapitre a posé la base et le contexte des travaux présentés dans cette thèse. Suivant une
classification des méthodes de reproduction artificielle du caractère naturel de l’audition, on
note le contexte physique – contexte qui coïncide parfaitement avec les travaux de cette thèse
– du problème de reproduction de champs acoustiques qui se détache des aspects perceptifs.
Plusieurs références bibliographiques ne furent pas explicitement commentées dans les sections
précédentes mais ont su jouer un rôle dans l’élaboration de cette revue de litérature
30
.
En bref, des points saillants de cette revue de connaissances sont maintenant présentés. De là
émerge les détails de la définition du projet de cette thèse. De façon bien générale, le problème
intérieur de la reproduction de champs acoustiques pose encore des problèmes non-résolus et des
développements potentiels. C’est ainsi qu’on trouve différentes méthodes basées sur l’intrégrale
de Kichhoff-Helmholtz comme la WFS et d’autres basées sur le contrôle actif ou le filtrage
adaptatif. On note, par contre, bien peu de travaux, à l’exception de ceux de Spors et d’autres
très récents, qui touchent ou intégrent les deux méthodes. Cette thèse peut s’inscrire dans cette
30
[Berkhout et al., 1980; Morgan, 1980; Kabal, 1983; Dobbins, 1984; Massa, 1985; Eargle, 1986; Miyoshi et
Kaneda, 1988; Kuriyama et Furukawa, 1989; Veronesi et Maynard, 1989; Kawakami et Shimizu, 1990; Kim et
Lee, 1990; Miyoshi et Kaneda, 1991; Tichener, 1992; Genereux, 1992; Gao et Snelgrove, 1992; Elliott et al., 1992;
Kirkeby et al., 1993; Stoughton, 1993; Elliott, 1993; Snyder et Tanaka, 1993; Mahieux et al., 1995; Rocchesso,
1995; Fahnline, 1995; Poltmann, 1995; Kendall, 1995b; Chen et al., 1996; Laakso et al., 1996; Ahn et Voltz, 1996;
Start et al., 1997; Davis et Davis, 1997; Mahieux et al., 1997; Garcia-Bonito et al., 1997; Chen et al., 1998; Feng et
Gan, 1998; Roure et Albarrazin, 1999; Jot, 1999; Fontana et al., 1999; Kahana et al., 1999; Berkhout et al., 1999;
Renault et al., 2000; Ihle et al., 2000; Yoon et Nelson, 2000; Fielder, 2001; Brandstein et Ward, 2001; Brix et al.,
2001; Delalande, 2001; Wang et H. Ge, 2001; Becker et Sapp, 2001; Leboucher et al., 2002; de Diego et al., 2002;
Wu et Zhao, 2002; Bouchard, 2002; Merimaa, 2002; Daniel, 2003; Bouchard, 2003; Komiyama et al., 2003; Jaffe,
2003; Miyazaki et al., 2003; Freiheit, 2003; Lu et Wu, 2003; New Adventures in Sound Art, 2003; Takane et al.,
2003; Caulkins et al., 2003; Gover et al., 2003; Spors et al., 2003b; Fahy, 2003; Yon et al., 2003; Fielder, 2003;
Bastyr et Capone, 2003; Zieli ´ nski et al., 2003; Kim et Wang, 2003; Reiter et al., 2003; Murphy et Beeson, 2003;
Buchner et al., 2004; Takane et Sone, 2004; Yokota et al., 2004; Theile et Wittek, 2004; Fahline, 2004; Kuster
et al., 2004; Gover et al., 2004; Rafaely, 2004; Bharitkar et Kyriakakis, 2004; Bai et Lin, 2005; Zhao et Wu, 2005;
Ahmad et Kundu, 2005; Mitsuki et al., 2005; Park et Rafaely, 2005; Guillaume et Grenier, 2006; Toole, 2006;
Sausalito Audio Works, sans date; Zvonar, sans date]
34
zone combinant à la fois WFS et filtrage adaptatif. Plus spécialement, il reste encore matière
à découvrir et à développer au niveau des liens possibles entre WFS et contrôle actif, et ce
notamment par le développement d’une nouvelle formulation du problème. C’est le sujet de
cette thèse, détaillé au chapitre suivant par le biais des objectifs de recherche et de la méthode
retenue.
35
CHAPITRE 3
OBJECTIFS ET MÉTHODES
3.1 Introduction
Ce chapitre présente les points saillants qui ont été poursuivis lors de la réalisation de cette
rercherche sur la reproduction de champs acoustiques à l’aide du contrôle actif du son. En ré-
sumé, les objectifs peuvent être divisés en deux points généraux : (1) établir une compréhension
de la reproduction de champs acoustiques par WFS et contrôle actif en champ libre et en salle ;
(2) développer un prototype illustrant la solution technologique retenue. Le détail de la métho-
dologie privilégiée est ensuite fourni.
3.2 Contexte de réalisation de la recherche
La présente recherche fut effectuée au sein du GAUS (Groupe d’Acoustique de l’Univer-
sité de Sherbrooke) qui, dans le cadre d’un projet de plus grande ampleur sur la transmission
multimédia, entretient des liens avec le CIRMMT (Centre for Interdisciplinary Research in Mu-
sic, Media, and Technology, Faculté de Musique, Université McGill)
1
. L’objectif principal du
CIRMMT est la réalisation de recherches interdisciplinaires directement reliées à la création, à
la transmission et à la perception du son et de la musique.
Finalement, le CIRMMT fut, en 2003-04, équipé d’un système de WFS provenant de l’insti-
tut de recherche Fraunhofer en Allemagne. Ce système fut utilisé dans le cadre du présent projet
de recherche.
1
Le GAUS est un membre du CIRMMT.
36
3.3 Objectifs de la recherche
Considérant l’état de l’art en matière de reproduction audio ou de champs acoustiques, état
précédemment revu, il est possible de formuler les objectifs de la présente recherche. De façon
très générale, l’exercice de recherche comportera la fusion de deux domaines distincts, soit le
contrôle actif du son et la reproduction de champs acoustiques. Cette approche transdisciplinaire
a déjà fait l’objet de quelques études récentes. Il n’en demeurre pas moins qu’une bonne part de
la recherche sur le sujet reste à faire.
Voici la liste explicite des objectifs généraux associés à la recherche concernant la reproduc-
tion de champs acoustiques à l’aide des techniques du contrôle actif.
1. Établir une compréhension physique de la WFS (avantages et inconvénients) fondée sur
des simulations et des expérimentations.
2. Investiguer la nature de la physique de la reproduction de champs acoustiques en salle et
en champ libre par contrôle actif.
3. Formuler une nouvelle approche de type WFS adaptative (AWFS, pour «Adaptive Wave
Field Synthesis») dans le domaine physique et pour son équivalent réel en traitement de
signal adaptatif.
4. Élaborer cette nouvelle méthode de synthèse de champs acoustiques sur une base essen-
tiellement physique. Cet objectif principal comporte les subdivisions suivantes
2
:
(a) production d’une zone de reproduction de champs acoustiques optimale plus large
pouvant par exemple contenir une audience plus ou moins importante
3
. Du point de
vue du contrôle actif du son, on sait que les zones d’égalisation (d’atténuation de
l’erreur) peuvent s’étendre aux environs d’un dixième de la longueur d’onde autour
d’un capteur d’erreur. Avec différentes configurations d’antennes de capteurs, on
peut s’attendre à mieux. D’un autre côté, la WFS couvre un espace d’écoute consi-
dérable qui n’est vraisemblablement que fonction du nombre de sources, et de la
2
Il est intéressant de noter que ces sous-objectifs, spécialement ce point, est typique de toute tentative actuelle
ou récente d’amélioration de la reproduction audio.
3
En terme de compréhension et d’explication des phénomènes, l’étude n’est pas forcée de se limiter à de larges
zones. Toute autre comparaison pourra être d’un apport bénéfique. On note que le «sweet spot», la zone d’écoute
optimale, pour la stéréophonie à deux canaux, forme un espace dont le diamètre correspond à 60 centimètres
environ. En dehors de cet espace, le caractère spatial de l’image auditive se dégrade [Nelson, 1994] tout autant que
la qualité du champ reproduction.
37
taille de l’antenne de sources, autour de l’audience. Pour le présent projet, on de-
vrait, en terme d’étendue de la zone d’écoute, proposer quelque chose de similaire à
la WFS;
(b) reproduction optimale, dans un espace de reproduction donné, d’un champ acous-
tique prescrit
4
;
5. Réaliser des expérimentations (dans le domaine acoustique et dans le domaine du trai-
tement du signal) qui démontrent l’intérêt et la valeur de l’approche technologique de
reproduction de champs acoustiques par WFS adaptative.
3.4 Méthodologie proposée
Avant d’établir la structure hiéarchique des activités qui fut suivie, quelques précisions
doivent être introduites au sujet des techniques privilégiées.
Dans le monde de la reproduction sonore, l’objectif ultime est de recréer une impression
auditive tridimensionnelle fidèle. Comme il fut mentionné plus haut, cette intention n’implique
pas de simples problèmes. En effet, certaines techniques de reproduction spatiale du son, telle
la stéréophonie évoquée au tableau 2.1, misent même sur l’illusion psycho-acoustique. Dans le
cadre de la présente recherche, c’est la reproduction physique de champs acoustiques qui forme
l’objet de l’étude.
D’un autre côté, en contrôle actif des vibrations et du son, il est plus qu’habituel d’injecter
une ou plusieurs perturbations secondaires afin de construire un champ secondaire qui, par in-
terférence destructive, éradique un champ primaire. Considérant ces dimensions de l’audio et
du contrôle actif du son, l’usage du contrôle actif pour créer un champ secondaire, à l’image
d’un champ primaire, dans le cadre de la reproduction, semble tout à fait légitime [Kirkeby
et al., 1996]
5
. Par contre, en comparaison avec la WFS, un système d’adaptation actif implique
l’usage d’une antenne de capteurs. Cette complication – en terme d’application – introduit avan-
tageusement la possibilité de tenir compte automatiquement du caractère acoustique de l’espace
de reproduction. Chose qui n’est pas possible avec la WFS qui assume, dans sa définition fon-
4
Dans le cadre de ces travaux on tente de reproduire des ondes simples afin de comprendre la physique du
problème. Recréer, dès le départ, une impression auditive pourrait être plus difficile puisqu’elle implique des tran-
sactions sensorielles multimodales complexes.
5
Voir le chapitre précédent, plus précisément la section 2.5.
38
damentale, un espace de reproduction anéchoïque. D’autres détails à ce sujet sont présentés plus
loin.
L’ensemble du projet peut être divisé en deux grandes parties. Les prochaines sections in-
troduisent et explicitent, principalement sous forme de liste, ces deux parties.
Partie I - Revue de littérature, études et expérimentations préliminaires, formulations
théoriques du problème et simulations (chapitres 2 à 8)
Le principal objectif de cette première partie est simple : définir, préciser et comprendre
le fonctionnement de l’approche choisie tout en valorisant une forte connaissance des travaux
récents et plus anciens dans le domaine. Les activités incluses dans cette première partie sont
classées comme suit :
1. lecture et recherche bibliographique sur les sujets suivants (chapitre 2) :
– psychoacoustique et perception spatiale du son,
– acoustique des salles,
– traitement du signal adaptatif,
– techniques de reproduction spatiale du son ;
2. analyses et expérimentations préliminaires de la WFS (chapitre 4) :
– antennes de sources acoustiques en champ libre,
– développement théorique de la WFS,
– simulations de la WFS en champ libre (et donc, production d’un programme qui génère
les opérateurs de synthèse de la WFS classique, utilisable à l’étape du traitement des
signaux et des expérimentations),
– mesures de champs reproduits par WFS et comparaison avec les simulations de la WFS
en champ libre pour évaluer l’effet du lieu ;
3. analyses théoriques et simulations de la problématique fondamentale (chapitre 5) :
– construction d’un modèle théorique du système de reproduction par contrôle actif (as-
pect physique de la reproduction en salle),
– réalisation de simulations à partir du modèle,
– élaboration de la compréhension des phénomènes acoustiques en jeu à partir de simu-
lations et d’analyses théoriques,
39
– étude paramétrique, en particulier au sujet de l’effet de l’espace d’écoute (avec ou sans
réflexions) sur la qualité et les mécanismes de la reproduction,
– formulation d’une conclusion quant à la possibilité physique de reproduction de champs
acoustiques en salle ;
4. simulations théoriques et développement du système réalisé en pratique (chapitres 6 à 8) :
– réalisation de simulations à l’image de la WFS adaptative (AWFS) pour établir les bases
d’un système qui sera développé ultérieurement,
– compréhension des mécanismes fondamentaux de l’AWFS,
– définition de l’architecture de traitement du signal correspondant à l’AWFS :
– modification du FXLMS («Filtered-Reference Least-Mean-Square»),
– définition de l’AWFS avec contrôle indépendant des modes de rayonnement ;
– simulations du traitement de signal adaptatif sollicité pour l’AWFS pour le contrôle
indépendant des modes de rayonnement.
Partie II - Essais expérimentaux et implantation pratique (chapitre 9)
Cette seconde partie constitue un aspect important de la recherche puisqu’elle inclut la dé-
monstration pratique du fonctionnement de la méthode proposée.
Cette partie de la recherche fut divisée comme suit :
1. développement d’une plateforme du traitement de signal pour l’AWFS expérimentale,
2. conception, construction et installation d’un prototype d’AWFS,
3. reproduction de champs acoustiques par AWFS :
– effet de différentes conditions de reproduction ;
– reproduction à large-bande en temps différé ;
– reproduction harmonique en temps réel.
3.5 Conclusion
En conclusion, la recherche porte donc sur la reproduction de champs acoustiques à l’aide
des méthodes de contrôle actif et de WFS. L’objectif est simple : recréer un champ acoustique le
40
plus fidèlement possible afin de procurer éventuellement une bonne reproduction auditive pour
une audience plus ou moins étendue. Le caractère novateur de la présente recherche concerne
l’usage des techniques du contrôle actif du son pour la reproduction audio, ce qui est baptisé
l’AWFS dans cette thèse. Cette application, quoique déjà entamée par d’autres chercheurs, de-
meure relativement peu exploitée : de nouveaux développements, améliorations, analyses et hy-
bridations, peuvent être encore effectués. On note, comme exemple de nouveauté, la définition
de l’AWFS sur une base de contrôle indépendant des modes de rayonnement.
41
CHAPITRE 4
EXPÉRIMENTATIONS PRÉLIMINAIRES AVEC UN SYS-
TÈME DE WFS CONVENTIONNEL
4.1 Introduction
Ce chapitre introduit une analyse objective de la performance de la WFS dans une salle de
reproduction réelle. Elle permet d’évaluer où se situent les améliorations potentielles qui pour-
raient être introduites par la présente recherche doctorale sur l’amélioration de la reproduction
de champs acoustiques à l’aide du contrôle actif.
Afin d’évaluer distinctement les implications de l’usage d’un réseau de sources de repro-
duction discrètes et de la dynamique de la salle de reproduction, des simulations en champ libre
sont préalablement introduites pour illustrer l’effet d’antenne et la construction interférentielle
en basse fréquence (sections 4.2 à 4.4), nécessaire pour la WFS. Ce type de simulations est
ensuite utilisé comme base de comparaison quantitative avec les mesures expérimentales (dé-
taillées à la section 4.5). Les simulations en champ libre illustrent aussi le comportement des
opérateurs de la WFS et fournissent ainsi une meilleure compréhension des rouages de la WFS
en lien avec les notions issues de la théorie des ouvertures et des réseaux de sources [Ziomek,
1995].
À ce sujet, il importe de notifier certains correspondances entre la WFS et la théorie des
ouvertures et des réseaux [Ziomek, 1995] : pour la WFS, on s’intéresse au champ proche
1
des
sources de reproduction puisque c’est dans cette zone que les interférences permettent la re-
production d’un champ acoustique. Pour les applications plus usuelles des réseaux acoustiques,
on s’intéresse aux possibilités que procurent les réseaux dans le champ lointain : soit, princi-
1
En accord avec la définition de champs proches telle que rencontrée dans la théorie des ouvertures et des
réseaux de sources [Ziomek, 1995].
42
palement, la formation de motifs de directivité. Les deux problèmes se rejoignent parce que,
par exemple, la reproduction d’une onde plane par WFS produit, en champ lointain, un lobe
principal de rayonnement dans la direction correspondante.
En complément aux notions et résultats présentés dans ce chapitre, l’annexe A présente le
développement théorique de la WFS et l’annexe C contient tous les détails sur les expérimenta-
tions ici décrites.
4.2 Réseau de sources acoustiques en phase
Dans un premier temps, quelques remarques sont introduites au sujet d’une antenne linéaire
de sources acoustiques en phase en champ libre puisque, pour une première approximation,
cette application correspond à la production approximative d’une onde plane
2
(dont la direction
de propagation est perpendiculaire à l’antenne linéaire) comme il le serait fait avec la WFS
[Gauthier et al., 2005a].
En considérant une seule source monopolaire théorique en champ libre, la réponse en fré-
quence évaluée en un point de l’espace est directement fonction de l’amplitude de la source en
question. Dès que deux sources ou plus sont présentes simultanément, la réponse en fréquence
d’un point quelconque laisse voir l’apparition d’un filtre en peigne. Ce filtrage en peigne est
attribuable à la présence d’interférences destructives et constructives au point d’évaluation de
la réponse. Pour la WFS, ce sont ces motifs d’interférences spatiales qui permettent la synthèse
de fronts d’onde, mais ils peuvent aussi être nuisibles pour la WFS. Les deux sous-sections sui-
vantes présentent des distributions de réponses en fréquences et de réponses à l’impulsion dans
l’espace pour quelques antennes de sources en champ libre.
2
Pour la WFS, la reproduction d’une onde plane peut paraître comme un abus de langage puisqu’elle cor-
respond, en fait, à une section plane horizontale d’une onde cylindrique (puisque l’antenne de reproduction est
linéaire). Dans ce plan horizontal, la distribution de phase d’une onde cylindrique correspond à la distribution de
phase d’une onde plane, d’où l’usage de l’expression «onde plane» pour décrire une telle onde dans le contexte de
la WFS.
43
4.2.1 Distribution de la réponse en fréquence dans un espace infini
La seule présence de deux sources en champ libre introduit un effet de filtre en peigne qui
varie selon la position du point d’évaluation de la réponse. La figure 4.1 (p. 45) présente la
configuration introduite pour illustrer simplement cette idée. Pour les capteurs et les sources, la
distance de séparation est 0.175 m. Sur cette figure, et les suivantes du même type, les points
noirs représentent des points de mesure ou d’évaluation de la pression alors que les carrés cochés
représentent des sources acoustiques, des monopôles dans ce cas. La figure 4.3 (p. 45) présente
les FRF (Fonctions de Réponse en Fréquence) lorsque les deux monopôles sont alimentés en
phase, c’est-à-dire d’amplitudes monopolaires complexes égales. L’entrée du système corres-
pond à l’alimentation des sources (qui est unique pour toutes les sources) et la sortie correspond
à la pression mesurée, ou évaluée, aux différents points de mesure. Pour ces simulations, les
sources sont modélisées comme des monopôles acoustiques pour lesquels l’amplitude monopo-
laire était unitaire en fonction de la fréquence de telle sorte que le champ acoustique rayonné
par une telle source soit
p(x) = S
e
jkr
r
. (4.1)
Pour cette équation, qui suppose une oscillation harmonique dans le temps, k = ω/c [rad/m]
est le nombre d’ondes, ω [rad/s] est la pulsation d’intérêt, c [m/s] la vitesse de phase du son
dans l’air, r [m] la distance entre la source et le point d’évaluation x de la pression acoustique
p [Pa] et S [kg/s
2
] l’amplitude monopolaire de la source [Morse, 1953; Pierce, 1991]. Le champ
acoustique produit par une série de sources d’amplitudes monopolaires égales à S est donc
p(x) = S

L
l=1
e
jkr
l
r
l
. Les FRF sont alors issues des ratios p(x)/S [Pa s
2
/kg →1/m].
Avec ce simple exemple, la figure 4.3 (p. 45) démontre l’apparition d’un filtre en peigne
dont l’allure change selon la position du capteur d’intérêt. Dans ce cas, avec deux sources seule-
ment, le capteur central offre une réponse en fréquences constante étant donnée la symétrie de la
position des sources par rapport à la position de ce capteur. L’illustration 4.3 (p. 45) montre l’im-
portante influence mutuelle que peuvent avoir deux sources, et ce même en champ libre. Cette
influence fait apparaître des fluctuations dans les fonctions de réponse en fréquence. Des fluc-
tuations qui changent selon la position d’intérêt et qui sont, du point de vue de la reproduction
(même dans le cas de base de la stéréophonie à deux canaux), indésirables, quoique atténuées ou
déformées par l’effet d’une salle d’écoute réelle qui n’est jamais un lieu anéchoïque [Rumsey,
2001].
Lorsque le nombre de sources devient plus important, et donc plus proche d’une réelle ap-
44
−2 −1 0 1 2
−0.5
0
0.5
1
1.5
2
2.5
x
1
[m]
x
2

[
m
]
Figure 4.1 Configuration en champ libre
utilisée pour la simulation du filtre en peigne
avec une distance de séparation de 0.175 m.
−2 −1 0 1 2
−0.5
0
0.5
1
1.5
2
2.5
x
1
[m]
x
2

[
m
]
Figure 4.2 Deuxième configuration en champ
libre utilisée pour la simulation du filtre en
peigne avec une distance de séparation de
0.175 m.
Figure 4.3 Gains des réponses en fréquence pour la configuration présentée à la figure 4.1 (p.
45)
plication élémentaire de la WFS [Gauthier et al., 2005a], comme pour le cas présenté à la figure
4.2 (p. 45)
3
, les FRF deviennent nettement plus complexes selon l’axe des fréquences comme le
montre la figure 4.4 (p. 46).
Afin de mieux identifier les phénomènes impliqués par les résultats de simulation de la figure
4.4 (p. 46), la figure 4.5 (p. 47) présente de différentes façons la FRF du capteur central uni-
quement. D’emblée, on note deux phénomènes importants. D’abord, l’interférence constructive
en basses fréquences est telle que les sources acoustiques agissent comme une source cylin-
3
La distance de séparation des sources et des capteurs est toujours de 0.175m.
45
Figure 4.4 Gain des réponses en fréquence pour la configuration présentée à la figure 4.2 (p.
45)
drique unique (ou continue) dont l’amplitude est plus importante étant donnée la contribution
cumulative des sources qui, en comparaison avec la longueur d’onde en basses fréquences, sont
essentiellement au même point lorsque la fréquence diminue. Comme il sera possible de le
voir plus loin, cette tendance converge vers un filtre de -3 dB/octave au fur et à mesure que le
nombre de sources de reproduction est augmenté. Sur les figures 4.5 (p. 47) et 4.6 (p. 47) qui
expriment le gain [p/S[ en décibels, cette courbe de -3 dB/octave est introduite par le biais d’un
trait mince de type discontinu et pointillé pour illustrer cette convergence
4
. On peut aisément
observer cette convergence à la figure 4.6 (p. 47) qui présente la FRF pour le capteur central
(voir la figure 4.2 (p. 45) pour la position des points de mesure) lorsque celui-ci fait face à cent
sources formant un réseau linéaire. Cette tendance est habituellement compensée par la WFS
grâce à l’introduction d’un filtre de type +3 dB/octave (causé par le terme
_
jk/2π dans les
opérateurs de synthèse WFS présentés au tableau A.1 à la page 338)
5
.
Toujours selon la figure 4.6 (p. 47), il est clair que la distance séparant les sources (0.175 m
dans ce cas) détermine la fréquence à partir de laquelle le filtre en peigne devient effectif. C’est
à partir de cette fréquence que, d’un mode d’interférence principalement constructif, on passe à
un mode d’interférence destructif et constructif. Cette fréquence de transition est définie comme
la fréquence de repliement spatial pour la WFS.
4
On note par contre que la position verticale de la courbe est ajustée manuellement pour fin de comparaison
visuelle.
5
Sachant que la WFS découle de la formulation intégrale de Kirchhoff-Helmholtz, on note au passage que
le fait que des monopôles de reproduction soient alimentés par le gradient de pression (attribuable à une source
virtuelle) introduit naturellement et partiellement (le reste est attribuable à l’approximation par la méthode de la
phase stationnaire) le terme
_
jk/2π dans les opérateurs de synthèse de la WFS.
46
10
1
10
2
10
3
10
4
0
2
4
6
8
Freq. [Hz]
|
p
/
S
|

[
1
/
m
]
10
1
10
2
10
3
10
4
−40
−30
−20
−10
0
10
20
Freq. [Hz]
G
a
i
n

|
p
/
S
|

[
d
B

r
e
f

1
]
≈ 945Hz → ← ≈ 1890Hz
Figure 4.5 Gain de la réponse en fréquence du
capteur central pour la configuration de la
figure 4.2 (p. 45).
10
1
10
2
10
3
10
4
0
5
10
15
20
25
Freq. [Hz]
|
p
/
S
|

[
1
/
m
]
10
1
10
2
10
3
10
4
−30
−20
−10
0
10
20
30
Freq. [Hz]
G
a
i
n

|
p
/
S
|

[
d
B

r
e
f

1
]
≈ 945Hz → ← ≈ 1890Hz
Figure 4.6 Gain de la réponse en fréquence du
capteur central pour une configuration
semblable à celle de la figure 4.2 (p. 45) avec
100 sources séparées par 0.175 m le long de x
1
.
La longueur d’onde correspondant à la séparation des sources donne environ 1890 Hz dans
le cas de la figure 4.6 (p. 47). Pour la WFS, la limite supérieure en fréquence est traduite par
le besoin d’avoir au moins deux sources par longueur d’onde, ce qui donne environ 945 Hz
[Verheijen, 1998]. Ce dernier critère au sujet de l’échantillonnage spatial est le plus sévère de
ceux qui existent [Corteel, 2006b; Spors et Rabenstein, 2006] : il est en effet bien connu que
la fréquence de repliement spatial est aussi dépendante de la forme de l’antenne de sources
(circulaire ou linéaire), de la direction de propagation du champ acoustique à reproduire et de
l’uniformité de la distance de séparation des sources de reproduction [Corteel, 2006b]. Si, de ces
aspects, il n’est conservé que celui en lien avec la direction de propagation du champ acoustique
à reproduire, on utilise le critère suivant pour les antennes linéaires de sources acoustiques
[Spors et Rabenstein, 2006]
f
repliement
=
c

l
(1 +[ cos θ[)
(4.2)
où la fréquence de repliement est en Hz, c est la vitesse du son [m/s], ∆
l
[m] est la distance de
séparation des sources et θ [rad] l’angle d’incidence d’une onde plane à reproduire par rapport à
l’antenne linéaire de sources
6
. Au-delà de cette fréquence de repliement spatial, on note l’appa-
rition d’ondes planes supplémentaires qui ne correspondent pas à la direction de propagation de
l’onde plane à reproduire [Spors et Rabenstein, 2006]. Les directions de propagation et la quan-
tité de ces ondes planes indésirables varient avec la fréquence et, selon le point d’observation,
6
Avec θ = 0 ou θ = π, on obtient une onde rasante alors qu’avec θ = π/2 on obtient une onde dont la direction
de propagation est perpendiculaire à l’antenne linéaire.
47
viennent modifier les FRFs, comme on peut le voir à la figure 4.6 (p. 47). Pour 0 ≤ θ ≤ π, on
trouve, selon l’équation (4.2), que la fréquence de repliement est environ comprise entre 945 Hz
et 1890 Hz alors que le dénominateur varie de ∆
l
à 2∆
l
. La règle sévère mentionnée plus tôt
donne 945 Hz pour des ondes rasantes. Dans le cas considéré, toutes les sources sont en phase
pour produire une onde plane de propagation perpendiculaire à l’antenne (θ = π/2), on trouve
la fréquence de repliement de 1890 Hz, c’est cette fréquence qui correspond bien à la zone de
transition identifiée à la figure 4.6 (p. 47). De façon générale, et pour la suite de cette thèse,
la définition de la fréquence de repliement sera la plus sévère et donc exigera deux sources de
reproduction par longueur d’onde. Cette règle est privilégiée de telle sorte qu’elle évite, pour
tous les cas de position et de type de sources virtuelles en relation avec les sources de repro-
duction, les imperfections de repliement spatial imputables à un sous-échantillonnage spatial au
niveau de l’antenne de sources. Cette définition plus stricte de la fréquence de repliement spatial
correspond à la définition classique du théorème d’échantillonnage spatial dans la théorie des
réseaux de sources et de capteurs [Ziomek, 1995].
Cette brève remarque au sujet des plages de fréquences effectives en relation avec la sépara-
tion des sources permet de faire valoir que pour la plage d’intérêt pour la WFS, les pointes et les
crevasses les plus néfastes sont au-delà de la plage de fréquence effective pour la WFS ; plage
de fréquences délimitée par la fréquence de repliement spatial. Certaines fluctuations demeurent
néanmoins présentes dans cette plage effective ; tel qu’il est possible de le voir à la figure 4.5 (p.
47) pour un nombre de sources plus réaliste. Ce genre de fluctuations est fonction (1) du nombre
de sources de reproduction impliquées lors de la reproduction d’une source virtuelle donnée et
(2) des effets de bords attribuables à l’usage d’une antenne de sources finie dans l’espace. Plus
de détails au sujet des effets de bords sont présentés plus loin. Si l’on ne tient pas compte de la
construction des basses fréquences, on peut voir des fluctuations d’environ 2 ou 3 décibels à la
figure 4.5 (p. 47). Dans le cas de la reproduction en salle, ces fluctuations seront ajoutées aux
fluctuations attribuables à la réponse de la salle de reproduction. Une première cause de fluc-
tuations indésirables de la réponse en fréquence est donc identifiée et liée aux effets d’antenne
discrète tronquée. Finalement, en terme de perception spatiale du son, la distribution précise
de la pression (amplitude et phase) dans l’espace n’est pas si importante au-delà de 1890 Hz
puisque pour les fréquences plus élevées ce sont les différences temporelles interaurales des
enveloppes qui priment, et non pas les retards temporels entre les fines structures des signaux
binauraux [Blauert, 1999]. C’est plutôt l’allure de la FRF – attribuable aux filtres en peigne
créés par l’antenne de sources – qui pourra causer des problèmes, des colorations indésirables
dans ce cas. Ces fluctuations drastiques peuvent être supplantées par la présence de la salle de
reproduction [Rumsey, 2001].
48
4.2.2 Multi-tracés des réponses à l’impulsion dans l’espace
Dans le domaine temporel, l’effet de filtre en peigne et, en conséquence, des jeux d’inter-
férence apparaissent sous la forme d’une série d’impulsions discrètes à intervalles irréguliers.
C’est ce qui est présenté par la figure 4.7 (p. 50) pour le capteur central de la configuration
de la figure 4.2 (p. 45). La partie du bas de la figure présente un agrandissement sur les 150
échantillons sur lesquels s’étend la partie significative de la réponse à l’impulsion de l’antenne
de sources. Sur cette figure, des échos distincts sont clairement visibles
7
. Cette figure permet
l’observation d’un fait important au sujet de l’échantillonnage spatial au niveau des sources : un
échantillonnage spatial régulier implique un échantillonnage temporel irrégulier et variable se-
lon la position du point de mesure [Corteel, 2006b]. C’est en particulier les dernières impulsions
du groupe qui, étant les plus distancées dans le temps, abaissent la fréquence de repliement spa-
tial formulée d’un point de vue temporel (c’est la principale distinction entre les approches de
Spors [Spors et Rabenstein, 2006] et de Corteel [Corteel, 2006b] ; en ce qui a trait à la définition
de l’apparition du repliement spatial, ces approches ne sont pas incompatibles).
Face à une telle antenne de sources toutes soumises à la même impulsion comme entrée,
un auditeur ne percevrait pas d’échos discrets puisque la réponse et les échos s’étendent sur
environ 50 échantillons avec une fréquence d’échantillonnage de 40 kHz, ce qui donne environ
1.3 ms. Selon les études psycho-acoustiques de la perception spatiale du son, le seuil d’audition
de l’écho est environ 30 ms ou 40 ms [Blauert, 1999], ce qui explique que l’effet de ces échos ne
sera essentiellement perçu que par la coloration, dite en peigne, de la réponse en fréquence. Dans
une telle situation, le mécanisme de localisation serait plutôt basé sur la localisation additive ou
l’effet de précédence [Blauert, 1999].
La figure 4.8 (p. 50) introduit le même type de résultat de simulation pour les 9 capteurs dans
la configuration de la figure 4.2 (p. 45). D’un point de vue objectif, il est clair, selon la figure 4.8
(p. 50) (a) qu’un front d’onde plan n’est pas exactement produit par une telle antenne. Pourtant,
c’est ce type d’alimentation et de configuration qui serait utilisé pour la WFS pour produire
un front d’onde plan dans le plan horizontal. La partie (b) de la figure 4.8 (p. 50) introduit les
réponses impulsionnelles qui représentent la plage de 0 à 945 Hz alors que la partie (c) présente
la plage de 945 à 20000 Hz. Ainsi, pour la plage de fréquences délimitée par l’effet de repliement
spatial (au moins deux sources par longueur d’onde, selon le critère le plus sévère, ce qui donne
7
Étant donné que les échos discrets (d’une largeur de bande limitée par la discrétisation du signal) ne tombent
pas directement sur la grille d’échantillonnage (pour des valeurs d’échantillon entières), certaines impulsions se
retrouvent distribuées sur les échantillons voisins selon le principe des délais fractionnaires.
49
0 100 200 300 400 500
−0.4
−0.2
0
0.2
0.4
0.6
0.8
Échantillons
R
é
p
.

i
m
p
.

[
1
/
m
]
200 250 300 350
−0.4
−0.2
0
0.2
0.4
0.6
0.8
Échantillons
R
é
p
.

i
m
p
.

[
1
/
m
]
← zoom
Figure 4.7 Réponse impulsionnelle évaluée
pour le capteur central (fréquence
d’échantillonnage : 40 kHz, la configuration est
présentée à la figure 4.2 (p. 45)).
−0.7
−0.525
−0.35
−0.175
0
0.175
0.35
0.525
0.7
5
6
7
8
9
x 10
−3
0
0.5
1
x
1
[m]
Temps [s]
R
é
p
.

i
m
p
.

[
1
/
m
]
−0.7
−0.525
−0.35
−0.175
0
0.175
0.35
0.525
0.7
5
6
7
8
9
x 10
−3
0
0.5
1
x
1
[m]
Temps [s]
R
é
p
.

i
m
p
.

[
1
/
m
]
−0.7
−0.525
−0.35
−0.175
0
0.175
0.35
0.525
0.7
5
6
7
8
9
x 10
−3
0
0.5
1
x
1
[m]
Temps [s]
R
é
p
.

i
m
p
.

[
1
/
m
]
(a)
(b)
(c)
Figure 4.8 Réponses impulsionnelles évaluées
pour les sources de la configuration présentée à
la figure 4.2 (p. 45) (fréquence
d’échantillonnage : 40 kHz, le trait pointillé
présente le temps de propagation sur 2 m à
331 m/s).
50
environ 945 Hz), un front d’onde plan peut être reconstruit. Pour l’ensemble des travaux de
recherche qui suivent, cette limite en fréquence, définie par la fréquence de repliement spatial,
détermine la plage de fréquences d’intérêt. Cet exemple illustre le principe de la WFS tel que
développée à l’annexe A.
4.3 Simulations et études de la WFS en champ libre
Afin de mieux cerner les effets d’antenne discrète et finie décrits plus haut dans le cas de la
reproduction de champs acoustiques par la WFS, quelques simulations de la WFS sont intro-
duites. La configuration utilisée pour la simulation de la WFS en champ libre est présentée à la
figure 4.9 (p. 52). C’est la même disposition relative que celle introduite à la figure 4.1 (p. 45)
sauf que les positions des sources virtuelles sont identifiées à la figure 4.9 (p. 52) par les lettres
(a), (b) et (c).
4.3.1 Distribution de la réponse en fréquence dans l’espace et effet de la position de la source
virtuelle pour un réseau linéaire de sources de reproduction
Les figures 4.10 (p. 52) à 4.12 (p. 54) présentent les pressions acoustiques reproduites par
WFS aux différents capteurs en fonction de la fréquence pour les trois positions de source vir-
tuelle. Ces pressions reproduites sont plutôt exprimées sous la forme des gains des FRF [1/m].
En comparaison avec les simulations de la section précédente, celles ici introduites au su-
jet de la WFS présentent des caractéristiques générales similaires. Ces caractéristiques sont
pratiquement toutes issues des interférences attribuables à l’existence d’un réseau de sources
discrètes. En gros, il est possible de distinguer deux phénomènes sur les figures 4.10 (p. 52) à
4.12 (p. 54).
D’abord, même sous la fréquence de repliement spatial de la WFS (environ 945 Hz), cer-
taines fluctuations sont observables et, notamment, plus importantes dans le cas où la source
virtuelle est éloignée de l’antenne de sources de reproduction (position virtuelle (a)). Dans ce
cas, les alimentations respectives des sources de reproduction sont presque toutes les mêmes et
conséquemment proches des cas étudiés à la section précédente au sujet des antennes de sources
en phase. Plus la position de la source virtuelle approche la position de l’antenne de sources de
51
−4 −2 0 2 4
0
1
2
3
4
5
6
7
x
1
[m]
x
2

[
m
]
(a)
(b)
(c)
Figure 4.9 Configuration utilisée pour la
simulation de la WFS en champ libre avec trois
positions de sources virtuelles (en aval,
c’est-à-dire derrière les sources de
reproduction) indiquées par des triangles (la
distance de séparation des sources et des
capteurs est toujours de 0.175 m).
Figure 4.10 Gain de la réponse en fréquence
aux capteurs pour la configuration de la figure
4.9 (p. 52) avec une source virtuelle en (a).
reproduction, moins l’effet de filtre en peigne est important. Ce qui était prévisible puisque
plus la source virtuelle est proche de l’antenne de sources de reproduction moins de sources de
reproduction sont impliquées pour la création du champ attribuable à la source virtuelle. Ces
remarques sont supportées plus aisément par l’observation des quatre graphiques de la figure
4.13 (p. 54). En plus des trois positions de sources virtuelles (a), (b) et (c), le quatrième gra-
phique illustre la FRF obtenue lorsque la source virtuelle est seulement à 2.5 cm à l’arrière de
l’antenne des sources. La figure 4.13 (p. 54) illustre clairement aussi un autre phénomène propre
à la WFS en fonction de la position de la source virtuelle en comparaison avec la FRF simulée
pour la source virtuelle. Ainsi, quoique la proximité de la source virtuelle introduise la souhai-
table réduction de l’effet de filtre en peigne, la FRF (sous la fréquence de repliement spatial, soit
945 Hz) converge vers un gain de +3 dB/octave directement issu de la définition des opérateurs
de synthèse de la WFS (voir le tableau A.1). Ce qui n’était pas le cas avec la source virtuelle la
plus éloignée puisque, quoique présentant un filtre en peigne plus important, les oscillations de
la FRF se trouvaient autour d’une droite horizontale. Cette forte coloration de +3 dB/octave,
assurément indésirable dans un contexte de reproduction audio, est une conséquence de l’hypo-
thèse de grande distance relative entre la source virtuelle et les sources de reproduction
8
. Dans
8
La section A.5 à la page 327 donne tous les détails sur la construction classique des opérateurs de synthèse de
la WFS.
52
Figure 4.11 Gain de la réponse en fréquence aux capteurs pour la configuration de la figure
4.9 (p. 52) avec une source virtuelle en (b).
le développement des opérateurs de synthèse, on assume en effet que la distance entre ces deux
types de sources est grande en comparaison avec la longueur d’onde d’intérêt. Ce qui n’est évi-
demment pas le cas avec une source virtuelle dont la proximité avec les sources de reproduction
est considérable, comme pour la dernière illustration de la figure 4.13 (p. 54). Ainsi, malgré le
fait que la WFS ne soit pas physiquement valide lorsque les sources virtuelles et les sources de
reproduction sont proches, la technologie actuelle de la WFS est tout de même utilisée pour réa-
liser de telles sources virtuelles puisque c’est l’utilisateur final qui place les sources virtuelles.
Les remarques précédentes ont donc illustré deux déformations nuisibles des FRF attri-
buables à la position de sources virtuelles reproduites par WFS. Ces deux modifications pourront
donc expliquer une part des imperfections observables dans les mesures expérimentales de la
reproduction de champs acoustiques par WFS. On note aussi que ces déformations de la ré-
ponse en fréquence peuvent donc être d’autres objectifs d’amélioration de la WFS par contrôle.
D’autres détails sont donnés à la section 4.4.
En salle, de tels effets de filtre en peigne peuvent être atténués. Par contre, un gain de
+3 dB/octave (alors que la source virtuelle est proche de l’antenne de sources de reproduc-
tion) sera assurément perceptible au travers de sa combinaison avec la réponse en fréquence de
la salle de reproduction.
53
Figure 4.12 Gain de la réponse en fréquence aux capteurs pour la configuration de la figure
4.9 (p. 52) avec une source virtuelle en (c).
0 1000 2000 3000 4000
−30
−20
−10
0
10
G
a
i
n

|
p
/
S
|

[
d
B

r
e
f

1
]
0 1000 2000 3000 4000
−30
−20
−10
0
10
G
a
i
n

|
p
/
S
|

[
d
B

r
e
f

1
]
0 1000 2000 3000 4000
−30
−20
−10
0
10
G
a
i
n

|
p
/
S
|

[
d
B

r
e
f

1
]
0 1000 2000 3000 4000
−30
−20
−10
0
10
Fréq. [Hz]
G
a
i
n

|
p
/
S
|

[
d
B

r
e
f

1
]
FRF pour les WFS
FRF pour les sources virtuelles
0 1000 2000 3000 4000
0
200
400
600
P
h
a
s
e

[
r
a
d
]
0 1000 2000 3000 4000
0
200
400
600
0 1000 2000 3000 4000
0
200
400
600
0 1000 2000 3000 4000
0
200
400
600
Phases des FRF
≈ 945Hz → ← ≈ 1890Hz
Position virtuelle (a) ((0,7,0) [m])
Position virtuelle (b) ((0,4,0) [m])
Position virtuelle (c) ((0,2.5,0) [m])
Position virtuelle (0,2.025,0) [m]

P
h
a
s
e

[
r
a
d
]


P
h
a
s
e

[
r
a
d
]
P
h
a
s
e

[
r
a
d
]

Figure 4.13 Gain de la réponse en fréquence
au capteur central pour la configuration de la
figure 4.9 (p. 52) avec des sources virtuelles en
(a), (b), (c) et (0,2.025,0) [m].
−0.7
−0.525
−0.35
−0.175
0
0.175
0.35
0.525
0.7
0.019
0.02
0.021
0.022
0.023
0.024
0.025
−0.2
0
0.2
x
1
[m]
Temps [s]
R
é
p
.

i
m
p
.

v
i
r
t
u
e
l
l
e

[
1
/
m
]
Figure 4.14 Réponses impulsionnelles
virtuelles (de la source monopolaire virtuelle,
position virtuelle (a) à la figure 4.9 (p. 52),
fréquence d’échantillonnage : 40 kHz).
54
4.3.2 Multi-tracés des réponses impulsionnelles dans l’espace infini
Cette section introduit les réponses temporelles des réponses en fréquences illustrées à la
section précédente.
Le premier cas considéré est présenté à la figure 4.14 (p. 54). Laquelle illustre la réponse
impulsionnelle de l’antenne de capteurs simulée pour la source monopolaire virtuelle. Sur cette
figure, deux lignes supplémentaires (les traits plus fins) sont introduites pour illustrer le temps
d’arrivée d’un front d’onde virtuel et l’amplitude du front d’onde virtuel
9
. Ce genre de lignes
est aussi introduit sur les prochaines figures.
Suivant la simulation de la reproduction d’une source virtuelle placée en (a) (selon la confi-
guration de la figure 4.9 (p. 52)) qui produit un champ acoustique impulsionnel illustré à la
figure 4.14 (p. 54), la figure 4.15 (p. 56) présente les réponses impulsionnelles produites par un
système de WFS en champ libre. Sur cette figure, la réponse à l’impulsion est divisée en deux
bandes de fréquences ((b) 0 à environ 976 Hz et (c) 976 Hz à 20 kHz, on retient 976 Hz qui est
proche de la fréquence de repliement selon le critère le plus strict). Comme on peut le voir sur
l’ensemble des trois graphiques de la figure 4.15 (p. 56), les basses fréquences du front d’onde
sont convenablement reproduites, notamment au niveau de la courbure et du temps d’arrivée du
front d’onde. Au-delà de la fréquence de repliement spatial, le front d’onde n’est pas conve-
nablement reproduit : des échos discrets apparaissent étant donné que la densité du réseau de
sources de reproduction n’est pas suffisante pour que les plus hautes fréquences forment, par
interférence constructive, le front d’onde virtuel. Sur toute la plage de fréquences, on sait aussi
que l’effet de l’ouverture spatiale finie de l’antenne produit des ondes de diffraction (provenant
des extrémités de l’antenne) qui suivent le passage du front d’onde reconstruit. On note au pas-
sage que, pour ces simulations en champ libre, l’antenne de capteurs utilisée ne présente pas
d’ambiguïté d’incidence étant donné : (1) la connaissance a priori du système en jeu, (2) la pré-
sence de sources d’un seul côté de l’antenne et (3) le fait que les sources et les capteurs habitent
le même plan horizontal. Ce qui permet les conclusions suivantes. Lors des expérimentations,
des phénomènes d’ambiguïté d’incidence surgissent puisque l’antenne de capteurs ne voit pas
de différence entre un front d’onde arrivant de l’avant ou de l’arrière ni même un front d’onde
9
Il est intéressant de noter au passage que même lors de l’évaluation des réponses impulsionnelles pour la
source virtuelle, les amplitudes des réponses ne correspondent pas exactement aux deux lignes introduites pour
illustrer le temps d’arrivée et l’amplitude du front d’onde produit par la source virtuelle. Cette différence s’ex-
plique simplement puisque les retards temporels ne sont pas nécessairement des multiples entiers de la période
d’échantillonnage. La section A.7.1 présente plus de détails à ce sujet
55
−0.7
−0.525
−0.35
−0.175
0
0.175
0.35
0.525
0.7
0.019
0.02
0.021
0.022
0.023
0.024
0.025
−0.2
0
0.2
x
1
[m]
Temps [s]
R
é
p
.

i
m
p
.

[
1
/
m
]
−0.7
−0.525
−0.35
−0.175
0
0.175
0.35
0.525
0.7
0.019
0.02
0.021
0.022
0.023
0.024
0.025
−0.01
0
0.01
x
1
[m]
Temps [s]
R
é
p
.

i
m
p
.

[
1
/
m
]
−0.7
−0.525
−0.35
−0.175
0
0.175
0.35
0.525
0.7
0.019
0.02
0.021
0.022
0.023
0.024
0.025
−0.2
0
0.2
x
1
[m]
Temps [s]
R
é
p
.

i
m
p
.

[
1
/
m
]
(a)
(b)
(c)
Figure 4.15 Réponses impulsionnelles pour la
WFS lors de la reproduction du front d’onde de
la figure 4.14 (p. 54). (a) Plage de 0 à 20 kHz,
(b) 0 à 976 Hz (environ) et (c) 976 Hz (environ)
à 20 kHz.
0.019 0.02 0.021 0.022 0.023 0.024 0.025
−2
0
2
4
6
x 10
−3
R
é
p
.

i
m
p
.

[
1
/
m
]
0.019 0.02 0.021 0.022 0.023 0.024 0.025
−2
0
2
4
6
x 10
−3
R
é
p
.

i
m
p
.

[
1
/
m
]
0.019 0.02 0.021 0.022 0.023 0.024 0.025
−2
0
2
4
6
x 10
−3
R
é
p
.

i
m
p
.

[
1
/
m
]
0.019 0.02 0.021 0.022 0.023 0.024 0.025
−2
0
2
4
6
x 10
−3
R
é
p
.

i
m
p
.

[
1
/
m
]
0.019 0.02 0.021 0.022 0.023 0.024 0.025
−2
0
2
4
6
x 10
−3
Temps [s]
R
é
p
.

i
m
p
.

[
1
/
m
]
Capteur #1 (−0.7, 0, 0) [m]
Capteur #2 (−0.525, 0, 0) [m]
Capteur #3 (−0.35, 0, 0) [m]
Capteur #4 (−0.175, 0, 0) [m]
Capteur #5 (0, 0, 0) [m]
Figure 4.16 Comparaison des réponses
impulsionnelles (dans la plage de fréquences
de 0 à 976 Hz) reproduites et virtuelles. Les
traits épais représentent les réponses
impulsionnelles reproduites et les traits fins, les
réponses impulsionnelles à reproduire.
arrivant à l’antenne avec une certaine élévation par rapport au plan horizontal des sources et des
capteurs. Ce sont des ambiguïtés triviales [Manikas et Proukakis, 1998], propres à une antenne
de capteurs omnidirectionels linéaire, qui empêchent la possibilité de conclure sur la direction
d’arrivée d’une réflexion. Il est par contre, pour le cas traité, possible de conclure sur cette di-
rection d’arrivée puisque que la direction d’incidence du premier front d’onde (le son direct)
arrive évidemment de l’avant.
56
Afin de mieux apprécier la correspondance de la reproduction d’un front limité à 976 Hz
(une fréquence choisie pour sa proximité à la fréquence de repliement spatial) la figure 4.16 (p.
56) présente des versions agrandies des réponses impulsionnelles des cinq premiers capteurs.
Comme le montre cette figure en cinq illustrations, le front d’onde est convenablement reproduit
mais une légère coloration est introduite suivant le passage de l’impulsion principale.
De la même façon, la figure 4.18 (p. 58) introduit des simulations de la WFS en champ libre
dans le domaine temporel pour une source virtuelle située en (c). Cette fois, les échos produits
par une cumulation de sources discrètes sont moins importants (l’amplitude des échos suivant
la première impulsion est plus faible et réduit l’importance du filtre en peigne) comme il est
possible de le voir par l’allure de la traînée des réponses présentées à la figure 4.17 (p. 58) (a) en
comparaison avec la figure 4.17 (p. 58) (b). Ainsi, tel que le présentent les figures 4.17 (p. 58)
(b) et 4.18 (p. 58), le front d’onde, et sa courbure maintenant plus importante pour la position
virtuelle (c), est bel et bien reproduit dans la plage de fréquences effective en WFS (cette fois,
c’est 940 Hz qui est utilisée comme approximation de la fréquence de repliement). Ce qui n’est
pas le cas en plus hautes fréquences alors que les échos discrets introduisent une coloration déjà
commentée à la section précédente. Par contre, comme on peut le voir à la figure 4.18 (p. 58),
une certaine erreur d’amplitude de reproduction est visible. Cette erreur est essentiellement at-
tribuable au filtre +3 dB/octave (qui atténue une part des basses fréquences) dont l’effet devient
nuisible lorsque la source virtuelle est trop proche des sources de reproduction et ne respecte
plus ainsi une des hypothèses sollicitées lors de l’édification des opérateurs de synthèse de la
WFS
10
.
En gros, au sujet de l’effet de l’utilisation d’un réseau de sources discrètes pour la recons-
truction des champs acoustiques par WFS classique, il est possible de conclure sur les points
qui suivent.
– L’usage de sources discrètes introduit une coloration fréquentielle de type filtre en peigne
qui varie selon la positions de la source virtuelle et selon la densité spatiale de sources de
reproduction.
– L’usage de sources discrètes introduit une coloration fréquentielle (+3 dB/octave) lorsque
la source virtuelle est proche des sources de reproduction.
– L’usage de sources discrètes reproduit convenablement un front d’onde en basses fré-
quences, pour les plus hautes fréquences des échos discrets résultent du repliement spatial
10
C’est à la section A.5 qu’il est possible de voir comment cette hypothèse s’inscrit dans le développement des
opérateurs de synthèse de la WFS.
57
−0.7
−0.525
−0.35
−0.175
0
0.175
0.35
0.525
0.7
6
7
8
9
10
11
12
13
x 10
−3
−1
0
1
x
1
[m]
Temps [s]
R
é
p
.

i
m
p
.

[
1
/
m
]
−0.7
−0.525
−0.35
−0.175
0
0.175
0.35
0.525
0.7
6
7
8
9
10
11
12
13
x 10
−3
−0.01
0
0.01
x
1
[m]
Temps [s]
R
é
p
.

i
m
p
.

[
1
/
m
]
−0.7
−0.525
−0.35
−0.175
0
0.175
0.35
0.525
0.7
6
7
8
9
10
11
12
13
x 10
−3
−1
0
1
x
1
[m]
Temps [s]
R
é
p
.

i
m
p
.

[
1
/
m
]
(a)
(b)
(c)
Figure 4.17 Réponses impulsionnelles pour la
WFS lors de la reproduction du front d’onde de
la figure 4.14 (p. 54). (a) Plage de 0 à 20 kHz,
(b) 0 à 940 Hz et (c) 940 Hz à 20 kHz.
6 7 8 9 10 11 12 13
x 10
−3
−5
0
5
10
x 10
−3
R
é
p
.

i
m
p
.

[
1
/
m
]
6 7 8 9 10 11 12 13
x 10
−3
−5
0
5
10
x 10
−3
R
é
p
.

i
m
p
.

[
1
/
m
]
6 7 8 9 10 11 12 13
x 10
−3
−5
0
5
10
x 10
−3
R
é
p
.

i
m
p
.

[
1
/
m
]
6 7 8 9 10 11 12 13
x 10
−3
−5
0
5
10
x 10
−3
R
é
p
.

i
m
p
.

[
1
/
m
]
6 7 8 9 10 11 12 13
x 10
−3
−5
0
5
10
x 10
−3
Temps [s]
R
é
p
.

i
m
p
.

[
1
/
m
]
Capteur #1 (−0.7, 0, 0) [m]
Capteur #2 (−0.525, 0, 0) [m]
Capteur #3 (−0.35, 0, 0) [m]
Capteur #4 (−0.175, 0, 0) [m]
Capteur #5 (0, 0, 0) [m]
Figure 4.18 Comparaison des réponses
impulsionnelles (dans la plage de fréquences
de 0 à 940 Hz) reproduites et virtuelles.
58
causé par un sous-échantillonnage spatial au niveau des sources de reproduction.
Ces points peuvent, parmi d’autres facteurs, expliquer les erreurs de reproduction en salle
qui seront notables à la section suivante. Cette courte analyse par le biais de simulations théo-
riques permettra donc de mieux interpréter les mesures expérimentales. Finalement, ces lacunes
sont aussi des points dignes d’attention dans le cadre de cette thèse puisqu’elles pourraient être
sujettes à certaines améliorations par le biais du contrôle actif et donc du filtrage adaptatif. La
section suivante présente deux modifications simples de la WFS pour améliorer la qualité du
champ reproduit (toujours dans le cas de l’étude en champ libre).
4.4 Atténuation des effets de bord en WFS et choix de la ligne de référence
Une des causes de l’imperfection des fonctions de réponse en fréquence obtenue pour la
WFS est issue de l’effet de bord. C’est-à-dire une conséquence directe de l’usage d’une ligne
de sources de reproduction finie [Ziomek, 1995] et non pas infinie comme l’assume le déve-
loppement des opérateurs de la WFS. Dans ce cas, les sources de reproduction à l’extrémité de
l’antenne finie produiront des ondes de diffraction
11
indésirables.
Pour amenuiser ces effets de bord, une fenêtre spatiale est habituellement appliquée pour
réduire progressivement l’amplitude des sources de reproduction aux extrémités du réseau de
sources sollicitées pour la reproduction d’une source virtuelle donnée à l’aide de la WFS. La
fenêtre mise de l’avant par Verheijen [Verheijen, 1998] est une fenêtre rectangulaire dont les
extrémités (s’étalant sur un mètre environ) sont deux moitiés d’une fenêtre de Hanning.
Pour illustrer cet effet de bord et l’utilisation d’une telle fenêtre, la figure 4.19 (p. 60) pré-
sente les FRF résultant de la WFS (comme dans le cas de la figure 4.10 (p. 52) pour la confi-
guration de la figure 4.9 (p. 52) avec la position de source virtuelle (a)) avec et sans fenêtre
11
On fait référence ici à la production d’ondes de diffraction par analogie avec la réflexion et la diffraction d’un
corps rigide fini exposé à une onde acoustique. Ainsi, en exposant une plaque finie et rigide à une onde acoustique
issue d’une source ponctuelle devant la plaque, on obtient une image (selon la technique des images) de la source
produisant l’onde incidente dans la mesure où la fréquence est suffisamment élevée pour produire un gradient de
pression incidente suffisamment important pour solliciter l’apparition de réflexion et de diffraction afin de respecter
une condition frontière rigide. Par contre, l’image, étant données les dimensions finies de la plaque, ne rayonne pas
pour toutes les directions de telle sorte que suivant un front d’onde produit par l’image devant la plaque, d’autres
fronts surgissent de la périphérie de la plaque. Il y a donc diffraction. Et c’est par analogie que l’on étend le principe
de diffraction des bords à la reproduction de champs acoustiques.
59
Figure 4.19 Comparaison des réponses en fréquence sans (en haut) et avec fenêtre (en bas)
d’atténuation des effets de bord
d’atténuation des effets de bord. Selon cette figure, il est clair qu’une part des effets de filtre en
peigne identifiés à la section 4.3.1 sont donc attribuables aux effets de bord
12
D’un autre côté, ce type de pondération spatiale présente ses limites. Ainsi, lorsque le réseau
de sources de reproduction présente des discontinuités géométriques, il y a d’abrupts change-
ments dans les amplitudes des sources de reproduction et les coins géométriques produisent
aussi des ondes de diffraction puisque les amplitudes aux coins ne sont pas pondérées. Ces
changements d’amplitudes attribuables aux coins géométriques proviennent du fait que le gra-
dient normal de pression virtuelle, qui fait partie de la définition des opérateurs de la WFS à
partir de la formulation intrégale de Kirchhoff-Helmholtz, change étant donnée, justement, la
12
On souligne ici que l’abrupte discontinuité spatiale des amplitudes monopolaires sollicitées pour la recons-
truction d’un champ est la cause des effets de bord. Aux environs de ces discontinuités, d’autres sources devraient
(dans le cas de la ligne infinie) être actives et qui, par interférence avec celles causant les effets de bord, éviteraient
l’apparition de fronts d’onde retardataires qui causent une part des effets de filtre en peigne sous la fréquence de
repliement spatial.
60
−3
−2
−1
0
1
2
3
−1
0
1
2
3
0
0.5
1
x
2
[m]
x
1
[m]
Figure 4.20 Amplitudes des sources de reproduction (représentées par des et multipliées
par 6 pour fins d’illustration) et amplitude de la pondération spatiale (représentée par les plus
gros cercles).
discontinuité de la définition de la normale. La figure 4.20 (p. 61) présente un exemple avec
une antenne de sources brisée. Sur cette figure, les carrés représentent les sources, les pré-
sentent les amplitudes (multipliées par 6 pour fin d’illustration) des sources selon la WFS et les
plus gros cercles illustrent la pondération spatiale décrite au précédent paragraphe. Les courtes
lignes terminées par de petits cercles dans le plan horizontal ne font qu’illustrer l’axe principal
des sources de reproduction de type monopôle
13
. On note aussi que la figure 4.20 (p. 61) pré-
sente des résultats pour une fréquence donnée arbitrairement, sous la fréquence de repliement
spatial. Pour d’autres fréquences, la courbe conserve la même distribution relative des ampli-
tudes, seule l’amplitude générale des sources change. Pour cette raison, cette figure représente
donc un cas générique à l’amplitude près. La source virtuelle n’est pas montrée sur l’illustration.
Elle se trouve à (0, 7, 0) mètres. Les discontinuités dans la distribution spatiale des amplitudes
des sources de reproduction pourront aussi produire des ondes de diffraction indésirables. La
contribution de ce genre de composantes pourrait aussi être réduite par le biais du contrôle actif
de la reproduction par WFS.
Ainsi, quoique des lacunes de reproduction par la WFS furent identifiées à la section 4.3.1,
une part de celles-ci peut être aisément atténuée par l’introduit d’une fenêtre de correction des
amplitudes des sources de reproduction. Il demeure qu’une certaine coloration puisse apparaître,
notamment en fonction de la position de la source virtuelle, tel qu’il le fut introduit à la section
13
Même si on suppose que les sources produisent un rayonnement omnidirectionnel, l’axe principal est important
dans le calcul des opérateurs de la WFS puisqu’il détermine la normale (dans le plan horizontal) à la ligne de sources
de reproduction.
61
−4
−2
0
2
4
0
2
4
0
1
x
2
[m]
x
1
[m]
Ligne de réf. →
← Source virtuelle
Figure 4.21 Configuration d’un système de
WFS avec une ligne de référence linéaire.
−2
−1
0
1
2
3
4
0
1
2
3
4
0
0.5
1
1.5
x
2
[m]
x
1
[m]
L
i
g
n
e

d
e

r
é
f
.



← Source virtuelle
Figure 4.22 Configuration d’un système de
WFS avec une ligne de référence circulaire.
4.3.1. Les ondes de diffraction produites par les coins d’une antenne de sources pourraient aussi
être corrigées par le contrôle actif de la WFS. Toutes les prochaines simulations avancées pour
fin de comparaison avec les mesures de champs reproduits incluent la fenêtre de correction
introduite en cette section, soit deux demi-fenêtres de Hanning aux extrémités du groupe de
sources de reproduction actives (ces demi-fenêtres s’étalent sur une mètre environ).
En plus de l’utilisation d’une pondération spatiale des amplitudes de reproduction pour at-
ténuer les effets de bord, on introduit maintenant quelques notes au sujet du choix de la ligne
de référence. Tel que l’expose la section A.5 à partir de la page 327, le choix de la ligne de
référence intervient dans la définition des opérateurs de synthèse de la WFS. Deux types de
ligne de référence sont habituellement utilisés. Dans le premier cas, la ligne de référence est une
droite passant par le centre de l’antenne de sources et perpendiculaire avec une droite reliant la
source virtuelle au centre de l’antenne de sources [Verheijen, 1998]. Le détail d’un tel exemple
est illustré à la figure 4.21 (p. 62). Sur la figure 4.21 (p. 62), les présentent l’amplitude des
sources de reproduction (toujours multipliée par 6) pour fin d’illustration. Le fait d’utiliser une
ligne de référence linéaire peut introduire quelques fluctuations dans les amplitudes des sources
de reproduction.
Dans le deuxième cas, la ligne de référence est un cercle passant par le centre de l’antenne
de sources et centré à la position de la source virtuelle [Verheijen, 1998]. Le détail d’un tel
exemple est illustré à la figure 4.22 (p. 62). En terme de champs reproduits, la différence entre
les approches est faible mais la ligne de référence de type circulaire réduit quelques problèmes
géométriques et simplifie le calcul des opérateurs de la WFS. Pour la plupart des simulations et
des expérimentations présentées dans cette thèse, on utilise une ligne de référence circulaire sauf
62
au chapitre 5 alors qu’une ligne droite de référence fut utilisée dans une version simplifiée de la
WFS. Pour les réalisations pratiques de la WFS (chapitre 9), une ligne de référence circulaire
est utilisée.
4.5 Évaluation objective de la WFS en situation expérimentale
Cette section regroupe l’ensemble des résultats les plus importants qui ont suivi une pro-
cédure d’évaluation objective de la reproduction à l’aide de la WFS dans une situation réelle.
Par le biais de telles mesures, on souhaite identifier les caractéristiques réelles qui méritent une
attention pour fin d’amélioration.
4.5.1 La procédure expérimentale en résumé
Le système étudié est un système de WFS développé par l’institut de recherche Fraunhofer
basé à Ilemenau (Allemagne) [Fraunhofer, Institut Integrierte Schaltungen, 2003]. Le système,
qui regroupait 88 haut-parleurs et deux transducteurs d’extrêmes basses, est illustré à la figure
4.23 (p. 64) et présenté avec plus de détails (notamment au sujet du lieu de reproduction) à l’an-
nexe C. La configuration des haut-parleurs et des microphones est présentée à la figure 4.24 (p.
64). Le réseau de haut-parleurs couvre approximativement un cercle d’environ 2.2 m de rayon.
Le local de reproduction est situé au sous-sol du Redpath Hall à l’Université McGill (Mont-
réal, Québec, Canada), ce local de recherche est le MARLAB («Multichannel Audio Research
LABoratory»). Le reste de l’information sur le système de WFS (le lieu de reproduction et la
démarche de traitement des données) est placé en annexe (annexe C, page 374).
En bref, on s’intéresse aux réponses à l’impulsion et aux réponses en fréquences entre la
source virtuelle et un réseau de microphones. Les réponses à l’impulsion sont directement obte-
nues à partir d’un processus d’identification adaptative. Tous les signaux et les réponses présen-
tés dans les sections qui suivent sont filtrés passe-bas à 1 kHz pour éviter le repliement spatial
dans la mesure où ce sont les performances de la WFS effective qui sont d’importance.
63
Figure 4.23 Photographie principale du système de WFS installé à l’Université McGill
montrant la partie frontale du réseau de haut-parleurs, la station PC et l’antenne de
microphones utilisée.
−2 0 2
−2
0
2
x [m]
y

[
m
]
Loudspeakers
Origin
Microphones
9 17
25
1
33
41
49
57
65
73
81
1→ 8
Figure 4.24 Configuration dans le plan horizontal des haut-parleurs et des microphones
utilisés pour la mesure objective de la reproduction de champs acoustiques par WFS.
64
−8 −6 −4 −2 0 2 4 6 8
−2
0
2
4
6
8
10
12
x
1
[m]
x
2

[
m
]
3
0

d
e
g
r
é
s

← Haut−parleurs
← Sources virtuelles
M
i
c
r
o
p
h
o
n
e
s


(
a
)





(
b
)
← (c)
Figure 4.25 Configuration des sources
virtuelles étudiées dans le plan horizontal.
200 400 600 800 1000
0.2
0.4
0.6
0.8
1
Fréq. [Hz]
C
o
h
é
r
e
n
c
e
550 600 650 700 750 800 850
0.8
0.9
1
Fréq. [Hz]
C
o
h
é
r
e
n
c
e
200 400 600 800 1000
0
0.5
1
Fréq. [Hz]
C
o
h
é
r
e
n
c
e
−50
0
50
100
G
a
i
n

d
e

l
a

F
R
F

[
d
B

r
e
f

1
]
#2
#3
#4
#5
512
64
128
256
512
64
128
256
(a)
(b)
(c)


FRF →
Figure 4.26 Estimations des fonctions de
cohérence pour différents nombres de
moyennes.
4.5.2 Configurations étudiées
Pour l’évaluation objective de la qualité de la reproduction par la WFS, différentes positions
de sources virtuelles et différentes configurations des rideaux acoustiques qui recouvrent les
murs sont étudiées. Les positions des six sources virtuelles sont présentées à la figure 4.25 (p.
65) en relation avec la position des haut-parleurs et du centre de l’antenne de haut-parleurs (le
point d’origine pour la description des scènes virtuelles). En tout, dix essais différents furent
réalisés. Dans cette thèse, seulement quatre essais sont exposés afin de faire valoir l’essentiel
des conclusions au sujet de l’évaluation objective des performances de la WFS en salle.
Une première série d’essais est réalisée pour les six positions de sources virtuelles indiquées
à la figure 4.25 (p. 65). On note qu’au moment des expérimentations, le logiciel de synthèse
«wfssynth», responsable de la production des opérateurs de WFS et du filtrage, produisait des
messages d’erreur lors de la reproduction d’ondes planes. La production d’ondes planes fut donc
simplement remplacée par la production d’ondes sphériques éloignées (avec compensation de la
perte d’amplitude). On note, par contre, qu’avec un rayon de courbure de 12 m au centre de l’an-
tenne de capteurs (qui fait près de 1.225 m de long), le front virtuelle serait pratiquement plan.
Trois autres essais sont réalisés pour deux positions de sources virtuelles, mais cette fois cer-
taines parties (le quart environ) des rideaux acoustiques sont enlevées. Les positions de sources
65
virtuelles dont les mesures sont relatées dans cette thèse sont identifiées par (a), (b) et (c) à la
figure 4.25 (p. 65).
4.5.3 Au sujet de la cohérence et de la validité des mesures
Quelques mots sont introduits au sujet de la cohérence et de la convergence des réponses à
l’impulsion (évaluées par le biais de la méthode introduite à la section C à la page 374) afin de
démontrer sommairement la validité des résultats expérimentaux.
Cohérence
Les fonctions de cohérence entre le signal de référence et les pressions acoustiques mesurées
pour quelques microphones dans le cas de la production d’une source virtuelle en (a) sont pré-
sentées à la figure 4.26 (p. 65) à titre d’exemples typiques. Pour cette évaluation, un maximum
de 512 moyennes sont réalisées avec un chevauchement de 66%.
La partie (a) de la figure 4.26 (p. 65) démontre qu’en augmentant le nombre de moyennes
lors de l’estimation de la cohérence, cette même estimation converge vers la courbe à 512
moyennes. La partie (b) de la même figure offre plus de détails à ce sujet alors qu’il est possible
d’y voir la variation de cohérence avec l’augmentation du nombre de moyennes. Pour les sec-
teurs où la cohérence est près de un, il est impossible de distinguer des changements alors que
dans les secteurs où la cohérence est plus faible, l’augmentation du nombre de moyennes laisse
voir une convergence plus étalée en fonction du nombre de moyennes. Ces deux remarques,
conjuguées avec l’atteinte d’une cohérence pratiquement unitaire sur une large plage de fré-
quence (à l’exception des plages de résonances et de crevasses de la réponse qui sont visibles
sur la FRF superposée au fonction de cohérence
14
), valident donc la qualité des mesures. La
partie (c) de la figure 4.26 (p. 65) présente des estimations de cohérences pour quatre autres
microphones pour le même scénario de reproduction.
14
Il est typique d’obtenir de telles réductions de la cohérence aux fréquences de résonance et aux crevasses de
la réponse étant donné que le dénominateur et le numérateur de la FRF deviennent très faibles pour des zones de
résonance et de crevasse, respectivement.
66
Réponse à l’impulsion
Pour l’identification des fonctions de transfert, un filtrage adaptatif de type gradient sto-
chastique LMS («Least-Mean-Square») normalisé est utilisé dans le domaine temporel. Pour
souligner la validité de l’approche on note que la variation absolue moyenne des coefficients du
filtre à la fin de ce processus d’identification est de l’ordre de 10
−9
alors que le coefficient maxi-
mal du filtre correspondant est environ 6 10
−2
soit bien au-delà du niveau de variation moyen
des coefficients. Les identifications utilisées pour illustrer la qualité de la reproduction par WFS
se basent sur près de 1 200 000 chantillons (environ 240 secondes à 6 kHz), tous utilisés pour
l’identification adaptative des réponses impulsionnelles.
4.5.4 Réponses en fréquence
De la même façon que les FRF de la WFS furent présentées pour les simulations théoriques,
les FRF expérimentales sont ici introduites pour quelques cas représentatifs. On s’intéresse,
cette fois, plus spécialement à la coloration potentielle de la salle sur les FRF.
Position virtuelle (a)
Les FRF mesurées pour la position virtuelle (a) sont présentées à la figure 4.27 (p. 69) pour
les huit microphones. Les gains sont exprimés en [dBref1] à partir du ratio entre les pressions
mesurées et le voltage de référence. Sur cette même figure, les FRF simulées pour la WFS
en champ libre (comme à la section 4.3
15
) sont aussi introduites. On note, par contre, que les
définitions des gains des simulations ne correspondent pas avec les gains des mesures et sont
donc arbitrairement superposés sur cette figure. Ils sont positionnés manuellement afin d’obtenir
une correspondance moyenne pour fin de comparaison. Dans le cas des FRF simulées pour la
WFS, le gain est défini par le ratio entre pression acoustique simulée et l’amplitude monopolaire
S de la source virtuelle. Ce décalage d’amplitude n’est pas important puisque c’est l’allure, la
distribution, de la courbe en fonction de la fréquence qui nous importe.
À partir de cette première figure, il est facile de constater l’important écart entre la WFS
15
Afin de clarifier quelque peu, on note que ces simulations de la WFS en champ libre incluent l’ensemble des
éléments mentionnés à la section 4.3 : pondération spatiale de l’amplitude des sources de reproductionpour atténuer
les effets de bord, utilisation d’une série discrète de sources de reproduction dont les positions correspondent à
celles du système réel utilisé pour les mesures et recours à une ligne de référence circulaire.
67
simulée en champ libre et la WFS mesurée dans une salle réelle. Les imperfections de la WFS
en salle sont donc essentiellement attribuables à la dynamique de la salle bien plus qu’aux autres
phénomènes identifiés en champ libre dans les sections précédentes.
Toujours selon la figure 4.27 (p. 69), on constate que les FRF, pour chacun des micro-
phones, sont passablement similaires en basses fréquences. C’est ainsi que les FRF partagent
par exemple une pointe de réponse, aux environs de 160 Hz, possiblement attribuable à un des
modes de la salle de reproduction. En plus hautes fréquences, les FRF montrent plus de distinc-
tions entre elles, ce qui est normal étant donnée la taille de la longueur d’onde en comparaison
avec celle de l’antenne de microphones. En plus, l’autocorrélation spatiale est d’une étendue
réduite en plus hautes fréquences pour un champ acoustique dans un espace clos [Pierce, 1991].
En basses fréquences (sous 250 Hz environ), les FRF, en plus d’être semblables, présentent
une réponse typiquement modale comme aux environs de 150 Hz. Il est par contre difficille
de dire avec certitude si cette pointe de réponse est causée par un mode propre seul ou par
un formant de salle [Jouhaneau, 1997]. Il est plus probable que ce soit un formant de salle
(une agglomération de modes) puisque 150 Hz est probablement au-dessus de la fréquence de
Schroeder
16
de la salle. En plus hautes fréquences, on note l’abscence de pointes dans les FRF.
Par contre, plusieurs crevasses, causées par l’interférence destructive des réflexions aux capteurs
sont remarquables. Ce genre de réponse est typique pour des espaces acoustiques fermés [Elliott,
2001]. Sur cette figure et les suivantes du même type, des résultats de simulations en salle sont
superposés pour les plus basses fréquences. Ces simulations sont basées sur le modèle décrit
au chapitre suivant. On note que, même si les FRF simulées en salle sont différentes de celles
obtenues par expérimentation (ce qui est normal si on considère la seule complexité géométrique
du lieu réel versus celle du modèle), elles présentent une tendance similaire à celles mesurées,
comme, par exemple, l’apparition de formants de salle en basses fréquences et la similarité des
huit FRF pour les plus basses fréquences.
Position virtuelle (b)
Les FRF mesurées pour la position virtuelle (b) sont présentées à la figure 4.28 (p. 69)
pour les huit microphones. On peut essentiellement avancer les mêmes conclusions que pour
la position virtuelle (a). C’est au niveau de la forme du premier front d’onde reproduit que des
différences entre les positions des sources virtuelles seront plus évidentes et faciles à interpréter
16
Au-delà de la fréquence de Schroeder, plus de trois modes sont alors excités à chaque fréquence.
68
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
Gains des FRF mesurées (p/v)
et simulées (p/S) pour la
WFS [dB ref 1]
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−40
−20
0
Fréq. [Hz]
Mesures
Sim. champ libre
Sim. en salle
#
1
#
2
#
3
#
4
#
5
#
6
#
7
#
8
Figure 4.27 FRF mesurées et simulées pour la
position virtuelle (a).
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
Fréq. [Hz]
Mesures
Sim. champ libre
Sim. en salle
Gains des FRF mesurées (p/V)
et simulées (p/S) pour la
WFS [dB ref 1]
#
1
#
2
#
3
#
4
#
5
#
6
#
7
#
8
Figure 4.28 FRF mesurées et simulées pour la
position virtuelle (b).
à la section 4.5.5.
Position virtuelle (c)
Les FRF mesurées pour la position virtuelle (c) sont présentées à la figure 4.29 (p. 71) pour
les huit microphones. On peut essentiellement avancer les mêmes conclusions que pour les
positions virtuelles (a) et (b).
69
Position virtuelle (a) avec une part des rideaux acoustiques qui est soustraite
Les FRF mesurées pour la position virtuelle (a) sont présentées à la figure 4.29 (p. 71)
pour les huit microphones alors qu’environ le quart de la surface des rideaux acoustiques est
soustraite. Encore une fois, les FRF mesurées ne correspondent pas avec la WFS théorique
idéale d’une situation de type champ libre.
Afin d’entrevoir quel pourrait être l’effet de la réduction de la surface couverte par les ri-
deaux acoustiques, la figure 4.30 (p. 71) superpose les résultats obtenus avec plus ou moins de
rideaux acoustiques. Comme on peut le voir sur cette dernière figure, des différences sont vi-
sibles mais aucune tendance particulière ne semble les caractériser. Il s’avère en fait impossible
de conclure quant à l’effet de la différence des situations puisque cette distinction n’est pas assez
marquée.
En ce qui concerne l’ensemble des FRF mesurées pour toutes les positions virtuelles, la
conclusion la plus importante semble être le fait que la salle introduit une importante coloration
de la réponse fréquentielle (en comparaison avec la WFS théorique simulée en champ libre)
qui ne semble pas varier en fonction de la position de la source virtuelle. Ainsi, quoique qu’en
champ libre cette coloration pouvait changer pour différentes positions de sources virtuelles,
il semble que ce soit la réponse de salle qui domine la déviation de la réponse fréquentielle
reproduite en comparaison avec celle simulée en champ libre.
4.5.5 Réponses à l’impulsion
Les RI expérimentales sont ici introduites pour des cas représentatifs de la reproduction de
champs par WFS. On s’intéresse plus spécialement à la reproduction de la courbure des fronts
d’onde en salle et à l’identification des effets de la salle sur la qualité du front d’onde reproduit,
et ce, notamment, après le passage du premier front d’onde correspondant au champ direct.
Position virtuelle (a)
Les RI pour la position virtuelle (a) sont présentées à la figure 4.31 (p. 73). Encore une fois,
les résultats de simulations en champ libre ont été positionnés manuellement sur les résultats ex-
périmentaux pour fin de comparaison, même si les systèmes simulés ne correspondent pas à un
70
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
Gain des FRF mesurées (p/V)
et simulées (p/S) pour la
WFS [dB ref 1]
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
Fréq. [Hz]
Mesures
Sim. champ libre
Sim. en salle
#
1
#
2
#
3
#
4
#
5
#
6
#
7
#
8
Figure 4.29 FRF mesurées et simulées pour la
position virtuelle (c).
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
Gains des FRF mesurées (p/V)
pour la WFS [dB ref 1]
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
100 200 300 400 500 600 700 800 900 1000
−60
−40
−20
0
Fréq. [Hz]
Avec rideaux
Avec 3/4 rideaux
#
1
#
2
#
3
#
4
#
5
#
6
#
7
#
8
Figure 4.30 FRF mesurées et simulées pour la
position virtuelle (a) avec une part des rideaux
acoustiques en moins.
ratio entre pression sonore et voltage de référence mais bien entre pression sonore et amplitude
monopolaire. Puisque les résultats simulés en champ libre sont ainsi superposés aux résultats
expérimentaux pour évaluer la forme du front d’onde reproduit : globalement, l’amplitude et le
retard temporel ne sont pas vraiment révélateurs. Ce qui permet donc cet ajustement manuel des
résultats. En plus des simulations de la WFS en champ libre, les temps et amplitudes de passage
du front d’onde virtuel sont indiqués par des cercles et reliés par un trait sur cette même figure.
Ces valeurs virtuels ont aussi été ajustées manuellement pour fin de comparaison.
Comme on peut le voir sur la figure, le premier front d’onde mesuré est convenablement
71
reproduit en ce qui concerne les amplitudes relatives et des délais relatifs entre les capteurs :
la correspondance avec la WFS simulée en champ libre et le passage du front d’onde virtuel
est bonne. On note aussi une bonne symétrie des RI autour du centre de l’antenne ; ce qui
correspond bien avec le fait que la source virtuelle est centrée devant l’antenne de microphones.
Par contre, après le passage du premier front (symétrique par rapport au centre de l’antenne de
microphones), la réponse de la salle de reproduction démontre clairement son influence et la
dégradation de la correspondance entre les simulations en champ libre et les mesures en salle.
Quoiqu’il soit périlleux d’identifier précisément les éléments de la réponse impulsionnelle, on
note la probable présence de quelques échos. Afin de mieux interpréter cette figure, on remarque
que 5 ms (selon la grille de la figure) correspond environ à une distance de propagation de 1.65 m
(avec une vitesse de propagation de 331 m/s).
Position virtuelle (b)
Les RI pour la position virtuelle (b) sont présentées à la figure 4.32 (p. 73). Selon le même
type d’observations que pour les RI de la position virtuelle (a), on note que le premier front
est convenablement reproduit. Et ce, notamment, au niveau de la courbure du front (différente
de celle de la position virtuelle (a)) et des amplitudes relatives. Par contre, puisque la ligne
de référence ne croise le groupe de microphones qu’au centre de la pièce
17
, des erreurs de
reproduction d’amplitudes [Verheijen, 1998] relatives entre les microphones sont probablement
introduites dans les résultats.
Position virtuelle (c)
Les RI pour la position virtuelle (c) sont présentées à la figure 4.33 (p. 74). Toujours selon
les arguments présentés aux deux sous-sections précédentes, seul le premier front d’onde – qui
correspond à une situation en champ libre, c’est-à-dire avant toute réflexion – est bien reproduit.
Suivant le passage de ce premier front, la dynamique indésirable de la salle laisse voir son effet.
17
La ligne de référence correspond à la ligne où, selon le développement théorique de la WFS, il n’y a pas
d’erreur d’amplitude lors de la reproduction théorique en champ libre. En dehors de la ligne de référence, on peut
s’attendre à de légères erreurs d’amplitude.
72
0.165 0.17 0.175 0.18 0.185 0.19
−0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
Temps [s]
Capteur #1
Capteur #2
Capteur #3
Capteur #4
Capteur #5
Capteur #6
Capteur #7
Capteur #8
Figure 4.31 RI mesurées et simulées pour la
position virtuelle (a). Les temps et amplitudes
d’arrivée du front d’onde virtuel sont illustrés
par les cercles et connectés par le trait pointillé.
0.165 0.17 0.175 0.18 0.185 0.19
−0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
Temps [s]
Capteur #1
Capteur #2
Capteur #3
Capteur #4
Capteur #5
Capteur #6
Capteur #7
Capteur #8
Figure 4.32 RI mesurées et simulées pour la
position virtuelle (b). Les temps et amplitudes
d’arrivée du front d’onde virtuel sont illustrés
par les cercles et connectés par le trait pointillé.
Position virtuelle (a) avec une part des rideaux acoustiques qui est soustraite
Les RI pour la position virtuelle (a) avec moins de rideaux absorbants sont présentées à la
figure 4.34 (p. 74). Encore une fois, seul le passage du premier front d’onde est convenablement
reproduit. En ce qui concerne la comparaison avec le cas qui inclut l’ensemble des rideaux et
celui dont une part des rideaux est soustraite, il est possible de noter que, par le biais de la figure
4.34 (p. 74) qui présente les deux RI, comme du point de vue fréquentiel, les différences sont
trop faibles pour établir une quelconque conclusion à ce sujet.
L’ensemble des résultats d’évaluation des RI peut se résumer autrement par le biais des
73
0.165 0.17 0.175 0.18 0.185 0.19
−0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
Temps [s]
Capteur #1
Capteur #2
Capteur #3
Capteur #4
Capteur #5
Capteur #6
Capteur #7
Capteur #8
Figure 4.33 RI mesurées et simulées pour la
position virtuelle (c). Les temps et amplitudes
d’arrivée du front d’onde virtuel sont illustrés
par les cercles et connectés par le trait pointillé.
0.165 0.17 0.175 0.18 0.185 0.19
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
Temps [s]
Capteur #1
Capteur #2
Capteur #3
Capteur #4
Capteur #5
Capteur #6
Capteur #7
Capteur #8
Figure 4.34 RI mesurées pour la position
virtuelle (a) avec une part rideaux des
acoustiques en moins. En pointillé : avec le 3/4
des rideaux. En continu : avec tous les rideaux.
Les temps et amplitudes d’arrivée du front
d’onde virtuel sont illustrés par les cercles et
connectés par le trait pointillé.
74
figures 4.35 (p. 76) et 4.36 (p. 77). Avec ces deux groupes de figures, on note quelques points
supplémentaires. Tel qu’il le fut déjà remarqué, et comme on peut le voir sur la figure 4.35 (p.
76), les fronts d’ondes sont convenablement reproduits. Par contre, la figure 4.35 (p. 76) permet
aussi de constater l’allure et la présence de réflexions distinctes suivant le passage du premier
front. C’est ainsi qu’entre 0.17 s et 0.18 s on note le passage de deux ou trois réflexions qui
prennent pratiquement la même courbure que le front à reproduire, ce qui laisse supposer que
ces réflexions proviennent de surfaces proches des sources de reproduction : le mur derrière
les haut-parleurs, le plafond et le plancher. Suivant 0.18 s, on peut voir d’autres fronts, moins
uniformes sur l’antenne. Fait intéressant, de plus petits fronts, avec un certain angle d’incidence,
sont visibles dans le cas des positions virtuelles (b) et (c). En complément, la figure 4.36 (p. 77)
présente une seule partie des réponses impulsionnelles dans l’espace de telle sorte qu’il soit
possible de mieux visualiser l’allure des fronts directs. Comme on peut le voir, les positions
virtuelles (b) et (c) (qui proposent la même direction d’incidence à l’antenne mais des distances
différentes) produisent des courbures de front différentes, comme le sont les fronts à reproduire
(on approche une onde plane dans le cas de la source virtuelle en (c) qui est à douze mètres du
centre de l’antenne de capteurs).
Pour l’ensemble de ces résultats d’analyse des RI mesurées en comparaison avec les RI
simulées en champ libre pour la WFS, on retient donc que le premier front d’onde (plus pré-
cisément sa courbure et ses délais relatifs aux positions des microphones) est reproduit mais
que la pièce laisse des traces indésirables après son passage. Encore une fois, c’est la salle qui
présente le plus d’influences indésirables dans le domaine temporel comme dans le domaine des
fréquences.
4.6 Conclusion
Ce chapitre rassemble les premiers essais au sujet de l’évaluation objective (sur la base de
critères physiques) de la qualité de la reproduction de champs acoustiques par WFS classique
dans une salle réelle. En deux parties, dont une présentait des simulations théoriques en champ
libre et dont l’autre illustrait les résultats de mesures expérimentales, il fut montré que la WFS
introduit différents types d’erreurs causées par différents facteurs. Pour résumer ces aspects, la
liste suivante est introduite.
1. Par le biais de simulations de réseaux et de la WFS en champ libre, il fut montré que
75
Figure 4.35 Réponses impulsionnelles mesurées pour la WFS en fonction du temps et de
l’espace. Le trait représente la courbure du front virtuel à titre indicatif.
(a) la WFS peut reproduire un front sous la fréquence de repliement spatial de la WFS
(au moins deux sources de reproduction par longueur d’onde, selon le critère le plus
restrictif) ;
(b) la WFS souffre d’une limite en fréquence définie par la séparation des sources (re-
pliement spatial) ;
(c) selon la position de la source virtuelle par rapport à l’antenne de sources de repro-
duction, une coloration fréquentielle indésirable peut apparaître même en champ
libre ;
(d) des colorations sont aussi attribuables aux effets de bord ; une part de ces colora-
tions peut être réduite grâce à l’utilisation d’une fenêtre de pondération spatiale des
amplitudes des sources ;
2. Grâce aux mesures expérimentales, il fut démontré que (sous 1 kHz)
(a) les réponses en fréquences subissent une importante coloration essentiellement at-
tribuable à la dynamique de la salle ;
76
Figure 4.36 Zoom temporel sur les réponses impulsionnelles mesurées pour la WFS en
fonction du temps et de l’espace. Le trait représente la courbure du front virtuel à titre indicatif.
(b) ces colorations prennent plus d’importance que les défauts introduits dans la situa-
tion théorique en champ libre ;
(c) ces colorations ne présentent pas de tendances en fonction de la position de la source
virtuelle ;
(d) en basses fréquences, on remarque l’apparition probable de formants de salle ;
(e) en basses fréquences, les FRF aux capteurs sont très similaires (la réponse est rela-
tivement homogène sur l’antenne de capteurs) ;
(f) en hautes fréquences, les colorations sont causées par des réflexions et des interfé-
rences destructives aux capteurs ;
(g) en hautes fréquences, les FRF aux capteurs varient beaucoup en fonction de l’es-
pace ;
(h) les premiers fronts d’ondes sont par contre convenablement reproduits (en terme de
courbure et d’incidence du front, sous la fréquence de repliement spatial) ;
(i) suivant le passage du premier front (en champ direct) la salle introduit des artéfacts
indésirables qui causent un écart entre la WFS théorique et la WFS pratique, en
situation réelle.
77
L’ensemble de ces remarques montre donc clairement que la WFS, en situation réelle, est
sujette à différentes imperfections d’abord causées par la présence d’un espace de reproduction
fermé. C’est sur ce point que la reproduction de champs acoustiques par contrôle actif et filtrage
adaptatif pourrait donc introduire une amélioration.
78
CHAPITRE 5
MODÉLISATIONACOUSTIQUEDE LA REPRODUCTION
DECHAMPS ACOUSTIQUESENSALLE: ANALYSES THÉO-
RIQUES ET SIMULATIONS
5.1 Résumé français
Cet article
1
présente les premières simulations de contrôle actif de la reproduction de champs
acoustiques en salle et en champ libre. L’objectif était alors d’effectuer une étude de faisabilité
qui se tournait vers l’aspect physique du problème. Le résumé de l’article suit.
Cet article décrit les simulations et les résultats obtenus en appliquant la théorie du contrôle
optimal à la reproduction de champs acoustiques progressifs (principalement pour des appli-
cations audio) sur une plage étendue de l’espace à l’aide de haut-parleurs monopolaires. Le
modèle simule un système de reproduction qui opère en champ libre ou en un espace fermé
qui approche une salle d’écoute typique et se base sur le contrôle optimal dans le domaine fré-
quentiel. Cette approche simple est retenue comme première investigation de la physique de
la problématique. D’autres sujets abordés concernent la comparaison avec la WFS et l’identi-
fication des mécanismes de contrôle physiques. Les résultats suggèrent que la reproduction de
champs acoustiques en salle par contrôle actif peut être atteinte avec une erreur de reproduc-
tion résiduelle moins importante que celle de la WFS dans la même situation. Les techniques
actives de reproduction ont l’avantage de compenser automatiquement la dynamique de la salle
de reproduction. Pour les cas considérés, les simulations montrent que les résultats de contrôle
optimal ne sont pas sensibles (en terme d’erreur de reproduction) à l’absorption des murs de
la salle de reproduction. Une configuration spéciale circonférentielle de capteurs est introduite
1
P.-A. Gauthier, A. Berry, W. Woszczyk, Sound field reproduction in-room using optimal control techniques :
Simulations in the frequency domain, Journal of the Acoustical Society of America, vol. 117, no 2, p. 662-678,
2005.
79
pour un espace d’écoute dégagé de capteurs pour des applications en champ libre.
5.2 Sound field reproduction in-room using optimal control techniques : Simulations in
the frequency domain
This paper describes the simulations and results obtained when applying optimal control to
progressive sound field reproduction (mainly for audio applications) over an area using mul-
tiple monopole loudspeakers. The model simulates a reproduction system that operates either
in free-field or in a closed space approaching a typical listening room, and is based on optimal
control in the frequency domain. This rather simple approach is chosen for the purpose of phy-
sical investigation especially in terms of sensing microphones and reproduction loudspeakers
configurations. Other issues of interest concern the comparison with Wave Field Synthesis and
the control mechanisms. The results suggest that in-room reproduction of sound field using ac-
tive control can be achieved with a residual normalized squared error significantly lower than
open-loop Wave Field Synthesis in the same situation. Active reproduction techniques have
the advantage of automatically compensating the room’s natural dynamics. For the considered
cases, the simulations show that optimal control results are not sensitive (in terms of reproduc-
tion error) to wall absorption in the reproduction room. A special surrounding configuration of
sensors is introduced for a sensor-free listening area in free field.
5.3 Introduction
This paper investigates the theoretical possibilities for sound field reproduction using opti-
mal control methods for potential audio applications. The major goals of this work are feasibi-
lity and parametric studies with questions : 1) The effect of a reflective acoustic environment
on objective reproduction quality in comparison with free-field conditions, 2) the comparison of
optimal control method with Wave Field Synthesis (WFS) and 3) the introduction of a practical
configuration which can be, as mentioned later, related to WFS.
The simulations presented in this paper have been carried with a conventional least-square
error formulation for the acoustical part of the problem [Elliott, 2001; Nelson et Elliot, 1992]
while Wave Field Synthesis has been simulated using non-focusing WFS operators for a ge-
neral source array with a straight reference line [Verheijen, 1998]. Simple and harmonic wave
80
reproductions are considered in free-field or in-room conditions.
Historically, spatial sound reproduction has been a vivid and creative research domain in-
volving artists, engineers and scientists [Davis, 2003; Henriksen, 2002; Rumsey, 2001; Wilson,
2003]. Numerous examples of historical systems, formats, patents and advances concerning
spatial audio have also been reported recently [Davis, 2003; Rumsey, 2001]. With the relati-
vely recent arrival of digital representation and multiple channels of audio, new possibilities of
sound field control and sound reproduction have been investigated. Commonly cited examples
are : binaural techniques [Begault, 1994; Blauert, 1999], ambisonic formats [Rumsey, 2001],
Wave Field Synthesis (WFS) [Berkhout et al., 1993; Verheijen, 1998], and Stereo-Dipole (SD)
[Nelson et al., 1997; Nelson, 2002; Watanabe et al., 1999]. In a broad sense, most of these tech-
niques try to improve two aspects of the consumer level reproduction technology, with variable
weighting and methods. 1) Achieve a large listening area for a given audience. 2) Create an
appropriate 3-D (or 2-D) auditory scene.
A few words will be introduced on some of those techniques since they are mainly distingui-
shed from traditional loudspeakers systems where the mixing engineer is entirely responsible
for the channels’ content, like for the 5.1 or 10.2 surround systems [Rumsey, 2001]. (The x.y
numbering convention for surround sound system is used to describe a system with x broad-
band channels and y low frequency channels for subwoofers.) The work presented here is more
connected to sound field simulation rather than to perceptual simulation, this short review will
be mainly devoted to sound field simulation which may provide a broader listening area without
any perceptual assumptions.
Although the ultimate goal of sound field reproduction is an audio application, one must be
aware that perfect reproduction of sound field does not necessarily lead to perfect auditory events
reproduction since multimodal sensory influences and cognitive mechanisms both strongly in-
fluence sound localization and construction of a 3-D auditory scene [Blauert, 1999; Bregman,
1990]. In spite of this, it is assumed that, if not perfect, at least optimal sound field reproduc-
tion will achieve optimal auditory impression if the audio system is not conflicting with visual
indications or other sensory experiences. This assumption justifies the wave field simulation
approach.
81
5.3.1 Recent advances in spatial sound reproduction
The whole issue of reproduction of the spatial character of hearing may be divided in various
complementary and hierarchic categories. The first fundamental division arises while introdu-
cing a distinction between perceptual simulation and sound field simulation. To ensure a more
general understanding, one can interpret the simulation of sound fields like the simulation of the
physical stimulus, the sound field in this case. Any technology that implies a measure or know-
ledge of the spatial hearing mechanisms will belong to the perception simulation class. Example
of this type are binaural technologies which may include a measure of the perceptive chain, the
external ear in this case [Begault, 1994; Blauert, 1999; Boulanger, 2000] and stereophonic pro-
ductions (usually based on phantom imaging related to interaural time delay or interaural level
difference auditory cues, [Rumsey, 2001]). With sound field simulation, although possibly ad-
dressing the hearing system, one is not concerned with the perceptive mechanisms of spatial
hearing in the technological development. Both perceptual simulation and sound field simula-
tion are subject of the research activities [Berkhout et al., 1993; Gardner, 1998; Kirkeby et al.,
1998; Nelson et al., 1997; Nelson, 2002; Takeuchi et Nelson, 2002; Tokuno et al., 1997; Ve-
rheijen, 1998; Ward et Elko, 1999; Watanabe et al., 1999]. The simulation of sound fields can
also be divided into two further approach types. The first is the outer problem (the creation of
a synthetic directivity pattern around a set of acoustical sources, the reproduced sound field is
surrounding the reproduction sources). The second is the inner problem. In this case the liste-
ning zone is surrounded by loudspeaker array which is introduced to create a sound field within
the interior of the surrounding array. The here reported investigations belong to this last type :
inner problem of sound field simulation. At the interface between outer and inner sound field
simulations, there is the sound field extrapolation where the reproduction sources are located
on a plane separating the listening area (either virtual or real) from a space where a sound field
must be extrapolated to the listening area.
Wave Field Synthesis (WFS)
The work on the WFS originates from the theoretical analysis by Berkhout in the late 80s
and in the early 90s [Berkhout et al., 1993; Verheijen, 1998]. The underlying idea is rather
simple. From the Kirchhoff-Helmholtz integral theorem, WFS operators are defined to “link” a
given simple virtual source, fed by monophonic input, to an array of loudspeakers which should
reproduce the virtual source acoustic field. The problem is usually concerned with reproduc-
tion in the horizontal plane by means of a finite number of discrete sources using appropriate
82
simplifications of the integral formulation [Verheijen, 1998]. Berkhout’s theory seems to be a
rigorous and up-to-date synthesis of some older ideas expressed by [Camras, 1968] and in the
30s, at the Bell Telephone Laboratory, by Steinberg and Snow [Davis, 2003; Rumsey, 2001]
2
.
With this WFS system, it is claimed that plane and spherical waves can be reproduced in a broad
planar listening area surrounded by the loudspeaker array, it is thus a volume solution. Consi-
derable amount of work on WFS has followed in Delft University of Technology and, later, in
the CARROUSO European research project, where practical issues have been investigated and
have been brought to a final prototype installed in a movie theater in Ilmenau (Germany). WFS
researches have investigated : spatial aliasing, source type, source directivity [Verheijen, 1998],
multi-actuator panel loudspeaker [de Vries et Boone, 2003], room compensation [Spors et al.,
2003a], scene composition with WFS, subjective evaluation [Verheijen, 1998] and more.
On one hand, the benefit of current WFS prototype is its efficiency to transmit a spatial
impression over a broad area surrounded by the loudspeakers. Actual prototypes also provide a
convenient software tool for scene construction and kinetic spatial compositions. On the other
hand, WFS drawbacks are more subtle and mainly related to the synthesis operators’ definition
which makes assumptions on two points : 1) Synthesis operators are defined for a virtual free
field space. 2) Reproduction room’s response is not considered in the process, except in specific
applications including room compensation filters after the WFS filters [Spors et al., 2003a]. The
typical WFS system is consequently based on an open-loop architecture.
In the following simulations, a relation will be shown between WFS and some particular
configuration of sensors using active control techniques.
2
The historical origin of what is called Wave Field Synthesis in its current symbolismand formulation is attribu-
table to Berkhout although some descriptions and ideas – such as the ones introduced by Steinberg [Rumsey, 2001]
and later by [Camras, 1968] – have been previously introduced. Interestingly, a similar theoretical concept has
been introduced by Jessel as early as in 1973 [Jessel, 1973]. Jessel’s “holophony” is based on the same Kirchhoff-
Helmholtz integral interpretation as WFS. Similar terminology is introduced about primary and secondary sources,
which is borrowed fromHuygens’ principle. In his book, Jessel’s idea was only theoretically developed in a generic
way. In fact, WFS is a specific application (implying a finite set of discrete reproduction sources) of the holophony
concept. A more recent publication has established a clear theoretical connection between ambisonic and holo-
phony or WFS [Nicol et Emerit, 1999], where it is demonstrated that ambisonic is a special case of holophony or
WFS.
83
Active sound control and adaptive filtering in audio reproduction
Classical active sound control techniques may be conceptually connected to sound repro-
duction from different view points. Firstly, in its application, active control of sound is aimed
to create a controlling (secondary) pressure field which, locally or globally, cancels a disturbing
(primary) pressure field. This task is nearly similar, except for a sign change, to the reproduc-
tion of a given sound field for audio applications. Secondly, from a temporal or spectral view
point, active control and corresponding adaptive filtering techniques may be used for single-
point or multiple-point frequency response equalization. With this in mind, active sound field
control may be applied to the spatial audio problem. This has already been done in the past using
various approaches and solutions.
Adaptive multi-point equalization in various environments, such as room and car, have been,
to our knowledge, studied and published by Elliot and Nelson firstly in 1985 and later in 1989
[Elliott et Nelson, 1989]. At that time, the main objective was the realization of a better fre-
quency response uniformity in a room enclosure. The equalization of room and loudspeakers
is thus approached from a frequency view point more than from a standpoint of an exten-
ded spatially-dependent sound field reproduction. It is now more than interesting to note some
conclusions from the previously cited authors. It clearly seems that appropriate multiple-point
frequency equalization has been obtained by applying a proper modelling delay between the
desired signals (at the error sensor locations) which where all deduced from a single monopho-
nic signal. The introduction of these delays reproduces a wave somewhat similar to a travelling
plane wave. This suggests that room and loudspeakers frequency equalization may thus benefit
from proper spatial reproduction of a given virtual field.
Simulations have been introduced by [Kirkeby et Nelson, 1993] for plane wave reproduction
over a restricted area in free-field condition. Major differences between Kirkeby’s paper and the
present paper are related to the configurations considered, the presence of a reflective environ-
ment and comparisons with WFS. Following Kirkeby’s conclusion, a narrow-arc arrangement of
loudspeakers in front of an equalization zone (a square of 0.5 meters) may create a progressive
plane wave in free-field reproduction conditions.
Another important research about adaptive 3-D sound systems is authored by [Garas, 1999].
Most of Garas’ work is related to various adaptive multichannel signal processing, including
generic electroacoustical transfer functions, for a general design which can be applied to active
noise control, cross-talk cancellation, and virtual imaging. In the case of adaptive virtual acous-
84
tics, the author suggests the use of error microphones inside listener’s ears, a solution which
may not be practical.
These previous examples form a part of the published works on active control in relation
with sound reproduction. Other important papers concerning audio applications of active control
and adaptive filtering which have been published more or less recently are listed in references
[Elliott et Nelson, 1989; Elliott et al., 1994; Kirkeby et al., 1996; Nelson et al., 1992; Nelson,
1994; Kirkeby et al., 1995; Nelson et al., 1996b, 1997; Nelson, 2002; Uto et Hamada, 1995].
5.4 Theoretical model
This section introduces the theoretical model on which the simulations are based. As it
was previously mentioned, the simulations are mainly concerned with sound field reproduction.
The reproduction system can be characterized by L monopole sources and M sound pressure
sensors. The radiation model for the sources is introduced first while the optimal control formu-
lation, the sound field reproduction (or sound field control), is presented next.
The proposed model is more appropriate for low frequencies, where the monopole may
more adequately represent a closed-box loudspeaker. In all cases, the simulations are carried
up to 1.5 kHz. This frequency limit roughly corresponds to the auditory transition from an ITD
(Interaural Time Delay) auditory cue based on signals’ fine structure of time differences to the
one based on signals’ envelope time differences [Blauert, 1999]. Note that this upper frequency
limit seems to be shared by the WFS systems which integrate frequencies up to 1500 Hz or so
[Verheijen, 1998]. In our room simulations, this upper frequency limit is lowered to 400 Hz for
computational efficiency. However, the covered frequency range is still representative for the
room considered in our simulations since it includes the Schroeder frequency [Nelson et Elliot,
1992] which dictates the progressive transition from a dominant-mode response to a diffuse
response.
5.4.1 Radiation modelling
The model is based on the Helmholtz equation for harmonic acoustic fields

2
p(x) +k
2
p(x) = 0. (5.1)
85
Figure 5.1 Signs and symbols convention for
the rectangular room. x describes an arbitrary
point in volume V (or on the surface S), y
describes an arbitrary point on S, n is a unitary
vector normal to S and pointing outward, x
i
is
a set of Cartesian coordinates and e
i
, a triad of
unit base vectors.
Figure 5.2 First investigated configuration in
free field. θ defines the propagation direction
for a progressive plane wave target field. The
sensor array covers a 1 m1 m area with a
separation distance of 0.125 m along x
1
and x
2
.
The source array covers approximately a
7.5 m6.4 m rectangle with a separation of
approximately 0.46 m.
and on boundary conditions (homogeneous and mixed) for locally reacting surfaces
∇p(y) n = jkβ(y)p(y). (5.2)
Where p is the space-dependent complex acoustic pressure [Pa], k the wavenumber [rad/m]
(k = ω/c), x the position in rectangular coordinates [m], y the position on walls [m], β the
specific acoustic admittance dimensionless ratio for a given surface (normalized by ρc, with
ρ = 1.18 kg/m
3
and c = 341 m/s), n a unit vector normal to the room surface (pointing
outwards the room), ω the radial frequency [rad/s] and c the sound phase speed [m/s] at ambient
temperature. A e
−jωt
time dependence is assumed for pressure and other harmonically varying
variables. The systemunder study, with signs convention and parameter definition, is graphically
introduced in Fig. 5.1 (p. 86).
Two different reproduction situations are investigated and compared : in a free field, and
in a room. In all cases, the reproduced sound field is simply the sum of the individual sources
86
radiated sound field
p
(rep)
(x) =
L

l=1
G(x[x
l
)(−jωρq
l
), (5.3)
where q
l
is the complex strength of source l (located at x
l
) and G(x[x
l
) is the Green’s function
[Nelson et Elliot, 1992; Pierce, 1991]. In free field, the Green’s function is
G(x[x
l
) =
e
jk|x−x
l
|
4π[x −x
l
[
, (5.4)
While in a room, the following definition (which implicitely assumes modal expansion and the
fact that eigenfunctions ψ
n
form an orthogonal set) is used [Morse et Ingard, 1968]
G(x[x
l
) =
N

n=0
ψ
n
(x)ψ
n
(x
l
)
V [k
2
n
−k
2
]
. (5.5)
Where, in Eq. (5.5), ψ
n
is the nth eigenfunction of Eq. (5.1) with boundary conditions Eq. (5.2),
k
n
the associated nth eigenvalue and V , the room volume. The eigenfunctions are amplitude
normalized in such a manner that
_
V
ψ
n
ψ
m
dV = δ
nm
. For the non-rigid case associated with Eq.
(5.2), complex eigenfunctions and eigenvalues are expected. The eigenfunctions and eigenvalues
are function of the driving frequency, which is explicit in the boundary conditions (see Eq. 5.2).
The modal scheme approximation for a rectangular room with non-rigid surfaces is taken from
Morse and Ingard [Morse et Ingard, 1968] and is given by the following expressions :
ψ
n
(x) = ψ
n
x1
(x
1

n
x2
(x
2

n
x3
(x
3
)/A
n
, (5.6)
A
n
=
_
V
ψ
n
x1
ψ
n
x2
ψ
n
x3
dV, (5.7)
ψ
n
xi
(x
i
) ≈ cos
_
q
n
xi
πx
i
L
xi
+jβ
kL
xi
πq
n
xi
_
, (5.8)
q
0
xi

1
πj
_
2jβkL
xi
, (5.9)
q
n
xi
≈ n −
2jβkL
x1
π
2
n
, (5.10)
k
2
n

_
πq
n
x1
L
x1
_
2
+
_
πq
n
x2
L
x2
_
2
+
_
πq
n
x3
L
x3
_
2
. (5.11)
This approximation is valid for a uniform admittance (which is the case since β is uniformly
distributed over S in the simulations) and for lowβkL
xi
, it is thus limited to low admittance and
more representative to low excitation frequency. Using matrix notation, Eq. (5.3) can be more
compactly written
p
(rep)
= [p
(rep)
(x
1
) . . . p
(rep)
(x
m
) . . . p
(rep)
(x
M
)]
T
= Z
(m)
q (5.12)
87
for a finite number of point, M, corresponding to receivers positions. In Eq. (5.12), Z
(m)
is a
transfer impedance matrix (from source strength to the reproduced sound pressure evaluated at
¦x
1
. . . x
m
. . . x
M
¦ in the reproduction space) and q, a complex source strength column vector
defined as follows
q = [q
1
. . . q
l
. . . q
L
]
T
. (5.13)
5.4.2 Control modelling
Now that the reproduced pressure field is defined in V subject to L simple monopole exci-
tations, the optimal determination of q needs to be derived. The target wave field, or the image
field, which has to be reproduced by the sources in V , is a plane wave of amplitude A
p
(im)
(x) = Ae
j

k·x
(5.14)
where

k is the wavenumber vector. The plane wave is assumed to propagate in the horizontal
(x
1
, x
2
) plane, with a direction defined by angle θ in Fig. 5.2 (p. 86). Alternatively, the image
field can be a spherical wave
p
(im)
(x) = A
e
jk|x−xo|
[x −x
o
[
. (5.15)
In the last equation, the virtual source position is defined by x
o
.
Using Eq. (5.3), (5.14) or (5.15), a reproduction error function evaluated as a function of x
is defined as follows
e(x) = p
(im)
(x) −p
(rep)
(x). (5.16)
Perfect and ideal sound field reconstruction would thus be obtained everywhere in the reproduc-
tion area while reaching e(x) = 0 with properly adjusted source strengths q. On a more practical
ground, now assume that the reproduction system is not only made of L sources fed by an open-
loop architecture but also of M error sensors for which the errors between the target pressure de-
fined and the reproduced pressure are evaluated at a set of M discrete points, ¦x
1
. . . x
m
. . . x
M
¦.
The corresponding set of reproduction error amplitudes have to be minimized with respect to
the control source strengths q. With this in mind, an error vector e = [e
1
. . . e
m
. . . e
M
]
T
is
introduced. For the mth term of e
e
m
(x
m
) = p
(im)
(x
m
) −p
(rep)
(x
m
). (5.17)
88
This allows the following definition of a cost function (in terms of quadratic error e
H
e), which
corresponds to the quadratic Hermitian including Tikhonov regularization (that is an effort pe-
nalty here expressed as γ q
H
q) [Nelson, 2001]
J
M
= e
H
e +γ q
H
q. (5.18)
In equation (5.18), H superscript denotes the Hermitian transpose and γ, the regularization
parameter. The reproduction performance optimization is expressed as function of the quadratic
reproduction errors because one wish to bring the errors to zero as nearest as possible, that is
the “least-square” solution. Moreover, this is a common practice in active control of sound or
vibration which found his correspondence with practical applications through adaptive filtering
which is often based on such type of quadratic cost function. On one hand, the regulariza-
tion parameter γ can represent the possible trade-off between optimal reproduction and source
strength minimization. On the other hand, γ introduces convenient regularization in the inverse
problem [Nelson, 2001] as it will be seen in the next equation. This Tikhonov regularization,
which is nothing more than the introduction of a γ-weighted source-strength penalty term in the
cost function, is thus used to circumvent any ill-conditioning of the problem. The purposes and
considerations of conditioning in regards to the sound field reproduction are both addressed in
section 5.5.5. Within the context of active control practice, such a regularization is conceptually
connected with the leaky adaptation of a feedforward system [Elliott, 2001]. For a more detai-
led review of inverse problems and regularization, the reader is referred to the work of [Nelson,
2001].
Provided that [Z
(m)H
Z
(m)
+γI] is positive definite, which is the case when L < M [Nelson
et Elliot, 1992], the cost function J
M
has a unique minimum associated with
q
opt
=
_
Z
(m)H
Z
(m)
+γI
¸
−1
Z
(m)H
p
(im)
, (5.19)
where I is the identity matrix and p
(im)
= [p
(im)
(x
1
) . . . p
(im)
(x
m
) . . . p
(im)
(x
M
)]
T
. By inspec-
tion of Eq. (5.19), it is apparent that the conditioning and hence invertibility of the matrix
_
Z
(m)H
Z
(m)
+γI
¸
will strongly influence the quality of the minimization results, therefore the
usefulness of the regularization parameter γ which adds a value to the diagonal terms of the
matrix to be inverted in Eq. (5.19). Explained briefly and textually, such an addition increases
all the matrix singular value from a given amount and consequently reduces the ratio of the lar-
gest to the smallest singular value. This ratio defines the condition number. While inverting any
matrix, a very small singular value of the matrix while results in very large values of the solution
and this may reduce the solution quality or even the numerical invertibility of the matrix [Nelson
89
et Yoon, 2000]. For this reason, the added diagonal value γ will stabilize the inversion of the
matrix. By such means, the Tikhonov regularization thus circumscribes the solution values q
opt
to a more acceptable range but, at the same time, it reduce, appreciably or not, depending on γ,
the reproduction quality.
Substitution of Eq. (5.19) in J
M
allows the definition of the residual normalized cost function
(excluding the Tikhonov regularization term γ q
H
q) when q is set to q
opt
E
LS
=
J
( q= qopt)
M
−γ q
H
opt
q
opt
J
( q=

0)
M
. (5.20)
This parameter has been chosen for comparison and validation with past works from [Kirkeby
et Nelson, 1993]. The real scalar-valued E
LS
here expresses the fitness between the image field
and the reproduced field. A small E
LS
value will thus demonstrate a good fit between the two
fields and therefore expressing the effectiveness of the reproduction. Although, one can monitor
the spatial sound field reproduction quality by means of the real scalar cost function J
M
of Eq.
(5.18), it would be difficult to use such a scalar for comparison purposes because it include the
effort penalty contribution (weighted by γ) and it vary with a varying number of error sensors
since J
M
includes the sum of the M quadratic errors. This motivates the E
LS
definition for
comparison purposes.
Using a small value of the regularization parameter γ can be sufficient, in term of regulariza-
tion, without reducing the reproduction quality. This idea is presented in Fig. 5.3 (p. 91) for the
free-field configuration of Fig. 5.2 (p. 86) while reproducing a progressive plane wave at 220 Hz
with θ = 30 degree. For a given regularization parameter, in this case roughly between 10 and
10
4
, the total source strength amplitude [q
opt
[ is bounded to acceptable value without important
residual reproduction error increase (E
LS
stays far below the suggested limit of E
LS
= 0.5
[Kirkeby et Nelson, 1993]). Accordingly, a fixed value of γ = 50 is used for all the simulations
considered in this paper although more rigorous determination rules have been introduced for
the regularization of the inverse problem [Nelson, 2001]. Moreover, Fig. 5.4 (p. 91) shows an
alternative representation of Fig. 5.3 (p. 91) which is referred to as a L-curve, where the chosen
γ is near the corner region associated with the optimal regularization parameter [Nelson, 2001].
Even if we use a frequency and case independent γ, it is, for our purpose, still sufficiently near
the optimal corner of the case-dependant L-curves. Some numerical experiments have shown
better conditioning with values as small as γ = 0.1 in comparison with absence of any regula-
rization (γ = 0). However, such small values usually lead to important error outside the sensor
array ; thus potentially introducing high sound pressure outside the reproduction area. This hi-
gher sound pressure is suggested in Fig. 5.3 (p. 91) by the [q
opt
[ drastic increase with small γ.
90
10
−2
10
0
10
2
10
4
10
6
0
0.1
0.2
0.3
0.4
0.5
E
l
s
γ
10
−2
10
0
10
2
10
4
10
6
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
|
q
o
p
t
|
γ = 50 →
Figure 5.3 E
LS
(on left) and [q
opt
[ (on right)
variation as a function of γ for the free-field
case of Fig. 5.2 (p. 86) while reproducing a
plane wave at 220 Hz with θ = 30 degree.
10
−4
10
−3
10
−2
10
−1
10
0
10
−3
10
−2
10
−1
10
0
E
LS
|
q
o
p
t
|
←γ = 0.001
←γ = 0.15999
←γ = 2.0236
←γ = 25.5955
←γ = 323.7458
γ = 655128.5569→
γ = 50 →
Figure 5.4 Relation between [q
opt
[ and E
LS
,
with γ as a parameter (that is the L-curve
representation of Fig. 5.3 (p. 91) for the
free-field case shown in Fig. 5.2 (p. 86))
Although this increase introduces an E
LS
reduction, its at the costly expense of potentially dis-
turbing high source strengths. A regularization parameter of γ = 50 thus seems to be a good
compromise between objective reproduction quality and source strength amplitude. When the
regularization parameter is roughly kept in the flat regions of E
LS
and [q
opt
[ shown in Fig. 5.3
(p. 91), the results can be considered to be valid and revealing for our purposes. This region
corresponds to the L-curve’s corner where a higher concentration of points can be seen on Fig.
5.4 (p. 91) for a logarithmic variation of γ. As shown in both Figs. 5.3 (p. 91) and 5.4 (p. 91),
this region is quite large and can support a γ variation, a tolerance which allow the use of a
case-independent γ for our purposes.
Tikhonov regularization and regularization parameter choice have been extensively studied
in the context of inverse source problem [Nelson, 2001] and for sound reproduction filter design
[Tokuno et al., 1997]. In our current theoretical problem, the idea is not to precisely define the
sources strength from a set of measurements (like for the inverse source problem) but more to
physically reproduce a given wave field and evaluate the possibilities. For this simple reason,
and for computational efficiency, the regularization parameter is not rigorously optimized in this
work.
This entirely acoustical approach to the control problem is easily connected to feed-forward
control systems which usually try to reduce an estimated error by the adaptation of filters ups-
tream of the actuators [Elliott, 2001]. Using the optimal control approach in the frequency do-
91
main, simulations give some cues about the best possible situation and the involved control
mechanisms. It is thus a preliminary evaluation and comparison tool which guides the unders-
tanding and the subsequent construction and configuration of such a system.
Since source power outputs may give some relevant indications about control mechanisms,
each source acoustical power output is computed using Π
l
= (1/2)'
_
p
H
(x
l
)q
l
_
[Elliott, 2001],
where superscript H denotes complex conjugation (that is the Hermitian transpose of a scalar)
and '(z), the real part of z.
As it will be presented in the next section, some comparisons with WFS are made. In this
case, the source strengths are derived from straight application of WFS operators given by [Ve-
rheijen, 1998] for general source arrays, non-focusing virtual image defined by a spherical wave
and a straight reference line through the source array center. For a given virtual spherical source,
the reference line is perpendicular to a line from the virtual source position to the source array
center. Some adjustments have been done to convert monopole amplitude to source strength re-
presentation [Pierce, 1991] using consistent time dependence notation. In this case, the optimal
source strength vector is replaced by the corresponding WFS sources strength.
5.5 Results of numerical simulations
5.5.1 Feasibility study
The first question that should be addressed concerns the feasibility of a method such as
active control in the context of sound field reproduction. As a first investigation, Figs. 5.2 (p.
86) to 5.11 (p. 97) illustrate some results for the free-field case with given source and sensor
configurations. The system configuration, which is depicted in Fig. 5.2 (p. 86), includes a one
meter square sensor array. The target wave field is first defined as a progressive plane wave with
a propagation direction of θ = 30 degrees. Figure 5.5 (p. 93), which presents the minimization
results, shows considerably low residual normalized cost function (E
LS
) over the frequency
range. Such a low residual error corresponds to a satisfactory quantitative reproduction of sound
field, at least over the sensor array. (This is shown in further figures.) Also note in Fig. 5.5 (p.
93) that the reduction of [q
opt
[ with increasing frequency is related to low monopole radiation
efficiency at low frequencies (for a frequency independent source strength, which is volume
velocity in this case).
92
500 1000 1500
0
0.2
0.4
0.6
0.8
1
E
L
S
Freq. [Hz]
500 1000 1500
0
0.01
0.02
0.03
0.04
0.05
0.06
|
q
o
p
t
|
Figure 5.5 Variation of E
LS
(on left) and
[q
opt
[ =
_
q
H
opt
q
opt
(on right) for progressive
plane wave (θ = 30 degree) reproduction in the
(x
1
, x
2
) plane, see configuration in Fig. 5.2 (p.
86).
Figure 5.6 On left, real part of the target wave
field (plane wave) and, on right, the reproduced
wave field at 220 Hz in free field.
Figure 5.6 (p. 93) shows the real part of the target wave field and the reproduced wave
field for the same configuration at 220 Hz. Clearly, a low E
LS
(below 0.1 as in Fig. 5.5 (p.
93) for 220 Hz) corresponds to a good wave field reproduction over the sensor array and in its
immediate vicinity. [Kirkeby et Nelson, 1993] suggested 0.5 as a maximumacceptable value for
E
LS
for a similarly formulated reproduction problem. Although this simulation corresponds to
an ideal situation, Figs. 5.5 (p. 93) and 5.6 (p. 93) allow to conclude that it is possible to locally
(in a 1 m
2
area) reproduce a plane wave using such a configuration in conjunction with active
control techniques. This demonstrates that active control can thus be effective as a wave field
reconstruction system, like WFS. This was to be expected from previously published works for
simple source configurations [Kirkeby et Nelson, 1993].
By analyzing Fig. 5.7 (p. 94), two simple phenomena can be observed for free-field condi-
tion. First, slightly better objective reproduction, in terms of E
LS
, is obtained for, roughly, 45
and 135 degree target plane wave propagation directions. These directions correspond to the
largest possible distance between reproduction source and sensor array for this configuration
(consequently presenting a spherical wavefront of larger radius at the sensor array) and, accor-
ding to Fig. 5.7(b), are associated with a [q
opt
[ increase. Second, depending on the target plane
wave propagation direction, a peculiar E
LS
fluctuation can be observed around 1400 Hz. This
fluctuation can be related to spatial aliasing which is function of sensor separation for this confi-
guration. In this respect, Fig. 5.8(a) shows E
LS
variations for a dense sensor array (which is the
93
500
1000
1500
0
45
90
135
180
0
0.02
0.04
0.06
0.08
0.1
A
n
g
l
e

θ

[
d
e
g
]
Freq. [Hz]
E
L
S
500
1000
1500
0
45
90
135
180
10
−3
10
−2
10
−1
A
n
g
l
e

θ

[
d
e
g
]
Freq. [Hz]
|
q
o
p
t
|
(b)
(a)
Figure 5.7 Variation of E
LS
(a) and [q
opt
[ (b)
with frequency and angle θ, for plane wave
reproduction in free field (see configuration in
Fig. 5.2 (p. 86)).
1000
2000
3000
0
45
90
135
180
0
0.2
0.4
0.6
0.8
1
Freq. [Hz]
A
n
g
l
e

θ

[
d
e
g
]
E
L
S
1000
2000
3000
0
45
90
135
180
0
0.2
0.4
0.6
0.8
1
Freq. [Hz]
A
n
g
l
e

θ

[
d
e
g
]
E
L
S
(b)
(a)
Figure 5.8 Variation of E
LS
with frequency
and angle θ, for plane wave reproduction in
free field with : (a) a dense sensor array (see
configuration in Fig. 5.2 (p. 86)) and (b) a
sparse sensor array (double spaced in
comparison with Fig. 5.2 (p. 86)).
same as in Fig. 5.2 (p. 86)) and Fig. 5.8(b) shows similar fluctuation for a sparse array (the same
number of sensors with a spacing twice that of Fig. 5.2 (p. 86)), both for a broader frequency
span. Above 1400 Hz, E
LS
rapidly increases for the dense array which is characterized by a
0.125 m sensor spacing (corresponding approximately to half wavelength at 1400 Hz). When
halving the sensor array density, this limiting frequency is also halved. This can be attributed to
spatial aliasing by the sensor array. At least two sensors per wavelength have to be included for
proper spatial sampling.
94
5.5.2 Comparison with WFS in free field
Since WFS systems have shown to provide impressive subjective reproduction, a compari-
son between optimal control of sound field reproduction and simple WFS is first presented in
free-field in Figs. 5.9 (p. 96) to 5.11 (p. 97). All these simulations have been carried out with a
virtual spherical source located at x
o
= [−2, −2, 1.2]
T
expressed in meters. The synthesis opera-
tors for an arbitrary source array and non-focusing virtual source are borrowed from [Verheijen,
1998] with a reference line across the sensor array center. This line is perpendicular to a line
from the virtual source to the source array center. The virtual source’s height, 1.2 m, is equal to
source and sensor height. The inspection of E
LS
in Fig. 5.9 (p. 96) shows that the reproduction
error is lower for optimal control than for WFS over the considered frequency range at the sen-
sor array. WFS provides an acceptable E
LS
at low frequency. Above 369 Hz (see broken vertical
line in Fig. 5.9 (p. 96)), the error for the WFS system increases drastically and monotonically.
This result was to be expected since the sources separation gives a spatial aliasing frequency
of approximately 369 Hz for WFS in a first approximation [Verheijen, 1998; Nicol et Emerit,
1999]. In fact, with such a source separation, WFS is penalized for higher frequencies. A den-
ser source array would advantageously push this upper frequency limit for WFS. WFS upper
frequency limit is actually defined by sources separation [Verheijen, 1998], while the optimal
control frequency limit is defined by sensors separation, at least for this configuration. From
a practical view point, increasing microphone density is more easily achieved than increasing
loudspeaker density since microphones are usually smaller than loudspeaker cabinets. On the
other side, from an auditory perception view point, it may not be relevant to attempt physical
sound field reconstruction at frequencies larger than 1.5 kHz since our auditory mechanism of
sound localization is dominated in time-domain, above this frequency, by ITD cues of signal en-
velope and not by ITD cues of signal’s fine temporal structure [Blauert, 1999]. Interaural Level
Differences (ILD), however, are still effective for a higher frequency range [Blauert, 1999].
Even if the residual error is considerably lower for the optimal control solution, the wave
field is correctly reproduced by WFS over a broader listening area at 220 Hz as demonstrated
in Fig. 5.10 (p. 97). However, increasing the size of the listening area for optimal control using
a broader sensor array may be desirable. The listening area aspect is further investigated in the
next section of this paper.
Figure 5.11 (p. 97) shows the source power output for optimal control and for WFS. Clearly,
similar power injection may be observed for both cases in free-field. Somewhat lower power
injection for optimal control is related to the smaller listening area, which corresponds to the
95
500 1000 1500
10
-2
10
-1
10
0
E
L
S
20 500 1000 1500
0
2
4
6

-
4
|
q
o
p
t
|

i
n

1
0
Freq. [Hz]


E
L
S

=

0
.
5


3
6
9
H
z

Figure 5.9 Variation of E
LS
and [q
opt
[ for spherical wave reproduction (x
o
= [−2, −2, 1.2]
T
meters) in free field, see configuration on Fig. 5.2 (p. 86). Solid lines : Optimal control. Dashed
lines : WFS.
sensor array in this case.
According to these simulations of the two methods, active control is able to achieve wave
field reproduction comparable to WFS in free-field condition.
5.5.3 In-room reproduction, comparison with WFS and control mechanisms
The effect of a reflective environment on optimal reproduction at the sensor array position,
in comparison with WFS, can now be evaluated. As shown previously, wave field reproduction
can be physically achieved in free field using active control technique. In the following, the
comparison is conducted for a simple rectangular room.
The investigated configuration is depicted in Fig. 5.12 (p. 98). The room dimensions have
been defined in accordance with the Audio Engineering Society [AES Technical Comittee
on Multichannel and Binaural Audio Technology, 2001] and German Surround Sound Forum
[Rumsey, 2001] recommendations for the optimal size of multichannel monitor rooms. For the
given volume, V = 139 m
3
(precisely 7.5 6.42.896 m; source and sensor height : 1.2 m), a
nominal reverberation time of approximately T
60
= 0.28 s is suggested [Rumsey, 2001]. Using
the Eyring-Norris reverberation model for diffuse field without medium absorption [Kinsler
96
Figure 5.10 (a) Real part of the target wave
field at 220 Hz in free field. (b) Real part of the
reproduced wave field at 220 Hz in free field
using optimal control (on left) and using WFS
(on right, the dashed line is the reference line).
0
2
4
6
0
2
4
6
0
2
4
x
1
[m] x
2
[m]
P
o
w
e
r

o
u
t
p
u
t

i
n

1
0

-
4
W
0
2
4
6
0
2
4
6
0
2
4

x
1
[m] x
2
[m]
P
o
w
e
r

o
u
t
p
u
t

i
n

1
0

-
4
W
(a)
(b)
Figure 5.11 Acoustical power output for : (a)
optimal control and (b) WFS while
reproducing a spherical wave at 220 Hz in free
field, see Fig. 5.9 (p. 96) and 5.10 (p. 97).
et al., 2000]
T
60
=
0.161V
−S ln(1 −a)
, (5.21)
an associated random-incidence energy absorption coefficient, a, is calculated and converted
into an equivalent specific conductance ratio (normalized by the air characteristic impedance
ρc) using an implicit relation [Kinsler et al., 2000]
a = 8β
_
1 +
β
β + 1
−2β ln
_
β + 1
β
__
. (5.22)
The surface-specific conductance ratio β (see boundary conditions in Eq. (5.2) and modal
scheme in Eqs. (5.6) to (5.11)) is set to 0.0651, which is real, frequency independent and uni-
form on S. For the simulations, the number of modes in Eq. (5.5), N, is set to 6137. This proved
sufficient to ensure convergence of the total time-averaged acoustical potential energy up to
400 Hz.
97
x
1
x
2
x
3
Sources
Error sensors
l
x1
: 7.5 [m]
l
x2
: 6.4 [m]
l
x3
: 2.8956 [m]
Sources: 50
Sensors: 81
Figure 5.12 Second investigated
configuration : a room of 139 m
3
with a
reverberation time of 0.28 s (as suggested by
the [AES Technical Comittee on Multichannel
and Binaural Audio Technology, 2001])
100 200 300 400
10
−3
10
−2
10
−1
10
0
10
1
E
L
S
20 100 200 300 400
0
2
4
6
x 10
−4
|
q
o
p
t
|
Freq. [Hz]


E
L
S

=

0
.
5

Dashed lines : WFS
Figure 5.13 Variation of E
LS
(on left) and
[q
opt
[ (on right) for spherical wave reproduction
in room. Solid lines : Optimal control. Dashed
lines : WFS. Thick lines : Reverberation time
of 0.28 s. Thin lines : Reverberation time of
2.8 s. [q
opt
[ is independent of the reverberation
time for WFS.
Figure 5.13 (p. 98) shows the comparison, for such a configuration, between optimal control
and WFS. The target wave field is a spherical wave originating from x
o
= [−2, −2, 1.2]
T
ex-
pressed in meters. E
LS
for optimal control is below 0.02. Optimal control provides a small
reproduction error over the whole frequency range. By comparison, WFS produces an E
LS
lar-
ger than 1 for the same frequency range in the simulated room. According to Eqs. (5.16) to
(5.20) an E
LS
value of 1 corresponds to a reproduction error as important as perfect silence
(p
(rep)
(x) = 0 and e(x) = p
(im)
(x)) in the reproduction space, hence large differences may be
expected between the target wave field and the wave field reproduced by WFS with this room
model. This is indeed supported by Fig. 5.14(a) to (c) where, this time, real and imaginary parts
of pressure have been plotted to clearly differentiate propagating and standing waves. As shown
on Fig. 5.14(b), the optimal control approach properly recreates the wave field at the position
of the sensor-array in the room. On the other hand, Fig. 5.14(c) reveals that WFS does not re-
create the wave field in room situation. Moreover, Fig. 5.14(d) shows that optimal control can
reproduce a progressive wave field over a larger area in the room (2 m 2 m sensor array).
Similar simulations have been carried out for another configuration (where the surface-
specific admittance ratio β have been replaced by 0.0059) corresponding to a reverberation
time of approximately 2.8 s (that is, ten times longer than the AES recommendation for the gi-
98
Figure 5.14 Real (on left) and imaginary (on right) part of : (a) the target wave field at 220 Hz
in room (T
60
≈ 0.28 s), (b) the corresponding reproduced wave field using optimal control, (c)
the reproduced wave field in room using WFS, and (d) the reproduced wave field using optimal
control in room for a larger sensor array.
ven volume). The reproduction room is consequently regarded as a poor environment for audio
applications since strong and distinct standing waves may appear both in space and frequency
responses. The results are again shown on Fig. 5.13 (p. 98) for active control and WFS. From
this figure, it is possible to conclude that active control, automatically accounts for room dyna-
mics, even for a highly reflective environment. This illustrates the usefulness of active control
in sound field reproduction.
99
0
2
4
6
0
2
4
6
0
0.5
1
x
1
[m]
x
2
[m]
P
o
w
e
r

o
u
t
p
u
t

i
n

1
0

-
6
W
0
2
4
6
0
2
4
6
0
5
10

x
1
[m]
x
2
[m]
P
o
w
e
r

o
u
t
p
u
t

i
n

1
0
-
7
W
(a)
(b)
Positive
Negative
Figure 5.15 Acoustical power output for : (a)
optimal control and (b) WFS while
reproducing a spherical wave at 220 Hz, in
room (T
60
≈ 0.28 s).
0
2
4
6
0
2
4
6
0
2
4
x
1
[m]
x
2
[m]
P
o
w
e
r

o
u
t
p
u
t

i
n

1
0

-
7
W
0
2
4
6
0
2
4
6
0
0.5
1
1.5

x
1
[m]
x
2
[m]
P
o
w
e
r

o
u
t
p
u
t

i
n

1
0
-
6
W
0
2
4
6
0
2
4
6
-1
0
1
2

x
1
[m]
x
2
[m]
P
o
w
e
r

o
u
t
p
u
t

i
n

1
0
-
7
W
Negative
Positive
Negative
Positive
(a)
(b)
(c)
Figure 5.16 Acoustical power output for : (a)
optimal control and (b) WFS while
reproducing a spherical wave at 70.5 Hz, in
room (T
60
≈ 0.28 s). (c) Acoustical power
output for optimal control while reproducing a
spherical wave at 220 Hz, in room with a lower
admittance (T
60
≈ 2.8 s).
The source acoustical power output for the 220 Hz spherical wave field reproduction is
shown in Fig. 5.15(a) for optimal control, and in Fig. 5.15(b) for WFS. The source output
distributions are clearly different in each case. Power absorption (negative power output) by
acoustic sources is hardly visible on Fig. 5.15(a) for the active control of sound reproduction.
This ensures reconstruction of a propagating wave field on a modal basis.
100
For such a frequency of 220 Hz (above the room’s Schroeder frequency which is approxi-
mately 94 Hz [Pierce, 1991]), where modal density and modal overlap are progressively more
important, control mechanisms may be interpreted, in the limit of the present physical model,
as a modal re-arrangement where appropriate field reconstruction arises from the superposition
and arrangement of modal responses at the driving frequency. Recalling that each room’s oblique
mode can be seen as a superposition of eight propagating plane waves, some superposition pos-
sibilities have to be expected when modal overlap increases. At lower frequencies, where the
modal density is, by far, lower, acoustical power absorption by the reproduction sources be-
comes more important. This is illustrated in Fig. 5.16(a) and (b) for an image field at 70.5 Hz.
For such low frequencies (below the room’s Schroeder frequency) the spatial sound pressure va-
riations over the sensor array are small and the modal density is smaller. In this frequency range,
the optimal control, again for this configuration, acts to create an acoustical energy flow over
the sensor array and mainly prevents a pure standing wave pattern. Acoustical power outputs are
finally shown in Fig. 5.16(c) at 220 Hz for the same room with a longer reverberation time of
approximately 2.8 s. In this case, power absorption by the reproduction sources is more effective
in the optimal reproduction process above the Schroeder frequency. From these results and com-
parisons with WFS, it is clear that all the sources are active in contributing to progressive wave
field reconstruction in room. For this reason, wave field reconstruction and room compensation
may not be performed with only a fraction of the total number of reproduction sources. These
sources that are inactive in WFS have to perform power absorption or modal re-arrangement for
better sound field reproduction in room.
5.5.4 Investigation of practical sensing configuration
In this section, a more practical microphone array is briefly introduced for sound field re-
construction. The main objective is to investigate a potential sensor array which can reduce the
total number of sensors and leave a listening zone (where the wave field must be reproduced)
free of any sensor.
WFS is based on the Kirchoff-Helmoltz integral formulation [Verheijen, 1998; Morse et
Ingard, 1968]
p(x) =
_
S

(G(x[y)∇p(y) −p(y)∇G(x[y)) ndS

(5.23)
which represents a mathematical formulation of the Huygens’ principle where the normal pres-
sure gradient on S

becomes a continuous monopole source and the pressure on S

becomes
101
a continuous dipole source. Note that this applies only in the volume V

bounded by surface
S

(see Fig. 5.1 (p. 86) for the chosen convention). Also note that S

may not correspond to
a physical surface such as a room wall or source array. The WFS fundamental and theoretical
interpretation of this formulation is that the wave field can be reconstructed using a surroun-
ding and continuous distribution of appropriately driven monopoles and/or dipoles sources on
S

where p(y) is the target wave field on S

. Another interpretation of Eq. (5.23) is that any
sound pressure field inside V

, which is assumed to be free of acoustic sources, is entirely and
uniquely defined by its pressure and pressure gradient on the bounding surface S

. With this
in mind, perfect wave field reconstruction should be obtained if the pressure and the pressure
gradient is continuously reconstructed on S

with reproduction sources outside V

and S

. Such
interpretation has been previously pointed out by [Ise, 1999]. Now considering the fact that
WFS, using a finite number of sources along a finite line replacing S

, appropriately repro-
duces an approximation of the target wave field below the WFS aliasing frequency in free-field
[Berkhout et al., 1993; Verheijen, 1998], another sensor array for optimal control is introduced
in Fig. 5.17(a). For this configuration, the sensors are distributed over the sides of a 3 m3 m
square, and consist of either single microphones or microphone pairs. For the microphone pair,
the microphones are separated by 0.1071 m. There is a total of 84 sensors. With this linear sensor
array, any reproduction error reduction will reconstruct an approximation of the sound pressure
(single microphone) and sound pressure gradient (microphone pairs) around the listening area.
Depending on the situation, it is consequently expected that such a reconstruction will also im-
ply wave field reproduction inside the sensor array. The surrounding property of the linear array
is chosen to ensure reproduction for all possible propagation directions in the horizontal plane.
In free-field, a simple layer, which only approximates sound pressure, could have alternatively
been considered as sufficient for reproduction.
A similar type of reconstruction has been used by [Corteel et al., 2002] for Wave Field
Synthesis with panel loudspeakers. In their paper, the authors report the experimental usage of
a simple linear sensor array in front of the panel sources to achieve filter design using adaptive
filters. Adaptive filter design procedure is chosen since explicit WFS operators would be too
difficult to theoretically define for such multi-exciter panel loudspeakers.
Using the discrete approximation of reproduced pressure and pressure gradient around a
listening area, in order to obtain an appropriate field inside the horizontal array, some revealing
results about practical possibilities for such a surrounding array are provided. Optimal control
application for a configuration in free-field situation is summarized in Figs. 5.17 (p. 103) and
5.18.
102
Figure 5.17 (a) A linear sensor array in free
field superposed to the real part of the target
wave field (a spherical wave originating from
x
o
= [−1, 2.8, 1.2]
T
meters) at 220 Hz. (b)
Real part of the corresponding reproduced
wave fields in free field with optimal control
(on left) and WFS (on right, the dashed line is
the reference line)
0
2
4
6
0
2
4
6
0
1
2
x
1
[m] x
2
[m]
P
o
w
e
r

o
u
t
p
u
t

i
n

1
0

-
3
W
0
2
4
6
0
2
4
6
0
1
2

x
1
[m] x
2
[m]
P
o
w
e
r

o
u
t
p
u
t

i
n

1
0
-
3
W
(a)
(b)
Figure 5.18 Acoustical power output while
reproducing a spherical wave at 220 Hz, in free
field with (a) optimal control and (b) WFS (see
Fig. 5.17 (p. 103)). Diamond markers denote
zero power output for WFS.
Wave field reproduction is conveniently achieved in the listening zone, surrounded by this
sensor array, using optimal control of error reproduction at these sensor locations. As illustrated
in Fig. 5.17(b), optimal control results are comparable to WFS reproduction. Clearly, this simple
preliminary result using a linear sensor array shows that active control leads to a sound field
reconstruction which is very similar to WFS reconstruction in a free-field reproduction space.
This type of pressure and pressure gradient reconstruction constitutes a conceptual connection
between WFS and active control of reproduction errors. Source power outputs are shown in
Fig. 5.18 (p. 103). Again, sound field control and WFS show similar power output distributions.
The narrower power distribution for optimal control is related to the smaller dimensions of
103
the reproduction area, as compared to the dimension of the WFS reference line in front of the
sources. As expected for the free-field acoustics, there is no control mechanism that operates in
this example other than wave interference. In comparison with the free-field results shown in
Fig. 5.10 (p. 97), a larger listening zone is achieved. This difference is due to the larger extent
of the sensor array that is more demanding in terms of securing a suitable reproduction area.
Being able to successfully use such an array in a room would be practically very attractive.
Unfortunately, preliminary simulations using such a sensor array in a room situation show an
inappropriate reproduction of sound field inside the surrounding array except for low frequen-
cies. For low frequency, the sensor array is not any more a linear array since the dimensions of
the sensor array are comparable to the acoustic wavelength. Such a difference between free-field
and in-room situations was physically foreseeable. From the Kirchhoff-Helmholtz formulation,
any distribution of sound pressure and sound pressure gradient over S

will entirely define sound
pressure p(x) inside V

. Since our simulations are concerned with a planar listening area (that
is source distribution and sensors distribution in an horizontal plane), the free-field situation al-
lows one to replace the surface integration by a line integration surrounding the listening area.
The linear array of Fig. 5.17 (p. 103) is thus a free-field specific interpretation of the Kirchhoff-
Helmholtz integral simplified to a surrounding line. By marked contrast with the free-field si-
tuation, the room situation implies source reflections from the walls, ceiling and floor, the sound
pressure field is thus defined by sound waves propagating with all possible directions through
the closed surrounding surface S

which consequently cannot be replaced by a line array without
loss of information. About this point, one can see a connection with the practical implementation
of surrounding linear sensor array by [Spors et al., 2003a] used for plane wave decomposition
and room compensation. For the aforementionned reasons, a linear array as the one introduced
in Fig. 5.17 (p. 103) should be replaced by a surrounding sensor surface for the in-room context
to achieve a more ideal correspondence with the Kirchhoff-Helmholtz integral formulation. In
any case, further investigation should be carried out to evaluate both the effect and nature of
such type of line approximation for in-room situation.
This linear sensor array gives only a frequency dependent approximation of the continuous
sound pressure and sound pressure gradient around the listening space, the reproduction inside
the array is consequently more sensitive to residual error and its quality is no more objectively
evaluated by the unique consideration of E
LS
. In spite of the need for further investigation of
such a sensor array, the previous simulations suggest some potential and interesting applica-
tions. Moreover, this establishes a relation between Wave Field Synthesis and active control of
sound reproduction. From a practical view point, such a linear sensor array would be attrac-
104
tive for sound field control since the quantity of sensors is seriously reduced (in comparison
with a uniform rectangular array) and the listening area, which is considerably larger, is free of
sensors. On the other hand, as mentioned earlier, some serious efforts should be devoted to the
applicability and adaptation of such a type of sensor array in-room situation.
5.5.5 Conditioning of the reproduction system
This section deals with two other aspects of sound field reproduction. The first is related
to the effect and meanings of the introduced earlier Tikhonov regularization within the optimal
control approach while the second is a search for an ideal source and sensor configuration.
Here, however, we do not seek an absolute solution to the quest for an ideal configuration, but
general rules for practical elaboration of a sound field reproduction system. For both aspects,
conditioning of matrices is regarded as a source of relevant information.
Figure 5.19 introduces some aspects of sound field reproduction in a room in comparison
with a free-field situation from the matrix inversion view point. Such considerations are first
monitored by the condition number of [Z
(m)H
Z
(m)
+γI], that is the matrix to be inverted in Eq.
(5.19) while achieving optimal control. The condition number of a matrix is formally defined as
the ratio of the largest to the smallest non-zero singular values of the matrix. (See [Golub et van
Loan, 1996] and [Nelson et Yoon, 2000] for a more detailed review of the potential meanings
and applications of the condition number in relation with singular value decomposition, a topic
which is beyond the scope of this paper.) A simple numerical interpretation of the condition
number is that an higher condition number reveals an ill-conditioned matrix which, by means of
numerical inversion, may lead to errors and fluctuations in the solution q
opt
. In the worst case of
ill-conditioning, the solution may not be valid at all (showing an extremely sensitive reaction to
numerical errors) and the matrix is nearly singular or singular and thus prevents any significa-
tive matrix inversion. For our application and by inspection of Fig. 5.19 (p. 106), the condition
number of the matrix which has to be inverted in the optimal control process is drastically re-
duced when the regularization parameter γ is introduced, as expected from Section 5.4.2. Since
a large condition number characterizes an ill-conditioned problem, the Tikhonov regularization
improves the conditioning and hence demonstrates its useful presence. Consequently, since this
regularization corresponds to an effort penalty in the active control perspective, the beneficial
effect of γ parameter suggests for future works on sound field reproduction with optimal control,
that a specific adaptation scheme such as the leaky adaptation
3
[Elliott, 2001] is to be considered
3
Leaky adaptation is the practical time-domain adaptive filtering method corresponding to the cost function
105
20 100 1000 1500
10
−5
10
0
10
5
10
10
10
15
10
20
Freq. [Hz]
[
Z
(
m
)
H
Z
(
m
)
+
γ
I
]
c
o
n
d
i
t
i
o
n

n
u
m
b
e
r
Free field, γ=50
Free field, γ=0
In room (T
60
≈0.28s), γ=0
In room (T
60
≈0.28s), γ=50
Figure 5.19 Condition number of
[Z
(m)H
Z
(m)
+γI] (see configurations in Figs.
5.2 (p. 86), 5.14(d) and 5.12 (p. 98)).
Figure 5.20 Condition number of Z
(m)
for
various configurations (physical situation, the
source configuration and the sensor
configuration). “Normal” refers to source
position of Fig. 5.2 (p. 86). “Random” refers to
source position of Fig. 5.2 (p. 86) with an
additional ± 0.1 m randomization along the
three axes. “Small” refers to sensor positions of
Fig. 5.2 (p. 86) while “large” refers to a larger
(3 m3 m) array with 81 sensors.
for practical implementation to compensate for ill-conditioning of the problem and by doing so
avoid unacceptable large source strengths. Again from Fig. 5.19 (p. 106), the condition num-
ber shows strong variations with frequency in a room enclosure. In case of modal-dominated
response (at lower frequency), the condition number increases at room resonances and thus sug-
gests the effect of room dynamics on the optimal control problem conditioning. This will be
more developed in the following comments.
We now consider effect of various parameters, such as : in-room versus free-field situation,
admittance variation, sensor and source positions, on the condition number of the matrix Z
(m)
to reach some guidelines for design purposes. This matrix is the plant matrix and it describes the
reproduction system through the relation between q and p
(rep)
expressed by Eq. (5.12). Theore-
introduced earlier by Eq. (5.18) [Elliott, 2001]. The “leaky” qualifier arises from the introduction of an effort-
penalty term in the cost function which make the solution leak toward zero when its possible.
106
tically, the condition number of Z
(m)
bounds the variations of q caused by p
(rep)
variations [Nel-
son, 2001] in the set of equations q = Z
(m)
−1
p
(rep)
. In such a manner that a well-conditioned
matrix (with a small condition number) shows a small source strength variations caused by small
pressure variations while an ill-conditioned matrix (with a large condition number) implies im-
portant source strength variations for small pressure variations. Since for optimal control p
(rep)
is always trying to imitate in a “least-square” sense p
(im)
, a high condition number for Z
(m)
may
thus lead to strong variations of q
opt
associated with slight variations of p
(im)
. Such a behavior
is undesirable in practice because progressive or smooth time variations of the target wave field
should necessarily be associated with a rather smooth variation of the source strength, since such
abrupt change may be noticeable to an audience. For all these reasons, the condition number of
Z
(m)
provides some cues for the most appropriate reproduction configuration. Moreover, the
condition number of Z
(m)
alone allows to compare the conditioning in various configurations
without the influence of γ. It worth noting that Optimal Source Distribution (OSD) systems for
cross-talk cancellation have been developed on a similar theoretical basis about conditioning
for a system including only two sources and two reproduction points [Takeuchi et Nelson, 2002;
Ward et Elko, 1999].
The computed Z
(m)
condition numbers are introduced in Fig. 5.20 (p. 106) for various confi-
gurations in free field and in room. The small sensor array refers to the one of Fig. 5.2 (p. 86).
The large sensor array refers to a larger (3 m3 m) square centered sensor array again including
81 sensors. Source positions are kept identical to Fig. 5.12 (p. 98), except for one case with
random variations of the source positions limited to ± 0.1 m along the three axes. As introdu-
ced earlier, an admittance ratio of β = 0.0651 is used in “normal” reverberation (T
60
≈ 0.28 s)
conditions (following the AES requirements) and an admittance ratio of β = 0.0059 (T
60

2.8 s) is used to evaluate the effect of less room absorption. All the corresponding J
M
minimi-
zation results are shown in Figs. 5.21 (p. 109) and 5.22 (p. 109) for an image field defined by a
spherical wave originating from x
o
= [−2, −2, 1.2]
T
expressed in meters.
In all cases of Fig. 5.20 (p. 106), the condition number decreases with increasing frequency.
This is caused by source and sensor separation distance in relation with decreasing wavelength.
At low frequency, where the spatial variation of the sound pressure is small over the source and
sensor arrays, the elements of Z
(m)
tend to be identical and the transfer impedance matrix Z
(m)
tends to be singular (hence presenting a more important condition number). This also explains
the better conditioning associated with the large sensor array, that can more effectively observe
longer wavelengths without the apparition of similar elements or linearly dependant lines or
rows in the matrix Z
(m)
.
107
For both free-field and in-room situations, the slightly randomized source positions implies
a better conditioning than the straightforward rectangular symmetrical array. Such alteration
effectively breaks the potential symmetry and increases the differences between Z
(m)
elements
and, consequently, reduces the Z
(m)
condition number and avoids a singular characteristic.
Let now investigate the effect of the reproduction space on the condition number as function
of frequency. From Fig. 5.20 (p. 106), the room situation with a shorter reverberation time shows
a better conditioning than both the free-field situation and the longer reverberation room situa-
tion. (This is for the same source and receiver positions.) Consequently, although E
LS
variation
for various reverberation times were nearly unnoticeable on Fig. 5.13 (p. 98) using optimal
control approach, the Z
(m)
condition number increases when reverberation time is increased to
T
60
= 2.8 s. This suggests that, although active control of sound may, in one unique operation,
synthesize a wave field and overcome the room’s natural dynamics, a less reflective environ-
ment, such as the one based on AES recommendations, is favorable in terms of conditioning
and robustness of the inverse problem q = Z
(m)
−1
p
(rep)
. Hence, a more damped room, that
is with a shorter reverberation time, will ensure less important q
opt
variation for a given p
(im)
variation.
The previous observation that suggests that the in-room case (with T
60
= 0.28 s) is better
conditioned than the free-field case may seem surprising at first glance. In fact, the major condi-
tioning difference between free-field and in-room situations arises from free-field and in-room
model differences. For the free-field model, a given frequency corresponds to a single acoustic
wavelength while the room model implies a modal expansion of the Green’s function. Recalling
that each mode has its own eigenvalue and corresponding wavelengths along axes, each mode
present in the response will differently contribute to Z
(m)
at a given frequency. The contribu-
tion of higher order modes in the room response therefore implies more differences in the Z
(m)
coefficients, and ultimately a better conditioning of the problem. Even when Z
(m)
is compu-
ted at low frequencies or for modal-dominated responses, such higher modes introduce a little
regularization of the matrix which drastically improves the matrix conditioning.
Again from Fig. 5.20 (p. 106), the best conditioning situation is obtained for the large sensor
array with rectangular source array in room. However, such a sparse sensor array may reduce
the upper frequency effective limit which is, as seen previously, dictated by effective spatial
sampling by the sensor array. Moreover, Figs. 5.21 (p. 109) and 5.22 (p. 109) show that both
free-field and in-room situations including a large sensor array are associated with the largest
source strengths and reproduction errors for spherical wave reproduction. However, in all cases
108
Figure 5.21 E
LS
values for the various cases
presented in Fig. 5.20 (p. 106) while
reproducing a spherical wave originating from
x
o
= [−2, −2, 1.2]
T
expressed in meters.
Figure 5.22 [q
opt
[ values for the various cases
presented in Fig. 5.20 (p. 106).
introduced in Figs. 5.21 (p. 109) and 5.22 (p. 109), E
LS
is still below 0.5. For these reasons, the
most well-conditioned system may not suggest an ideal configuration. However, it is clear, from
previous allegations about conditioning, that a broken symmetry and a reduced reverberation
time will provide a better conditioned systemwhich should be favored for practical applications.
Since these conditioning considerations have been formulated for the transfer impedance
matrix Z
(m)
, the remarks apply to a broader range of problems such as optimal control of noise
and inverse problems in acoustics since the usage of such transfer impedance matrix like Z
(m)
is common to those problems. Moreover, even within a sound reproduction context which is not
based on optimal control, the conditioning observations give interesting insight into the relation
between source strengths and reproduced pressure variations.
5.6 Discussion
From a practical perspective, loudspeakers can be relatively inexpensive, allowing their li-
beral use in multiple-loudspeaker arrays. On the other hand, a microphone array, such as the
one introduced in Fig. 5.2 (p. 86) or 5.17, gives no practical advantages to an audience and its
109
physical presence may even be questionable in comparison with multiple channel open-loop
systems such as WFS. Indeed, one should consider that any attempt to introduce more complex
reproduction systems (including more sources and, in this case, a supplementary set of sen-
sors) in real situation will have to overcome some resistance attributable to the non-practical
nature of a supplementary device located in the reproduction space intended for entertainment
or virtual reality purposes. However, substantial benefits of the sensor array and active control
are closely related to closed-loop and adaptive architectures for wave field reproduction and
room dynamics compensation as shown in section 5.5.3. Moreover, the adaptive nature of a ty-
pical active control system implies that source (loudspeaker) frequency responses may not be
perfectly matched since adaptive filter design will compensate for such discrepancies. This ar-
gument again points to the usefulness of sensors aray in contrast with other open-loop systems.
In this paragraph we had briefly introduced the subtle and touchy compromise between high-
fidelity objective reproduction and more practical and less critical applications. A compromise
is needed which is a key factor for any further practical developments and which may suggest
few different practical approaches to this problem.
A first type of method would thus be a straight-forward direct application of optimal control
as simulated in this paper, that is providing the optimal control of sound field reproduction
on-line. Alternatively, one can think of optimal control including a sensor array as a setup pro-
cedure, that is working off-line. In the latter case, a database of both possible virtual source
positions and types may have to be stored. This database should also includes the complete set
of corresponding filters which would have been identified by means of adaptive signal proces-
sing, consistently with the optimal control theoretical analysis. Such a setup procedure could
thus rapidly become a tedious one and may consequently be not so interesting in comparison
with on-line applications. Moreover, the off-line application may introduce serious errors which
come from the weakly time-variant acoustical nature of a room[Hatziantoniou et Mourjopoulos,
2004]. In either the on-line or off-line case, the here introduced observations and conclusions
still valid, again except for the remark about the nature of room acoustics which may slightly
change with time [Hatziantoniou et Mourjopoulos, 2004].
Considerations and decision regarding the merits of on-line versus off-line solutions could
be both further investigated and clarified in any corresponding practical studies.
From an adaptive active control view point, the system includes a large number of inputs and
outputs and may consequently become a computational burden, even for a 1.5 kHz frequency
range. On the other hand, depending on the controller architecture and adaptation scheme [El-
110
liott, 2001], some reduction in computation time can be achieved. If some practical aspects of
current audio systems and sound control technology are taken into account, a reduced number
of sensors should be considered in subsequent simulations and research.
In spite of this, the introduced configurations and the associated physical model have been
used for investigation purposes, because they give indications about the physical possibility of
creating a wave field (spherical or planar) in a given horizontal region with various closed-
loop reproduction systems. These simple simulations have in fact revealed that it is possible to
reproduce a progressive wave front in a closed reflective environment, thus from a set of room
modes, in a least-square sense.
Most of the presented simulations have been interpreted from an active control view point,
assuming an adaptive controller such as feedforward system with effort penalty. The simulations
and results can also be considered from the inverse problem perspective. From this view point,
the questions are : is it physically possible to recreate a given wave field with a given set of
sources and what mechanisms are involved ? As a response, the wave fields can be constructed,
in the least-square sense, by a set of simple sources with source strengths totally different than
WFS source strengths in a room situation. Some sources that are inactive in WFS are now active
in the optimal control approach and may possibly perform power absorption. This suggests the
need for WFS modifications in reflective environments. (See [Spors et al., 2003a] as an example
of practical implementation).
5.7 Conclusion
Active control techniques can be applied to sound field reproduction with satisfactory quan-
titative reproduction results achieved in a room and in a free field. These methods provide more
accurate sound field reproduction than a standard open-loop WFS system operating in a room.
Such benefits are related to source power absorption and compensation of room dynamics in a
reflective environment. Moreover, the simulations show that all reproduction sources are active
in the optimal control approach, thus suggesting a need for modifications of the standard WFS
operators. It is also demonstrated that active sound control can simultaneously perform wave
field reproduction and room compensation in a unique error minimization task.
Other relevant conclusions are related to spatial aliasing and special sensor configuration. It
111
has been shown that spatial aliasing in optimal control is dictated by sensor spacing in the case of
a dense enough sensor array away from the sources, while it is source density which dominates
spatial aliasing for WFS [Verheijen, 1998; Nicol et Emerit, 1999]. For this reason, optimal
control may be more interesting since a dense microphone array is practically more convenient
than a dense source array. However, one has to reduce the quantity of sensors for practical
applications. Again from a practical view point, an interesting configuration of sensors, namely
a sensor layer around a listening area, provides satisfactory sound field reproduction inside the
array while keeping the listening region free of any sensors. Such a configuration, which implies
pressure and pressure gradient reconstruction on a surrounding line constitutes a conceptual link
between active control and WFS. In this paper, the surrounding sensor configuration has not
been optimized for all possible situations. Further research should address this point, since the
sensor array introduced here is not performing sound field reproduction in a room.
Other conclusions have been drawn on the conditioning of the reproduction system inclu-
ding sources, reproduction situation and sensors. The results suggest that a large sensor area, a
slightly randomized source positioning and reproduction in closed space are favorable in terms
of the problem conditioning. On the other hand, some well-conditioned configurations, like the
large sensor area, imply larger reproduction errors. The introduction of a regularization parame-
ter at this stage of the study suggests the needs for proper effort penalty consideration in any
following practical work.
Future work should be devoted to control architecture, practical prototyping and further
objective evaluation of the suggested technique.
Acknowledgments
This work has been supported by NSERC (Natural Sciences and Engineering Research
Council of Canada), FQRNT (Fond Québecois de la Recherche sur la Nature et les Techno-
logies), VRQ (Valorisation Recherche Québec) and Université de Sherbrooke.
112
CHAPITRE 6
ÉTUDE COMPARATIVE DE LA WFS, DE LA MINIMISA-
TION RÉGULARISÉE DE L’ERREUR ET DE L’AWFS
6.1 Introduction
Les deux chapitres précédents ont su démontrer l’utilité théorique de la reproduction de
champs acoustiques par contrôle plutôt que par WFS lorsque la reproduction doit par exemple
avoir lieu en salle. Le chapitre 5 ayant plutôt misé sur la compréhension physique de la repro-
duction d’ondes progressives en salle, le présent chapitre se base sur une formulation similaire
et introduit la définition de l’AWFS («Adaptive Wave Field Synthesis», l’originalité technolo-
gique décrite dans cette thèse) mais se consacre surtout aux analyses des intérêts et limitations
des applications et configurations pratiques potentielles ; l’objectif principal étant de comparer
certaines configurations géométriques et finalement de définir celle qui sera privilégiée expéri-
mentalement.
Un reproche couramment formulé à l’égard de l’égalisation en plusieurs points (ce qui cor-
respond à quelques détails près à la formulation de contrôle optimal pur [minimisation de l’er-
reur de reproduction et pénalisation de la commande] exposée au chapitre 5) vient du fait que
même si l’erreur de reproduction est réduite aux points de contrôle, il est possible que l’erreur
de reproduction soit trop importante pour des points qui ne correspondent pas à des points de
contrôle
1
. D’autres méthodes d’égalisation spatiale ont été proposées pour tenter d’éviter ce
problème [Spors et al., 2003a]. L’une des principales se base sur des notions d’extrapolations
de champs acoustiques [Poletti, 2000; Spors et al., 2003a] afin d’étendre les zones de contrôle.
Par contre, ces extrapolations de champs sont basées sur des hypothèses dont la validité peut ai-
sément être mise en doute puisqu’au bout du compte, les extrapolations (basées sur l’utilisation
1
On trouve le problème équivalent dans le cas du contrôle actif du bruit alors que de faibles erreurs aux capteurs
de contrôle n’indiquent pas toujours une réduction globale d’un niveau de bruit indésirable.
113
d’une antenne de capteurs circulaire et des décompositions en harmoniques cylindriques puis en
ondes planes) résident en partie sur des hypothèses de champs libres [Spors et al., 2003a]. Ce
qui ne correspond pas au cas de la reproduction en salle. Même dans ce cas d’extrapolation de
champs, la performance idéale du système serait caractérisée par une erreur nulle aux capteurs
de l’erreur, ce qui donc ne distingue pas vraiment l’approche par extrapolation de champs telle
que mise de l’avant par Spors [Spors et al., 2003a] de l’approche par égalisation en plusieurs
points. De plus, Spors reconnaît textuellement qu’une faible erreur résultante observée dans
l’expression du champ transformé n’a pas donné les résultats escomptés en dehors des positions
des capteurs de l’erreur, soit comme dans le cas de l’égalisation en plusieurs points [Spors et al.,
2003a].
En plus des inconvénients mentionnés plus tôt, on note le problème pratique de l’encombre-
ment d’un espace de reproduction par une vaste antenne de capteurs de l’erreur de reproduction.
Dans cette optique, ce chapitre met l’accent sur des antennes de capteurs compactes afin d’éviter
ce problème d’encombrement.
Dans ce chapitre, des comparaisons entre les trois méthodes (WFS, minimisation régularisée
de l’erreur de reproduction – comme au chapitre 5 – et AWFS) sont avancées avec la définition
théorique de l’AWFS afin d’évaluer les caractéristiques propres aux approches mentionnées.
Ces comparaisons sont effectuées avec différentes configurations de sources et de capteurs.
L’objectif n’est pas de prétendre à l’atteinte d’une erreur nulle, ou très faible, sur un espace
très étendu mais plutôt d’établir laquelle des méthodes semble la plus prometteuse par rapport
au critère de réduction de l’importance des erreurs en dehors des points de contrôle.
Ce chapitre est donc introduit à titre de complément au précédent et présente un résumé de
tous les résultats de simulations issus de cette étude comparative des méthodes et configurations
possibles. Il met aussi en place la formulation de la partie physique de l’AWFS à la section 6.2.
La section 6.3 présente les résultats en champ libre, la section 6.4 analyse l’effet de la distance
de séparation des capteurs, la section 6.5 présente une configuration de sources en «U» alors que
les sections suivantes (6.6 et 6.7) abordent respectivement l’effet de la présence d’une surface
rigide infinie et la description de la configuration privilégiée pour les expérimentations et pour la
suite de cette thèse. On note aussi que cette analyse répond au besoin d’établir et de comprendre
les mécanismes d’une méthode, l’AWFS, qui requiert possiblement un nombre moindre de cap-
teurs pour des applications pratiques viables (considérer à ce sujet la discussion au chapitre 5
aux pages 109 et suivantes). L’AWFS est développée et étudiée selon d’autres perspectives aux
chapitres 7 à 9. Le présent chapitre constitue, quant à lui, une définition préliminaire de l’AWFS.
114
6.2 Formulation théorique d’une approche d’AWFS
Dans cette section, la définition de la WFS adaptative (l’AWFS) est introduite pour l’aspect
physique du problème. D’autres détails au sujet de ce développement sont présentés en annexe
à la section A.3 à partir de la page 302. Les propriétés de l’AWFS sont aussi développées dans
tous les chapitres suivants puisque l’AWFS est la solution technologique retenue dans le cadre
de cette thèse.
Indépendamment de la relation entre le nombre de sources et le nombre de capteurs, une
nouvelle fonction coût représentative de l’intention de l’amélioration reproduction par contrôle
actif est posée comme suit
J
AWFS
= e
H
e +λ(q − q
WFS
)
H
(q −q
WFS
) (6.1)
où e
H
e représente l’indice scalaire de performance et λ(q − q
WFS
)
H
(q − q
WFS
) la pénalisation
de l’écart de la solution optimale en rapport à une solution posée a priori, soit q
WFS
dans le cas
de l’AWFS. L’ensemble de la définition des termes suit donc la nomenclature du chapitre pré-
cédent. La solution posée a priori est celle obtenue par la définition des opérateurs de synthèse
de la WFS pour le cas considéré (les opérateurs de synthèse sont définis à la section A.5). Ce
type de formulation des moindres-carrés est connu dans le contexte plus général des problèmes
inverses linéaires [Hansen, 1998]. Cette nouvelle fonction coût représente donc le fait qu’une
solution qui minimise les erreurs de reproduction est recherchée tout en favorisant, selon l’am-
pleur de λ, la solution optimale la plus proche de celle avancée par la WFS. Dans le cas où la
fonction coût de l’équation (6.1) est utilisée avec q
WFS
,=

0, on parlera d’AWFS; si q
WFS
=

0,
on parlera de minimisation régularisée des erreurs de reproduction.
Il est possible d’utiliser l’équation (6.1) même dans le cas sous-déterminé (avec un nombre
de sources plus important que le nombre de capteurs) étant donné que la présence de la pénalisa-
tion de la commande (λq
H
q) dans le développement du terme λ(q −q
WFS
)
H
(q −q
WFS
) garantit
que la matrice Hessienne de la fonction quadratique Hermitienne de l’équation (6.1) soit définie
positive
2
. Ce qui assure qu’une seule solution optimale puisse minimiser cette nouvelle fonction
coût. Cette solution optimale est la suivante
q
(opt)
=
_
Z
(m)
H
Z
(m)
+λI
_
−1
_
Z
(m)
H
p
(im)
+λq
WFS
_
(6.2)
λ régularise donc la solution q
(opt)
aux environs de la solution posée a priori q
WFS
.
2
La section A.3 à la page 302 présente la démonstration de ces deux affirmations.
115
6.3 Comparaisons en champ libre entre WFS, AWFS et minimisation régularisée des
erreurs de reproduction
Ce chapitre présente principalement des résultats de simulations de l’AWFS qui servent de
premières illustrations des possibilités de l’AWFS. Des comparaisons sont effectuées en champ
libre pour, par exemple, considérer la nature du champ direct qui serait reproduit en salle par les
différentes approches. On cherche à comparer les différences de base et celles qui sont visibles.
De plus, un système de AWFS devrait performer aussi bien en salle qu’en champ libre, ce qui
motive cette approche comme entrée en la matière en AWFS.
6.3.1 Configuration circulaire des sources et configurations centrées pour les capteurs de
l’erreur
Deux configurations de sources sont étudiées, en cercle ou en «U» (à la section 6.5). Dans les
deux cas, on considère un total de 24 sources acoustiques. Pour les configurations de capteurs,
on considère des distributions compactes centrées pour réduire le nombre de capteurs et l’espace
d’encombrement qu’ils occupent.
Cas (a) : antenne de sources circulaire et capteur central unique.
La configuration est présentée à la figure 6.1 (p. 117). Elle inclut un seul capteur d’erreur
pour le contrôle et 32 moniteurs de l’erreur de reproduction afin d’évaluer l’erreur de reproduc-
tion en dehors du point de contrôle. La distance de séparation des sources est de 26.11 cm et
donne une fréquence de repliement spatial d’environ 634 Hz (en accord avec le critère défini
au chapitre 4). Le diamètre de l’antenne de sources est de 2 m et la séparation angulaire des
sources est de 14.4 deg. Les figures 6.2 (p. 117) à 6.5 (p. 118) présentent les résultats de la WFS
selon la même approche que celle du chapitre précédent. Comme ces figures le suggèrent, la
reproduction par WFS suit bien ce qui fut exposé au chapitre 4 et est maintenant utilisée comme
base de comparaison.
Pour la même configuration, les résultats par minimisation régularisée de l’erreur (avec un
paramètre de régularisation (λ) de 50 et q
WFS
=

0) sont présentés aux figures 6.6 (p. 118) à 6.9
(p. 120). Étant donné qu’un seul capteur de l’erreur est utilisé, le système qui se baserait ainsi
uniquement sur la réduction de l’erreur sans solution a priori ne pourrait pas avoir accès à des
116
x
2
← 2 m →
x
1
Sources
Capteur
Moniteurs
Sources: 24
Capteur: 1
Figure 6.1 Configuration pour le cas (a). ´:
position de la source virtuelle, ÷: direction
principale des sources.
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Fréq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
−3
|
q
o
p
t
|
Figure 6.2 E
LS
et [q
opt
[ pour la WFS pour le
cas (a). − − : [q
opt
[. : E
LS
évalué aux
moniteurs. : E
LS
évalué aux capteurs
d’erreur.
Figure 6.3 Pression acoustique réelle
reproduite pour le cas (a) par WFS à 220 Hz.
− − : courbes isopression (p
(im)
(x) = 0) de la
pression acoustique réelle à reproduire. ´:
source virtuelle.
Figure 6.4 Pression acoustique imaginaire
reproduite pour le cas (a) par WFS à 220 Hz.
− − : courbes isopression (p
(im)
(x) = 0) de la
pression acoustique imaginaire à reproduire.
´: source virtuelle.
117
1
2
3
1
2
3
0
0.005
0.01
0.015
x
1
[m]
x
2
[m]
P
u
i
s
s
a
n
c
e

d
e
s
o
r
t
i
e

[
W
]
Figure 6.5 Puissance acoustique de sortie
pour le cas (a) par WFS pure à 220 Hz. B :
Puissance de sortie positive. # : Puissance de
sortie nulle.
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Fréq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
−3
|
q
o
p
t
|
Figure 6.6 E
LS
et [q
opt
[ pour la minimisation
régularisée de l’erreur pour le cas (a). − − :
[q
opt
[. : E
LS
évalué aux moniteurs. :
E
LS
évalué aux capteurs d’erreur. Les courbes
en gris correspondent à la WFS.
informations au sujet de la distribution spatiale des champs à reproduire et reproduits. Dans ce
cas, toutes les sources contribuent également (voir la figure 6.9 (p. 120) à ce sujet) à produire le
bon niveau de pression acoustique au seul capteur d’erreur.
Même si ce cas de minimisation régularisée de l’erreur de reproduction de champs avec un
seul capteur semble peu intéressant lorsque le contrôle de l’erreur est appliqué sans solution a
priori (sans q
WFS
), il en est tout autrement lorsque le principe de l’AWFS exposé plus tôt est
appliqué à la même situation. Les résultats de l’AWFS (avec λ = 50 et q
WFS
défini par les
opérateurs de la WFS dans le domaine des fréquences) sont résumés aux figures 6.10 (p. 120)
à 6.13 (p. 121). Ainsi, la pénalisation par rapport à une solution q
WFS
posée a priori introduit
une tout autre distribution des puissances acoustiques des sources de reproduction, même avec
un seul capteur de l’erreur de reproduction, comme on peut le voir en comparant les figures 6.9
(p. 120) et 6.13 (p. 121) alors que les puissances acoustiques de sources dans le cas de l’AWFS
sont très proches de celles introduites par la WFS (voir les figures 6.13 (p. 121) et 6.5 (p. 118)).
L’avantage du contrôle de type AWFS par rapport à la minimisation régularisée de l’erreur (avec
pénalisation de la commande et non pas pénalisation de l’écart par rapport à la WFS) tient donc
du fait que l’imprécision spatiale de cette antenne de capteurs (et notamment l’ambiguïté maxi-
118
Figure 6.7 Pression acoustique réelle
reproduite pour le cas (a) par minimisation
régularisée de l’erreur à 220 Hz. − − : courbes
isopression (p
(im)
(x) = 0) de la pression
acoustique réelle à reproduire. ´: source
virtuelle.
Figure 6.8 Pression acoustique imaginaire
reproduite pour le cas (a) par minimisation
régularisée de l’erreur à 220 Hz. − − : courbes
isopression (p
(im)
(x) = 0) de la pression
acoustique imaginaire à reproduire. ´: source
virtuelle.
male attribuable à un seul capteur omnidirectionnel) est compensée par l’information fournie a
priori par la définition de q
WFS
. L’avantage de l’AWFS par rapport à la WFS se situe quant à lui
au niveau de la coloration réduite au capteur de contrôle. Ce qui peut se voir en considérant la
valeur de E
LS
en fonction de la fréquence pour l’AWFS (figure 6.10 (p. 120)) et la WFS (figure
6.2 (p. 117)). Qui plus est, la seule introduction du terme de pénalisation par rapport à la solu-
tion posée a priori (AWFS) procure au bout du compte une distribution de pression acoustique
immensément plus fidèle au champ à reproduire (et donc celui produit par WFS en champ libre)
que dans le cas de minimisation régularisée de l’erreur (sans solution posée a priori) comme on
peut le voir en comparant les figures 6.11 (p. 120) et 6.12 (p. 120) avec les figures 6.3 (p. 117)
et 6.4 (p. 117).
Cas (b) : antenne de sources circulaire et antenne de capteurs centrale approchant deux
capteurs de premier ordre perpendiculaires.
La configuration en question est illustrée à la figure 6.15 (p. 122). Comme il est possible de
le voir, les positions des capteurs forment une approximation d’un quadrupôle tesséral dans le
plan horizontal. Il est ainsi possible de contrôler au moins la pression acoustique et les gradients
de pression au centre de l’antenne de sources. Les capteurs sont séparés par 0.175 m selon x
1
119
1
2
3
1
2
3
0
2
4
x 10
−4
x
1
[m]
x
2
[m]
P
u
i
s
s
a
n
c
e

d
e
s
o
r
t
i
e

[
W
]
Figure 6.9 Puissance acoustique de sortie
pour le cas (a) par minimisation régularisée de
l’erreur à 220 Hz. B : Puissance acoustique de
sortie positive. # : Puissance acoustique de
sortie nulle.
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Fréq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
−3
|
q
o
p
t
|
Figure 6.10 E
LS
et [q
opt
[ pour l’AWFS pour le
cas (a). − − : [q
opt
[. : E
LS
évalué aux
moniteurs. : E
LS
évalué aux capteurs
d’erreur. Les courbes en gris représentent les
résultats de la WFS.
Figure 6.11 Pression acoustique réelle
reproduite pour le cas (a) par AWFS à 220 Hz.
− − : courbes isopression (p
(im)
(x) = 0) de la
pression acoustique réelle à reproduire. ´:
source virtuelle.
Figure 6.12 Pression acoustique imaginaire
reproduite pour le cas (a) par AWFS à 220 Hz.
− − : courbes isopression (p
(im)
(x) = 0) de la
pression acoustique imaginaire à reproduire.
´: source virtuelle.
120
1
2
3
1
2
3
0
0.005
0.01
0.015
x
1
[m]
x
2
[m]
P
u
i
s
s
a
n
c
e

d
e
s
o
r
t
i
e

[
W
]


Figure 6.13 Puissance acoustique de sortie
pour le cas (a) par AWFS à 220 Hz. B :
Puissance de sortie positive. # : Puissance
acoustique de sortie nulle.
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Fréq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
−3
|
q
o
p
t
|
Figure 6.14 E
LS
et [q
opt
[ pour la minimisation
régularisée de l’erreur pour le cas (b). − − :
[q
opt
[. : E
LS
évalué aux moniteurs. :
E
LS
évalué aux capteurs d’erreur.
et x
2
. Les résultats de minimisation régularisée de l’erreur (toujours avec λ = 50 et q
WFS
=

0)
sont résumés par les figures 6.14 (p. 121) à 6.16 (p. 122). En comparaison avec la minimisation
régularisée de l’erreur du cas (a), il fut observé que le cas (b) avec la même méthode étend la
zone de contrôle (voir les figures 6.7 (p. 119) et 6.8 (p. 119) versus les figures 6.15 (p. 122)
et 6.16 (p. 122)). Ainsi, même pour la minimisation régularisée de l’erreur sans AWFS, le cas
avec quatre capteurs laisse voir un avantage important par rapport à une configuration avec un
seul capteur : le champ reproduit est plus étendu dans l’espace. On note évidemment qu’il fut
observé que la taille de cette étendue est fonction de la longueur d’onde : de faibles longueurs
d’onde produisant de plus petites zones où l’erreur est moindre.
Les résultats pour cette configuration avec une approche AWFS sont présentés aux figures
6.17 (p. 122) à 6.19 (p. 123). L’avantage le plus important de l’AWFS en comparaison avec la
minimisation régularisée de l’erreur vient encore du fait que l’erreur aux moniteurs est moins
importante par AWFS que par minimisation régularisée de l’erreur (voir les figures 6.14 (p.
121) et 6.17 (p. 122)), étant donnée l’information spatiale introduite a priori par l’expression
de q
WFS
qui compense pour le manque d’informations disponibles par la seule entremise des
capteurs de l’erreur. Ce qui suggère encore une fois l’intérêt d’une approche par AWFS avec
capteurs centrés.
121
Figure 6.15 Pression acoustique réelle
reproduite pour le cas (b) par minimisation
régularisée de l’erreur à 220 Hz. − − : courbes
isopression (p
(im)
(x) = 0) de la pression
acoustique réelle à reproduire. ´: source
virtuelle.
Figure 6.16 Pression acoustique imaginaire
reproduite pour le cas (b) par minimisation
régularisée de l’erreur à 220 Hz. − − : courbes
isopression (p
(im)
(x) = 0) de la pression
acoustique imaginaire à reproduire. ´: source
virtuelle.
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Fréq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
−3
|
q
o
p
t
|
Figure 6.17 E
LS
et [q
opt
[ pour l’AWFS pour le cas (b). − − : [q
opt
[. : E
LS
évalué aux
moniteurs. : E
LS
évalué aux capteurs d’erreur.
122
Figure 6.18 Pression acoustique réelle
reproduite pour le cas (b) par AWFS à 220 Hz.
− − : courbes isopression (p
(im)
(x) = 0) de la
pression acoustique réelle à reproduire. ´:
source virtuelle.
Figure 6.19 Pression acoustique imaginaire
reproduite pour le cas (b) par minimisation
régularisée de l’erreur à 220 Hz. − − : courbes
isopression (p
(im)
(x) = 0) de la pression
acoustique imaginaire à reproduire. ´: source
virtuelle.
Cas (c) : antenne de sources circulaire et antenne de capteurs centrale approchant deux
capteurs de second ordre en position perpendiculaire.
La configuration en question est illustrée à la figure 6.20 (p. 124). Comme il est possible
de le déduire par cette figure, le groupe de capteurs peut former différents motifs de directivité
(monôpole, dipôles, quadrupôle tesséral et quadrupôles axiaux) qui fournissent, du coup, une
approximation des dérivées partielles de second ordre selon x
1
et x
2
. Des résultats en minimi-
sation régularisée de l’erreur sont présentés aux figures 6.20 (p. 124) à 6.23 (p. 125). En basses
fréquences, le champ reproduit correspond bien au champ à reproduire (figure 6.20 (p. 124)), par
contre en plus hautes fréquences, notamment aux environs de 600 Hz, on remarque une certaine
particularité (figures 6.22 (p. 125) et 6.23 (p. 125)). Cette particularité est difficilement expli-
cable à l’heure actuelle mais se comprend aisément à la lueur des considérations théoriques, au
sujet des modes de rayonnement, de l’AWFS présentées au chapitre suivant.
La figure 6.24 (p. 125) résume les résultats d’AWFS pour le même cas. Encore une fois,
l’erreur de reproduction évaluée aux moniteurs de l’erreur est plus faible que dans le cas de la
minimisation régularisée de l’erreur pour la même configuration. Par contre, comme le présente
la figure 6.24 (p. 125), cette configuration de capteurs introduit une particularité indésirable
123
Figure 6.20 Pression acoustique réelle
reproduite pour le cas (c) par minimisation
régularisée de l’erreur à 220 Hz. − − : courbes
isopression (p
(im)
(x) = 0) de la pression
acoustique réelle à reproduire. ´: source
virtuelle.
Figure 6.21 Pression acoustique imaginaire
reproduite pour le cas (c) par minimisation
régularisée de l’erreur à 220 Hz. − − : courbes
isopression (p
(im)
(x) = 0) de la pression
acoustique imaginaire à reproduire. ´: source
virtuelle.
aux environs de 600 Hz (particularité aussi notée aux figures 6.22 (p. 125) et 6.23 (p. 125)) :
l’erreur de reproduction évaluée aux moniteurs présente une importante déviation, même plus
importante que pour le cas (b) qui comportait un nombre moins important de capteurs. Cette
configuration serait donc à proscrire. Tel que noté plus tôt, cette particularité s’explique plus
facilement avec la description théorique de l’AWFS présentée au chapitre suivant.
Cas (d) : antenne de sources circulaire et antenne de capteurs centrale approchant
quatre capteurs de second ordre séparés par 45 degrés.
La configuration en question est illustrée à la figure 6.27 (p. 127). Comme il est possible de
l’imaginer par le biais de la configuration de capteurs illustrée sur cette figure, le groupe de cap-
teurs pourrait former différents motifs de directivité (monôpole, dipôles, quadrupôles tesséraux
et quadrupôles axiaux). Les résultats en minimisation régularisée de l’erreur sont résumés aux
figures 6.25 (p. 126), 6.27 (p. 127) et 6.28 (p. 127). Avec un plus grand nombre d’estimations
possibles des dérivées spatiales, il fut observé que la zone de correspondance entre champ à
reproduire et champ reproduit est plus grande. Il est en fait même possible de le voir en plus
hautes fréquences en considérant les figure 6.27 (p. 127) et 6.28 (p. 127). Pour des configura-
tions de capteurs telle celle du cas (b), la zone effective de reproduction en champ libre et en
124
Figure 6.22 Pression acoustique réelle
reproduite pour le cas (c) par minimisation
régularisée de l’erreur à 600 Hz. − − : courbes
isopression (p
(im)
(x) = 0) de la pression
acoustique réelle à reproduire. ´: source
virtuelle.
Figure 6.23 Pression acoustique imaginaire
reproduite pour le cas (c) par minimisation
régularisée de l’erreur à 600 Hz. − − : courbes
isopression (p
(im)
(x) = 0) de la pression
acoustique imaginaire à reproduire. ´: source
virtuelle.
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Freq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
−3
|
q
o
p
t
|
Figure 6.24 E
LS
et [q
opt
[ pour l’AWFS pour le cas (c). − − : [q
opt
[. : E
LS
évalué aux
moniteurs. : E
LS
évalué aux capteurs d’erreur.
125
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Fréq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
−3
|
q
o
p
t
|
Figure 6.25 E
LS
et [q
opt
[ pour la minimisation
régularisée de l’erreur pour le cas (d). − − :
[q
opt
[. : E
LS
évalué aux moniteurs. :
E
LS
évalué aux capteurs d’erreur.
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Fréq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
−3
|
q
o
p
t
|
Figure 6.26 E
LS
et [q
opt
[ pour l’AWFS pour le
cas (d). − − : [q
opt
[. : E
LS
évalué aux
moniteurs. : E
LS
évalué aux capteurs
d’erreur.
plus hautes fréquences (à 600 Hz) était plus petite que celle présentée par cette figure.
Les résultats de l’AWFS pour le cas (d) sont quant à eux résumés aux figures 6.26 (p. 126),
6.29 (p. 127) et 6.30 (p. 127). Il est essentiellement possible de formuler les mêmes remarques
que dans le cas (c) avec l’AWFS. Par contre, la particularité observée pour le cas (c) aux en-
virons de la fréquence de repliement spatial de l’antenne de source (634 Hz) est disparue. La
configuration (d) serait donc avantageuse par rapport à la configuration (c).
Avec les quatre cas de configuration de capteur considérés, il est clair qu’une approche
AWFS introduit un intérêt par rapport à la WFS seule ou à la minimisation régularisée de l’er-
reur seule. Même si les résultats présentés jusqu’ici n’explicitent pas la nature fondamentale
de l’AWFS, ils démontrent clairement l’intérêt de l’approche. Le chapitre suivant présente une
interprétation fondamentale de l’AWFS; une telle interprétation permet d’expliquer les spécifi-
cités observées sur les courbes issues des simulations préliminaires présentées dans le chapitre.
Aussi, d’un point de vue pratique, l’utilisation d’une antenne compacte est plus commode
que le recours à une antenne circulaire en situation réelle (en salle) parce qu’il demeure plus
facile d’ajouter quelques capteurs selon un axe vertical pour mieux distinguer les incidences
des réflexions attribuables à la salle. Ce qui, dans le cas d’une approche périphérique (avec une
antenne de capteurs circulaire élargie, ou linéaire et carrée [voir par exemple la configuration
de Spors [Spors et al., 2003a]]), nécessiterait une surface complètement discrétisée de capteurs
126
Figure 6.27 Pression acoustique réelle
reproduite pour le cas (d) par minimisation
régularisée de l’erreur à 600 Hz. − − : courbes
isopression (p
(im)
(x) = 0) de la pression
acoustique réelle à reproduire. ´: source
virtuelle.
Figure 6.28 Pression acoustique imaginaire
reproduite pour le cas (d) par minimisation
régularisée de l’erreur à 600 Hz. − − : courbes
isopression (p
(im)
(x) = 0) de la pression
acoustique imaginaire à reproduire. ´: source
virtuelle.
Figure 6.29 Pression acoustique réelle
reproduite pour le cas (d) par AWFS à 220 Hz.
− − : courbes isopression (p
(im)
(x) = 0) de la
pression acoustique réelle à reproduire. ´:
source virtuelle.
Figure 6.30 Pression acoustique imaginaire
reproduite pour le cas (d) par AWFS à 220 Hz.
− − : courbes isopression (p
(im)
(x) = 0) de la
pression acoustique imaginaire à reproduire.
´: source virtuelle.
127
(voir la discussion du chapitre 5) et donc, un nombre de capteurs beaucoup plus important. Pour
comparer les performances des quatre configurations de capteurs, deux figures synthèses sont
introduites. C’est ainsi que les figures 6.31 (p. 129) et 6.32 (p. 129) introduisent l’ensemble
des E
LS
évalués pour tous les cas. Sur ces figures, deux fréquences importantes sont indiquées.
La première, 634 Hz, correspond à une première approximation de la fréquence de repliement
spatial attribuable à la distance de séparation des sources
3
. La deuxième, 945 Hz, correspond à
la fréquence de repliement spatial attribuable à la distance de séparation des moniteurs. On porte
une attention particulière aux valeurs de E
LS
évaluées aux moniteurs de l’erreur de reproduction
puisqu’elles indiquent la validité du contrôle en dehors de la zone de contrôle et, du coup, le
compromis entre nombre de capteurs et gain en terme de qualité de reproduction. On remarque
aussi, que pour fournir une base de comparaison valable, la valeur du paramètre de régularisation
λ varie selon les cas (pour l’ensemble des figures précédentes, elle était fixée à 50)
4
. Ainsi,
puisque λ est fixé à 50 pour le cas (a) avec un capteur, on impose respectivement λ = 200,
λ = 250 et λ = 450 pour les cas avec 4 (cas (b)), 5 (cas (c)) et 9 (cas (d)) capteurs.
En considérant d’abord la figure 6.32 (p. 129), on remarque que les configurations (b), (c)
et (d) en AWFS procurent les meilleures réductions E
LS
aux moniteurs sous la fréquence de
repliement spatial du réseau de sources. Outre la variation particulière de E
LS
aux moniteurs
avec la configuration (c) en AWFS aux environs de 634 Hz, les trois configurations procurent
une réduction comparable de E
LS
. Il serait donc possible de solliciter une configuration avec un
nombre réduit de capteurs comme la configuration (b) pour obtenir des résultats proches d’une
configuration plus exigeante telle la (d). Dans tous les cas, une réduction de E
LS
aux moniteurs
est seulement observable sous la fréquence de repliement spatial de l’antenne de sources. On
note aussi que l’erreur par WFS augmente considérablement à partir de 634 Hz alors qu’il y a
repliement. Ainsi, le gain de qualité attribuable à l’AWFS n’est valable que sur la plage de fré-
quences effective de la WFS : en approchant la fréquence de repliement spatial de l’antenne de
sources, l’AWFS et la WFS convergent vers une même valeur de E
LS
aux moniteurs. La figure
6.31 (p. 129) montre qu’avec un accroissement du nombre de capteurs, l’erreur de reproduction
résiduelle normalisée (E
LS
) devient de plus en plus importante, quoiqu’elle demeure tout de
même très loin sous la limite supérieure de E
LS
= 0.5.
3
On note que cette première approximation est ainsi baptisée puisqu’elle dépend en fait de la direction d’inci-
dence du front d’onde virtuel arrivant à l’antenne de sources pour la WFS. En gros, cette première approximation
découle de la distance de séparation des sources : pour éviter le repliement, il doit y avoir au moins deux sources
par longueur d’onde.
4
Il est important de changer la valeur de λ selon le nombre de capteurs, étant donné qu’avec un nombre de
capteurs de plus en plus important et avec un nombre de sources constant, l’apport de la régularisation est réduit en
comparaison avec e
H
e qui est en fait la somme des erreurs quadratiques.
128
10
2
10
3
10
−6
10
−5
10
−4
10
−3
10
−2
10
−1
10
0
E
L
S
Fréq. [Hz]
WFS (a)
AWFS (a)
WFS (b)
AWFS (b)
WFS (c)
AWFS (c)
WFS (d)
AWFS (d)
≈ 634Hz →
≈ 945 Hz →
Figure 6.31 E
LS
aux capteurs de l’erreur pour
les quatre cas.
10
2
10
3
10
−2
10
−1
10
0
E
L
S
Fréq. [Hz]
WFS (a), (b), (c) & (d)
AWFS (a)
AWFS (b)
AWFS (c)
AWFS (d)
≈ 634Hz →
≈ 945 Hz →
Figure 6.32 E
LS
aux moniteurs de l’erreur
pour les quatre cas.
6.4 Effet de la distance de séparation des capteurs
Pour les cas considérés à la section précédente, les distances de séparation des capteurs
étaient fixées arbitrairement à partir de 0.175 m qui offre une fréquence de repliement spatial
d’environ 945 Hz. Sachant que la configuration (b) avec quatre capteurs (voir la figure 6.18
(p. 123)) semble procurer de bons résultats, de nouvelles simulations sont effectuées en faisant
varier la distance nominale de 0.35 m à 0.0875 m avec un paramètre de régularisation de 200.
Les simulations sont résumées aux figures 6.33 (p. 130) et 6.34 (p. 130).
Comme on peut le voir dans le cas de E
LS
(voir la figure 6.33 (p. 130)) aux capteurs en
fonction de la fréquence, plus la distance de séparation des capteurs est petite, plus la présence
d’une pointe de E
LS
est repoussée en hautes fréquences. Ce qui indique donc qu’une antenne
plus compacte pourrait être avantageuse puisqu’elle peut repousser cet accroissement subit en
dehors de la plage de fréquence d’intérêt. Par contre, cet accroissement reste à un niveau d’er-
reur relativement faible en comparaison avec l’erreur par simple WFS, ce qui permettrait tout de
même l’utilisation d’une antenne pas trop compacte, comme dans le cas (b) initialement intro-
duit à la section précédente. De plus, la figure 6.34 (p. 130) démontre que la variation de l’erreur
aux moniteurs est faible pour l’AWFS lorsque la distance de séparation des capteurs est variée.
L’erreur aux moniteurs est même plus faible lorsque l’antenne des capteurs de l’erreur affiche
une distance de séparation plus importante.
129
10
2
10
3
10
−7
10
−6
10
−5
10
−4
10
−3
10
−2
10
−1
10
0
E
L
S
Fréq. [Hz]
WFS (b), 0.35m
Contrôle (b), 0.35m
AWFS (b), 0.35m
WFS (b), 0.175m
Contrôle (b), 0.175m
AWFS (b), 0.175m
WFS (b), 0.0875m
Contrôle (b), 0.0875m
AWFS (b), 0.0875m


6
3
4
H
z


9
4
5

H
z
WFS
AWFS
Contrôle
Figure 6.33 E
LS
aux capteurs de l’erreur pour
le cas (b) avec un variation de la distance entre
les capteurs selon les deux axes.
10
2
10
3
10
−2
10
−1
10
0
E
L
S
Fréq. [Hz]
WFS (b), toutes sép.
Contrôle (b), 0.35m
AWFS (b), 0.35m
Contrôle (b), 0.175m
AWFS (b), 0.175m
Contrôle (b), 0.0875m
AWFS (b), 0.0875m


6
3
4
H
z


9
4
5

H
z
WFS
C
o
n
t
r
ô
l
e

W
F
S

&
A
W
F
S

Figure 6.34 E
LS
aux moniteurs de l’erreur
pour le cas (b) avec un variation de la distance
entre les capteurs selon les deux axes.
Les figures 6.33 (p. 130) et 6.34 (p. 130) illustrent aussi clairement une différence particu-
lière entre l’AWFS et la simple minimisation régularisée de l’erreur (identifiée «contrôle» sur
ces figures). L’erreur de reproduction aux capteurs de l’erreur est plus importante par contrôle
que par AWFS. Cette différence, peut-être surprenante aux premiers abords, s’explique sim-
plement. Dans la mesure où une part de la solution par minimisation régularisée de l’erreur
comporte des éléments proches de la WFS, l’ensemble de cette solution est plus pénalisée par la
régularisation que dans le cas de l’AWFS où la partie proche de la solution par WFS n’implique
qu’une faible contribution dans la pénalisation particulière de la fonction coût de l’AWFS.
En bref, on recommande donc l’utilisation d’une antenne de capteurs dont la fréquence de
repliement spatial est proche de celle de l’antenne de sources utilisée pour l’AWFS. De plus,
la distance minimale entre les capteurs est influencée par la marge d’erreur sur les réponses en
phase des microphones qui prendront, en pratique, la place des capteurs de l’erreur. Ainsi, la
tolérance sur l’erreur de phase entre des microphones sera plus faible dans le cas d’une antenne
très compacte puisque les retards temporels de propagation entre les capteurs deviennent de plus
en plus brefs et donc, potentiellement de l’ordre des erreurs de phase entre les microphones.
130
CONFIGURATION DES SOURCES POINTS DISTINCTIFS
Configuration circulaire (fig. 6.15 (p. 122)) • Distribution plus lisse des E
LS
(voir figures 6.37 (p. 132)
et 6.38 (p. 132)).
• E
LS
plus faibles pour la WFS et l’AWFS (voir figures 6.37
(p. 132) et 6.38 (p. 132)).
• Structure portante plus difficile à réaliser en pratique.
• Couverture angulaire complète.
Configuration en «U» (fig. 6.35 (p. 132)) • E
LS
plus importants pour la WFS et l’AWFS (voir figures
6.37 (p. 132) et 6.38 (p. 132)).
• Effet de diffraction des coins plus important.
• Possibilité d’évaluer la compensation des effets de coins
par AWFS.
• Structure portante rectangulaire plus facile à réaliser en
pratique.
• Couverture angulaire incomplète.
Tableau 6.1 Points distinctifs pour les antennes de sources circulaires et celles en «U».
6.5 Antenne de sources en «U»
Pour des raisons pratiques, il peut être plus facile de réaliser un système d’AWFS basé sur
des antennes de sources linéaires, un peu comme l’antenne introduite pour les études théoriques
fondamentales en salle présentées au chapitre 5. Puisque la configuration (b) de capteurs semble
prometteuse en pratique, une même configuration de capteurs est considérée alors qu’elle est
entourée d’une antenne de sources en «U». La configuration est en fait présentée à la figure 6.35
(p. 132). L’ensemble des résultats est résumé par les figures 6.35 (p. 132) et 6.36 (p. 132) pour
l’AWFS seulement (avec λ = 50) qui illustre la proximité des résultats de l’AWFS avec une telle
configuration en «U» et ceux de l’AWFS avec la configuration circulaire de sources présentée
plus tôt. On remarque que la configuration en «U» ici introduite est inspirée de la configuration
présentée par Spors [Spors et al., 2003a].
En complément, les figures 6.37 (p. 132) et 6.38 (p. 132) introduisent la comparaison entre
une antenne de sources circulaire et une autre en «U» pour la même situation par le biais des
erreurs aux capteurs (dans la configuration de capteurs (b)) et aux moniteurs. Les observations
sont résumées au tableau 6.1. En pratique, et pour les chapitres qui suivent, on retient la confi-
guration circulaire principalement parce que sa couverture angulaire est complète (elle recouvre
360 deg).
131
Figure 6.35 Pression acoustique réelle
reproduite pour le cas (b) par AWFS avec une
configuration de sources en «U» à 220 Hz.
− − : courbes isopression (p
(im)
(x) = 0) de la
pression acoustique réelle à reproduire. ´:
source virtuelle.
Figure 6.36 Pression acoustique imaginaire
reproduite pour le cas (b) par AWFS avec une
configuration de sources en «U» à 220 Hz.
− − : courbes isopression (p
(im)
(x) = 0) de la
pression acoustique imaginaire à reproduire.
´: source virtuelle.
10
2
10
3
10
−6
10
−5
10
−4
10
−3
10
−2
10
−1
10
0
E
L
S
Fréq. [Hz]
AWFS, en «U»
AWFS, en «O»
Contrôle pur, en «O»
Contrôle pur, en «U»
WFS, en «U»
WFS, en «O»
A
W
F
S

C
o
n
t
r
ô
l
e

WFS


6
3
4
H
z


9
4
5

H
z
Figure 6.37 E
LS
aux capteurs de l’erreur par
WFS, AWFS et minimisation régularisée de
l’erreur pour le cas (b) avec des configurations
de sources circulaires (◦) et en «U» (¯).
10
2
10
3
10
−1
10
0
E
L
S
Fréq. [Hz]
AWFS, en «U»
AWFS, en «O»
WFS, en «O»
WFS, en «U»
Contrôle pur, en «O»
Contrôle pur, en «U»


6
3
4
H
z


9
4
5

H
z
W
F
S

C
o
n
t
r
ô
l
e

AWFS
Figure 6.38 E
LS
aux capteurs de l’erreur par
WFS, AWFS et minimisation régularisée de
l’erreur pour le cas (b) avec des configurations
de sources circulaires (◦) et en «U» (¯).
132
6.6 Effet d’une seule réflexion causée par une surface rigide infinie
Quelques cas sont ici présentés en bref pour des configurations similaires à celles sollicitées
aux sections précédentes mais en présence d’une surface infinie rigide. L’objectif principal est
d’obtenir une idée des implications attribuables à la présence d’une surface réfléchissante.
Les premiers résultats correspondent exactement au cas (b), avec une antenne de sources
circulaire, présentée précédemment, ils sont résumés aux figures 6.39 (p. 135) à 6.41 (p. 135).
La différence avec les cas notés plus tôt vient du fait qu’une surface rigide infinie est placée dans
le plan x
1
− x
3
(voir la figure 6.15 (p. 122)). Sur ces figures, les résultats en champ libre sont
superposés à titre de références comparatives. L’effet de la surface rigide et infinie est modélisé
par la méthode des images. Comme on peut le voir en considérant les variations de E
LS
aux
moniteurs, la présence de la réflexion augmente généralement la valeur de E
LS
aux moniteurs
mais peut tout de même être compensée par l’AWFS, en comparaison avec la WFS, par exemple.
Pour toutes ces simulations, la pénalisation (λ) est arbitrairement fixée à 50.
De façon générale les valeurs de E
LS
pour les capteurs et les moniteurs sont plus importantes
en présence d’une surface rigide qui défie les hypothèses à la base de la définition de la WFS. On
note par contre que dans le cas de reproduction par minimisation régularisée de l’erreur ou par
AWFS, l’erreur aux capteurs de l’erreur et aux moniteurs de l’erreur est de beaucoup moindre
que par WFS. Ce qui illustre encore l’intérêt de la compensation active.
Pour ces mêmes simulations, des champs de pression acoustique reproduits par WFS et par
AWFS sont présentés aux figures 6.42 (p. 136) et 6.43 (p. 136) (page 136). Selon ces figures,
il est clair que la réflexion causée par la surface rigide ne domine pas l’allure des champs har-
moniques reproduits étant donné la distance relativement importante des images des sources de
reproduction par rapport à la distance des sources réelles jusqu’au centre de l’antenne, soit la
zone d’intérêt. Par contre, la présence d’une erreur de reproduction est indéniable (et plus impor-
tante qu’en champ libre) au niveau des valeurs de E
LS
évaluées pour les moniteurs de l’erreur
(figure 6.41 (p. 135)). Elle reste par contre moindre en AWFS et en minimisation régularisée de
l’erreur qu’en WFS.
Les informations les plus révélatrices au sujet de l’effet d’une réflexion sur le contrôle de
la reproduction viennent de la figure 6.44 (p. 137) sur laquelle on peut voir la superposition
des réponses impulsionnelles des sources pour la reproduction par minimisation régularisée de
133
l’erreur de reproduction et par AWFS, pour les résultats correspondant aux figures 6.40 (p. 135)
et 6.41 (p. 135). Comme ces résultats en boucle fermée le suggèrent, la présence d’une réflexion
acoustique est compensée par une seconde impulsion négative et d’amplitude réduite dans les
réponses impulsionnelles des sources. Par extension, on peut imaginer qu’en présence de plu-
sieurs surfaces réfléchissantes parallèles, la nature des réponses impulsionnelles des sources
serait plutôt récursive puisque chaque front produit pour compenser les réflexions doit être à
son tour compensé lorsqu’il est lui-même réfléchi. Soit un aspect qui peut présenter certaines
limitations en pratique. Par contre, la pénalisation variable de l’écart par rapport aux opérateurs
de la WFS permet toujours de limiter manuellement la déviation de la solution optimale par
rapport aux opérateurs de la WFS qui ne comportent évidemment pas de composante récursive.
C’est une caractéristique importante et intéressante de l’AWFS.
On note aussi la différence d’amplitude globale des réponses à l’impulsion (figure 6.44 (p.
137)) pour la minimisation régularisée de l’erreur versus l’AWFS. Dans le cas de la minimisa-
tion régularisée, le problème vient justement de la régularisation qui pénalise autant la partie de
la solution produisant le champ direct (semblable à la définition de la WFS) que la partie qui
annule la réflexion. Un accroissement de l’amplitude de l’impulsion produisant le champ direct
augmente aussi la valeur de la fonction coût alors que dans le cas de l’AWFS c’est, approxi-
mativement, seulement la partie compensatoire des réponses à l’impulsion (la différence entre
la WFS et la solution de l’AWFS) qui est pénalisée, ce qui permet une amplitude globale plus
importante sans pénalisation.
Les derniers résultats de simulations en présence d’une surface réfléchissante sont présentés
aux figures 6.45 (p. 138) et 6.46 (p. 138), pour la WFS et l’AWFS seulement. Cette fois, la
surface réfléchissante est un plan horizontal (selon x
1
−x
2
avec x
3
= 2 m) au-dessus des sources
de reproduction. L’intérêt de ces simulations vient du fait que les sources de reproduction ne
peuvent pas nécessairement compenser une réflexion dont l’incidence sur l’antenne de capteurs
ne correspond pas à une incidence directe des sources de reproduction. Comme on peut le voir
l’AWFS n’est pas plus efficace que la WFS aux moniteurs de l’erreur. Une des causes de cette
erreur peut être liée à la définition générale de l’AWFS telle qu’exposée à l’équation (6.1). Les
chapitres suivants montrent qu’il est possible d’améliorer ce constat.
134
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Fréq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
−3
|
q
o
p
t
|
Figure 6.39 E
LS
par WFS pour le cas (b) avec
une configuration de sources circulaire avec
une surface rigide formée par le plan x
1
−x
3
.
: E
LS
aux moniteurs de l’erreur. : E
LS
aux capteurs de l’erreur. : E
LS
aux
moniteurs de l’erreur en champ libre. : E
LS
aux capteurs de l’erreur en champ libre. − − :
[q
opt
[.
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Fréq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
−3
|
q
o
p
t
|
Figure 6.40 E
LS
par minimisation régularisée
de l’erreur pour le cas (b) avec une
configuration de sources circulaire avec une
surface rigide formée par le plan x
1
−x
3
(voir
la nomenclature à la figure 6.39 (p. 135)).
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Freq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
−3
|
q
o
p
t
|
Figure 6.41 E
LS
par AWFS pour le cas (b) avec une configuration de sources circulaire et avec
une surface rigide formée par le plan x
1
−x
3
(voir la nomenclature à la figure 6.39 (p. 135)).
135
Figure 6.42 Pression acoustique reproduite à
220 Hz (en haut : partie réelle ; en bas : partie
imaginaire) par WFS pour le cas (b) avec une
configuration de sources circulaire et avec une
surface rigide formée par le plan x
1
−x
3
.
Figure 6.43 Pression acoustique reproduite à
220 Hz (en haut : partie réelle ; en bas : partie
imaginaire) par AWFS pour le cas (b) avec une
configuration de sources circulaire et avec une
surface rigide formée par le plan x
1
−x
3
.
6.7 Discussion et configuration choisie
La configuration des capteurs de l’erreur privilégiée pour le reste du développement présenté
dans cette thèse correspond à la configuration (b) faite de quatre capteurs centrés. En pratique,
il sera possible de varier, au besoin, la distance de séparation des capteurs.
Pour ce qui est de la configuration des sources de reproduction, on favorise une antenne cir-
culaire plutôt qu’une antenne en «U». Même si l’antenne en «U» serait plus facile à construire,
136
0 50 100 150
−5
0
5
10
15
20
25
x 10
−5
q
o
p
t
0 50 100 150
−5
0
5
10
15
20
25
x 10
−5
Échantillons
q
o
p
t
Figure 6.44 RI des sources pour la reproduction avec une surface rigide formée par le plan
x
1
−x
3
. En haut, reproduction par minimisation régularisée de l’erreur de reproduction. En
bas, reproduction par AWFS.
on favorise une structure portante modulaire (faite de produits commerciaux) de telle sorte que
le positionnement des sources de reproduction en cercle reste simple. Encore une fois, la dis-
tance de séparation des sources pourra être changée au besoin. On note aussi, plus spécialement
à la lueur des considérations présentées dans le chapitre suivant, que la configuration de sources
de reproduction en cercle introduit l’immense avantage d’établir un lien plus clair avec la WFS,
l’AWFS et l’Ambisonie. Le réseau de source circulaire, contrairement à l’antenne en «U», offre
aussi une couverture angulaire complète dans le plan horizontal. L’antenne circulaire est retenue
pour l’ensemble de ces raisons.
137
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Freq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
−3
|
q
o
p
t
|
Figure 6.45 E
LS
par WFS pour le cas (b) avec
une configuration de sources circulaire avec
une surface rigide formée par un plan
horizontal à deux mètres au-dessus de x
1
−x
2
(voir la nomenclature à la fig. 6.39 (p. 135)).
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Fréq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
−3
|
q
o
p
t
|
Figure 6.46 E
LS
par AWFS pour le cas (b)
avec une configuration de sources circulaire
avec une surface rigide formée par un plan
horizontal à deux mètres au-dessus de x
1
−x
2
(voir la nomenclature à la fig. 6.39 (p. 135)).
6.8 Conclusion
En bref, ce chapitre a posé la définition préliminaire d’une fonction coût à l’image de la
WFS adaptative («Adaptive Wave Field Synthesis» ou AWFS) qui représente la minimisation
d’une erreur de reproduction accompagnée de la pénalisation de l’écart de la solution optimale
par rapport à la solution WFS.
Il fut démontré, par le biais d’exemples, l’efficacité de l’AWFS à réduire l’erreur de repro-
duction en comparaison avec la WFS tout en obtenant une solution pas trop éloignée – selon la
pénalisation λ – de la solution de type WFS.
Par contre, puisque ce chapitre n’a que posé des observations en relation avec des simula-
tions numériques, il est plus difficile de généraliser la portée des conclusions et il est impossible
d’éclairer les mécanismes fondamentaux de l’AWFS. Dans la mesure où l’AWFS semble par
contre intéressante, des recherches sur le comportement fondamental de l’AWFS furent entre-
prises. Elles sont présentées au chapitre suivant dans lequel on trouve aussi des propositions
de réalisations particulièrement avantageuses du traitement de signal adaptatif en relation avec
la nature fondamentale de l’AWFS aussi présentée au chapitre suivant. Cette compréhension
appronfondie de l’AWFS rend cette même solution technologique d’autant plus intéressante.
D’autres considérations au sujet de l’AWFS sont présentées dans l’annexe A.
138
CHAPITRE 7
WFS ADAPTATIVEAVECCONTRÔLEINDÉPENDENTDES
MODES DE RAYONNEMENT
7.1 Résumé français
Cet article
1
paru en 2006 présente la définition de la synthèse de champ adaptative («Adap-
tive Wave Field Syntesis», ou AWFS), soit une approche de contrôle optimal de l’erreur de
reproduction qui combine une pénalisation de l’écart de la solution optimale par rapport à la
solution boucle ouverte de type WFS. Par le biais de la décomposition en valeurs singulières
du système électroacoustiques sous contrôle, les propriétés théoriques de l’AWFS sont analy-
sées et illustrées par des exemples simples en champ libre. Avec une telle décomposition, et
selon un argument analytique, il fut possible d’illustrer la nature de la rédondance dans les de-
grées de liberté d’un système générique de contrôle à plusieurs canaux. En travaillant l’AWFS
dans un espace transformé, il est ainsi possible d’annuler ces redondances et de contrôler indé-
pedement chacun des modes de rayonnement du système électroacoustique. Parmi les aspects
intéressants de l’AWFS, on note que la solution WFS projetée sur la base vectorielle formant le
noyau de la matrice de transfert représentant le système électroacoustique forme la partie boucle
ouverte, constante et imposée, d’un système d’AWFS. La partie en boucle fermée de l’AWFS
implique aussi une projection des opérateurs de synthèse mais sur la base vectorielle formée
par les premiers vecteurs singuliers de la décomposition en valeurs singulières. Cette partie en
boucle fermée inclut en plus, évidemment, une partie adaptative. Avec la décomposition en va-
leurs singulières, il fut aussi possible de démontrer le lien qu’entretient l’AWFS avec une autre
technologie de reproduction de champs acoustiques : l’«Ambisonie». L’AWFS proposerait ainsi
non seulement une réalisation hybride de la WFS et du contrôle actif, mais une réalisation en
1
P.-A. Gauthier, A. Berry, Adaptive wave field synthesis with independent radiation mode control for active
sound field reproduction : Theory, Journal of the Acoustical Society of America, vol. 119, no 5, p. 2721-2737,
2006.
139
boucle fermée de l’«Ambisonie» quelque peu modifiée. Ainsi, ce lien augmente l’originalité et
la pertinence de l’AWFS en relation directe avec la WFS, mais aussi avec l’«Ambisonie»; deux
technologies importantes de reproduction de champs acoustique dans le contexte du problème
intérieur de la reproduction de champs acoustiques.
Cet article traite de l’aspect physique de l’AWFS; ces considérations physiques permettent
le développement de la méthode du traitement de signal adaptatif dévelopée dans les deux cha-
pitres subséquents.
7.2 Adaptive wave field synthesis with independent radiation mode control for active
sound field reproduction : Theory
Sound field reproduction finds applications in music or audio reproduction and experimental
acoustics. For audio applications, sound field reproduction can be used to artificially reproduce
the spatial character of natural hearing. The general objective is then to reproduce a sound field
in a real reproduction environment. Wave field synthesis (WFS) is a known open-loop techno-
logy which assumes that the reproduction environment is anechoic. For classical WFS, the room
response thus reduces the quality of the physical sound field reproduction. In this paper, adaptive
wave field synthesis (AWFS) is analytically investigated as an adaptive sound field reproduction
system combining WFS and active control with a limited number of reproduction error sensors
to compensate the response of the listening environment. The primary point of this paper is the
definition of AWFS. Therefore, the fundamental behavior of AWFS is illustrated by analytical
considerations and simple free-field simulation results. As demonstrated, AWFS is fundamen-
tally related to WFS and “Ambisonics.” The paper introduces independent adaptive control of
sound field reproduction on the basis of radiation modes, via the singular value decomposition
of the transfer impedance matrix. Possible practical independent control of radiation modes for
AWFS is discussed.
7.3 Introduction
Sound field reproduction finds applications in music or audio reproduction (multisensory
immersion for teaching, concerts, etc. [Woszczyk et al., 2005]) and experimental acoustics and
psychoacoustics. For audio applications, sound field reproduction can be used to artificially re-
140
produce the spatial character of natural hearing. Such a challenge has always fascinated both
inventors and sound artists [Poulin, 1957; Malham et Myatt, 1995; Davis, 2003; Staff technical
writer, 2005]. The general objective is to reproduce a sound field in a real reproduction envi-
ronment. [See reference [Staff technical writer, 2005] for a review of spatial and multichannel
audio.]
Wave field synthesis (WFS) is an open-loop sound field reproduction technology which as-
sumes that the reproduction environment is anechoic [Berkhout, 1988; Berkhout et al., 1993;
Verheijen, 1998]. For objective sound field reproduction, classical WFS thus does not perform
well in a real reproduction space [Gauthier et al., 2005c]. Typical physical inaccuracies are cau-
sed by the room resonant response at low frequencies along with reflections and reverberation
at higher frequencies. Adaptive wave field synthesis (AWFS) is investigated as a potential so-
lution for room compensation with a limited number of acoustic sensors. The primary point of
this paper is the theoretical analysis of AWFS. Therefore, the fundamental behavior of AWFS
is illustrated by analytical considerations and simple free-field simulations. Other research has
been devoted to in-room sound field reproduction or local sound reproduction using various ap-
proaches often derived from adaptive control [Kirkeby et Nelson, 1993; Nelson, 1994; Asano et
Swanson, 1995; Uto et Hamada, 1995; Kirkeby et al., 1996; Garas, 1999; Ise, 1999; Santilla´ n,
2001; Corteel et al., 2002; Nelson, 2002; Spors et al., 2003a; Epain et al., 2004; Gauthier et al.,
2005b; Schobben et Aarts, 2005; Spors et al., 2005a; Fuster et al., 2005].
This paper theoretically introduces AWFS which is a combination of optimal control and
open-loop Wave field synthesis (WFS) designed for active sound field reproduction. The adap-
tive nature of AWFS comes from the use of reproduction error sensors that observe the system
performance and adapt the input of the reproduction sources. What differentiates AWFS from
classical active control is that the regularization is not included as a quadratic effort-penalty
term in the cost function, but as a quadratic departure penalty from the WFS solution.
Although AWFS can be applied to any source and sensor configuration, numerical results
are presented here for a small, central and compact sensor array that provides WFS compen-
sation without occupying the reproduction space with a large and impractical sensor array. As
discussed in previous reports [Gauthier et al., 2005b], such a reduced sensor array is used as a
practical compromise. However, the use of a limited number of reproduction sensors results in
interesting properties of AWFS.
A compact sensor array is investigated here as a practical alternative to larger or circular
141
sensors arrays that have been previously proposed. They were suggested for applications such
as sound field recording [Hulsebos et al., 2003; Poletti, 2005], WFS room compensation [Spors
et al., 2003a, 2005a] and active sound field reproduction [Betlehem et Abhayapala, 2005].
As introduced by references [Spors et al., 2003a, 2005a], one approach to active compensa-
tion in WFS is to work in a transformed domain which can potentially uncouple the problem.
In the present paper, it is shown that AWFS can be achieved in a transformed domain based on
the source modes and pressure modes derived from the Singular Value Decomposition (SVD) of
the source-sensor transfer impedance matrix. SVD has found various applications in acoustics
[Nelson, 2001; Nelson et Kahana, 2001; Nelson, 2002; Williams et al., 2003; Bai et Lin, 2005].
Recently, reference [Bai et Elliott, 2004] used a plant transfer matrix SVD to define an
uncoupled adaptive system. This was motivated by the need to accelerate the convergence of
standard LMS adaptive multichannel algorithms and the results are illustrated in the context of
binaural sound field reproduction with cross-talk cancelation. The authors used two comple-
mentary methods : 1) prewhitening of the reference and 2) plant uncoupling via SVD of the
transfer impedance matrix in the frequency domain and time-domain realization of the resulting
uncoupled multichannel system. This proved to accelerate the LMS convergence rate at the cost
of a processing delay.
Section 7.4 of the paper presents the radiation, WFS and AWFS models. Section 7.5 intro-
duces a first interpretation of the AWFS mechanism. Numerical simulations are introduced in
Sec. 7.6. Section 7.7 expands the theoretical behavior of AWFS on the basis of the SVD of the
transfer impedance matrix including room effects. Section 7.8 specifically shows the link bet-
ween AWFS and closed-loop “Ambisonics”. Practical considerations for independent radiation
mode control are discussed in Sec. 7.9.
7.4 Radiation, WFS and control models for AWFS
Let an active sound field reproduction system be represented by L monopole reproduction
sources located at ¦x
(l)
1
x
(l)
L
¦ and M sound pressure sensors located at ¦x
(m)
1
x
(m)
M
¦
where x are position vectors expressed in rectangular coordinates (see Fig. 7.1 (p. 144) for an
explanatory sketch). In the frequency domain, the sound pressure field radiated by the reproduc-
142
tion sources is defined as follows at radial frequency ω [rad/s]
p
(rep)
(ω) = Z(ω)q(ω), (7.1)
where p
(rep)
(ω) is a M coefficients column vector comprising the reproduced complex sound
pressures [Pa] at sensor locations, Z(ω) is a M L transfer impedance matrix and q(ω) [m
3
/s]
is the L coefficients reproduction source strength column vector. The frequency dependance
may be omitted. All components in Eq. (7.1) are complex. For practical reasons, it is assumed
that M < L since a convenient system should not introduce a large number of sensors in
the reproduction space. For free-field radiation, the transfer impedance matrix coefficients are
defined by the free-field Green’s function G(x[x
(l)
l
) [Pierce, 1991; Nelson et Elliot, 1992]
Z
ml
= −jωρG(x
(m)
m
[x
(l)
l
) (7.2)
with
G(x[x
(l)
l
) =
e
jk|x−x
(l)
l
|
4π[x −x
(l)
l
[
, (7.3)
where x [m] is the field point, x
(l)
l
[m] the l source position, k = ω/c [rad/m] the wave number
(with sound speed c = 331 m/s) and ρ [kg/m
3
] the air density (ρ = 1.18 kg/m
3
). The time
convention is e
−jωt
(p(x, t) = p(x, ω)e
−jωt
). Without loss of generality, the following analytical
developments can also be applied to Green’s functions defined for semi-infinite or finite spaces.
Free-field Green’s functions are used here to illustrate general results of the fundamental AWFS
behavior, through simple simulations. With these simulations, our primary objective is to clarify
and illustrate the theoretical properties of AWFS.
The reproduction goal is defined as a target pressure field produced by a virtual source
located at x
o
[m]
p
(im)
(x, ω) = A(ω)
e
jk|x−xo|
[x −x
o
[
, (7.4)
where k is the wave number and A(ω) is the virtual source monopole amplitude, which is set
to unity. Such a specific target wave field is used for simulation purposes. It could be replaced
by any other target field definition (plane or directive fields for example) and the remaining
analytical developments would still be valid. Indeed, a part of the main points presented in this
paper relies on analytical developments where no assumptions about the nature of p
(im)
(x, ω)
or G(x[x
(l)
l
) are included. The virtual source position is arbitrary. A virtual source “in front”
of the source array (i.e. on the same side as the listening space) is often cited as an interesting
practical possibility of sound field reproduction. In this paper, virtual sources are always located
“behind” the array (with respect to the listening space).
143
Figure 7.1 Symbol convention for the WFS operators definition. The virtual source is located
in x
o
. The reproduction source l is located in x
(l)
l
. x
(ref)
describes points which belong to the
reference line. x describes any field point and x
(m)
m
is the m sensor position. L is the
reproduction source line, the virtual source is on the left of the source line and the reproduction
space is on the right of the source line. All sources and sensors are located in the x
1
−x
2
plane.
7.4.1 WFS operators
WFS is an open-loop technology for sound field reproduction which assumes a free-field re-
production space [Berkhout et al., 1993; Verheijen, 1998]. The WFS operators are defined from
the Kirchhoff-Helmholtz integral theorem. These operators are then used to drive a reproduc-
tion source array according to the virtual source definition and to the reproduction source array
geometry. In free-field conditions, using these WFS operators along with the source array would
then approximately reproduce the target field produced by the virtual source. The WFS problem
is usually limited to reproduction in the horizontal plane by means of a finite number of discrete
sources using appropriate simplifications of the integral formulation [Verheijen, 1998; Nicol et
Emerit, 1999; Spors et al., 2005a]. A monopole array for WFS would be fed by the normal
virtual sound pressure gradient evaluated along the reproduction source line. This is obtained
using the monopole radiation part of the Kirchhoff-Helmholtz integral with the stationary phase
approximation [Junger et Feit, 1993; Verheijen, 1998]. Both the stationary phase approximation
and the source line discretization introduce reproduction errors. Moreover, usage of a truncated
reproduction array or piecewise linear array in practical WFS implementation causes finite aper-
ture and corner effects which produce reproduction errors [Verheijen, 1998]. The above WFS
reproduction errors are readily observable in free field but they are masked in rooms by the
144
comparatively large room effects. [This was observed by time- and frequency-domain numeri-
cal simulations in comparison with objective WFS sound field reproduction measurements in a
real studio [Gauthier et al., 2005c].]
On the one hand, the inherent free-field assumption of WFS reduces the objective accuracy
of the sound field reproduction in real situations, thus suggesting the need for a closed-loop
compensation [Spors et al., 2003a; Gauthier et al., 2005b,c]. On the other hand, WFS provides
satisfactory results for sound localization by the human auditory system since the WFS direct
field approaches the target field [Gauthier et al., 2005c]. (It is possible to decompose the WFS
reproduced field as the superposition of a direct field and a field which is reverberated by the
room walls and furniture surfaces.) Direct-field reproduction is critical for accurate subjective
localization [Blauert, 1999]. Therefore, the active compensation introduced by AWFS includes
a departure penalty from the WFS operators, thus motivating the Adaptive WFS terminology.
The WFS operators are defined as follows [Verheijen, 1998] :
Q
WFS
(x
(l)
l
, ω) = −A(ω)j
_
jk

cos Ψ
e
jkro

r
o
_
r
(ref)
/(r
(ref)
+r
o
)∆
l
(7.5)
and
q
WFS
(x
(l)
l
, ω) = −
4πQ
WFS
(x
(l)
l
, ω)
jωρ
, (7.6)
where A(ω) is the virtual source monopole amplitude, Ψ [rad] is the angle between the virtual
source and the normal to the reproduction line at the reproduction source position x
(l)
l
, r
o
=
[[x
o
−x
(l)
l
[[
2
is the distance [m] between the virtual source (in x
o
) and the reproduction source
(in x
(l)
l
) and r
(ref)
= [[x
(ref)
−x
(l)
l
[[
2
is the distance [m] between the reproduction source and the
reference line along the line r
o
. These geometric parameters are illustrated in Fig. 7.1 (p. 144).
In Eq. (7.5), ∆
l
[m] is the reproduction source separation (∆
l
= [[x
(l)
l
−x
(l)
l+1
[[
2
). Equation (7.5)
expresses the WFS monopole source amplitude Q
WFS
(x
(l)
l
, ω) to produce p
(im)
(x, ω) while
Eq. (7.6) transforms WFS monopole amplitudes in source strength amplitudes q
WFS
(x
(l)
l
, ω)
[Pierce, 1991].
The stationary phase approximation in WFS also leads to the definition of a “reference line”
[Verheijen, 1998] on which the amplitude of the reproduction error should theoretically be zero
in comparison with points outside the reference line, again for free field. Indeed, the stationary
phase approximation in WFS implies that the reproduced sound field would be effectively re-
produced only on a line in front of the reproduction source array. For WFS, this line is arbitrarily
chosen and this corresponds to the WFS reference line. This line is shown in Fig. 7.1 (p. 144).
In this paper, the reproduction source line L is defined as a circle, and the reference line is also
145
defined as a circle, centered on the virtual source position x
o
and passing through the source
array center. The choice of a given reference line definition is not relevant to the AWFS fun-
damental idea, but it remains an important choice for the WFS definition (for numerical results
reproducibility) since the reference line influences the WFS operators of Eq. (7.5).
For WFS, a reproduction source is active if [Ψ[ < π/2 radian (see Fig. 7.1 (p. 144) for Ψ
definition). An active source implies that Q
WFS
(x
(l)
l
, ω) ,= 0. Other sources, with [Ψ[ ≥ π/2, are
not active [artificially forced to Q
WFS
(x
(l)
l
, ω) = 0]. This highlights the fact that WFS solution
implies that only a part of the reproduction source array is active for a given virtual source. A
spatial weighting window is also used to progressively reduce the WFS strength amplitudes.
This is applied to the reproduction sources closer to the end of the active part of the source WFS
array. Such spatial windowing limits the finite aperture effects of the reproduction array. Here,
the spatial weighting window is a rectangular window with half Hanning windows at its ends.
The half Hanning window extends over 0.5 m [Verheijen, 1998].
7.4.2 Definition of AWFS
Using the radiation model of Eqs. (7.1) to (7.3) with the target pressure field of Eq. (7.4),
AWFS (adaptive wave field synthesis) is introduced as an optimal control approach with this
cost function
J
AWFS
= e
H
e +λ(q − q
WFS
)
H
(q −q
WFS
) (7.7)
which must be minimized with λ being a real positive scalar. Superscript
H
denotes Hermitian
transposition. Equation (7.7) introduces the reproduction error vector e = p
(im)
− p
(rep)
=
p
(im)
−Zq, where p
(im)
is the complex column vector of the target sound pressure at the M sensor
locations, defined by Eq. (7.4) with x
(m)
m
replacing x. The first term in Eq. (7.7) represents the
summation of the quadratic reproduction errors with respect to the target reproduced sound field,
observed at the sensor locations. The second term in Eq. (7.7) is weighted by the regularization
parameter λ and it represents a quadratic departure penalty of the solution q with respect to the
fixed WFS solution q
WFS
.
J
AWFS
is a quadratic function of q,
J
AWFS
= q
H
_
Z
H
Z +λI
¸
q − q
H
_
Z
H
p
(im)
+λq
WFS
¸

_
p
(im)
H
Z +λq
H
WFS
_
q +
_
p
(im)
H
p
(im)
+λq
H
WFS
q
WFS
_
, (7.8)
146
where I is the L L identity matrix.
Although the reproduction system of Eq. (7.1) is under-determined (M < L) [Nelson et
Elliot, 1992], the WFS departure penalty term, weighted by λ, ensures that there will be a
unique minimum of Eq. (7.7). That is, the Hessian matrix ([Z
H
Z + λI]) of the quadratic Eq.
(7.8) is positive definite provided that λ > 0. This optimum source strength vector minimizes
the cost function [Nelson et Elliot, 1992]
q
(opt)
=
_
Z
H
Z +λI
¸
−1
_
Z
H
p
(im)
+λq
WFS
¸
. (7.9)
When λ →∞the solution reduces to the WFS operators q
WFS
, when λ →0 the solution is the
optimal control solution that minimizes the reproduction error in a least-mean-square (LMS)
sense. These two situations are the limiting cases of AWFS.
7.5 Interpretation of AWFS
Equations (7.7) and (7.9) lead to insightful observations about the behavior of AWFS. It
first should be noted that the second term of the cost function (7.7) includes a standard effort
penalty obtained by λq
H
q and a projection term −2λq
H
WFS
q. The first term acts like a standard
regularization while the second introduces a contribution of q
WFS
in the solution.
Rewriting Eq. (7.9) and extracting the q
WFS
contribution, one finds
q
(opt)
=
_
Z
H
Z +λI
¸
−1
_
Z
H
e
WFS
¸
+q
WFS
, (7.10)
where e
WFS
= p
(im)
−Zq
WFS
is the reproduction error of WFS at the sensors. This potentially
includes the inherent WFS approximation errors reviewed in Sec. 7.4.1, along with the room
effects.
Equation (7.10) illustrates that the optimal solution q
(opt)
is the superposition of the optimal
correction [Z
H
Z + λI]
−1
[Z
H
e
WFS
] on the fixed WFS solution q
WFS
. The optimal correction
matches a standard optimal solution for active control (including effort penalization), the dif-
ference is that the target is the WFS reproduction error e
WFS
replacing the target wave field
p
(im)
. Although the WFS contribution q
WFS
activates only a limited set of sources, the optimal
contribution ([Z
H
Z +λI]
−1
[Z
H
e
WFS
]) will activate all the reproduction sources.
147
Figure 7.2 System configuration in free field and real part of the target wave field at 220 Hz.
Dashed lines represent zero-pressure contours of the target pressure field p
(im)
(x, ω). ÷, the
normals to the source line. ,, virtual source in x
o
= [2, 6, 0] meters.
7.6 Simulation results
Simulation results are reported for a relatively small and compact hypothetical error sensor
array prototype. (Such a prototype is currently under development for practical AWFS.) Simu-
lations are performed in free field to illustrate the fundamental AWFS mechanisms.
The system configuration and the target pressure field p
(im)
(at 220 Hz) are shown in Fig.
7.2 (p. 148). As illustrated, the system includes 24 sources, 4 error sensors and 32 monitoring
sensors used to quantify the reproduction quality outside the control region defined by the error
sensor locations. The error sensors are separated by 0.175 m along x
1
and x
2
. The source array
has a diameter of 2 m and the source separation is 0.2611 m. The monitoring sensor array has
a diameter of 1 m and the monitoring sensor separation is 0.098 m. All the arrays are centered
around x
1
= x
2
= 2 m. The virtual source is located at x
o
= [2, 6, 0] meters.
Simulation results are globally quantified by E
LS
E
LS
=
e
H
e
p
(im)
H
p
(im)
(7.11)
148
E
LS
is the global residual quadratic reproduction error normalized by the summation of the qua-
dratic target pressures at the error sensor locations. E
LS
= 0 characterizes perfect reproduction
and E
LS
= 1 corresponds to an error as large as the target field.
E
LS
can also be computed for the M
m
monitoring sensors using the reproduction errors at
the monitoring sensor locations ¦x
(mon)
1
x
(mon)
Mm
¦. The monitoring sensors are introduced to
monitor the reproduction error outside the error sensor locations.
Results in terms of E
LS
are shown in Figs. 7.3 (p. 150) and 7.4 (p. 150) for the configuration
of Fig. 7.2 (p. 148) and others. Configuration (b) corresponds to Fig. 7.2 (p. 148). Configuration
(a) corresponds to a unique sensor located at the center of the source array (at x
1
= x
2
= 2 m).
Configuration (c) is similar to (b) plus an additional sensor at the center of the source array.
Configuration (d) includes 9 sensors forming two tesseral quadrupoles (π/2 radian apart, the
separation distance is the same as in case (b)) plus a centered sensor. In Fig. 7.3 (p. 150), WFS
produces slightly different E
LS
because the error sensor locations change : The WFS reproduced
field is the same for the four configurations. In each case, the regularization parameter λ for
AWFS was set to different values to take into account that an increased number of sensors
reduces the importance of the penalization term in J
AWFS
with a fixed λ. Case (a) was simulated
with λ = 50 while the other values were : (b) λ = 200, (c) λ = 250 and (d) λ = 450. Here, the
λ values are not optimally chosen (with respect to inverse problem criteria such as the L-curve
[Hansen, 1998; Nelson, 2001]), they were set to an arbitrary value multiplied by the number of
sensors.
As shown in Fig. 7.3 (p. 150), E
LS
at the error sensors is larger with WFS than AWFS.
Also, the reproduction quality at the monitoring sensors with AWFS converges to the WFS
results above approximately 634 Hz (Fig. 7.4 (p. 150)). This frequency corresponds to the WFS
spatial aliasing frequency which is defined in a first approximation by the source separation
distance [Verheijen, 1998]. WFS requires at least two reproduction sources per wavelength to
avoid spatial aliasing.
Reproduced sound fields at 220 Hz for WFS, AWFS and reproduction error regularized mi-
nimization [λ = 50 and q
WFS
= 0 in Eq. (7.9), that is optimal sound field reproduction without
the WFS a priori solution] are shown in Figs. 7.5 (p. 151), 7.6 (p. 151), and 7.7 (p. 153) for
the configuration (b) shown in Fig. 7.2 (p. 148). λ = 50 for all these reproduced fields. The
reproduced sound fields approach the target wave field. On these three figures, the spatial extent
of effective reproduction is also shown. The size of this region varies with frequency. The spatial
149
10
2
10
3
10
−6
10
−5
10
−4
10
−3
10
−2
10
−1
10
0
E
L
S
Freq. [Hz]
WFS (a)
AWFS (a)
WFS (b)
AWFS (b)
WFS (c)
AWFS (c)
WFS (d)
AWFS (d)
≈ 634Hz →
W
F
S

A
W
F
S

(a) (b) (c) (d)
Figure 7.3 E
LS
at the error sensors for various
approaches (WFS and AWFS) and error sensor
configurations (shown as dot plots).
Configuration (b) corresponds to Fig. 7.2 (p.
148) ; (a) corresponds to a unique sensor
located at the center of the source array ; (c)
corresponds to configuration (b) plus an
additional sensor at the center of the source
array ; (d) includes nine sensors approaching
two tesseral quadrupolelike dispositions (45
degrees apart) plus a centered sensor.
10
2
10
3
10
−2
10
−1
10
0
E
L
S
Freq. [Hz]
WFS (a), (b), (c) & (d)
AWFS (a)
AWFS (b)
AWFS (c)
AWFS (d)
≈ 634Hz →
W
F
S

A
W
F
S

(a) (b) (c) (d)
Figure 7.4 E
LS
at the monitoring sensors for
the cases of Fig. 7.3 (p. 150) (the error sensor
configurations are shown as dot plots).
extent of effective reproduction is displayed via contour plots of the local quadratic normalized
error ([p
(im)
(x, ω) − p
(rep)
(x, ω)[
2
/[p
(im)
(x, ω)[
2
). Contours are plotted only for the 0.25, 0.5,
0.75, 1 and 1.5 levels. The 0.5 level is suggested as the acceptable reproduction region limit
for comparison purposes [Kirkeby et Nelson, 1993; Gauthier et al., 2005b]. AWFS introduces
lower reproduction error than WFS in the source array center and the effective reproduction re-
gion is somewhat larger than the WFS effective region. AWFS in Fig. 7.6 (p. 151) also produces
a more extended reproduction area (based on the 0.5 error level) than when simply minimizing
the reproduction error at the error sensors with a control effort penalty (Fig. 7.7 (p. 153)).
One of the benefits of AWFS is that it is possible adjust the solution between a pure WFS
realization (using a large penalization parameter) to a simple reproduction error minimization
(with λ → 0). This is shown in Fig. 7.8 (p. 153) on the basis of E
LS
variations as a function of
the penalization term λ. WFS, AWFS and reproduction error minimization regions are defined
150
Figure 7.5 Reproduced sound field at 220 Hz
in free field by WFS (real part on top,
imaginary part on bottom). Dashed lines show
zero-pressure contours of the target pressure
field. Local normalized quadratic residual error
is represented as continuous line contour plots.
Reproduction sources are replaced by a thick
source line for clarity. ,, virtual source.
Figure 7.6 Reproduced sound field at 220 Hz
in free field by AWFS with λ = 50 (real part
on top, imaginary part on bottom). Dashed
lines show zero-pressure contours of the target
pressure field. Local normalized quadratic
residual error is represented as continuous line
contour plots. Reproduction sources have been
replaced by a thick source line for clarity. ,,
virtual source.
151
in Fig. 7.8 (p. 153). The E
LS
values for regularization parameter λ = σ
2
i
(where σ
i
are the
transfer impedance matrix singular values) are plotted as circles. WFS corresponds to a large
value of λ and E
LS
does not significantly change with λ in this region. Reproduction error
minimization corresponds to small values of λ and E
LS
does not significantly change with λ in
this region. The AWFS region is defined by the transition region between WFS and reproduction
error minimization. The points for λ = σ
2
i
belong to this transition region.
For near-coincident error sensor arrays (relative to the wavelength) such as shown in Fig.
7.2 (p. 148), an under-regularized AWFS (λ → 0) system can be regarded as a “closed-loop
Ambisonics” reproduction system (“Ambisonics” systems are usually implemented as a open-
loop systems, that is without any feedback or compensation), because such sensor arrays can be
used to evaluate the pressure and two perpendicular pressure gradients in the horizontal plane.
This relation between “Ambisonics” reproduction and AWFS is examined in Sec. 7.8.1.
These simple simulations were used as an exemplary illustration of a simple AWFS behavior
in free field. The more general underlying AWFS behavior, independent of the reproduction
space, is exposed in the following section.
7.7 AWFS and singular value decomposition of Z
The singular value decomposition of the transfer impedance matrix is [Golub et van Loan,
1996]
Z = U
M×M
Σ
M×L
V
H
L×L
, (7.12)
where subscripts indicate matrix dimensions. Uis the matrix whose columns are the left singular
vectors u
i
of Z, V is the matrix whose columns are the right singular vectors v
i
of Z and Σ is
the rectangular matrix of Z real positive singular values σ
i
Σ =
_
¸
¸
¸
¸
_
σ
1
0 0
0 σ
2
0 0
.
.
.
0 0 σ
M
0
_
¸
¸
¸
¸
_
M×L
, (7.13)
where σ
i
> σ
i+1
. The rank r of Z (r ≤ M < L) is equal to the number of nonzero singular
values. In Eq. (7.13) it was assumed that r = M for convenience.
152
Figure 7.7 Reproduced sound field in free
field at 220 Hz by reproduction error
minimization with λ = 50 and q
WFS
=

0 (real
part on top, imaginary part on bottom). Dashed
lines show zero-pressure contours of the target
pressure field. Local normalized quadratic
residual error is represented as continuous line
contour plots. Reproduction sources have been
replaced by a thick source line for clarity. ,,
virtual source.
10
−2
10
0
10
2
10
4
10
6
10
8
10
10
0
0.1
0.2
0.3
0.4
0.5
E
L
S
λ
9.2
9.3
9.4
9.5
9.6
x 10
−4
|
q
(
o
p
t
)
|
←WFS→ ← AWFS → ← Error →
λ
=
5
0

Error and WFS
departure
minimization
minimization
λ
=
σ
1 2

λ
=
σ
3 2
=
σ
2 2
λ
=
σ
4 2

Figure 7.8 E
LS
at the error sensors (thick line)
and at the monitoring sensors (thin line) and
[q
(opt)
[ =
_
q
(opt)
H
q
(opt)
(dashed line) at 220 Hz
as a function of the regularization parameter λ.
E
LS
values for λ = σ
2
i
are shown as circles.
153
The matrices U and V are unitary matrices (U
H
U = UU
H
= V
H
V = VV
H
= I) since
the left and right singular vectors are orthonormal vectors. SVD has well known properties
[Golub et van Loan, 1996; Hansen, 1998]. Examples of SVD in acoustics are described by refe-
rences [Nelson, 2001; Nelson et Kahana, 2001; Williams et al., 2003; Bai et Elliott, 2004; Bai et
Lin, 2005]. The span of the left singular vectors u
i
constitutes the range of the matrix Z and the
span of the last L−r right singular vectors v
i
is the nullspace of Z(Zv
i
= 0 for i > r and i ≤ L)
[Lancaster et Tismenetsky, 1985; Golub et van Loan, 1996]. In order to explicitly relate left and
right singular vectors to physical parameters, right singular vectors v
i
and left singular vectors u
i
will hereafter be respectively identified as “source modes” and “pressure modes.” Each source
and pressure modes pair with the corresponding singular value is here defined as a “radiation
mode.” This AWFS-specific terminology is different from the terminology introduced by re-
ference [Photiadis, 1990] and from the more common definition of a radiation mode being a
source distribution which radiates sound power independently from the other radiation modes.
Equations (7.1) and (7.12) result in this transformed radiation equation
˜
p
(rep)
= Σ
˜
q (7.14)
with the transformed source strengths
˜
q and acoustic pressures
˜
p
˜
p
(im)
= U
H
p
(im)
,
˜
p
(rep)
= U
H
p
(rep)
,
˜
q = V
H
q. (7.15)
Since Σis a pseudodiagonal rectangular matrix (the elements are nonzero only on the main dia-
gonal), the radiation problem of Eq. (7.14) is a set of independent acoustical radiation between
source modes v
i
and pressure modes u
i
.
7.7.1 Nature of the under-determined set of equations Zq = p
(im)
In Section 7.4.2 we treated the equation Zq = p
(im)
as a quadratic minimization. We nowdis-
cuss the under-determined set of equations Zq = p
(im)
. Since there are more unknown variables
than equations (L > M), the set of equations Zq = p
(im)
can not be solved in this form : there
exists an infinite set of source strength values that will produce p
(im)
. Such under-determination
is expressed as the contribution of left singular vectors in the solution
q =
r

i=1
˜ p
(im)
i
σ
i
v
i
+
L

i=r+1
α
i
v
i
, (7.16)
154
where α
i
represents arbitrary coefficients which, with the vector basis of the null space of Z,
define the under-determined nature of Zq = p
(im)
. Inserting (7.16) in Zq will effectively produce
p
(im)
regardless of α
i
. A solution to such an under-determined problem is to cast it in a new
quadratic minimization form which seeks to reduce the departure between the solution q and a
given solution q
o
. If this a priori solution [Hansen, 1998] is simply 0 then the pseudo-inversion
can be applied to solve Zq = p
(im)
[Golub et van Loan, 1996]. If the a priori solution q
o
is not
zero, a more general rule is obtained : the α
i
in Eq. (7.16) correspond to the projection of q
o
on
v
i
α
i
= v
H
i
q
o
∀ i > r and i ≤ L (7.17)
and the first r contributions of v
i
are determined by the first term in Eq. (7.16). This minimizes
the cost function
J(α
i
) =
r

i=1
_
˜ p
(im)
i

i
−v
H
i
q
o
_
2
+
L

i=r+1
_
α
i
−v
H
i
q
o
_
2
(7.18)
In the next section, we proceed to show how the AWFS solution [expressed by Eq. (7.9)]
corresponds to a modified version of Eqs. (7.16) and (7.17) where q
WFS
replace q
o
.
7.7.2 Independent radiation mode control for AWFS
Taking the AWFS solution of Eq. (7.9) and using the SVD of Z, the AWFS solution can be
expanded over the source modes v
i
, q
(opt)
=

L
i=1
˜ q
i
v
i
, as follows
˜ q
i
=
_
¸
¸
¸
_
¸
¸
¸
_
σ
i

2
i

i
)
˜ p
(im)
i
+
λ
i

2
i

i
)
v
H
i
q
WFS
∀ i ≤ r ≤ M,
v
H
i
q
WFS
∀ λ
i
> 0 , ∀ i > r and i ≤ L,
0 ∀ λ
i
= 0, ∀ i > r and i ≤ L,
(7.19)
where the independent contributions of v
i
in q
(opt)
were individually regularized with λ
i
. AWFS
thus proceeds to control each radiation mode independently. The AWFS solution of Eq. (7.9)
implicitly assumed an identical regularization parameter for all sources modes, λ
i
= λ ∀ i. Note
that Eq. (7.19) was slightly modified in comparison to Eq. (7.9) for the particular case λ
i
= 0 :
Eq. (7.19) is forced to the pseudoinverse definition by the addition of the third case in Eq. (7.19)
[Hansen, 1998]. The reproduction error is expanded
e =
M

i=1
˜ e
i
u
i
(7.20)
155
with
˜ e
i
=
λ
i
(˜ p
(im)
i
−σ
i
v
H
i
q
WFS
)

2
i

i
)
∀ i ≤ r. (7.21)
Equation (7.19) shows that even if the multichannel system must generate the L source
inputs in q
(opt)
, the total number of degrees of freedom is in fact r. In the first case [i ≤ r ≤ M
in Eq. (7.19)], the ˜ q
i
are a combination of reproduction error minimization with q
WFS
projection
on the corresponding source mode v
i
. This combination is weighted by λ
i
. When λ
i
= 0, Eq.
(7.19) provides the same solution as Eqs. (7.16) and (7.17) for i ≤ r ≤ M. In the second case
[i > r and i ≤ L in Eq. (7.19)], the corresponding ˜ q
i
are solely defined by the projection of
q
WFS
on v
i
if λ
i
> 0. This shows that even if such source modes produce no sound pressure
at sensor locations, they contribute to the solution in order to better match the WFS sound field
reproduction outside the control region. These results explain how a part of the WFS operators
is modified by AWFS and how the other fixed part is defined by the projection of q
WFS
on the
null space vector basis. Since these observations stem from an analytical development and since
the SVD exist for any complex matrix Z, it is possible to extent this interpretation to a any real
situation.
Equation (7.19) shows the discontinuity in the solution q
(opt)
as λ → 0, specifically in the
components ˜ q
i
corresponding to the null space of Z. This discontinuity in the solution would not
be observable in the reproduced field at the error sensors, because the span of these source modes
is the nullspace of the transfer impedance matrix. However, anywhere else such discontinuity
would be observable in the reproduced sound field.
Equations (7.19) and (7.21) give insights into how each radiation modes are affected by
λ
i
= λ. Rewriting these equations for i ≤ r in terms of transformed WFS reproduction error
(˜ e
i
WFS
= u
H
i
p
(im)
−σ
i
v
H
i
q
WFS
= u
H
i
( p
(im)
−Zq
WFS
)), one finds
˜ q
i
=
σ
i

2
i

i
)
˜ e
i
WFS
+v
H
i
q
WFS
∀ i ≤ r (7.22)
and
˜ e
i
=
λ
i

2
i

i
)
˜ e
i
WFS
∀ i ≤ r (7.23)
When λ
i
<< σ
2
i
, the solution ˜ q
i
, for the control of the radiation mode i, is dominated by WFS
reproduction error ˜ e
i
WFS
minimization (˜ q
i
−v
H
i
q
WFS
is large and ˜ e
i
is small). When λ
i
>> σ
2
i
,
the solution ˜ q
i
is dominated by WFS departure penalty (˜ q
i
−v
H
i
q
WFS
is small and ˜ e
i
is large).
This illustrates that for a regularization parameter λ as in Eqs. (7.7) and (7.9), the amount of
penalization is different for each radiation mode ; some radiation modes can be over-penalized
156
0 5 10 15 20 25
−0.5
0
0.5
A
m
p
.
Source modes
1 2 3 4
−1
0
1
σ
1
= 1232.0589

Pressure modes
0 5 10 15 20 25
−0.5
0
0.5
A
m
p
.
1 2 3 4
−1
0
1
σ
2
= 235.4339
0 5 10 15 20 25
−0.5
0
0.5
A
m
p
.
1 2 3 4
−1
0
1
σ
3
= 235.4339
0 5 10 15 20 25
−0.5
0
0.5
Source number (l)
A
m
p
.
1 2 3 4
−1
0
1
Sensor number (m)
σ
4
= 32.6085
Real part
Imaginary part
σ
1
= 1232.0589

σ
2
= 235.4339
σ
3
= 235.4339
σ
4
= 32.6085
Figure 7.9 Source modes v
i
at 220 Hz on the
left-hand side and corresponding pressure
modes u
i
(for σ
i
,= 0, that is i ≤ r = M) on
the right-hand side. Source and sensor numbers
are shown in Fig. 7.2 (p. 148).
0 5 10 15 20 25
−1
0
1
Numéro de sources
A
m
p
.
0 5 10 15 20 25
−1
0
1
Numéro de sources
A
m
p
.
0 5 10 15 20 25
−1
0
1
Numéro de sources
A
m
p
.
0 5 10 15 20 25
−1
0
1
Numéro de sources
A
m
p
.
0 5 10 15 20 25
−1
0
1
Numéro de sources
A
m
p
.
0 5 10 15 20 25
−1
0
1
Numéro de sources
A
m
p
.
0 5 10 15 20 25
−1
0
1
Numéro de sources
A
m
p
.
0 5 10 15 20 25
−1
0
1
Numéro de sources
A
m
p
.
0 5 10 15 20 25
−1
0
1
Numéro de sources
A
m
p
.
0 5 10 15 20 25
−1
0
1
Numéro de sources
A
m
p
.
0 5 10 15 20 25
−1
0
1
Numéro de sources
A
m
p
.
0 5 10 15 20 25
−1
0
1
Numéro de sources
A
m
p
.
0 5 10 15 20 25
−1
0
1
Numéro de sources
A
m
p
.
0 5 10 15 20 25
−1
0
1
Numéro de sources
A
m
p
.
0 5 10 15 20 25
−1
0
1
Numéro de sources
A
m
p
.
0 5 10 15 20 25
−1
0
1
Numéro de sources
A
m
p
.
0 5 10 15 20 25
−1
0
1
Numéro de sources
A
m
p
.
0 5 10 15 20 25
−1
0
1
Numéro de sources
A
m
p
.
0 5 10 15 20 25
−1
0
1
Source number (l)
A
m
p
.
0 5 10 15 20 25
−1
0
1
Source number (l)
A
m
p
.
Real
Imaginary
Figure 7.10 The null space source modes v
i
at
220 Hz. Increasing i proceeds from left to right
and from top to bottom.
(λ ≥ σ
2
i
) and some others under-penalized (λ ≤ σ
2
i
). This suggests that the behavior of AWFS
with a global penalization (λ
i
= λ) is a complex contribution of the radiation modes. This
defines the AWFS transition band in Fig. 7.8 (p. 153).
7.8 Analysis of simulation results with SVD
The behavior of independent AWFS is illustrated through numerical results shown in Figs.
7.9 (p. 157)-7.14 (p. 161) for free-field situations. Our goal is to simply exemplify the analytical
results presented in the preceeding section.
Figure 7.9 (p. 157) shows the first four source and pressure modes for the configuration
of Fig. 7.2 (p. 148) at 220 Hz. There is 24 sources modes and four pressure modes in this
configuration. The last 20 source modes produce no sound pressure at the sensor array. Figure
7.9 (p. 157) shows that the source modes have a single circumferential harmonic component, and
the corresponding pressure modes provide a multipole expansion of the sound field at the sensor
array. Moreover, one notes that the third source mode has a π/4 radian spatial phase difference
157
with the second source mode (a similar trend is observed for the corresponding pressure modes).
The source modes producing the Z null space are shown in Fig. 7.10 (p. 157). The null space
source modes are spatially high-pass filtered impulses. This filtering removes the low-order
source mode components from the spatial impulses.
Figure 7.11 (p. 159) shows the produced sound field for the first six source modes v
i
at
220 Hz. The first source mode produces uniform sound pressure at the sensor array [subfigure
(a)]. The next two source modes [subfigures (b) and (c)] produce perpendicular pressure gra-
dients. The next source mode [subfigure (d)] produces a tesseral quadrupole field component.
The last two source modes produce no sound pressure at the sensors [subfigures (e) and (f)]
since the corresponding source modes belong to the nullspace. These two source modes are
shown on the first line in Fig. 7.10 (p. 157).
Figure 7.12 (p. 160) shows multipole representations of the pressure modes u
i
at 220 Hz. The
corresponding free-field directivities are also shown as polar plots. These directivity patterns
were computed with plane wave responses at the sensors weighted by the complex pressure
modes u
H
i
as sensor gains. This figure illustrates that the i = 1 pressure mode corresponds
to sound pressure, the i = 2 pressure mode approximates pressure gradient along x
1
(dipole
sensitivity in the low frequency limit), the i = 3 pressure mode gives a pressure gradient along
x
2
(dipole sensitivity in the low frequency limit) and the i = 4 pressure mode corresponds to
a tesseral quadrupole finite approximation. Since Eq. (7.19) suggests independent control of
the reproduced pressure modes, one can conclude, from the pressure mode shapes of Fig. 7.12
(p. 160), that AWFS [Eqs. (7.7) and (7.9)] effectively operates on the independent control of
pressure, pressure gradients and tesseral quadrupole pressure modes at the sensor array.
Figure 7.13 (p. 161) shows the source strength vectors for WFS and AWFS used to produce
the sound fields in Figs. 7.5 (p. 151) and 7.6 (p. 151) along with the projections of q
WFS
and
q
(opt)
on the source modes v
i
. By comparing the left graphs of Fig. 7.13 (p. 161), it is clear
that WFS activates only a part of the reproduction sources while AWFS significantly activates
nearly all sources. This illustrates the additive combination of WFS and reproduction error mi-
nimization. As shown in the right graphs of Fig. 7.13 (p. 161), AWFS only changes the first
r = M source mode contributions ˜ q
i
in comparison with WFS, this was shown in Eq. (7.19).
This illustrates that the general AWFS minimization [Eqs. (7.7) and (7.9] effectively gives the
SVD solution of Eq. (7.19). Even if deriving (7.19) from (7.9) is straightforward using SVD,
this numerical example is used to illustrate this equivalence.
158
Figure 7.11 Sound field radiated by the first six source modes. Source modes (a)-(d) generate
the range of the transfer impedance matrix. Source modes (e) and (f) belong to the null space of
the transfer impedance matrix. Dashed lines show zero-pressure contours of the pressure fields.
159
Pressure mode 1 Pressure mode 2
Pressure mode 3 Pressure mode 4
Figure 7.12 Multipole representations of the first M = 4 pressure modes and corresponding
free field directivity. , sensor position; , positive real part ; , negative real part ; +, positive
imaginary part ; , negative imaginary part. Symbol diameter illustrates the magnitude of the
corresponding value. Dashed lines, free field directivity.
7.8.1 AWFS and “Ambisonics”
The next simulations are introduced to draw the link between AWFS, using a compact cen-
tered sensor array as shown in Fig. 7.2 (p. 148), and “Ambisonics.”
For the first simulation, the regularization parameter λ was set to the small value of 110
−4
and the WFS solution q
WFS
was set to 0 in Eq. (7.9). A small penalization parameter λ is one
of the limiting cases of AWFS. This corresponds to the minimization of the reproduction errors
with a small penalty of the control effort. The optimal source strengths q
(opt)
at 220 Hz and
the corresponding projections on the source modes v
i
are shown in Fig. 7.14(a). Figure 7.14(a)
shows that only the first r = M source modes are active, this is consistent with Eq. (7.19)
when q
WFS
= 0. As explained below, such a type of source distribution is somewhat related to
“Ambisonics” panning functions.
A short description of “Ambisonics” is introduced here. A more complete theoretical de-
velopment is included in the appendix. “Ambisonics” is an open-loop reproduction technology
from the 70s introduced by Gerzon [Rumsey, 2001]. In the most simple case, the target wave
160
0 5 10 15 20 25
−2
−1
0
1
2
3
4
x 10
−4
Source number (l)
q
W
F
S
0 5 10 15 20 25
−4
−2
0
2
4
x 10
−4
Source mode index (i)
q
i
0 5 10 15 20 25
−2
0
2
4
x 10
−4
Source number (l)
q
(
o
p
t
)
0 5 10 15 20 25
−4
−2
0
2
4
x 10
−4
Source mode index (i)
q
i
Real
Imaginary
WFS WFS
AWFS AWFS (b)
(a)
~

~

Figure 7.13 Left, complex source strengths
for (a) WFS (q
WFS
corresponding to Fig. 7.5
(p. 151)) and (b) AWFS (q
(opt)
corresponding
to Fig. 7.6 (p. 151)). Right, complex source
mode contributions ˜ q
i
of (a) WFS and (b)
AWFS solutions obtained from the orthogonal
projection (˜ q
i
= v
H
i
q
(opt)
or ˜ q
i
= v
H
i
q
WFS
) of
the source strengths on the source modes.
0 5 10 15 20 25
−2
0
2
4
x 10
−4
Source number (l)
q
(
o
p
t
)
0 5 10 15 20 25
−4
−2
0
2
4
x 10
−4
Source mode index (i)
q
i
0 5 10 15 20 25
−2
0
2
4
x 10
−4
Source number (l)
q
(
o
p
t
)
0 5 10 15 20 25
−4
−2
0
2
4
x 10
−4
Source mode index (i)
q
i
Real
Imaginary
Real
Imaginary
λ=1×10
−4
q
WFS
=0
λ=1×10
−4
q
WFS
=0
λ=1×10
−4
q
WFS
≠0
λ=1×10
−4
q
WFS
≠0
(a)
(b)
~

~

~

~

Figure 7.14 Left, complex source strengths
for optimal control (a) q
(opt)
with λ = 1 10
−4
and q
WFS
=

0, (b) q
(opt)
with λ = 1 10
−4
and q
WFS
,=

0). Right, corresponding source
mode contributions ˜ q
i
obtained from the
orthogonal projections (˜ q
i
= v
H
i
q
(opt)
) of the
source strengths on the source modes.
field p
(im)
(x, ω) is defined as a plane wave in free field
p
(im)
(R, φ, ω) = A(ω)e
jkRcos(φ−θ)
, (7.24)
where space coordinates are now described in terms of cylindrical coordinates (R, φ, z), and θ
is the direction of propagation of the plane wave.
The reproduction system is assumed to be in free field and the reproduction sources (uni-
formly distributed over 2π radians) produce a set of plane waves at the origin of the coordinate
system
p
(rep)
(R, φ) =
L

l=1
A
l
e
jkRcos(φ−φ
l
)
, (7.25)
where A
l
is the unknown contribution of the plane reproduction wave l whose direction of
propagation is φ
l
.
161
Using Fouriel-Bessel series for both the target sound pressure field [Eqs. (7.24) and (7.28)]
and the reproduced field [Eqs. (7.25) and (7.34)], it is possible to minimize (in an LMS sense)
the reproduction error over each of the coefficient of the Fourier-Bessel series. This gives a
panning function (amplitude A
l
of plane waves reproduction sources as function of θ and φ
l
)
A
l
=
A
L
_
1 + 2
N

n=1
cos(n(θ −φ
l
))
_
(7.26)
This is a circular sinc function of φ
l
for which the series truncature order N defines the number
and amplitudes of the side lobes.
From this, one gets a panning function as to how (in an a posteriori operation) distribute a
given signal to a circular source array to create, under the free field and plane wave assump-
tions, the target wave field. Since the Fourier-Bessel coefficients [see Eq. (7.31)] correspond
to low-order directivity patterns of microphones (first order “Ambisonics,” N = 1, gives three
coefficients in the two series : monopole and two perpendicular dipole patterns), it is possible
to consider the limiting case of AWFS with λ → 0 as a “closed-loop Ambisonics” realization.
The “closed-loop” appears since AWFS would be implemented with real microphones for re-
production error minimization while “Ambisonics” is a LMS solution that is implemented as
an open-loop system. This is first supported by the pressure modes of Fig. 7.12 (p. 160) which
shows that AWFS in this case corresponds to independent reproduction control of pressure, two
perpendicular sound pressure gradients and a tesseral quadrupole approximation of the sound
field at the error sensors in the low frequency limit. However, this connection between “Ambi-
sonics” and AWFS using compact sensor array is essentially conceptual. This arises from that
AWFS and “Ambisonics” use 1) different radiation models (spherical waves and plane waves
for the reproduction system, respectively) and 2) different sensing devices (discrete sensor array
for AWFS and perfectly coincident directive patterns for “Ambisonics”).
The previous remarks show that AWFS (while letting λ → 0 and forcing the WFS solution
to zero) can be interpreted as a closed-loop “Ambisonics” realization. In the next example, we
proceed in explaining how the AWFS realization (with q
WFS
,= 0 and for the specific sensor
configuration shown in Fig. (7.2 (p. 148))) is an hybrid solution between WFS and a “closed-
loop Ambisonics” realization. This corresponds to “closed-loop modified Ambisonics.” The
“modified Ambisonics” arises from the superposition of the filtered WFS solution and the low-
order closed-loop “Ambisonics” solution.
Figure 7.14(b) corresponds to the limiting case of AWFS with a vanishing regularization
parameter λ = 1 10
−4
and q
WFS
corresponding to the WFS solution [Eq. (7.5) and (7.6)].
162
For the first four source modes contributions (˜ q
i
with i = 1, 2, 3, 4), the solution with q
WFS
,= 0
is almost identical to the solution with q
WFS
= 0. This was to be expected from Eq. (7.19)
since when λ → 0, ˜ q
i
≈ ˜ p
(im)
i

i
for i ≤ r. The higher-order source mode (r < i ≤ L)
contributions ˜ q
i
are the WFS projections (v
H
i
q
WFS
) on v
i
and are independent of λ. This appears
when comparing the two graphs on the right-hand side of Fig. 7.14 (p. 161).
The previous results suggested a conceptual connection between AWFS in the configuration
of Fig. 7.2 (p. 148) and “Ambisonics.” In the next example, the nearly exact correspondence of
AWFS, using Eq. (7.19), and the “Ambisonics” panning function of Eq. (7.26) will be shown.
For this simulation, the AWFS radiation model is replaced with a reproduction source radiation
model consistent with the “Ambisonics” formalism (plane waves as reproduction sources). The
sensor array is however kept identical to the one shown in Fig. 7.2 (p. 148). Eq. (7.19) is also
applied in the following conditions : First, the a priori solution q
WFS
is set to 0. Second, the
effort penalization parameter λ is set to 0. Third, the ˜ q
i
components are only computed for
i = 1, 2, 3 (these first three pressure modes correspond to uniform pressure and two pressure
gradients sensing at the sensor array). This would correspond to first order “Ambisonics” using
N = 1 in Eq. (7.26). Fourth, the target wave field is a plane wave [see Eq. (7.24)] for which the
direction of propagation corresponds to reproduction source number 12, see Fig. 7.2 (p. 148)
for the angular plane source distributions which correspond to the reproduction source angular
positions). The corresponding AWFS and “Ambisonics” solutions are shown in Fig. 7.15 (p.
164). The AWFS and “Ambisonics” source distributions are almost identical and correspond to
a raised cosine [see Eq. (7.26) with N = 1]. Despite apparences, the solutions are not exactly
the same. The difference is due to the AWFS sensor array which can only provide a finite
approximation to monopole and dipole sensitive patterns. The AWFS solution of Eq. (7.19)
matches the “Ambisonics” solution of Eq. (7.42) when the radiation models are consistent.
In summary, when the regularization parameter λ is large, AWFS simply converges towards
WFS. When λ is small, the first (i ≤ r) source modes contributions ˜ q
i
approach a closed-loop
“Ambisonics” realization with a small WFS departure penalty, while all the other source modes
(which create the nullspace) contributions are determined by the projection of WFS solution
q
WFS
on the corresponding source modes v
i
. This precisely defines what was described earlier as
“closed-loop modified Ambisonics.” Briefly stated, the limiting cases of AWFS implementation
produce (1) the WFS solution or (2) a closed-loop “Ambisonics” solution superposed to the
spatially filtered WFS solution.
163
0 5 10 15 20 25
−0.1
−0.05
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
Source number (l)
P
l
a
n
e

w
a
v
e

a
m
p
.

(
A
l
)
First order Ambisonics
Imaginary part, AWFS
Real part, AWFS
← Reproduction source 12
corresponds to the target
plane wave direction.

l
=
1
2
Figure 7.15 Reproduction source amplitudes
for plane wave reproduction with first order
“Ambisonics” and truncated modified AWFS.
0 5 10 15 20 25
−0.5
0
0.5
A
m
p
.
(a) With a rigid plane
0 5 10 15 20 25
−0.5
0
0.5
σ
1
= 1151.2298
(b) In room
0 5 10 15 20 25
−0.5
0
0.5
A
m
p
.
0 5 10 15 20 25
−0.5
0
0.5
σ
2
= 246.1264
0 5 10 15 20 25
−0.5
0
0.5
A
m
p
.
0 5 10 15 20 25
−0.5
0
0.5
σ
3
= 234.9035
0 5 10 15 20 25
−0.5
0
0.5
A
m
p
.
Source number (l)
0 5 10 15 20 25
−0.5
0
0.5
σ
4
= 29.5188
Real
Imaginary
σ
1
= 1566.746
σ
2
= 326.5514
σ
3
= 275.8447
σ
4
= 37.8151
Source number (l)
Figure 7.16 First four source modes and
singular values. (a) with a rigid plane in
x
2
−x
3
. (b) in a room of 6.05 5.2 2m with
a reverberation time of approximately 0.28 s.
7.8.2 Including reflections and room effects
The preceeding paragraphs showed the fundamental theoretical mechanisms of AWFS on
the basis of analytical developments and illustrative simulation results in free field. However,
AWFS has the potential to compensate for the effects of the listening space. Although this paper
does not primarily address AWFS in room situation, some details are introduced to extend the
significance of the preceeding sections. In room, the compensation is more significant since the
free-field assumptions of WFS are no longer respected and the accuracy of the reproduction by
WFS is reduced [Gauthier et al., 2005b,c].
The main goal of this section is to illustrate that even if both source modes and singular
values are altered by the presence of boundaries, the pressure modes still provide pressure and
pressure gradients estimates at the error sensors. Interestingly, this, with Eq. (7.19) (which is
valid for any Z), extends the relation between AWFS and “Ambisonics” to sound field repro-
duction in rooms : independent control of pressure, pressure gradients and tesseral quadrupole
pressure modes is achieved by AWFS in the configuration shown in Fig. 7.2 (p. 148) even in
theoretical non-free-field conditions.
164
Figure 7.16(a) shows the first four source modes at 220 Hz when a rigid wall replaces the
x
2
− x
3
plane. The transfer impedance matrix was computed using the method of images. The
corresponding pressure modes are shown as multipole representations in Fig. 7.17 (p. 166). Even
if the pressure modes of Fig. 7.17 (p. 166) are slightly different to the free-field source modes
of Fig. 7.12 (p. 160), the pressure modes still give finite difference approximations of pressure,
pressure gradients and tesseral quadrupole as shown in Fig. 7.17 (p. 166). Figure 7.16(b) shows
the first source modes when the system is located in a room for which the transfer impedance
is based on a modal model including 6137 modes [the model is fully described by reference
[Gauthier et al., 2005b], see also reference [Morse et Ingard, 1968]]. The room is rectangular
and its dimensions are 6.05 5.2 2 m, the room corner is located at x
1
= x
2
= x
3
= 0. The
source and sensor plane is at x
3
= 1.2192 m. The reverberation time is approximately 0.28 s.
The corresponding pressure modes are shown as a multipole representation in Fig. 7.18 (p. 166).
Even though the source modes are distorted in comparison with the free field or rigid wall si-
tuation, the pressure modes still give finite difference approximations of pressure, perpendicular
pressure gradients and tesseral quadrupole at the sensor array as shown in Fig. 7.18 (p. 166).
By comparing Figs. 7.9 (p. 157) and 7.16(b), one notes that the room singular values are signi-
ficantly higher than the free-field and the semi-infinite space singular values. This demonstrates
that for a given source strength vector q, the sound pressures p
(rep)
produced in a closed volume
are larger than in free field.
According to these examples, independent control of radiation mode as pressure and higher-
order sound pressure field derivatives is still a valid fundamental interpretation of Eq. (7.19)
in the presence of a wall or a room. This suggests that AWFS based on independent radiation
mode control as shown by Eq. (7.19) is a promising avenue for practical adaptive sound field
reproduction which should somehow keep a link with “Ambisonics” and WFS.
7.9 Implementation of AWFS by independent feedforward control of radiation modes
This section describes a possible implementation of AWFS based on adaptive signal pro-
cessing. As noted in Eq. (7.19), each source mode contribution ˜ q
i
in q
(opt)
is solely defined by
the corresponding ˜ p
(im)
i
, σ
i
, λ
i
and v
H
i
q
WFS
. It is possible to exploit this independence of the
radiation modes for practical implementations of AWFS.
In a classical adaptive minimization of Eq. (7.7), a centralized multichannel adaptive algo-
165
Pressure mode 1 Pressure mode 2
Pressure mode 3 Pressure mode 4
Figure 7.17 Multipole representations of the
first M = 4 pressure modes and corresponding
free field directivity for the source modes in
Fig. 7.16 (a). , sensor position ; , positive
real part ; , negative real part ; +, positive
imaginary part ; , negative imaginary part.
Symbol diameter illustrates the magnitude of
the corresponding value. Dashed lines, free
field directivity.
Pressure mode 1 Pressure mode 2
Pressure mode 3 Pressure mode 4
Figure 7.18 Multipole representations of the
first M = 4 pressure modes and corresponding
free field directivity for the source modes in
Fig. 7.16 (b). , sensor position ; , positive
real part ; , negative real part ; +, positive
imaginary part ; , negative imaginary part.
Symbol diameter illustrates the magnitude of
the corresponding value. Dashed lines, free
field directivity.
rithm would be implemented [Elliott, 2001] using a feedforward architecture. This is illustrated
in Fig. 7.19 (p. 167). A set of z-transformed adaptive filters w(z) are adapted to reduce the
quadratic summation of the M reproduction errors e
M
(n). The discrete filters w(z) are fed by a
reference signal x(n) and produce the L command signals y
L
(n) for the L reproduction sources.
Here, Z(z) is the only physical system : All other operations are achieved in a signal processing
domain. This includes
ˆ
Z(z) which is an identified approximation of Z(z). The target field de-
finition at the error sensors is obtained by passing the reference signal x(n) through the target
pressure modeler a(z). The WFS solution departure penalty [see Eq. (7.7)] is automatically ta-
ken into account by the LMS adaptation which is based on a discrete time representation of the
AWFS cost function of Eq. (7.7). Using M sensors, this will be a multiple-input-multiple-output
(MIMO) L M system. The computational burden involved in the block diagram of Fig. 7.19
(p. 167) becomes prohibitive as L, M and the adaptive filters order increase [Elliott, 2001; Bai
et Elliott, 2004]. Moreover, this may slow down the gradient LMS algorithm convergence as L
and M increase [Bai et Elliott, 2004].
166
Figure 7.19 Block diagram of a possible
AWFS least-mean-square adaptive digital
processing implementation using FXLMS
multichannel algorithm. Subscripts denote
signal dimensions.
Figure 7.20 Block diagram of a possible
AWFS least-mean-square adaptive digital
processing implementation based on
independent radiation mode control. Subscripts
denote signal dimensions.
Another approach is illustrated as a block diagram in Fig. 7.20 (p. 167). Z(z) is again the
only physical system. With this diagram, we seek to produce a set of M (with M ≤ L) in-
dependent SISO (single-input-single-output) adaptive systems
˜
w
i
(z). Here, each independent
adaptive system generates the signal sent to each source mode v
i
for i < r ≤ M. This type of
independent control using SVD was investigated by reference [Bai et Elliott, 2004] for cross-
talk cancelation but without any a priori solution like q
WFS
. This independent radiation mode
control of AWFS is also a modification of the principal-component LMS (PC-LMS) for active
noise control of tonal disturbance [Cabell et Fuller, 1999; Elliott, 2000; Cabell et al., 2001].
The PC-LMS is based on SVD, but for AWFS the SVD decoupling must operate over the entire
frequency range of interest [Bai et Elliott, 2004].
This implementation requires additional MIMO (multiple-input-multiple-output) synthesis
and MIMO analysis filters,
(s)
G

(z) and
(a)
G(z) respectively, which must be generated in a
priori identification stage. In this case, an identification of frequency response functions (FRF)
ˆ
Z
ml
(ω) between each source l and each sensor m must be achieved. The SVD of the correspon-
ding transfer matrix for each frequency provides source modes v
i
(ω) and corresponding pressure
modes u
i
(ω). The inverse Fourier transform of v
i
(ω)/σ
i
(ω) ∀ i ≤ r ≤ M and u
i
(ω) generates
the z-transformed discrete-time impulse responses (IR) matrices
(s)
G

(z) and
(a)
G(z), respec-
tively. The
(s)
G

(z) matrix generates the inputs of the individual reproduction sources from the
source mode inputs with a delay of ∆
SV D
samples [Bai et Elliott, 2004]. Note that division by
σ
i
(ω) implies plant whitening along uncoupling. Conversely, the
(a)
G(z) matrix is used to ge-
167
nerate the pressure mode errors from the individual sensor errors, again with a delay of ∆
SV D
samples [Bai et Elliott, 2004]. The second synthesis filter matrix
(s)
G

(z) is created from the
nullspace source modes to produce the fixed part of the AWFS solution. The delay block (Fig.
7.20 (p. 167)) of 2∆
SV D
samples then represents the uncoupled plant model. This type of rea-
lization was more extensively described by reference [Bai et Elliott, 2004] for cross-talk cance-
lation. Also, because of the WFS departure penalty in the AWFS definition, an additional set of
fixed filters produce the outputs for the i > r (and i ≤)L WFS fixed source mode contributions
˜ q
i
. This a priori solution creates a difference with the work of reference [Bai et Elliott, 2004].
All the preceding remarks should be subject of further investigations and experimental veri-
fications. This is topic of current research on practical AWFS in a real reproduction space, that
is including a reflective environment.
7.10 Conclusion and perspectives
This paper introduced AWFS in the physical domain for active sound field reproduction.
AWFS is based on the minimization of the quadratic reproduction errors with a quadratic de-
parture penalty from the WFS solution. Although the AWFS practical interest would be for
room compensation, this theoretical paper was mainly concerned with the fundamental AWFS
behavior via general analytical considerations and simple free-field simulations.
AWFS can be interpreted as an additive combination of (1) a fixed WFS solution and (2) an
optimal regularized solution which seeks to minimize the WFS reproduction error. Contrary to
WFS, the AWFS active contribution is spread over the entire source array.
SVD of the transfer impedance matrix shown that, for AWFS, independent control operates
on each radiation mode. In the case of a four sensor array, this leads to independent control
of a multipole expansion of the sound field at the error sensor locations. For a transfer impe-
dance matrix including either a rigid wall reflection or room effects, the pressure modes still
provide finite difference approximations of pressure, pressure gradients and tesseral quadrupole
as pressure modes. In real situation, we thus expect that AWFS control will effectively and in-
dependently work on similar pressure modes at the sensor array since the analytical results of
Sec. 7.7.2 apply for any transfer impedance matrix Z.
168
Apractical usefulness of AWFS arises fromthe possibility to move fromWFS to closed-loop
modified “Ambisonics.” AWFS converges toward (1) WFS when the regularization parameter
λ is large and (2) closed-loop modified “Ambisonics” when λ is low. In the latter case, it was
shown that low order source mode contributions approach an “Ambisonics” problem and that
higher order source mode (creating the null space) contributions are imposed by the projection
of the WFS solution on the null space basis of Z.
SVD of the transfer impedance matrix suggests an independent radiation mode control im-
plementation of AWFS. This could be achieved with r ≤ M independent LMS adaptive al-
gorithms which would independently control the source mode contributions in a real adaptive
control application. Work is in progress to implement AWFS using the currently developed
AWFS adaptive algorithms for a configuration like the one shown in Fig. 7.2 (p. 148). AWFS
performance in-room situation is being therefore investigated from a practical and signal pro-
cessing view point.
Most of the analytical developments for AWFS can be applied to active noise or vibration
control. To the authors knowledge, the use of an a priori solution like q
WFS
have not been
used for active control, this could be of potential interest. Eqs. (7.7) and (7.16) to (7.18) are
also typically encountered in inverse problems theory [Hansen, 1998]. Inverse problems are of
importance in acoustics [Nelson, 2001; Gérard et al., 2005], where the use of a priori solutions
could also be applied.
7.11 Acknowledgments
This work was supported by NSERC (Natural Sciences and Engineering Research Coun-
cil of Canada), NATEQ (Fond Québecois de la Recherche sur la Nature et les Technologies),
VRQ (Valorisation Recherche Québec) and Université de Sherbrooke and was conducted wi-
thin CIRMMT (Centre for Interdisciplinary Research in Music Media and Technology, McGill
University). The first author (P.-A. G.) acknowledges Anthony Gérard from Université de Sher-
brooke for interesting discussions.
169
7.12 APPENDIX : “Ambisonics” review
The target wave field p
(im)
(x, ω) is defined as a plane wave in free field
p
(im)
(R, φ, ω) = A(ω)e
jkRcos(φ−θ)
(7.27)
with cylindrical coordinates (R, φ, z), and θ is the direction of propagation of the plane wave.
This target plane wave field is represented by a Fourier-Bessel series
p
(im)
(R, φ, ω) = A(ω)J
0
(kR) + 2A(ω)

n=1
j
n
J
n
(kR) cos(n(φ −θ)) (7.28)
where J
n
is the Bessel function of the first kind and order n. Rewriting Eq. (7.28) gives
p
(im)
(R, φ) = AJ
0
(kR) + 2A

n=1
j
n
J
n
(kR) cos(nθ) cos(nφ)+
2A

n=1
j
n
J
n
(kR) sin(nθ) sin(nφ). (7.29)
In practice, this series is truncated and expressed in vector form
p
(im)
(R, φ) = Ac
T

h (7.30)
with
c
T
=

2
_
1/

2 cos(θ) sin(θ) . . . cos(nθ) sin(nθ) . . .
_
(7.31)
and

h
T
=

2
_
J
0
(kR)/

2 j cos(φ)J
1
(kR) j sin(φ)J
1
(kR) . . .
j
n
cos(nφ)J
n
(kR) j
n
sin(nφ)J
n
(kR) . . .
_
, (7.32)
where T denotes real transposition. Equation (7.32) is independent of the target wave field defi-
nition while Eq. (7.31) includes the target wave field direction θ. The Fourier-Bessel coefficients
c are proportional to the outputs produced by harmonic directivity patterns on which the plane
target field would impinge [see Eq. (7.31)]. In c, the first coefficient produces omnidirectional
sensing, the second and the third produce perpendicular dipole patterns and this continues with
higher order circumferential harmonics.
170
The reproduction system is assumed to be in free field and the reproduction sources (uni-
formly distributed over 2π radians) produce a set of plane waves at the origin of the coordinate
system
p
(rep)
(R, φ) =
L

l=1
A
l
e
jkRcos(φ−φ
l
)
, (7.33)
where A
l
is the unknown contribution of the plane reproduction wave l whose direction of
propagation is φ
l
. The reproduced field is also expressed as truncated Fourier-Bessel series
p
(rep)
(R, φ) =
L

l=1
A
l
c
T
l

h =

A
T
C
T

h (7.34)
with

A
T
= [A
1
. . . A
L
] , (7.35)
C = [c
1
. . . c
L
] (7.36)
c
l
=

2
_
1/

2 cos(φ
l
) sin(φ
l
) . . . cos(nφ
l
) sin(nφ
l
) . . .
_
T
, (7.37)
The final step is the minimization of the sum of the quadratic reproduction error [(Ac
T

A
T
C
T
)

h[
2
, that is : the reproduced wave field Fourier-Bessel coefficients

A
T
C
T
must approach,
in a least-mean-square (LMS) sense, the target wave field Fourier-Bessel coefficients Ac
T
. The
minimization problem can readily be solved using the generalized pseudoinverse [Golub et van
Loan, 1996] denoted by

A = AC

c (7.38)
with
C

= V
c
Σ
+
c
U
H
c
, (7.39)
where the SVD of the matrix C is U
c
Σ
c
V
H
c
and
_
Σ
+
c
¸
T
=
_
¸
¸
¸
¸
_
1/σ
1c
0 0
0 1/σ
2c
0 0
.
.
.
0 0 1/σ
Nc
0
_
¸
¸
¸
¸
_
N×L
, (7.40)
where it was assumed that N ≤ L. σ
1c
, . . . , σ
Nc
are the singular values of C. When all the “Am-
bisonics” reproduction sources are uniformly distributed over 2π radians, Eq. (7.38) becomes

A = A
C
T
L
c (7.41)
171
and this gives the following panning function (amplitude A
l
of plane waves reproduction sources
as function of θ and φ
l
)
A
l
=
A
L
_
1 + 2
N

n=1
cos(n(θ −φ
l
))
_
. (7.42)
This corresponds to circular sinc function of φ
l
.
172
CHAPITRE 8
TRAITEMENT DE SIGNAL NUMÉRIQUE POUR LA WFS
ADAPTATIVE
8.1 Résumé français
Ce chapitre correspond à un manuscrit sur le traitement de signal numérique pour l’AWFS.
Les notions introduites sont en fait liées aux réalisations à large bande des concepts d’AWFS
introduits aux deux précédents chapitres. Ce manuscrit sera prochainement soumis au «Journal
of the Acoustical Society of America».
Une première partie d’introduction du chapitre expose les notions de WFS, d’AWFS et de
reproduction de champs acoustiques dans la perspective des sujets ensuite présentés. Les al-
gorithmes à large bande pour la réalisation de l’AWFS sont par la suite définis sur une base
analytique. Parmi ces algorithmes, on retrouve celui de la référence filtrée LMS («filtered refe-
rence LMS», ou FXLMS) et celui basé sur la décomposition en valeurs singulières du système
électroacoustique. À un tel algorithme correspond l’AWFS basée sur le contrôle indépendant
des modes de rayonnement. Sont aussi passées en revue les propriétés de convergence de ces
algorithmes : la pénalisation de la solution adaptative par rapport à la solution WFS introduit
une stabilisation des algorithmes de la même façon que les versions «leaky» du FXLMS et du
FELMS stabilisent les versions classiques de ces deux mêmes algorithmes. L’intensité de cette
pénalisation dicte la valeur résiduelle des erreurs de reproduction et permet, du coup, de passer
d’une solution purement de type WFS à une solution de type minimisation maximale de l’erreur
de reproduction, au choix et au besoin. Cette flexibilité intrinsèque à l’AWFS est une de ses qua-
lités remarquables. Une des plus importantes originalités contenue dans ce chapitre concerne le
découplage du système électroacoustique à l’aide de sa décomposition en valeurs singulières.
Des aspects précis et propres à un tel découplage sont détaillées et illustrés.
173
Suivant les définitions des algorithmes, deux exemples de réalisation du traitement de signal
pour l’AWFS sont évoqués pour supporter les arguments analytiques. Déjà décrit au chapitre
7, le premier exemple correspond au système à 24 sources de reproduction dans des conditions
de champ libre. Ce cas est exposé afin d’illustrer la bonne marche des algorithmes à l’abri des
effets d’un lieu de reproduction. Par contre, dans la mesure où l’AWFS est une technique po-
tentielle de reproduction de champs acoustiques et, surtout, de compensation active de salle,
le second exemple est introduit : il comporte trois parois rigides qui produisent des réflexions
franches. Dans les deux cas, il est montré que les algorithmes fonctionnent : l’erreur de repro-
duction est réduite au niveau des capteurs de l’erreur. De façon bien plus prometteuse, l’AWFS
semble efficace dans le second cas : les réflexions franches sont effectivement compensées par
le système. L’algorithme basé sur le contrôle indépendant des modes de rayonnement démontre
plusieurs avantages dont la possibilité de contrôler les propriétés de convergence (coefficient de
convergence et paramètre de pénalisation) de chacun des modes de rayonnement du système.
L’ensemble des notions et des résultats posé dans ce chapitre confirme donc l’efficacité pro-
bable de l’AWFS pour l’amélioration de la reproduction de champs acoustiques à l’aide du
filtrage adaptatif et la présence de capteurs de l’erreur de reproduction dans la zone de repro-
duction.
Des résultats de simulations complémentaires à ceux présentés dans ce chapitre sont décrits
en annexe (section B.2, page 365 et suivantes). Ils ajoutes une distinction plus marquée entre
l’algorithme FXLMS et celui du contrôle indépendant des modes de rayonnement pour l’AWFS.
8.2 Adaptive wave field synthesis and independent radiation mode control for
broadband active sound field reproduction : Signal processing
Sound field reproduction is a physical approach to the reproduction of the natural spatial
character of hearing. It is also useful in experimental acoustics and psychoacoustics. Wave
field synthesis (WFS) is a known open-loop technology which assumes that the reproduction
environment is anechoic. A real reflective reproduction space thus reduces the objective accu-
racy of WFS. Recently, adaptive wave field synthesis (AWFS) was suggested as a combination
of WFS and active compensation. AWFS is based on the minimization of reproduction errors
with a departure penalty from the WFS solution. This paper focuses on signal processing for
AWFS. Classical adaptive algorithms are modified for AWFS : filtered-reference least-mean-
174
square (FXLMS). These modified algorithms give similar convergence properties than classical
equivalent leaky algorithms except that the WFS solution influences in the adaptation. The paper
also introduces signal processing for independent radiation mode control of AWFS on the basis
of the plant decoupling. Simulation results for AWFS are introduced for free-field and reflec-
tive spaces. The two algorithms effectively reproduce the sound field and compensate for the
reproduction errors at the error sensors. As an advantage over the other algorithms, independent
radiation mode control allows a more flexible tuning of the algorithm.
8.3 Introduction
Following the constantly evolving digital signal processing and the relatively recent advent
of multichannel audio, spatial audio has gained more attention in the past decades from resear-
chers and practitioners for applications such as high-fidelity sound reproduction, music repro-
duction, virtual reality display, interactive multisensory environments, auralization and sound
installations [Kleiner et al., 1993; Scheirer, 1999; Camurri et Ferrentino, 1999; Jot, 1999; Wil-
son, 2003; Staff technical writer, 2005; Woszczyk et al., 2005]. The interest for immersion and
convincing multisensory environments is not new [Grau, 2003] and various techniques for spa-
tial audio have been introduced in the past [Poulin, 1957; Kleiner et al., 1993; Kendall, 1995a;
Verheijen, 1998; Poletti, 2000; Rumsey, 2001; Davis, 2003].
Two classes of approaches characterize spatial audio technologies : the perception simu-
lation and the sound field simulation. The former method includes : traditional stereophonic
techniques (level-difference and time-difference stereophony [Blauert, 1999]) extended to mul-
tichannel systems, along with binaural technologies. The perception simulation approach, by
definition, directly adresses the perception and it is typically based on illusion [Snow, 1953].
Such illusions are usually created on the basis of knowledge from spatial hearing (which then
guides various types of practical stereophonic realization) or on the artificial imitation of the ex-
ternal ear filtering on incident sound (giving the class of binaural technologies) [Blauert, 1999].
The method of sound field simulation attempts to reproduce the physical stimulus (wave field),
thereby reducing any perceptual considerations in the technology definition. Sound field repro-
duction was investigated by researchers in the past decades [Camras, 1968; Berkhout et al.,
1993; Nelson et al., 1997; Verheijen, 1998; Start et al., 1999; Nicol et Emerit, 1999; Poletti,
2000; Nelson, 2002; Choi et Kim, 2004b; Epain et al., 2004; Takane et Sone, 2004; Keller
et al., 2006] and one of the most active and recent related matter is room compensation [Spors
175
et al., 2003a; Gauthier et al., 2005b; Betlehem et Abhayapala, 2005; Spors et al., 2005a; Fuster
et al., 2005; Gauthier et Berry, 2006], which is essential for sound field reproduction in a real
reproduction space.
This paper deals with the problem of sound pressure field reproduction using adaptive di-
gital signal processing applied to adaptive wave field synthesis (AWFS) initially introduced by
[Gauthier et al., 2005c]. As recently pointed by the authors [Gauthier et Berry, 2006], inde-
pendent radiation mode control can be achieved by AWFS. The paper focuses on digital signal
processing realization for AWFS, including such independent control of radiation modes.
The concepts and results shown in this paper are not limited to audio applications. Indeed,
sound field reproduction may also be applied to experimental acoustics [Veit et Sander, 1987;
Bravo et Elliott, 2004] or psychoacoustics [Epain et al., 2004; Keller et al., 2006]. These are
promising applications of sound field reproduction.
Within this introductory section, the general problem of sound pressure field reproduc-
tion and a review of corresponding technologies are presented. Section 8.4.1 introduces WFS.
Section 8.4.2 presents the FXLMS realization of AWFS. Section 8.4.3 poses the modified-
multichannel AWFS on the basis of independent radiation mode control including the plant
singular value decomposition (SVD) [Gauthier et al., 2005c; Gauthier et Berry, 2006]. Digi-
tal signal processing simulation results are reported in Sec. 8.5 for AWFS using the proposed
algorithms. Section 8.6 discusses the results.
8.3.1 Sound field reproduction
In sound field simulation, the main objective can be generally stated as the aim to recreate a
given physical quantity, such as sound pressure, sound intensity [Choi et Kim, 2004b; Merimaa
et Pulkki, 2005], spatial diffuseness [Merimaa et Pulkki, 2005], etc., over a certain space. This
can be achieved with a reproduction system including electroacoustical sources and receivers,
signal processing, and the desired physical output description. In several cases, usage of adap-
tive filtering implies the minimization of a cost function which is representative of the repro-
duction objective [Gauthier et al., 2005b; Gauthier et Berry, 2006]. Adaptive signal processing
for spatial sound reproduction has been considered in various forms by researchers (illustrative
examples are : [Asano et Swanson, 1995; Ise, 1999; Takane et al., 1999; Radlovi ´ c et al., 2000;
Santilla´ n, 2001; Tam et Rafaely, 2002; Epain et al., 2004; Choi et Kim, 2004b; Gauthier et al.,
176
2005b,c; Spors et al., 2005a; Gauthier et Berry, 2006]).
8.3.2 Multichannel filters for adaptive sound reproduction
It is possible to define two classes of multichannel sound reproduction systems based on
reproduction error minimization (in the least-mean-square sense) : the generalized cross-talk
cancelation [Tokuno et al., 1997; Kirkeby et al., 1998] and the generalized sound pressure field
reproduction. Such a minimization can be achieved by direct inversion or by adaptive signal pro-
cessing using the least-mean-square (LMS) algorithms [Elliott, 2001]. Although providing only
approximate inverse filters, LMS and the corresponding adaptive methods have the advantage
of allowing for in-situ adaptive filter design using error receivers [Nelson et Elliot, 1992].
Fig. 8.1 (p. 178) introduces an adaptive realization of generalized cross-talk cancelation for
M reproduction points. In this case, the problem is to reproduce (by filtering the references

d
M
(n)) a set of signals (the desired signals

d
M
(n − ∆), which are also the ∆-sample delayed
reference signals ; ∆ is the modeling delay) at a set of M positions in the reproduction space
using L reproduction sources. Fig. 8.2 (p. 178) presents the generalized sound field reproduc-
tion system. On both figures, w(z) is the control filter vector (or matrix W(z)) and G(z) the
acoustical plant responses (between reproduction sources and error sensors). Here, x(n) is the
reference signal that is used to define a given simple source field defined in space and time do-
mains through the target vector a(z) and

d
M
(n) (

d
M
(z) =a(z)z
−∆
x(z)) is the target wave field
at the M error sensors. Passage from Fig. 8.1 (p. 178) to Fig. 8.2 (p. 178) is rather straightfor-
ward [Kirkeby et al., 1998]. Hence, if one is able to solve the generalized cross-talk cancelation
problem (Fig. 8.1 (p. 178)), the solution of the sound field reproduction problem (Fig. 8.2 (p.
178)) follows for any target vector a(z). For the remaining developments, the focus is on the
generalized sound field reproduction as shown in Fig. 8.2 (p. 178).
8.3.3 Wave Field Synthesis (WFS)
Work on WFS originates from the theoretical investigations by Berkhout in the late 80s
and in the early 90s [Berkhout et al., 1993; Verheijen, 1998; Start et al., 1999; Gauthier et al.,
2005b]. A major assumption is that the reproduction space is a free field. From the Kirchhoff-
Helmholtz integral theorem, WFS operators are defined to “link” a given simple virtual source
177
Figure 8.1 Generalized cross-talk system using adaptive filtering. Capitalized subscripts
denote signal dimensions.
Figure 8.2 Generalized sound field reproduction using adaptive filtering. Capitalized
subscripts denote signal dimensions.
(typically creating spherical or plane waves), fed by a monophonic signal, to a loudspeaker
array which reproduces the virtual source’s acoustic field (also called the target sound field).
The problem is usually concerned with reproduction in the horizontal plane with a finite num-
ber of discrete sources using appropriate simplifications of the integral formulation [Verheijen,
1998]. It is claimed that plane and spherical waves can approximately be reproduced using the
WFS concept in a planar listening area enclosed by the loudspeaker array. WFS studies have
investigated spatial aliasing [de Vries et al., 1994a; Spors et Rabenstein, 2006; Corteel, 2006b],
reproduction source type (electrodynamic, electrostatic, panels), source directivity [Verheijen,
1998], objective performance in-room situation [Klehs et Sporer, 2003; Sporer et Klehs, 2004]
1
,
compensation of listening room acoustics [Spors et al., 2003a, 2005a; Fuster et al., 2005].
On one hand, the benefit of current WFS prototypes is their effectiveness to create a spatial
impression (in terms of localization) over a broad area surrounded by the loudspeakers. On the
other hand, WFS drawbacks are related to the synthesis operators which relie on an important
assumption : the reproduction room’s response is not considered in the process, except in speci-
fic WFS research [Spors et al., 2003a, 2005a]. The typical WFS systemis consequently based on
1
Un article par P.-A. Gauthier et A. Berry correspondant au contenu du chapitre 4 est actuellement en traitement
pour publication chez «Acta Acustica united with Acustica».
178
an open-loop architecture and active room compensation (ARC) for WFS is an active research
topic for objective sound field reproduction in real situations [Elliott et Nelson, 1989; Asano
et Swanson, 1995; Bouchard et Quednau, 2000; Santilla´ n, 2001; Spors et al., 2003a; Gauthier
et al., 2005b,c; Spors et al., 2005a; Fuster et al., 2005].
8.3.4 Adaptive wave field synthesis (AWFS)
In a recent paper [Gauthier et Berry, 2006], AWFS was defined as a possible practical com-
promise between WFS and active room compensation. AWFS is an adaptive version of WFS
using a reduced number of reproduction error sensors to reduce the computational burden and
system complexity. AWFS is based on a cost function to be minimized by the reproduction
sources. The cost function is a quadratic function of : (1) the reproduction errors and (2) the
adaptive filters departure from the WFS filters. Using a singular value decomposition (SVD)
of the plant matrix (frequency response functions between reproduction sources and error sen-
sors) [Gauthier et Berry, 2006], it was shown that the underlying AWFS mechanism is the
independent control of radiation modes. This suggested a decoupled implementation of AWFS
which is practically developed in this paper from a signal processing perspective.
8.4 Signal processing for adaptive wave field synthesis
For a target sound field produced by a virtual monopole with amplitude A [Pa m], a(z) is
defined as the z transform of discrete-time sequences having the frequency response functions
a(e

) = A[e
−jω∆
1
/r
1
e
−jω∆
2
/r
2
e
−jω∆m
/r
m
e
−jω∆
M
/r
M
]
T
(8.1)
where ∆
m
is the time delay which corresponds to r
m
/c. The time convention is e
jωt
, c [m/s]
is the sound phase velocity and r
m
= [x
(m)
m
− x
o
[ represents the distance between the virtual
source in x
o
and the m-th error sensor in the reproduction space (Fig. 8.3 (p. 181)), x
(l)
l
is a
reproduction source position vector (x
(l)
1
, x
(l)
2
, ..., x
(l)
L
), x is the position of an arbitrary point in
the reproduced wave field, and x
(m)
m
is the position of the m-th error sensor.
179
8.4.1 Review of WFS operators for AWFS
According to [Verheijen, 1998], the following general WFS operators are obtained in the
frequency domain
Q(x
(l)
l
, e

) =
_
jk

Acos(Ψ)
e
−j(kro)
e
−j(ωTs∆)

r
o
¸
r
(ref)
(r
(ref)
+r
o
)
(8.2)
and the reproduced sound field in free space is
p
(rep)
(x, e

) =
_

−∞
Q(x
(l)
l
, e

)H(e

)
e
−jkr
r
dL (8.3)
where A is the target pressure field amplitude (virtual source monopole amplitude), Q(x
(l)
l
, e

)
is the driving function (expressed as a monopole amplitude) for the reproduction sources along
the line L, k = ω/c is the wavenumber and e
−jkr
/r (with r = [x
(l)
l
−x[) is the complex sound
pressure produced at x by a unitary amplitude monopole source in x
(l)
l
(the position of the
reproduction source l). H(e

) represents a fictitious reconstruction filter frequency response,
which would typically corresponds to a band-pass filter. The exponent −j(ωT
s
∆) has also been
artificially added in Eq. (8.2) to ensure that both the sound field reproduction problem in Fig. 8.2
(p. 178) and WFS assume the same modeling delay of ∆ samples, T
s
[s] is the sampling period.
It is assumed that the virtual source and the reproduction sources are both in the horizontal plane
(x
1
, x
2
). All other variables in Eq. (8.2) are defined in Fig. 8.3 (p. 181).
Both the reproduction source line L and the reference line could be of arbitrary shape [Start
et al., 1999]. To simplify the computation of r
(ref)
in Fig. 8.3 (p. 181), the reference line is cho-
sen as a circle centered at the virtual source and passing through the center of the reproduction
source array [Verheijen, 1998; Gauthier et Berry, 2006].
Practical WFS implementation using discrete reproduction sources on a finite line replaces
Eq. (9.2) by
p
(rep)
(x, e

) =
L

l=1

s
Q(x
(l)
l
, e

)H(e

)
e
−jkr
r
(8.4)
where ∆
s
is the reproduction source separation distance.
For WFS, a reproduction source is active if [Ψ[ < 90
o
where Ψ is shown in Fig. 8.3 (p.
181). For real applications the reproduction array is finite and some truncation effects appear
[Verheijen, 1998; de Vries et al., 1994a]. In comparison with a linear reproduction source array,
180
Figure 8.3 Symbol convention for the WFS operators definition. The virtual source is located
in x
o
. The reproduction source l is located in x
(l)
l
. x
(ref)
describes points which belong to the
reference line. x describes any field point and x
(m)
m
is the m sensor position. L is the
reproduction source line, the virtual source is on the left of the source line and the reproduction
space is on the right of the source line. All sources and sensors are located in the x
1
−x
2
plane.
a circular array reduces the diffraction or corner effects. These effects are also reduced using a
spatial weighting window which reduces the amplitude of the sources at the end of the activated
set. In this paper, half-Hanning window (with an half-length of one meter) is applied to the
amplitude of the driving function (Eq. (8.2)) [Verheijen, 1998; Gauthier et Berry, 2006].
The major drawbacks of WFS (since the free-field assumptions are not respected) that would
be potentially compensated by AWFS are : roomcompensation, truncation effects correction and
loudspeaker responses correction.
8.4.2 FXLMS for AWFS
Classical FXLMS algorithm [Elliott, 2001] is adapted for the implementation of AWFS in
a discrete-time domain. The structure of the AWFS problem fits the one shown in Fig. 8.2 (p.
178).
The system is characterized by M sensors, L reproduction sources, one reference signal
181
and L FIR control filters each including I coefficients (see Fig. 8.2 (p. 178)). The multichannel
reproduction system can thus be described by (capitalized subscripts denote matrix dimensions)
e(n)
M×1
=

d(n)
M×1
−R(n)
M×LI
w(n)
LI×1
(8.5)
with
e(n) = [e
1
(n) . . . e
M
(n)]
T
(8.6)

d(n) = [d
1
(n) . . . d
M
(n)]
T
(8.7)
w(n) = [ w
T
0
(n) . . . w
T
I−1
(n)]
T
(8.8)
w
i
(n) = [w
1i
(n) . . . w
Li
(n)]
T
(8.9)
R(n) =
_
¸
¸
¸
¸
_
r
T
1
(n) r
T
1
(n −1) . . . r
T
1
(n −I + 1)
r
T
2
(n) r
T
2
(n −1) . . . r
T
2
(n −I + 1)
.
.
.
.
.
.
.
.
.
r
T
M
(n) r
T
M
(n −1) . . . r
T
M
(n −I + 1)
_
¸
¸
¸
¸
_
(8.10)
Where a filtered reference vector was introduced
r
m
(n) = [r
1m
(n) . . . r
Lm
(n)]
T
(8.11)
The filtered reference r
lm
(n) corresponds to the reference signal convolved with the plant im-
pulse response from reproduction source l to error sensor m
r
lm
(n) =
J−1

j=0
G
lmj
x(n −j) (8.12)
where the J-coefficient plant MIMO (multiple-input-multiple-output) impulse responses are
stocked in G
L×M×J
.
The general cost function for multichannel AWFS is
J
AWFS
= E[e
T
(n)e(n)] +γ w
T
(n) w(n) +λ( w(n) − w
WFS
)
T
( w(n) − w
WFS
) (8.13)
where the first term represents the mathematical expectation (E[]) of the summation of the
quadratic reproduction errors, the second term represents a control effort penalty [Elliott, 2001]
and the third term corresponds to a quadratic penalty term for the coefficients w(n) deviation
from w
WFS
, the time-domain WFS operators. These time-domain WFS operators are obtained
from inverse discrete-time Fourier transform of the WFS operation Q(x
(l)
1
, (e

)) defined in Eq.
(8.2). In Eq. (8.13) the WFS operators w
WFS
have been defined similarly to the control filter
coefficient vector in Eq. (8.8).
182
The stochastic gradient, using instantaneous values of the gradient, of Eq. (8.13) is
∂J
AWFS
∂ w
= 2[R
T
(n)R(n) + (γ +λ)I] w(n) −2R
T
(n)

d(n) −2λ w
WFS
. (8.14)
This gives a multichannel recursive algorithm
w(n + 1) = (1 −α(γ +λ)) w(n) +αλ w
WFS

ˆ
R
T
(n)e(n) (8.15)
which corresponds to a modified version of the multichannel leaky LMS algorithm [Elliott,
2001] where α, (1 − α(γ + λ)), αλ w
WFS
and
ˆ
R
T
(n)e(n) are respectively the convergence
coefficient (α = 2µ), the leakage term, the WFS operator coefficient ( w
WFS
) reinjection in the
solution and the adaptive filter update according to the instantaneous errors. WFS departure term
in Eq. (8.13) introduces a leakage term in the filter update Eq. (8.15) plus a bias in the gradient
which is proportional to w
WFS
(−2λ w
WFS
). In Eq. (8.15), the matrix R
T
(n) has been replaced
by
ˆ
R
T
(n) which uses a plant model to compute the estimated filtered reference.
As a simple demonstration of the leakage effect, assume that the reproduction errors are
artificially forced to zero (e(n) =

0) and γ = 0. If w(n) ,= w
WFS
, the filter coefficients are
expressed by a variation on the WFS operator : ∆ w(n) = w(n) − w
WFS
. In this case Eq. (8.15)
leads to ∆ w(n+1) = (1 −αλ)∆ w(n) so that ∆ w(n) vanishes with increasing n. In Eq. (8.15),
the filter adaptation would be initialized by a set of filter defined by w
WFS
in a preliminary stage
( w(0) = w
WFS
).
Analysis of convergence for FXLMS applied to AWFS is detailed in the remainder of this
section. Using these results, one may evaluate the convergence behavior of the multichannel
AWFS in comparison with standard FXLMS or leaky FXLMS.
Eq. (8.15) is rewritten using the error vector definition of Eq. (8.5)
w(n + 1) = w(n) +αλ w
WFS
+αR(n)

d(n) −α
_
(R
T
(n)R(n) + (γ +λ)I)
¸
w(n) (8.16)
which allows the derivation of the asymptotic filter coefficients w

= lim
n→∞
E[ w(n)]
w

=
E[
ˆ
R
T
(n)

d(n)] +λ w
WFS
E[
ˆ
R
T
(n)R(n)] + (γ +λ)I
(8.17)
where it is assumed that E[ w

] = w

and E[ w
WFS
] = w
WFS
since w
WFS
is constant for a
fixed virtual source position. Equation (8.17) illustrates that the reproduction filters after conver-
gence of the adaptation algorithm are partly defined by the WFS operators to an extent determi-
ned by λ and partly by the more typical leaky LMS error attenuation.
183
An alternative form of Eq. (8.17) is in terms of the adaptive part of the reproduction filter
w
Adaptive

= w

− w
WFS
(assuming γ = 0)
w
Adaptive

=
E[
ˆ
R
T
(n)e
WFS
(n)]
E[
ˆ
R
T
(n)R(n)] +λI
(8.18)
e
WFS
(n) =

d(n) − p
(rep)
WFS
(n) is the WFS instantaneous reproduction error vector and p
(rep)
WFS
(n)
is the sound pressure field reproduced by WFS. As suggested by this equation, as p
(rep)
WFS
(n) ap-
proaches the target pressure

d(n), the adaptive contribution w
Adaptive

vanishes. Since Eq. (8.18)
formally corresponds to the convergence of standard leaky FXLMS adaptation where the tar-
get signals (disturbance in active noise control and target wave field in sound field reproduc-
tion) have been replaced by the WFS errors e
WFS
(n), this suggests that AWFS using modified
FXLMS (see Eq. (8.15)) is an additive combination of WFS operators and adaptive filters which
seek to reduce the WFS errors. Since e
WFS
(n) is practically not accessible, Eq. (8.18) should
only be regarded as an illustation of AWFS mechanism, not a practical implementation.
Using Eq. (8.17), and Eq. (8.15),
E[ w(n + 1) − w

] = [I −αE[
ˆ
R
T
(n)R(n) + (γ +λ)I]]E[ w(n) − w

] (8.19)
The eigenvalue decomposition of the matrix [I −αE[
ˆ
R
T
(n)R(n) +(γ +λ)I]] is introduced
E[
ˆ
R
T
(n)R(n) + (γ +λ)I] = QVQ
−1
(8.20)
and the transformed filter
v(n + 1) = Q
−1
E[ w(n + 1) − w

] (8.21)
where V is a diagonal matrix of eigenvalues and Q is the matrix of the eigenvectors. One can
rewrite Eq. (8.19) as a set of uncoupled update equations for the various convergence modes
since V is diagonal
v(n + 1) = [I −αV]v(n) (8.22)
Each convergence mode will converge provided that 0 < [1 − αV
i
[ < 1 with V
i
being the i-th
complex eigenvalue of the decomposition introduced in Eq. (8.20). This allows the following
criterion for the convergence factor which would provide stable convergence [Morgan, 1980;
Elliott, 2001]
0 < α < 2
'[V
i
]
[V
i
[
2
(8.23)
184
This is a typical result for FXLMS for which convergence properties in relation with plant
responses are known [Elliott, 2001], thus supporting that modified FXLMS for AWFS has the
same convergence properties than classical FXLMS. Finally, the diagonal penalization terms
[(γ + λ)I] in Eq. (8.20) have the effect of stabilizing the standard FXLMS by compensating
for potentially small or negative eigenvalues V

i
[Elliott, 2001] where V

i
is the i-th eigenva-
lue of E[
ˆ
R
T
(n)R(n)]. This effect can be shown by rewriting Eq. (8.23) using the eigenvalue
decomposition of E[
ˆ
R
T
(n)R(n)]
0 < α < 2
'[V

i
] + (γ +λ)
[V

i
+ (γ +λ)[
2
(8.24)
From the last equation, we note that both the control effort penalization γ and the WFS penali-
zation λ have the same effect in terms of convergence condition and may both equally stabilize
a system by compensating for small negative eigenvalues V

i
.
For the derivation of a more practical approximation of this convergence criterion, suppose
that the plant model is exact so that
ˆ
R(n) = R(n) and
ˆ
R
T
(n)R(n) is symmetric. In this case,
the eigenvalues V
i
are real and Eqs. (8.23) and (8.24) become
0 < α < 2/V
i
∀ i and 0 < α < 2/(V

i
+ (γ +λ)) ∀ i (8.25)
respectively. A more stringent convergence criterion is obtained with the summation of the ei-
genvalues replacing a unique eigenvalue in Eq. (8.25). The summation of the eigenvalues is
the trace of the original matrix, either E[R
T
(n)R(n)] or E[R
T
(n)R(n) + (γ + λ)]. For the
multichannel situation, the trace of this matrix is difficult to evaluate. However, for the hy-
pothetical single-channel situation the matrix E[R
T
(n)R(n)] is the auto-correlation matrix of
the sole filtered reference signal so that one recovers the classical convergence criterion for a
single-channel situation
0 < α <
2
(I(¯ r
2
+ (γ +λ)))
(8.26)
where ¯ r
2
is the mean-square value of the filtered reference [Elliott, 2001]. This confirms that, in
active sound field reproduction like in active noise control, it is easier to derive an approximation
of the maximum convergence coefficient α in a single-channel situation.
The various effects attributable to the WFS penalization λ for multichannel FXLMS are
investigated. It is assumed here that γ = 0. The trivial case is when λ is also 0 and AWFS
simply becomes a purely adaptive reproduction system without any regularization [Gauthier et
Berry, 2006]. The other extreme AWFS situation is when λ → ∞. Since in this limiting case
the eigenvalue V
i
are assumed to be small in comparison with λ, the convergence criterion of
185
Eq. (8.24) becomes
0 < α _
2
λ
with λ →∞ (8.27)
This means that as the deviation of w from w
WFS
is increasingly more penalized by a large λ,
the convergence coefficient α must be reduced to provide stable convergence of the adaptation.
With λ →∞, one finds
w

= w(n) = w
WFS
(8.28)
where the maximum convergence coefficient (α = 2/λ) has been used in Eq. (8.15) along with
w(0) = w
WFS
.
Although sound field reproduction using AWFS as defined by the adaptation algorithm of
Eq. (8.15) is readily applicable, some well-known disadvantages of multichannel FXLMS also
apply to AWFS. These are related to the slow FXLMS convergence properties and computatio-
nal load with an increasing number of filter coefficients I and reproduction sources L. Most of
the slow convergence properties of the multichannel FXLMS are related to the cross-coupling
paths and the non-flat frequency responses of the electroacoustical multichannel plant between
the sources and the sensors [Elliott, 2001; Bai et Elliott, 2004]. Since a sound field reproduction
system like a AWFS system implies many reproduction sources, this might limit the application
of FXLMS for AWFS. With this in mind, it would be interesting to transform the multichan-
nel problem in a set of independent single-channel systems. This is possible on the basis of
independent radiation mode control [Gauthier et Berry, 2006] and is related to the principal-
component LMS (PC-LMS) algorithm [Cabell et Fuller, 1999; Elliott, 2000; Bai et Elliott,
2004]. Section 8.4.3 defines the digital signal processing realization of independent radiation
mode control for AWFS [Gauthier et Berry, 2006] to evaluate the potential and feasibility of
such an algorithm.
8.4.3 AWFS with independent radiation mode control using singular value decomposition
This section presents the system preconditioning for independent radiation mode control
using parallel single-channel adaptive systems as already suggested in a previous paper on the
physical aspects of AWFS [Gauthier et Berry, 2006]. The control architecture is shown in Fig.
8.4 (p. 187). Before going in details in the following sections, some general ideas are presented.
Most of the signal nomenclature has already been described. The target wave field is defined by

d
M
(n) in the upper branch. The independent LMS algorithms operate on the decoupled plant.
The plant G(z) is decoupled using the first synthesis filter matrix
(s)
G

(z) and the analysis filter
186
Figure 8.4 Block diagram of the AWFS least-mean-square adaptive digital processing
implementation based on independent radiation mode control. Subscripts denotes signal
dimensions.
matrix
(a)
G(z).
Parts of this section follow the plant decoupling described by [Bai et Elliott, 2004]. It is
also related to the principal-component LMS (PC-LMS) [Cabell et Fuller, 1999]. However, this
paper includes new considerations for the null space of the plant response, which has proven to
be of importance for AWFS [Gauthier et Berry, 2006] and for realization and numerical aspects
of singular vectors reordering and modification to reduce the time-domain filter leakage in the
decoupling filters (synthesis and analysis filters). Moreover, the AWFS approach implies the
projection of the WFS operators on the SVD basis. These correspond to differences with Bai’s
work.
System decoupling and whitening using singular value decomposition (SVD) in the frequency
domain
The MIMOelectroacoustical plant G(z) is represented in the frequency domain by G(e

) =
G(z)
¸
¸
z=e

where j =

−1. Using the SVD, the plant matrix can be expressed as
G(e

)
M×L
= U(e

)
M×M
Σ(e

)
M×L
V
H
(e

)
L×L
(8.29)
187
with
Σ(e

) =
_
¸
¸
_
σ
1
(e

) 0
.
.
.
.
.
.
.
.
. [0]
M×(L−M)
0 σ
M
(e

)
_
¸
¸
_
M×L
(8.30)
where U is the column matrix of the left singular vectors, V is the column matrix of the right
singular vectors, Σ(e

) is a pseudo-diagonal matrix of the real singular values σ
i
(e

) (ordered
on the main diagonal by decreasing amplitude). V should not be confused with the eigenvector
matrix introduced in Eq. (8.20). In Eq. (8.30), the plant matrix rank r was assumed to be M for
notation convenience and we assume L > M.
The first radiation mode synthesis filter L M matrix
(s)
G

(e

) is defined by
(s)
G

(e

)
L×M
= V(e

)
L×L

+
(e

)]
L×M
(8.31)
where the pseudo-inversion []
+
of the pseudo-diagonal matrix Σ is defined as follows
Σ
+
(e

) =
_
¸
¸
_
1/σ
1
(e

) 0
.
.
.
.
.
.
.
.
. [0]
M×(M−L)
0 1/σ
M
(e

)
_
¸
¸
_
T
(8.32)
The first synthesis filters are defined to create the source modes corresponding to the first r
radiation modes. Each group of L synthesis filters create one of these source modes. Accor-
ding to this definition of the first synthesis filter matrix, one notes that : (1) the
(s)
G

(e

) co-
lumns produces the range of the matrix G(e

) by its multiplication with the plant FRF matrix
(Im[G(e

)
(s)
G

(e

)] = Im[G(e

)]) and (2) Im[
(s)
G

(e

)] ⊥ Span[Ker[G(e

)]]. (Im[]
denotes the image, or the range, of the given matrix, Span[] indicates the span of the vectors
and Ker[] denotes the null space (the kernel) of the matrix [Lancaster et Tismenetsky, 1985]).
The last point implies that the first radiation mode synthesis filter matrix
(s)
G

(e

) does remove
the null space basis vectors from V(e

) by post-multiplication by Σ
+
(e

) (with only r = M
non-zero elements) in Eq. (8.31). Alternatively, the 1/σ
i
can be replaced by 1 on the main diago-
nal of Eq. (8.32) so that the plant is decoupled but not whitened. In this specific case, the same
terminology and notation, for the synthesis filters, is used. For the simulations reported in this
paper, the plant is only decoupled, but not whitened.
An analysis filter matrix
(a)
G(e

)
M×M
is also defined from the SVD
(a)
G(e

)
M×M
= U
H
(e

)
M×M
(8.33)
188
The analysis filter matrix is created to transform the physical sound pressure in the first r pres-
sure modes. Each of the M groups of analysis filters produces the correspoding pressure mode.
The multiplication of the plant matrix by the first synthesis filter matrix gives
G(e

)
(s)
G

(e

) = U(e

)Σ(e

)V
H
(e

)V(e


+
(e

) = U(e

) (8.34)
Pre-multiplication of Eq. (8.34) by the analysis filter matrix then gives
(a)
G(e

)G(e

)
(s)
G

(e

) = I(e

) (8.35)
where the fact that both matrices V(e

) and U(e

) are unitary matrices has been used. Equa-
tion (8.35) allows plant decoupling and pre-whitening using synthesis and analysis filters. This
property is of fundamental importance for practical implementation of AWFS based on inde-
pendent radiation mode control [Gauthier et Berry, 2006]. If, as noted earlier, the plant is only
decoupled, one finds :
(a)
G(e

)G(e

)
(s)
G

(e

) = Σ

(e

), where Σ

(e

) is the first MM
submatrix of Σ(e

).
The previous description corresponds to the plant decoupling and whitening presented by
[Bai et Elliott, 2004] for two-channel cross-talk cancellation. We next proceed in the theoretical
development of the null space of the plant matrix (Ker[G(e

)]) which is needed for AWFS
[Gauthier et Berry, 2006].
The theoretical definition of the second radiation mode synthesis filter matrix
(s)
G

(e

)
(producing the null space) is
(s)
G

(e

)
L×1
= V(e

)
L×L

i
L×1
(8.36)
where

i is a block vector defined by

i
L×1
=
_
[

0]
1×M
[

1]
1×(L−M)
_
T
. This filter matrix produces all
the radiation modes which belong to the null space of the plant matrix G(e

) so that, according
to the null space definition [Lancaster et Tismenetsky, 1985] G(e

)
(s)
G

(e

) =

0
M×1
. Pos-
sible plant decoupling realization including the null space components is shown in Fig. 8.5 (p.
190). In this figure, the physical plant blocks include a black shadow. The signal dimensions (for
vector signals) are marked by lines that cross the given arrows. The dashed arrows and block
(G

(e

)) correspond to a real physical system : sound field at any location except at the error
sensor locations.
In realistic applications, the frequency responses G(e

) must be identified and stored in an
estimated model
ˆ
G(e

) before the SVD being applied. Since the model used for plant decou-
pling is not perfect (
ˆ
G(e

) ≈ G(e

)), the right sides of Eqs. (8.34) and (8.35) should be repla-
189
Figure 8.5 Plant decoupling with first and second synthesis filter matrices, and with analysis
filter matrix.
ced by
ˆ
U(e

)
ˆ
I(e

) and
ˆ
I(e

), respectively, where
ˆ
I(e

) (an approximation of the identity ma-
trix) represents the fact that decoupling is not perfect. This also applies to G(e

)
(s)
G

(e

) =

0
M×1
where the right side should be replaced by

ˆ
0(e

) which is not a perfect zero vector.
Time-domain filters from SVD in the frequency domain
The procedure to generate time-domain decoupling filters from the frequency response ma-
trices
(s)
G

(e

) and
(a)
G(e

) has been described by [Bai et Elliott, 2004]. For AWFS, a si-
milar procedure must also be applied to
(s)
G

(e

). Here, a short review of the procedure is
first introduced before being adapted to the problem of sound field reproduction. Moreover, a
supplementary modification of plant decoupling is introduced as an extension of the Bai’s work.
An illustrative example is also presented.
The frequency response matrices, that we nowtemporarily denote F(e

), are calculated (for
simulations) or measured (for practical implementations) at N frequencies regularly sampled.
This gives F(k) = F(e

)
¸
¸
ω=(2π/N)k
(with F(e
−jω
) = F

(e

)). Where k now represents a fre-
quency index. Using inverse discrete-time Fourier transform (DTFT), a corresponding discrete-
time sequence matrix T(n) is obtained : F(k) ↔T(n). A time delay of ∆
SV D
samples is then
added for causality purposes. T(n) is then transformed to produce the filter coefficient matrix
T(z).
Although this procedure is readily applicable to derive the synthesis and analysis filters,
the SVD decoupling being independently computed at each frequency, the complex frequency
response functions may not be straightly taken for inverse DTFT to create time-domain filters
without risk. The limitation comes from the SVD definition that involves a singular value matrix
Σ(e

) in which the singular values are ranked in decreasing order of magnitude. Left and right
190
singular vectors are accordingly ranked in the matrices U(e

) and V(e

). In some ideal cases
(like the free-field situation considered for the AWFS definition [Gauthier et Berry, 2006]),
some singular values may be coincident over a frequency range so that left and right singular
vector ranking arbitrarly switches between the two singular values since they are equal down
to the numerical resolution. Even if the plant SVD does not include identical singular values
over the frequency range of interest, some singular values may decrease and some others may
increase as function of frequency up to a point where the singular values cross in amplitude. At
this point, the SVD calculation with classical numerical algorithms will introduce a switch in
the radiation mode ordering so that the frequency responses
(s)
G

(e

),
(s)
G

(e

),
(a)
G(e

)
and their components go through abrupt transitions over the frequency range of interest. Such
discontinuities (amplitude and phase) as function of frequency produces longer time responses
when inverse DTFT is applied. Applying a simple smoothing algorithm to the SVD matrices
in the frequency domain (that is radiation mode reordering so that they smoothly change as
function frequency) before taking the inverse DTFT had proven to greatly ameliorate the time
responses of the filters (they are more like filtered impulses with much less temporal leakage
and temporal aliasing).
An example of plant decoupling is presented for the reproduction source and error sensor
arrays shown in Fig. 8.6 (p. 192) for a infinite field.
Note that to increase the robustness of the reordering for the theoretical free-field case repor-
ted in this paper, an artefact has been introduced for practical SVD decoupling demonstration.
A random variation (normal distribution with zero mean and 1 mm variance) of the source and
sensor positions (in the horizontal plane) proved, along with standard SVD algorithm and smoo-
thing process, to enhance the decoupling results. This was also applied to the second simulation
case reported in Sec. 8.5 Since a practical application using loudspeakers and microphones al-
ways results in various position errors, slightly different directivities and transducer responses,
such random artefact in the theoretical configuration is somewhat more representative of a real
situation than the otherwise geometrically perfect configuration.
An example of plant decoupling based on SVD and smoothing process is introduced in Figs.
8.7 (p. 193) to 8.10 (p. 194) for the configuration shown in Fig. 8.6 (p. 192). The four error sen-
sors are separated by 0.175 m along x
1
and x
2
. The source array has a diameter of 2 m and the
source separation is 0.2611 m. Note that this example does not include plant whitening. In Fig.
8.7 (p. 193), the 24 synthesis filter impulse responses for each source mode (corresponding to
the first synthesis filters) are shown using 256 points in the time domain with a sampling fre-
191
12
11
13
10
14
9
15
8
16
7
17
x
2
6
18
5
19
4
20
3
21
2
22
1
23
24
x
1
Sources
Error sensors
Monitor sensors
Monitor sensors
Virtual source
Figure 8.6 Configuration of the reproduction source, error sensor and monitor sensor arrays.
Two different groups of monitor sensors are used : a linear array of 8 monitors or a circular
array of 24 monitors. , : virtual source in x
o
= [0, 4, 0] meters.
quency of 1200 Hz (conservative approximation of the minimal spatial aliasing frequency for the
given reproduction source separation distance is 634 Hz, at least two reproduction sources per
wavelength, so that a sampling frequency of 1200 Hz covers the frequency range of interest
2
).
These impulse responses have been delayed by 128 samples (∆
SV D
= 128). Each of the subplot
represents the L impulse responses of a column of the first synthesis filter matrix
(s)
G

(z)
L×M
to produce y
L
(n) from
˜
y
M
(n). Without the smoothing algorithm before inverse DTFT, the time-
leakage of these filters had proven to be much more important. Fig. 8.8 (p. 193) shows the 4
analysis filters (for each pressure mode) in the time domain using ∆
SV D
= 128 samples delay.
Each of the subplot represents the M impulse responses of a column of the analysis filter matrix
(a)
G(z)
M×M
to transform the reproduction errors e
M
(n) into
˜
e
M
(n).
To test the validity of the SVD decoupling using these filters, the plant decoupling of Fig.
8.5 (p. 190) has been simulated in the frequency domain using the synthesis and analysis filters
described above. The 4 impulse responses corresponding to the upper branch of Fig. 8.5 (p.
190), for each source mode being individually excited are shown in the time domain in Figs.
8.9 (p. 194) and 8.10 (p. 194). Theoretically, we should expect
(a)
G(e

)G(e

)
(s)
G

(e

) =
2
Une discussion plus approfondie de cet aspect est actuellement en processus de révision pour publication chez
«Acta Acustica united with Acustica». Cette discussion n’est pas incluse dans cette thèse.
192
50 100 150 200 250
−0.15
−0.1
−0.05
0
0.05
A
m
p
.
Source mode #1
50 100 150 200 250
−0.2
0
0.2
A
m
p
.
Source mode #2
50 100 150 200 250
−0.2
0
0.2
A
m
p
.
Source mode #3
1 64 128 192 256
−0.2
0
0.2
A
m
p
.
Source mode #4
Samples
Figure 8.7 Free-field theoretical synthesis
filters in the time domain for the source modes
1 to 4. Each plot includes the 24 synthesis
filters to create the given source mode with the
24 reproduction sources. Each impulse
response includes 256 samples.
1 64 128 192 256
−0.4
−0.2
0
A
m
p
.
Pressure mode #1
1 64 128 192 256
−0.5
0
0.5
A
m
p
.
Pressure mode #2
1 64 128 192 256
−0.5
0
0.5
A
m
p
.
Pressure mode #3
1 64 128 192 256
−0.5
0
0.5
A
m
p
.
Pressure mode #4
Samples
Figure 8.8 Free-field theoretical analysis
filters in the time domain for the pressure
modes 1 to 4. Each plot includes the 4 analysis
filters to construct the pressure mode from the
4 pressure sensors. Each impulse response
includes 256 samples.
Σ

(e

). Note that this test has been performed by frequency domain multiplication so that the
128-samples delays are in fact an arbitrary adjustment to compensate for circular convolution
and ensure figure clarity, as we would normally obtain delays of 2∆
SV D
= 256 samples (as
suggested by upcoming equations). Clearly, the plant decoupling (whitening was excluded) is
effective since an impulse applied to the first synthesis filter only gives a non-zero output for the
first analysis filter. The same behavior applies for the other modes. This proves that broadband
plant decoupling using SVD as described previously is effective.
Although the same procedure is effective for the nullspace filters
(s)
G

(z) (the second syn-
thesis filters defined by Eq. (8.36)), i.e. it produces no sound pressure at the error sensor, the
193
1 64 128 192 256
−2
0
2
(1;1)
A
m
p
.
1 64 128 192 256
−2
0
2
(1;2)
A
m
p
.
1 64 128 192 256
−2
0
2
(1;3)
A
m
p
.
1 64 128 192 256
−2
0
2
(1;4)
A
m
p
.
Samples
1 64 128 192 256
−2
0
2
(2;1)
1 64 128 192 256
−2
0
2
(2;2)
1 64 128 192 256
−2
0
2
(2;3)
1 64 128 192 256
−2
0
2
(2;4)
Samples
Figure 8.9 Impulse responses of individual
components of the 4 4 matrix
(a)
G(e

)G(e

)
(s)
G

(e

) using the synthesis
and analysis filters shown in Figs. 8.7 (p. 193)
and 8.8 (p. 193). The (i, j) component
represents the output of pressure mode j when
source mode i input is a unitary impulse.
1 64 128 192 256
−2
0
2
(3;1)
A
m
p
.
1 64 128 192 256
−2
0
2
(3;2)
A
m
p
.
1 64 128 192 256
−2
0
2
(3;3)
A
m
p
.
1 64 128 192 256
−2
0
2
(3;4)
A
m
p
.
Samples
1 64 128 192 256
−2
0
2
(4;1)
1 64 128 192 256
−2
0
2
(4;2)
1 64 128 192 256
−2
0
2
(4;3)
1 64 128 192 256
−2
0
2
(4;4)
Samples
Figure 8.10 Figure 8.9 (p. 194) continued.
nullspace basis produces longer impulse responses so that the WFS operators, once projected
over this basis, are smeared over time and they are no more time-aligned with the projection
of the WFS operators on the first r source modes. This is simply caused by the fact that the
nullspace basis has not been reordered by a smoothing algorithm over the frequency range. For
the nullspace basis, any smoothing operation is by far more complicated and less effective. The-
refore, an alternative solution was used for practical DSP implementation. The most simple but
effective solution is based on the fact that the WFS operators projected on the nullspace and then
synthesized by the second synthesis filters are time independent. This implies that the second
194
synthesis filters and the projection of the WFS operators on the nullspace can be constructed as
a single set of fixed filters.
Projection of the WFS operators on the source modes and synthesis of the nullspace
As shown in the next section, the AWFS algorithm based on SVD decoupling requires the
projection of the WFS operators on the synthesis filters [Gauthier et Berry, 2006]. This is the
purpose of this section.
Once the first radiation modes are re-ordered, it is possible to write the column-re-ordered
matrix V(e

) as a block matrix : V(e

)
L×L
= [V

(e

)
L×M
V

(e

)
L×(L−M)
] where V

was used to create the first synthesis filter according to the method described in the previous
section while V

was used for the second synthesis filters. In a similar manner, Σ(e

) is
made of two blocks : Σ
M×L
= [Σ

M×M
0
M×(L−M)
]. Therefore, the projection of the WFS
operators on the first radiation modes is a vector of dimension M defined by
˜
q
WFS
(e

) =
Σ

(e

)V
H
(e

)q
WFS
(e

). Here, each component of
˜
q
WFS
represents a projection of the WFS
operators on the given source mode multiplied by the corresponding singular value. The multi-
plication by the singular value is needed since the first synthesis filters are made fromV

(e


−1
(e

)
according to the method described in the previous section. If the system is only decoupled, the
projection of the WFS operators becomes
˜
q
WFS
(e

) = V
H
(e

)q
WFS
(e

). Taking the inverse
discrete-time Fourier transform (DTFT) of a component of
˜
q
WFS
gives the impulse response
corresponding to the z transform of
˜
w
WFS
i
for the i-th source mode. This impulse response is
non-causal and an additional delay of ∆
SV D
is added to make it causal. The importance of the
resulting filter (projection of the WFS operators on the first synthesis filters) will become clear
in the next section.
For the projection of the WFS operators on the nullspace, a different approach is used. Ra-
ther than directly projecting the WFS operators on the nullspace (with V
H
(e

)q
WFS
(e

)), a
simple approach is to substract the first radiation mode contributions from the WFS operators so
that q
WFS
null
(e

) = [I
L×L
− V

(e

)
L×M
V
H
(e

)
M×L
]q
WFS
(e

) where both q
WFS
null
(e

)
and q
WFS
(e

) are L 1 vectors. The vector q
WFS
null
(e

) not only represents the WFS pro-
jection on the nullspace basis, it also corresponds to the projection of the WFS operators on
the nullspace combined with synthesis of the nullspace. Therefore, q
WFS
null
(e

) is simply the
part of q
WFS
(e

) which belong to the nullspace. This was defined without using the projec-
tion of the WFS operators on the nullspace basis. Since the impulse responses corresponding to
q
WFS
null
(e

) are non-causal, an additional delay of ∆
SV D
is included in the impulse responses
195
for the synthesis of the WFS operators projected on the nullspace basis. This proved to be effec-
tive when projecting the WFS operators on the source modes and then reconstructing the WFS
operators from these source modes.
AWFS using SVD
Exploiting the nature of the physical AWFS solution [Gauthier et Berry, 2006] and the plant
decoupling described above, it is possible to define an alternative controller architecture which
is different to the AWFS-modified FXLMS algorithm presented in Sec. 8.4.2 Several precon-
ditioning methods have been published for feedforward control [Cabell et Fuller, 1999; Cabell
et al., 2001; Elliott, 2001, 2000; Bai et Elliott, 2004]. Preconditioning using plant decoupling
has been treated using principal component LMS (PC-LMS) using SVD for tonal disturbances
[Cabell et Fuller, 1999; Bélanger et al., 2006] or, equivalently, SVD controller for tonal distur-
bances [Elliott, 2000]. SVD decoupling has been recently extended for broadband signals using
a decoupling filter formulation in the frequency domain and inverse transformation towards the
time domain for two-channel cross-talk cancelation [Bai et Elliott, 2004].
The AWFS digital signal processing architecture presented here is based on independent
radiation mode control using SVD and is shown in Fig. 8.4 (p. 187). The upper branch includes
the target wave field definition, that is

d
M
(n) at the reproduction error sensors. The second
branch represents the fixed WFS contribution according to the WFS operators projection on the
nullspace. This part is non-adaptive. Note that the corresponding two dashed blocks in this figure
are now combined in a single operation with an additional delay of ∆
SV D
samples. Therefore,
(s)
G

(e

) now represents the WFS operators projected on the nullspace basis. The third branch
includes the adaptive independent controller
˜
w
i
, the first synthesis filter matrix
(s)
G

(z), the
reproduction source signals y
L
(n) and the plant response G(z) to produce the reproduced sound
pressures p
(rep)
M
(n). The bottom branch includes the uncoupled plant model, the independent
LMS gradient algorithms and the analysis filter matrix
(a)
G(z) to transform the reproduction
errors into the SVD basis.
Let us consider the discrete-time formulation of Eq. (8.35). This is now expressed in the
z-transform domain (with the target signals

d
M
(n) being forced to zero)
˜
e(z) =
(a)
ˆ
G(z)G(z)
(s)
ˆ
G

(z)
˜
y(z) = z
−2∆
SV D ˜
y(z) (8.37)
so that plant decoupling and whitening are effective (as noted for Eq. (8.35)) except that the SVD
delays have been included : the decoupled-plant output
˜
e(z) (as seen by the LMS algorithms) is
196
the delayed decoupled-plant input
˜
y(z) (as seen by the AWFS LMS algorithms). If the system
is only decoupled, Eq. (8.37) is replaced by
˜
e(z) =
(a)
ˆ
G(z)G(z)
(s)
ˆ
G

(z)
˜
y(z) = z
−2∆
SV D
Σ

(z)
˜
y(z) (8.38)
For the sake of brevity, the following developments are presented for system uncoupling and
whitening. Minor modifications, as noted later, are needed when the system is only decoupled.
Since the control system shown in Fig. 8.4 (p. 187) can be considered as a set of independent
single-channel radiation-mode controllers, for the m-th independent radiation mode controller,
the instantaneous error is
˜ e
m
(n) =
˜
d
m
(n) − ˜ p
(rep)
m
(n) (8.39)
where
˜
d
m
(n) is the m-th element of

d(n) passing through the analysis filter matrix and ˜ p
(rep)
m
(n)
is the m-th element of p
(rep)
(n) passing through the analysis filter matrix. This equation can be
rewritten as follows
˜ e
m
(n) =
˜
d
m
(n) −
˜
w
T
m
(n)x(n −2∆
SV D
) (8.40)
where
˜
w
m
(n) is the J-coefficient vector associated to the control filter for the m-the radiation
mode and the reference signal vector is x(n) = [x(n) x(n −1) x(n −I −1)]
T
. In this case
the cost function associated to the reproduction of the m-th radiation mode is expressed as
˜
J
m
= E[˜ e
2
m
(n)] +λ
m
[
˜
w
m
(n) −
˜
w
WFSm
]
T
[
˜
w
m
(n) −
˜
w
WFSm
] (8.41)
where
˜
w
WFSm
is the J-coefficient vector of the WFS operators projected on the m-th first syn-
thesis filter as defined in the previous paragraphs. The gradient of this cost function is

˜
J
m

˜
w
m
= −2r
x
˜
dm
(2∆
SV D
) + 2R
xx
(0)
˜
w
m
(n) + 2λ
m
˜
w
m
(n) −2λ
m
˜
w
WFSm
(8.42)
with r
x
˜
dm
(t) = E[
˜
d
m
(n + t)x(n)] and R
xx
(t) = E[x(n + t)x
T
(n)]. Using Eq. (8.40), the
instantaneous value of the gradient becomes

˜
J
m

˜
w
m
= −2˜ e
m
(n + 2∆
SV D
)x(n) + 2λ
m
˜
w
m
(n) −2λ
m
˜
w
WFSm
(8.43)
Asingle-channel LMS algorithmwith a convergence coefficient α
m
for the m-th controller gives
˜
w
m
(n + 1) = (1 −α
m
λ
m
)
˜
w
m
(n) +α
m
˜ e
m
(n + 2∆
SV D
)x(n) +α
m
λ
m
˜
w
WFSm
(8.44)
The adaptation rule is, however, based on future values of the reproduction error ˜ e
m
(n+2∆
SV D
)
so that a modification of this algorithm is introduced as follows
˜
w
m
(n + 1) = (1 −α
m
λ
m
)
˜
w
m
(n) +α
m
˜ e
m
(n)x(n −2∆
SV D
) +α
m
λ
m
˜
w
WFSm
(8.45)
197
where x(n − 2∆
SV D
) represents the filtered reference in the SVD-transformed domain which
includes decoupling and whitening. This last equation can be implemented for each radiation
mode controller for practical applications of AWFS based on plant decoupling. If the plant
whitening is excluded, it is still possible to use the last equation as an adaptation algorithm
since x(n − 2∆
SV D
) would then correspond to a delayed version of the reference signals. In
this case, one finds that this implementation would be related to the DXLMS (delayed-reference
LMS) algorithm [Poltmann, 1995; Ahn et Voltz, 1996; Chen et al., 1998].
As one can note, Eq. (8.45) exactly matches the structure of the single-channel AWFS sys-
tem.
Denoting
˜
w
m∞
= lim
n→∞
E[
˜
w
m
(n)] and taking the expectation of Eq. (8.45) along with the
requirement that the convergence is achieved when E[
˜
w
m
(n + 1)] = E[
˜
w
m
(n)], one finds
˜
w
m∞
=
r
x
˜
dm
(2∆
SV D
) +λ
m
˜
w
WFSm
R
xx
(0) +λ
m
I
=
E[
˜
d
m
(n)x(n −2∆
SV D
)] +λ
m
˜
w
WFSm
E[x(n −2∆
SV D
)x
T
(n −2∆
SV D
)] +λ
m
I
(8.46)
Assume that an AWFS system with independent radiation mode control is constructed using
the cost function of Eq. (8.41) along with the adaptation rule of Eq. (8.45). If plant decoupling
by SVD is not perfect, the instantaneous errors for the M controllers would be (in matrix form)
˜
e(n) =
˜

d(n) −
˜
W
T
(n)x(n −2∆
SV D
) −
J−1

j=0
C
j
˜
W
T
(n −j)x(n −2∆
SV D
−j) (8.47)
where
C
j
=
_
¸
¸
_
C
11
j
C
1M
j
.
.
.
.
.
.
.
.
.
C
M1
j
C
MM
j
_
¸
¸
_
(8.48)
represents a fictitious effect of the first M radiation modes on the first M radiation modes. In
case of perfect plant decoupling C
j
is a diagonal matrix for all j. In Eq. (8.48),
˜
W(n) is the
matrix of the column vector control filters for the first M source modes
˜
W(n) =
_
˜
w
1
(n)
˜
w
M
(n)
_
I×M
(8.49)
Here, index j is used for convolution. Using Eq. (8.47) which gathers all the independent
controllers, the independent radiation mode control algorithm for AWFS would be rewritten
as follows (in replacement of Eq. (8.45))
˜
W(n + 1) = (1 −αλ)
˜
W(n) +αx(n −2∆
SV D
)
˜
e
T
(n) +αλ
˜
W
WFS
(8.50)
198
where
˜
W
WFS
is the matrix of the WFS operators projected on the first synthesis filters. The
structure of this matrix matches that of the control filters described by Eq. (8.49). Note that
for the sake of clarity, it is assumed that all the penalization parameters λ
m
and convergence
coefficient α
m
are equal to a general penalization parameter λ = λ
m
and a general convergence
coefficient α = α
m
. This does not limit the following observations.
After insertion of Eq. (8.47) in the AWFS independent control adaptive algorithm of Eq.
(8.50), one would find that the control filters converge toward an implicit expression for
˜
W

different from Eq. (8.46)
˜
W

=
R
x
˜
d
(2∆
SV D
) +λ
˜
W
WFS

J−1
j=0
(R
xx
(j)
˜
W

C
T
j
)
R
xx
(0) +λI
(8.51)
where
˜
W

represents the mathematical expectation of
˜
W(n) when n →∞. This development
includes two assumptions : (1) the cross-coupling C
j
does not change with time (in comparison
with the adaptation time) so that it might be removed from the expectation operation (as for the
filter coefficients
˜
W(n)) and (2) for the convolution with respect to j, the controller coefficients
˜
W are assumed time-invariant (
˜
W(n − j) ≈
˜
W(n) as long as the adaptation is slow over J
samples). In any case, for arbitrary C
j
, Eq. (8.51) suggests that as cross-coupling caused by
a imperfect plant decoupling increases, the coefficients C
j
become more important so that the
difference between Eqs. (8.51) and (8.46) increases. Equation (8.51) also highlights the fact that
as plant decoupling using SVD gets less effective (this might be caused by the slowly changing
plant response as function of time), the control filters converge toward the ones described by
Eq. (8.51). This last equation also shows that the independently implemented controllers will
then have mutual influences : the right-hand side of Eq. (8.51) includes all the M controller
coefficient vectors
˜
W

after convergence so that an explicit expression for
˜
W

does not exist.
The independent controllers are then coupled even if their realization was originally not.
For practical applications, if C
j
becomes too important, a new plant identification and de-
coupling using SVD needs to be performed so that any undesirable or extreme behaviors would
be avoided.
8.5 Simulations results
In order to demonstrate the feasibility of an AWFS system based on the adaptive signal
processing described in this paper, simulations were performed for various acoustical situations.
199
8.5.1 Free field
The system shown in Fig. 8.6 (p. 192) was simulated using a simple free-field model : the re-
production sources were represented by monopoles with a sound pressure radiated field e
−jkr
/r
where r [m] is the distance from the source and k the wavenumber. The impulse responses from
the reproduction sources to the error sensors were then computed by IFFT. Since the function
e
−jkr
/r generally involves fractional time delays [Laakso et al., 1996], Hanning windows were
applied in the time domain (centered on the main impulsion of the response) to reduce time
aliasing. For the free field simulations, the circular group of monitor sensors shown in Fig. 8.6
(p. 192) is used.
Results of AWFS signal processing simulations for this case are shown in Figs. 8.7 (p. 193)
to 8.12 (p. 201). Figures 8.7 (p. 193) to 8.10 (p. 194) were already described in Sec. 8.4.3. Most
of the results, shown in Fig. 8.11 (p. 201) are described in terms of the E
LS
criterion which is
defined by
E
LS
(n) = e(n)
T
e(n) (8.52)
and corresponds to the sum of the squared reproduction errors. In Fig. 8.11 (p. 201), E
LS
is also
smoothed with a moving-average filter to enhance the figure readability.
The fixed WFS solution is obtained by setting the convergence coefficient α = 0 and the
penalization parameter λ = 0 in Eq. (8.15). Since α = 0, the control filters then stick to the
WFS solution which is used as the initial value for the control filters. For the first FXLMS
case, we used α = 0.00004 and λ = 0 while α = 0.00004 and λ = 10 were used for the
second FXLMS case. For the AWFS algorithm based on independent radiation mode control,
each radiation mode is associated to its own values of the convergence coefficients α
1
= 0.0002,
α
2
= α
3
= 0.001, α
4
= 0.004 and penalization parameters λ
1
= λ
2
= λ
3
= λ
4
= 1. In all cases,
the size of the control filters
˜
w
i
was set to 256 and γ was set to 0 . The adaptation coefficients
were chosen to approach the maximum value for stable convergence. This was evaluated by
simulations. A modeling delay of 16 samples, ∆ = 16, was used in these simulations. The SVD
delay was set to 128, ∆
SV D
= 128. The first and second synthesis filters and the analysis filters
all include 256 coefficients.
Figure 8.11 (p. 201) shows that the different algorithms effectively reduce the reproduc-
tion error in comparison with WFS. It is also possible to conclude on several points : (1) the
criterion E
LS
(n) at the error sensors can be reduced to a plateau level controlled by the pena-
200
0 2 4 6 8 10
10
−4
10
−3
10
−2
10
−1
10
0
E
L
S
(
n
)


0 2 4 6 8 10
10
−2
10
−1
Time [s]
E
L
S
(
n
)

(
m
o
n
i
t
o
r
s
)


WFS
AWFS, FXLMS, λ=0
AWFS, FXLMS, λ=10
AWFS, SVD
WFS
AWFS, FXLMS, λ=0
AWFS, SVD
AWFS, FXLMS, λ=10
Figure 8.11 Learning curves for the error
sensors and for the monitor sensors using
FXLMS and independent radiation mode
control algorithms in free field.
1
6
12
18
24 1
64
128
192
256
−0.02
0
0.02
Samples
Source no
A
m
p
.
1
6
12
18
24 256
320
384
448
512
−0.02
0
0.02
Samples
Source no
A
m
p
.
A
m
p
.
A
m
p
.
Figure 8.12 Examples of the L resulting
control filters for AWFS by FXLMS (top) and
by independent radiation mode control
(bottom) in free field.
lization parameter λ and (2) the FXLMS and independent radiation mode control realizations
of AWFS can reduce the residual criterion to a similar value. Although the FXLMS algorithm
can reach a similar residual criterion than AWFS based on independent radiation mode control,
the independent implementation allows for fine tuning of the convergence of each mode, which
is not possible with FXLMS. This is highlighted in Fig. 8.12 (p. 201), which shows the 24
control filters after convergence for the FXLMS and SVD-based algorithms. Note that for the
SVD-based algorithm, these control filters correspond to the multiplication of the adaptive filter
matrix (LM 256, with L = 24 and M = 4) with the first synthesis filter matrix (M 256)
along with the addition of the nullspace synthesis filters (L 256). This then create the control
signals y
L
(n) as shown in Fig. 8.4 (p. 187).
201
Clearly, both algorithms result in a similar set of control filters. For the SVD-based algo-
rithm, the presence of the higher-order SVD radiation modes is visible from sources 1 to 12
where the spatial variation of the control filters is more pronounced [Gauthier et Berry, 2006].
This is because the independent radiation mode control allows for the faster convergence of
these higher order modes as compared to in the FXLMS algorithm which is based on uniform
values of α and λ. The next simulation example for a semi-infinite space provides more insight
of this point. Moreover, a uniform penalization parameter λ potentially too severely penalizes
the higher order modes so that they tend to be imposed by the corresponding WFS solution. The
higher order modes are of notable importance for the reduction of the reproduction error outside
the error sensor positions since they typically correspond to higher order spatial derivatives at
the error sensor array [Gauthier et Berry, 2006].
8.5.2 Semi-infinite space delimited by a rigid floor and two hard walls
To further investigate the effectiveness of the AWFS algorithms for active sound field repro-
duction, other simulations were performed for the system shown in Fig. 8.6 (p. 192) but here
the acoustical responses included three rigid surfaces (normal pressure gradient equal to zero on
these surfaces). The sources and the sensors are 1.22 m above a rigid floor. Two perpendicular
walls are also included as planes located at x
2
= −2m and x
1
= −6m. This configuration
roughly corresponds to a real laboratory space where an experimental AWFS system was re-
cently assembled and tested.
Although this reproduction space is simpler than a real listening room, it provides enough
departures with respect to the free field situation to investigate AWFS in a reflective reproduction
space and it ensures simple and illustrative results over a wide region of space.
The frequency spectrum of the four singular values of the plant frequency response is shown
in Fig. 8.14 (p. 203) where the FRF from reproduction source l = 1 to the error sensor m = 1 is
superimposed as an illustrative response of the system. Several points stem from this figure : (1)
the singular values are well separated in four continuous lines, but σ
2
≈ σ
3
, and (2) the dominant
singular value follows the typical FRF as function of frequency. As the plant response is more
complex than for the free-field situation, it was observed that the radiation mode reordering
algorithm was useless in this situation, this is partly caused by the more pronounced separation
of the singular values as function of frequency. The sign changes modification algorithm (as
described in Sec. 8.4.3) was however needed for the modification of the first synthesis and
202
x
3
x
1
x
2
Infinite rigid wall (x
1
=−6)
Infinite rigid wall (x
2
=−2)
Infinite rigid floor (x
3
=0)
Reproduction
source array
Figure 8.13 Circular reproduction source
array in three dimensional semi-infinite space.
0 100 200 300 400 500 600
10
−1
10
0
10
1
Freq. [Hz]
S
i
n
g
u
l
a
r

v
a
l
u
e
s

σ
i
σ
1
σ
2
σ
3
σ
4
10
−3
10
−2
10
−1
10
0
10
1
F
R
F

g
a
i
n

(
s
o
u
r
c
e

#
1
,

s
e
n
s
o
r

#
1
)




Figure 8.14 Left : Spectrum of the singular
values (σ
i
, i = 1...4) for the system with a
rigid floor (at x
3
= 0 [m]) and two hard walls
(at x
2
= −2 [m] and x
3
= −6 [m]). Right :
FRF gain from source #1 to sensor #1.
analysis filters matrices in the frequency domain before inverse DTFT.
Figs 8.15 (p. 204) and 8.16 (p. 204) present the first synthesis filters
(s)
G

(z) (see Eq. (8.31))
and analysis filters
(a)
G(z) (see Eq. (8.33)) each of which includes 256 coefficients. Clearly,
these filters show a more complex response than those of the free-field case (see Figs. 8.7 (p.
193) and 8.8 (p. 193)). The synthesis filters of the first source mode clearly show an in-phase
response from all the reproduction sources, this is in agreement with our previous theoretical
results [Gauthier et Berry, 2006]. Note that, once again, the synthesis and analysis filters only
include plant decoupling, that is : the plant is not whitened in this case. A modelling delay of 16
samples, ∆ = 16, was used in these simulations. The SVD delay was set to 128, ∆
SV D
= 128.
Comparaison of WFS and AWFS is reported in Fig. 8.17 (p. 205) in terms of the learning
curves for the various algorithms. For WFS, the following values were used : α = 0 and λ = 0.
For the first FXLMS case, we used α = 0.00004 and λ = 0 while α = 0.00004 and λ = 10
was used for the second FXLMS case. For the AWFS algorithm based on independent radiation
mode control, the convergence and penalization parameters were adjusted for each individual
radiation mode : α
1
= 0.00015, α
2
= α
3
= 0.0004, α
4
= 0.003 and λ
1
= 1, λ
2
= λ
3
=
0.1, λ
4
= 0.01. As the singular values get smaller for higher order modes, it is possible to
reduce the corresponding penalization parameter so that the convergence of these higher order
modes is not blocked by an excessively large penalization parameter. As it was shown in a
203
50 100 150 200 250
−0.1
−0.05
0
0.05
A
m
p
.
Source mode #1
50 100 150 200 250
−0.05
0
0.05
A
m
p
.
Source mode #2
50 100 150 200 250
−0.1
0
0.1
A
m
p
.
Source mode #3
50 100 150 200 250
−0.2
0
0.2
A
m
p
.
Source mode #4
Samples
Figure 8.15 Synthesis filters in the time
domain for the source modes 1 to 4 for the
system with a rigid floor and two hard walls.
Each plot includes the 24 synthesis filters to
create the given source mode with the 24
reproduction sources. Each filter includes 256
coefficients.
50 100 150 200 250
−0.4
−0.2
0
A
m
p
.
Pressure mode #1
50 100 150 200 250
−0.2
0
0.2
A
m
p
.
Pressure mode #2
50 100 150 200 250
−0.4
−0.2
0
0.2
A
m
p
.
Pressure mode #3
50 100 150 200 250
−0.5
0
0.5
A
m
p
.
Pressure mode #4
Samples
Figure 8.16 Analysis filters in the time
domain for the pressure modes 1 to 4 for the
system with a rigid floor and two hard walls.
Each plot includes the 4 analysis filters to
construct the pressure mode with the 4 pressure
sensors. Each filter includes 256 coefficients.
previous paper on AWFS [Gauthier et Berry, 2006], the effect of the penalization parameter λ
i
is related to the corresponding singular value magnitude σ
i
. In all cases, the size of the control
filters was 256 and γ was set to 0 . According to the learning curves of Fig. 8.17 (p. 205), it is
clear that AWFS provides a reduction of the reproduction error both at the error and monitor
sensors as compared to WFS. As noted earlier, the residual reproduction error is controlled by
the penalization parameters λ or λ
m
.
The effects of the reflective surfaces on sound field reproduction in space are first shown in
Figs. 8.18 (p. 205) to 8.20 (p. 206), which present the reproduced impulse responses (instanta-
204
0 2 4 6 8 10
10
−4
10
−3
10
−2
10
−1
10
0
E
L
S
(
n
)
0 2 4 6 8 10
10
−2
10
−1
Time [s]
E
L
S
(
n
)

(
m
o
n
i
t
o
r
s
)
WFS
AWFS, FXLMS, λ=0
AWFS, SVD
AWFS, FXLMS, λ=10
WFS
AWFS, FXLMS, λ=0
AWFS, SVD
AWFS, FXLMS, λ=10
Figure 8.17 Learning curves for the error
sensors and for the monitor sensors using
FXLMS and independent radiation mode
control algorithms with the system with a rigid
floor and two hard walls.
1
2
3
4
5
6
7
8
1
16
32
48
64
80
−0.1
0
0.1
0.2
Monitor no Samples
I
n
s
t
a
n
t
a
n
e
o
u
s

s
o
u
n
d

p
r
e
s
s
u
r
e

[
P
a
]
Direct wave fronts Walls and floor
Floor
First wall
and floor
Figure 8.18 Reproduced (thin lines) and
virtual (thick dashed lines) impulse responses
at the monitor sensor array (linear array shown
in Fig. 8.6 (p. 192)) for WFS with the system
with a rigid floor and two hard walls.
neous sound pressure) at the monitoring sensors for the linear monitor array shown in Fig. 8.6
(p. 192). For the WFS solution, one can clearly distinguish the undesirable reflections reaching
the monitor array in Fig. 8.18 (p. 205). Each discrete reflection is identified on this figure. The
FXLMS case, Fig. 8.19 (p. 206), is relative to a penalization parameter λ = 10. On this figure,
one can note the effective reduction of the reflections. This reduction of room effects are most
notable for the floor and late reflections. The attenuation of the room effects is especially noticed
at the central monitoring sensors (this region corresponds to the control region, that is monitor
sensors #4 and #5). An important advantage of AWFS based on independent radiation mode
control is the possibility to individually control each of the radiation mode with an individual
convergence coefficient and penalization parameter. This allows faster convergence of the higher
205
1
2
3
4
5
6
7
8
1
16
32
48
64
80
−0.1
0
0.1
0.2
Monitor no Samples
I
n
s
t
a
n
t
a
n
e
o
u
s

s
o
u
n
d

p
r
e
s
s
u
r
e

[
P
a
]
Figure 8.19 Reproduced (thin lines) and
virtual (thick dashed lines) impulse responses
at the monitor sensor array (linear array shown
in Fig. 8.6 (p. 192)) for AWFS by FXLMS
with the system with a rigid floor and two hard
walls.
1
2
3
4
5
6
7
8
257
272
288
304
320
336
−0.1
0
0.1
0.2
Monitor no Samples
I
n
s
t
a
n
t
a
n
e
o
u
s

s
o
u
n
d

p
r
e
s
s
u
r
e

[
P
a
]
Figure 8.20 Reproduced (thin lines) and
virtual (thick dashed lines) impulse responses
at the monitor sensor array (linear array shown
in Fig. 8.6 (p. 192)) for AWFS based on
independent radiation mode control with the
system with a rigid floor and two hard walls.
order radiation modes which are of crucial importance for the reproduction error minimization
outside the region defined by the error sensor array. The comparison between Fig. 8.19 (p. 206)
and Fig. 8.20 (p. 206) shows how the AWFS algorithm based on independent control effectively
reduces the undesirable reflections at the monitoring sensors.
To further highlight the effectiveness of active sound field reproduction and reflection can-
cellation by AWFS, Figs. 8.21 (p. 207) to 8.23 (p. 208) are introduced. They provide a different
spatio-temporal representation of the reproduced impulse responses by WFS and AWFS after
convergence. These figures are based on AWFS control filters after convergence of the algo-
rithms presented in the learning curves of Fig. 8.17 (p. 205). On these figures, the circular re-
production source array is represented by a continuous thick circle. Note that the instantaneous
sound pressure fields at time t = 0.56s and t = 0.59s are magnified 5 times to enhance the
visibility of the late reflections. Clearly the FXLMS and independent radiation mode control
AWFS algorithms, reduce the reflective room response in the region confined by the reproduc-
tion source array. By comparing the reproduced sound field obtained by FXLMS or independent
radiation mode control, it is clear the the second algorithm based on plant decoupling reduces
the reflection over a wider region of space. This is a consequence of the faster convergence and
reduced penalization of the higher order radiation modes.
206
Figure 8.21 Reproduced sound field at
different times by WFS for the system with a
rigid floor and two hard walls. The target
wavefront is identified by the dashed circular
line. The sound fields at times t = 0.56s and
t = 0.59s are magnified by a factor of 5 to
enhance the visibility of the late reflections.
Figure 8.22 Reproduced sound field at
different times by AWFS based on modified
FXLMS for the system with a rigid floor and
two hard walls. The target wavefront is
identified by the dashed circular line. The
sound fields at times t = 0.56s and t = 0.59s
are magnified by a factor of 5 to enhance the
visibility of the late reflections.
207
Figure 8.23 Reproduced sound field at different times by AWFS based on independent
radiation mode control for the system with a rigid floor and two hard walls. The target
wavefront is identified by the dashed circular line. The sound fields at times t = 0.56s and
t = 0.59s are magnified by a factor of 5 to enhance the visibility of the late reflections.
8.6 Discussion
The previous analysis and simulation results suggest that AWFS can be used as an effective
system for active sound field reproduction and active room compensation. However, several
other considerations are of interest for further research. They are discussed in this section.
As for most current WFS systems, the configuration retained here was a two-dimensional
distribution of reproduction sources. This is usually motivated for simplicity and lower cost.
208
Usage of compact sensor arrays can however easily be extended to three dimensions. For the
presented configuration, one can easily imagine an other error sensor pair vertically separated
but centered at the origin. This solution should not imply major additional complexity. Extension
of AWFS in three-dimensional spaces is a research avenue that could be investigated.
Moreover, it should be noted that the basic definition of AWFS is absolutely not limited to
the retained configuration. This configuration was chosen to illustrate the basic AWFS ideas
and to validate the algorithm. That is, the AWFS typical cost functions (see Eqs. (8.13 and
(8.41)) and the presented adaptive algorithms can be applied to any reproduction source and
reproduction error sensor configuration. This could be subject of further research and should
depend on the practical problem of interest.
8.7 Conclusion and perspectives
Adaptive wave field synthesis, as introduced by the authors in a previous theoretical paper
[Gauthier et Berry, 2006], was originally proposed as a solution for active sound field repro-
duction and active room compensation for WFS. AWFS is based on minimization of the re-
production errors with a departure penalty from the WFS solution. This paper pushed further
the understanding and definition of AWFS by analyzing broadband signal processing and im-
plementation on the basis of several algorithms : modified FXLMS and independent radiation
mode control based on plant decoupling by singular value decomposition.
It was shown theoretically that the application of classical adaptive algorithms for active
noise control such as FXLMS provides a practical implementation frame for AWFS. The conver-
gence properties of the modified FXLMS algorithm are very similar to the properties of the
classical leaky FXLMS algorithm. The main difference between these classical algorithms and
their modified counterparts for AWFS is the constant re-introduction of a scaled part of the WFS
solution at each sample in the adaptation rules. Plant SVD and AWFS based on independent ra-
diation mode control was then introduced. The corresponding adaptation equation showed that it
is possible to control the convergence of each of the radiation modes. This is a major advantage
of plant decoupling for AWFS along with reduction of the computational burden (partly caused
by the simplification of the adaptation rules and of the computation of the reference signals). In
comparison with other published results on plant preconditioning by SVD [Bai et Elliott, 2004],
further practical considerations for first synthesis and analysis filters were presented in Sec.
209
8.4.3. It was shown that either a reordering algorithm or a sign change tracking algorithm (both
working in the frequency domain) are needed before any tractable time-domain implementation
of AWFS can be achieved. Moreover a special attention was devoted to the practical nullspace
definition which is of great importance for AWFS.
The reported simulation examples included 24 reproduction sources and 4 error sensors
in free field and in a semi-infinite space bounded by three rigid surfaces. The first case was
introduced to validate the AWFS algorithms in a simple situation. It proved the workability
of the algorithms. The second case was introduced as a demonstration of the main interest of
AWFS : active sound field reproduction and active room compensation. A simple semi-infinite
space was chosen as an example where identifiable discrete reflected wave fronts impinge on the
sound field reproduction system. In this example, it was demonstrated that in-plane AWFS can
effectively be used to compensate for undesirable room effects like reflections in the vicinity of
the error sensors. These included reflections from vertical and horizontal surfaces. It is therefore
possible to compensate for reflections coming from horizontal surfaces with a planar horizontal
system using AWFS and a compact error sensor array.
From all these remarks and from the detailed results presented in Sec. 8.5, we conclude
that AWFS effectively works as a potential solution for room compensation and active sound
field reproduction. We currently experimentally evaluate an AWFS system using the configu-
ration depicted in Fig. 8.6 (p. 192) in several environments : semi-anechoic chamber, arbitrary
laboratory space and a reverberation chamber. Experimental evaluation of physical AWFS per-
formance for active sound field reproduction is thus a topic of current and immediate future
research.
Several other issues related to AWFS are open questions : evaluation of system size on per-
formance, possible use of several compact error sensor arrays in a larger distributed reproduction
region, modification of other classical adaptive algorithms (frequency domain implementation,
sparse adaptation and others [Garas, 1999; Elliott, 2000]) for AWFS and both subjective and
objective evaluations of AWFS performance in several reproduction rooms in comparison with
WFS.
210
8.8 Acknowledgments
This work has been supported by NSERC (Natural Sciences and Engineering Research
Council of Canada), NATEQ (Fond Québecois de la Recherche sur la Nature et les Techno-
logies), VRQ (Valorisation Recherche Québec) and Université de Sherbrooke. This research
has been conducted in collaboration with CIRMMT (Centre for Interdisciplinary Research in
Music Media and Technology, McGill University).
211
CHAPITRE 9
RÉSULTATS D’EXPÉRIMENTATIONS DE SYNTHÈSE DE
CHAMPS SONORES ADAPTATIVE
Au terme des considérations abordées dans les chapitres précédents, ce neuvième et dernier
chapitre propose, sous la forme d’un manuscrit
1
, une synthèse des résultats expérimentaux en
reproduction de champs acoustiques par AWFS.
Suivant un rappel des notions de WFS et d’AWFS, le chapitre relate des expérimenta-
tions harmoniques et à large bande pour trois lieux aux propriétés acoustiques différentes qui
couvrent un spectre assez vaste pour poser une évaluation critique des performances objectives
de l’AWFS comme méthode de reproduction de champs acoustiques et comme méthode de com-
pensation des lieux de reproduction. Les lieux utilisés sont une chambre semi-anéchoïque, un
espace de laboratoire standard et une chambre réverbérante avec quelque morceaux de matériaux
acoustiques. Ces lieux sont décrits à la section C.4 à la page 390. Le système expérimental, dont
la configuration correspond à celle exposée aux deux précédents chapitres, est décrit à l’annexe
C (section C.4).
Il est démontré que la WFS souffre d’une performance objective réduite lorsque la réponse
acoustique de la salle devient plus importante, et ce en accord avec les résultats initiaux présentés
au chapitre 4. La synthèse de champs sonores adaptative (AWFS), en minimisant les erreurs de
reproduction et l’écart de la solution par rapport à la WFS, permet d’augmenter la performance
objective de la reproduction de champs sonores en compensant les erreurs de reproduction au-
tant causées par le lieu de reproduction que par les imperfections du système électroacoustique
utilisé, et ce, pour les trois espaces de reproduction considérés. Cette augmentation de la per-
formance objective démontre expérimentalement l’efficacité de l’AWFS alors que les chapitres
1
Manuscrit dont Philippe-Aubert Gauthier est le premier auteur et Alain Berry le second, sera prochainement
soumis pour évaluation par des pairs. Selon les plans actuels, le manuscrit sera soumis au Journal of the Acoustical
Society of America.
212
précédents avaient plutôt défini le principe et posé une compréhension théorique de la méthode.
C’est ainsi que plusieurs notions proposées dans un cadre théorique sont vérifiées : l’AWFS
basée sur le contrôle indépendant des modes de rayonnement permet d’élargir la taille de la
région de contrôle efficace, les réflexions acoustiques discrètes sont amenuisées, etc. Un nouvel
algorithme qui implique quelques modifications supplémentaires à celles posées au chapitre 8
pour le FXLMS est aussi sollicité : il se base sur des connaissances et notions issues de l’AWFS
par le contrôle indépendant des modes de rayonnement. Un tel algorithme pourrait faire l’objet
de recherches futures étant donné l’intérêt des résultats obtenus et le fait que peu de temps y fut
dédié dans cette thèse.
L’originalité principale de ce chapitre vient du fait que c’est la première et unique mise en
place expérimentale de l’AWFS. Qui plus est, ces expériences sont une démonstration de la
possibilité d’effectuer un découplage à large bande par la décomposition en valeurs singulières
pour un système réel.
Ce dernier chapitre, par le biais de la démonstration pratique de l’efficacité de l’AWFS,
conclut donc le travail de recherche exposé par cette thèse et complète l’atteinte des objectifs
décrits au chapitre 3.
Des résultats expérimentaux supplémentaires et des considérations théoriques qui supportent
certains points exposés dans ce chapitre sont présentés aux sections B.2, C.5 et C.6.
9.1 Adaptive wave field synthesis and independent radiation mode control for active
sound field reproduction : Experimental results
Sound field reproduction finds applications in music reproduction, spatial audio, sound en-
vironment reproduction and experimental acoustics. For generic audio applications, sound field
reproduction can be used to artificially reproduce the spatial character of natural hearing. The
objective is then to reproduce a sound field in a real reproduction environment. Wave field
synthesis (WFS) is a known open-loop technology which assumes that the reproduction envi-
ronment is anechoic. For WFS, the room response thus reduces the quality of the physical sound
field reproduction. In recent research papers, adaptive wave field synthesis (AWFS) was defined
as a potential solution to compensate for these quality reductions from which WFS objective
performance suffers. In this paper, AWFS is experimentally investigated as an active sound field
213
reproduction system with a limited number of reproduction error sensors to compensate the res-
ponse of the listening environment. Several digital signal processing algorithms for AWFS are
used for comparison purpose, one of which is based on independent radiation mode control.
A new promising algorithm for AWFS is also investigated. For the three tested reproduction
spaces (hemi-anechoic chamber, standard laboratory space and reverberation chamber), AWFS
performed propagating sound field reproduction better than WFS.
9.2 Introduction
Following the constantly evolving digital signal processing and the relatively recent advent
of multichannel audio, spatial audio has gained more attention in the past decades from resear-
chers and practitioners for applications such as high-fidelity sound reproduction, music repro-
duction, virtual reality display, interactive multisensory environments, auralization and sound
installations [Camurri et Ferrentino, 1999; Wilson, 2003; Rumsey, 2001; Staff technical writer,
2005; Woszczyk et al., 2005; Blesser et Salter, 2007]. The interest for immersion and convin-
cing multisensory environments is not new[Grau, 2003] and various techniques for spatial audio
have been introduced in the past [Poulin, 1957; Kendall, 1995a; Verheijen, 1998; Poletti, 2000;
Rumsey, 2001; Davis, 2003].
Sound field reproduction attempts to reproduce the physical stimulus (wave field), thereby
avoiding any perceptual considerations in the implementation. Sound field reproduction was
investigated by researchers in the past decades [Berkhout et al., 1993; Nelson et al., 1997;
Verheijen, 1998; Start et al., 1999; Nicol et Emerit, 1999; Poletti, 2000; Nelson, 2002; Choi et
Kim, 2004b; Epain et al., 2004; Takane et Sone, 2004; Keller et al., 2006] and one of the most
active and recent related matters is room compensation [Spors et al., 2003a; Gauthier et al.,
2005b; Betlehem et Abhayapala, 2005; Spors et al., 2005a; Fuster et al., 2005; Gauthier et
Berry, 2006], which is essential for sound field reproduction in a real reproduction space on the
basis of objective, physically measurable, performances. This is especially true when acoustical
treatment of the reproduction space is not possible, like for sound field reproduction in vehicle
mock-ups where the visual reproduction of the original space is important.
This paper deals with the problem of sound pressure field reproduction using adaptive di-
gital signal processing applied to adaptive wave field synthesis (AWFS) initially introduced by
[Gauthier et al., 2005c]. More specifically it validates the AWFS concept on the basis of expe-
214
riments.
The concepts and results shown in this paper are not limited to audio applications. Indeed,
sound field reproduction may also be applied to experimental acoustics [Veit et Sander, 1987;
Bravo et Elliott, 2004], psychoacoustics [Epain et al., 2004; Keller et al., 2006], sound environ-
ment reproduction or even as a vibroacoustics design tool. These are promising applications of
sound field reproduction.
This paper is divided in five parts. In this introductory section, sound field reproduction,
wave field synthesis (WFS) and adaptive wave field synthesis (AWFS) are described on the
basis of recent research literature. Section 9.2.3 presents a summary of signal processing for
AWFS. This aspect has been fully described in an earlier paper
2
. The complete experimental
procedures and setups are described in section 9.4. Results of experiments with AWFS are then
reported in section 9.5 for three different reproduction spaces. Section 9.6 discusses the results
and draws the major concluding remarks following the experiments.
9.2.1 Sound field reproduction
For sound field reproduction, the main objective can be generally stated as the aim to re-
create a given acoustical property of the sound field, such as sound pressure, sound intensity
[Choi et Kim, 2004b; Merimaa et Pulkki, 2005], spatial diffuseness [Merimaa et Pulkki, 2005],
etc., over an extended region of space. This can be achieved with a reproduction system inclu-
ding electroacoustical sources and receivers, signal processing, and the desired physical target
description. In several of these cases, usage of adaptive filtering implies the minimization of
a cost function which is representative of this reproduction objective [Gauthier et al., 2005b;
Gauthier et Berry, 2006]. Adaptive signal processing for spatial sound reproduction has been
considered in various forms by researchers [Asano et Swanson, 1995; Ise, 1999; Takane et al.,
1999; Radlovi´ c et al., 2000; Santilla´ n, 2001; Epain et al., 2004; Choi et Kim, 2004b; Gauthier
et al., 2005b,c; Spors et al., 2005a; Gauthier et Berry, 2006].
2
Cet article est en fait le manuscrit présenté au chapitre 8.
215
9.2.2 Wave field synthesis (WFS)
Works on WFS originate from the theoretical propositions by Berkhout in the late 80s and in
the early 90s [Berkhout et al., 1993; Verheijen, 1998; Start et al., 1999; Gauthier et al., 2005b].
WFS is developed as follows : From the Kirchhoff-Helmholtz integral theorem, WFS operators
are defined to “link” a given simple virtual source (typically creating spherical or plane waves
in an horizontal plane, the listening plane), fed by a monophonic signal, to a loudspeaker array
which reproduces the acoustic field of the virtual source (that is the target, or virtual, sound
field). The problem is usually limited to reproduction in the horizontal plane with a finite num-
ber of discrete sources using appropriate simplifications of the integral formulation [Verheijen,
1998]. With WFS systems, it is claimed that plane and spherical waves can approximately be
reproduced in a broad planar listening area surrounded by the loudspeaker array. WFS studies
have investigated : spatial aliasing [de Vries et al., 1994a; Start et al., 1995; Spors et Rabenstein,
2006; Corteel, 2006b], reproduction source type (electrodynamic, electrostatic, panels), source
directivity [Verheijen, 1998], objective performance in-room situation [Klehs et Sporer, 2003;
Sporer et Klehs, 2004]
3
, acoustic room compensation [Spors et al., 2003a, 2005a; Fuster et al.,
2005] and WFS equalization [Corteel, 2006a].
On one hand, the benefit of current WFS prototypes is their effectiveness in transmitting a
spatial impression (in terms of localization) over a broad area surrounded by the loudspeakers.
On the other hand, WFS drawbacks related to the definition of the synthesis operators which as-
sumes that the reproduction room’s response or electroacoustical system limits [Corteel, 2006a]
are not considered in the process, except in specific research [Spors et al., 2003a, 2005a; Corteel,
2006a]. The typical WFS system is consequently based on an open-loop architecture assuming
a free field as the reproduction space. Active room compensation or system equalization for
WFS is an active research topic for objective sound field reproduction in real situation [Elliott
et Nelson, 1989; Asano et Swanson, 1995; Bouchard et Quednau, 2000; Santilla´ n, 2001; Spors
et al., 2003a; Gauthier et al., 2005b,c; Spors et al., 2005a; Fuster et al., 2005; Corteel, 2006a].
Review of WFS operators for AWFS
The description of the WFS operators follows the convention introduced in Fig. 9.1 (p.
218). According to [Verheijen, 1998], the following general WFS operators are obtained in the
3
Voir aussi le chapitre 4 de cette thèse qui fut aussi soumis comme manuscrit a Acta Acustica united with
Acustica.
216
frequency domain
Q(x
(l)
l
, e

) =
_
jk

A(e

) cos(Ψ)
e
−j(kro)
e
−j(ωTs∆)

r
o
¸
r
(ref)
(r
(ref)
+r
o
)
(9.1)
and the reproduced sound field in free space is
p
(rep)
(x, e

) =
_

−∞
Q(x
(l)
l
, e

)H(e

)
e
−jkr
r
dL (9.2)
where A(e

) is the target pressure field amplitude (virtual monopole source amplitude), Q(x
(l)
l
, e

)
is the driving function (expressed as a monopole amplitude linear density, also known as the
WFS operators) for the reproduction sources along the line L, k = ω/c is the wavenumber and
e
−jkr
/r (with r = [x
(l)
l
− x[) is the complex pressure produced at x by a unitary amplitude
monopole source in x
(l)
l
(the position of the reproduction source l). In Eq. (9.2), H(e

) repre-
sents a fictitious reconstruction filter frequency response, which would typically correspond to a
band-pass filter. The phase shift −j(ωT
s
∆) has also been artificially added in Eq. (9.1) to ensure
that both the active sound field reproduction and WFS assume the same modeling delay of ∆
samples, T
s
[s] is the sampling period. The modeling delay simply delays the target signals from
an integer number of, typically, few samples. It is assumed that the virtual source and the repro-
duction sources are both in the horizontal plane (x
1
− x
2
). All the other geometrical variables
in Eq. (9.1) are defined in Fig. 9.1 (p. 218).
Both the reproduction source line L and the reference line can be of arbitrary shape [Start
et al., 1999]. To simplify the computation of r
(ref)
in Fig. 9.1 (p. 218), the reference line is cho-
sen as a circle centered at the virtual source and passing through the center of the reproduction
source array [Verheijen, 1998; Gauthier et Berry, 2006].
Practical WFS implementation using discrete reproduction sources on a finite line implies
replacing Eq. (9.2) by
p
(rep)
(x, e

) =
L

l=1
Q(x
(l)
l
, e

)H(e

)
e
−jkr
r

s
(9.3)
where ∆
s
is the reproduction source separation distance. This is the theoretical reproduced
sound field assuming free field conditions.
For WFS, a reproduction source is active if [Ψ[ < 90
o
where Ψ is shown in Fig. 9.1 (p.
218). In real applications the reproduction array is finite and some truncation effects appear
[Verheijen, 1998; de Vries et al., 1994a]. In comparison with a linear reproduction source array,
217
Figure 9.1 Symbol convention for the WFS operators definition. The virtual source is located
in x
o
. The reproduction source l is located in x
(l)
l
. x
(ref)
describes points which belong to the
reference line. x describes any field point and x
(m)
m
is the m-th sensor position. L is the
reproduction source line, the virtual source is on the left of the source line and the reproduction
space is on the right of the source line. All sources and sensors are located in the x
1
−x
2
plane.
a circular array reduces the diffraction or corner effects. These effects are also reduced using a
spatial weighting window which reduces the amplitude of the reproduction sources at the end
of the activated set. In this paper, a half-Hanning window (with a half-length of one meter) is
applied to the amplitude of the driving function (Eq. (9.1)) [Verheijen, 1998; Gauthier et Berry,
2006].
The major drawbacks of WFS are : room effects (since the free-field assumptions are not
respected), truncation effects and loudspeaker responses [Corteel, 2006a]. These drawbacks are
potentially compensated by AWFS which minimizes the reproduction errors without regard to
the origins of the reproduction errors.
9.2.3 Adaptive wave field synthesis (AWFS) and independent radiation mode control
In a recent paper [Gauthier et Berry, 2006], AWFS was suggested as a practical compromise
between WFS and active room compensation, that usually requires a large amount of sensors.
AWFS automatically adapts the WFS operators typically with a reduced amount of reproduction
error sensors to minimize the computational burden of multichannel adaptation. AWFS is based
218
on a cost function to be minimized. Although implemented here in a specific configuration, the
AWFS concept described by this cost function can readily be applied to any configuration. The
cost function is a quadratic function of : (1) the reproduction errors and (2) the adaptive filters
departure from the WFS operators. The penalization of the departure from the WFS operators
is the major originality of AWFS in comparison with other research on sound field reproduction
using active noise control techniques.
Via the singular value decomposition (SVD) of the plant matrix (frequency response func-
tions [FRFs] between reproduction sources and error sensors) involved in AWFS, it was shown
that the underlying AWFS mechanism is the independent control of radiation modes [Gauthier
et Berry, 2006]. This suggested a practical implementation of AWFS which had already been
thoroughly described from a a signal processing perspective
4
.
In this paper, the performance of AWFS based on modified filtered-reference least-mean-
square (FXLMS) and independent radiation mode control algorithms is derived from experi-
ments with a real AWFS system in three different acoustical situations. Moreover, a practical
yet promising compromise between modified FXLMS and independent radiation mode control
for AWFS is suggested and tested. This paper therefore validates the AWFS concepts, previously
investigated in theory [Gauthier et Berry, 2006]
5
, with experimental results.
9.3 Signal processing for AWFS
Two different types of AWFS experiments were performed. The first implementation invol-
ved a broadband target wave field. In that case, the implementation was off-line since it was
impossible, according to the computational load, to make it run in real time. The second imple-
mentation involved an harmonic target wave field to reduce the computational load. Accordin-
gly, this second implementation was running on-line. The two corresponding signal processing
implementations are now briefly described. The reader is refereed to earlier publications for a
complete description and analysis of the algorithms
6
.
4
Voir le manuscrit présenté par le chapitre 8.
5
Voir aussi le manuscrit présenté par le chapitre 8 et soumis au Journal of the Acoustical Society of America.
6
Voir le manuscrit présenté par le chapitre 8.
219
9.3.1 Broadband AWFS
For all AWFS algorithms presented here, the general cost function is defined by
J
AWFS
= E[e
T
(n)e(n)] +λ( w(n) − w
WFS
)
T
( w(n) − w
WFS
) (9.4)
where the control filters are I-taps FIR(finite impulse response) filters w(n) = [ w
T
0
(n) . . . w
T
I−1
(n)]
T
with w
i
(n) = [w
1i
(n) . . . w
Li
(n)]
T
, the WFS operators are saved in w
WFS
, the reproduc-
tion errors are e(n) = [e
1
(n) . . . e
M
(n)]
T
=

d
M
(n) − p
M
(n),

d
M
(n) are the target signals at
the M error sensors, p
M
(n) are the reproduced signals at the M error sensors, λ is a penali-
zation parameter, n is the sample index and E[] denotes mathematical expectation. There is L
loudspeakers in the reproduction source array.
Off-line realization of AWFS based on independent radiation mode control is achieved ac-
cording to the block diagram shown in Fig. 9.2 (p. 221). The plant is described by the M L
G(z) transfer function matrix between the reproduction sources and the errors microphones. Via
the plant G(z) singular value decomposition (SVD), one finds the first synthesis filters
(s)
G

(z)
and second synthesis filters
(s)
G

(z) which create the source modes at the reproduction sources
according to the implementation depicted in Fig. 9.2 (p. 221). Note that the SVD produces the
radiation modes, each of which includes a source mode (at the reproduction source array), a
corresponding singular value and pressure mode (at the error sensor array). The corresponding
analysis filters (from the pressure modes) are defined to transform the physical reproduction
errors into the SVD basis. The target sound field

d
M
(n) is defined by the top branch of Fig. 9.2
(p. 221) where one also finds the modelling delay ∆. Each single-channel controller
˜
w
m
inde-
pendently operates to minimize the corresponding transformed reproduction error ˜ e
m
(n) (the
m-th element of
˜
e
M
(n)). The m-th independent least-mean-square (LMS) algorithm uses the
following adaptation rule
˜
w
m
(n + 1) = (1 −α
m
λ
m
)
˜
w
m
(n) +α
m
˜ e
m
(n)x(n −2∆
SV D
) +α
m
λ
m
˜ w
WFSm
(9.5)
where
˜
w
m
(n) is the coefficient vector of the m-th radiation mode controller at sample n, α
m
is a convergence coefficient, λ
m
is the m-th radiation mode regularization parameter (note that
λ
m
does not necessarily equal λ included in Eq. (9.4)), ˜ e
m
(n) is the m-th radiation mode ins-
tantaneous reproduction error at sample n, x(n −2∆
SV D
) is the time history (the past I filtered
reference signal samples) of the filtered reference signal (x(n)), ∆
SV D
is the delay (in samples)
introduced in the synthesis and analysis filters [Gauthier et Berry, 2006], and
˜
w
WFSm
is the
projection of the WFS operators on the m-th radiation mode synthesis filters. For a detailed
220
Figure 9.2 Block diagram of the AWFS least-mean-square adaptive digital processing
implementation based on independent radiation mode control. Subscripts denotes signal
dimensions.
description of this algorithm, see the chapter 8
7
.
Alternatively, AWFS can be implemented on the basis of a modification of the leaky FXLMS
algorithm [Elliott, 2000]. The corresponding block diagram is shown in Fig. 9.3 (p. 222). For
the moment, it is assumed that matrix the T is the M M identity matrix. In this case, the
adaptation rule is
w(n + 1) = (1 −αλ) w(n) +αλ w
WFS

ˆ
R
T
(n)e(n) (9.6)
with
R(n) =
_
¸
¸
¸
¸
_
r
T
1
(n) r
T
1
(n −1) . . . r
T
1
(n −I + 1)
r
T
2
(n) r
T
2
(n −1) . . . r
T
2
(n −I + 1)
.
.
.
.
.
.
.
.
.
r
T
M
(n) r
T
M
(n −1) . . . r
T
M
(n −I + 1)
_
¸
¸
¸
¸
_
(9.7)
where r
m
(n) = [r
1m
(n) . . . r
Lm
(n)]
T
is the filtered reference signal vector. The filtered refe-
rence is a set of ML signals obtained from the convolution of the reference signal x(n) by the
plant ML impulse responses. In Eq. (9.6), R(n) is evaluated from an identified system, so that
an approximate
ˆ
R(n) is used.
For broadband AWFS, the adaptation rules Eqs. (9.5) and (9.6) are applied off-line once the
plant is identified from measurements. More details on the practical implementation of these
algorithms are given in Sec. 9.4.
7
Dans le manuscrit pour soumission, cette référence au chapitre 8 de cette thèse sera remplacée par l’article
éventuellement publié sur le traitement du signal.
221
Figure 9.3 Block diagram of the AWFS least-mean-square adaptive digital processing
implementation based on the modification of the FXLMS algorithm for AWFS. Subscripts
denotes signal dimensions.
9.3.2 Harmonic AWFS
It is possible to use the previous algorithms for the AWFS of an harmonic sound field. In this
case, each control, synthesis and analysis filter includes only two coefficients and the SVD-based
algorithm then corresponds to a modified version of the PC-LMS (principal-component LMS
algorithm) [Cabell et Fuller, 1999; Elliott, 2000]. The difference with the PC-LMS comes from
the penalization by the departure to the WFS solution. The block diagram of Fig. 9.2 (p. 221)
is still a valid schematic representation of the implementation except that ∆
SV D
= 0 [Elliott,
2000]. It is then possible to rewrite the adaptation rule as follows for the m-th independent
controller
˜ y
m
(n + 1) = (1 −α
m
λ
m
)˜ y
m
(n) +α
m
˜ e
m
(n) +α
m
λ
m
˜ y
WFSm
(9.8)
where ˜ y
m
(n) is the m-th complex control input at sample n, α
m
is the m-th controller conver-
gence coefficient, λ
m
is the m-th controller regularization parameter, ˜ e
m
(n) is the m-th radiation
mode complex reproduction error and ˜ y
WFSm
is the projection of the WFS complex input on
the m-th radiation mode complex synthesis filter. This modified PC-LMS has some well-known
properties [Elliott, 2000]. It is a good compromise between the multichannel FXLMS and the
multichannel Newton algorithm when identical convergence coefficients and regularization pa-
rameters are used for all independent controllers : α
m
= α and λ
m
= λ. The other important
property, as for the broadband implementation described previously, is that it is possible to fine
tune the convergence properties of each radiation mode by using different α
m
and λ
m
for each
radiation mode for each corresponding controller. This latter property was explored for the re-
ported experiments.
The modified FXLMS algorithm for harmonic AWFS can also be written on the basis of
222
complex variables for a given radial frequency ω
o
[rad/s]. We then find
y(n + 1) = (1 −αλ)y(n) +αG
H
(e
jωo
)e(n) +αλy
WFS
(9.9)
where y(n) is the L coefficients complex control input vector at sample n, G(e
jwo
) the plant
complex response (a M L matrix) at frequency ω
o
, e(n) the M coefficients complex repro-
duction error vector and y
WFS
the L coefficients complex WFS solution vector. The superscript
H denotes Hermitian transposition.
For AWFS with harmonic wave field, the two adaptation rules Eqs. (9.8) and (9.9) are com-
puted on-line once the plant is identified from measurements. The practical implementation of
these algorithms is detailed in Sec. 9.4.
9.4 Experimental protocol
This section describes the experimental setups and the two experimental methods which
have been used for practical AWFS implementation.
9.4.1 Experimental setups
The tested system includes L = 24 reproduction sources and M = 4 reproduction error
sensors. The complete system is shown in Fig. 9.4 (p. 224). The reproduction sources create a
2m-diameter circular array in the horizontal plane. Sources are separated by 26cm, thus giving
an approximate minimal spatial aliasing frequency of 634Hz (λ/2 = 26cm) [Spors et Raben-
stein, 2006]
8
. This minimal spatial aliasing frequency gives the frequency range of interest for
the reported experiments. The error microphones form a cross, in the same horizontal plane
than the reproduction sources, and their separation along x
1
and x
2
axes are 17.5cm. Sources
and sensors stand 1.22m above the floor.
The loudspeakers are “M-Audio” DX4 studio monitors (amplified two-way cabinets). The
microphones are “PCB” 130D10/130P10. For the off-line broadband AWFS implementation,
the loudspeakers and the microphones are connected to a signal conditionner (“PCB” 482A20)
and a computer using “Motu” sound cards (24 analog inputs and 24 analog outputs). In this
8
À ce sujet, on consultera aussi le chapitre 4 de cette thèse.
223
12
11
13
10
14
9
15
8
16
... 8
7
17
x
2
6
18
5
19
1 ...
4
20
3
21
2
22
1
23
24
2

m
x
1
Sources
Error sensors
Monitoring sensors
Sources: 24
Sensors: 4
Figure 9.4 Schematic AWFS setup made of
24 reproduction sources, 4 reproduction error
sensors and 8 monitoring sensors. ´: typical
virtual source position.
Figure 9.5 Schematic representation of the
AWFS instrumentations, (a) : broadband, (b) :
harmonic.
setup, the AWFS signal processing presented in Sec. II.A operates off-line. The setup is sche-
matically shown in Fig. 9.5(a). For the second setup involving harmonic target wave fields, the
loudspeakers and microphones are connected to reconstruction and anti-aliasing filters (440 Hz
low-pass, 8-th order Butterworth), respectively, before connection to a “dSpace” station used
for on-line harmonic AWFS (as described in Sec. 9.3.2). The “dSpace” station is built around
a Texas Instrument TMS320C40 floating point Digital Signal Processor (DSP). The setup is
shown in Fig. 9.5 (p. 224)(b). For these two material setups, the experimental methods differ.
The system is pictured in Fig. 9.6 (p. 226).
9.4.2 Methods of experiments
Two types of reproduction methods are reported. For the first type, the AWFS algorithms
operate off-line. In this case, the experimental procedure is as follows : (1) Identification of
the plant impulse responses (from all reproduction sources to all error sensors). Sweep sine
identification was used to cover from 0 to 600 Hz. The number of coefficients vary according
to the reproduction environment. (2) Off-line running, by simulation, of the AWFS algorithms
224
described in Sec. 9.3.1. (3) Rendering, with the real electroacoustical system, of the AWFS
solution after convergence of the control filters. (4) Measurement of the reproduced sound fields.
The reproduced sound field measurements are based on reproduced impulse responses (from the
reference signal to the eight monitor microphones [see Fig. 9.4 (p. 224)]). Broadband AWFS
results shown in Sec. 9.5 include measurements of the reproduced sound fields using sweep
sines.
For the second type of experiments, the objective is to evaluate the performance of AWFS
with an on-line adaptation system. To reach this goal, several practical trade-offs are included to
reduce the computational burden so that on-line adaptation can be performed using the available
“dSpace” station. For harmonic sound field reproduction in the time domain, all the AWFS
filters (including : controllers
˜
w
m
, target operators a(z), synthesis [
(s)
G

(z) and
(s)
G

(z)] and
analysis [
(a)
G(z)] filters shown in Fig. 9.2 (p. 221)) are implemented using two-coefficients FIR
filters. In this very specific situation, the computational load is drastically reduced and on-line
adaptation is possible using the algorithm described in Sec. 9.3.2.
For both types of AWFS realization, the convergence coefficients used in the adaptive algo-
rithms (Eqs. (9.5) and (9.8)) are set near the maximum values which guaranteed stability and
convergence of the adaptation.
9.5 AWFS experiments
This part presents the results of experiments with the AWFS system. The first section des-
cribes the acoustical characteristics of the reproduction rooms. The following sections present
the AWFS results for these different environments.
9.5.1 Acoustical characteristics of the reproduction rooms
The three reproduction environments were selected to cover a large spectrum of reverbe-
ration properties. These three environments are : (1) a hemi-anechoic chamber, (2) a standard
laboratory space, (3) a reverberant chamber.
The hemi-anechoic chamber (Fig. 9.6 (p. 226)) has a volume of 125m
3
(6.556.253.05m)
225
Figure 9.6 Experimental AWFS setup in the
hemi-anechoic chamber.
0 50 95 160 220 310 400 440 500
−60
−50
−40
−30
−20
−10
0
10
20
Freq. [Hz]
G
a
i
n

(
d
B

r
e
f
.

1
)
Hemi−anechoic chamber
Reverberant chamber
Arbitrary laboratory space
Figure 9.7 Typical identified FRFs (from a
reproduction source to an error microphone) in
the hemi-anechoic chamber, standard
laboratory space and reverberant chamber.
with a floor surface of 41m
2
. A typical FRF (transfer function between a reproduction source
and an error microphone) is shown in Fig. 9.7 (p. 226). In this situation, the FRFs are smooth
and the dip around 310Hz is created by the destructive interference with the floor reflection at
this frequency. In the hemi-anechoic chamber, the error sensor signals are mostly dominated by
the direct sound field of the reproduction sources. There is however a strong reflection from the
concrete floor.
The volume of the standard laboratory space (see Fig. 9.17 (p. 236)) is 469m
3
(8.23
14.02 4.06m) with a floor surface of 115m
2
. The typical FRF shown in Fig. 9.7 (p. 226)
is more complex and shows various dips. The reverberation radius was estimated to be more
than 1.4m (according to spatial sound pressure level decay curves from an omnidirectional
loudspeaker) with broadband noise. It is then concluded that in this standard laboratory space,
the error sensors are roughly equally exposed to the direct sound field of the reproduction source
and the field reflected by the room walls.
The volume of the reverberant chamber is 142m
3
with a floor surface of 46.5m
2
(7.56.2
3.05m). Several sheets of damping material were placed in corners of the room to reduce the
excessively long reverberation time. Without these materials the most important damping object
was the system operator. Any movement of the operator then influenced the observed response
226
and stability of the system. The typical FRF shown in Fig. 9.7 (p. 226) has gains that vary
strongly with frequency and the transitions from frequency to frequency are very sharp. The
reverberation radius was estimated to be between 0.45m and 0.51m for broadband signal. The-
refore, in this highly reverberant space, the error sensors are mostly exposed to the diffuse sound
field of the reproduction sources since the mean distance between the reproduction sources and
the error sensors is 1m. This is an hostile environment both for WFS and AWFS.
These reproduction rooms represent three possible situations between nearly free field and
diffuse field.
9.5.2 Hemi-anechoic space
Broadband AWFS
The broadband off-line demonstration of AWFS is interesting because it validates the com-
plete AWFS concept, as described in previous papers [Gauthier et Berry, 2006]
9
. The broadband
nature of the off-line system places a general point of view on the results. Some of the more spe-
cific interpretations will become clearer with the on-line harmonic realization of AWFS.
In a preliminary stage, the system FRFs are identified using sweep sines with an average
over 200 realizations. The resulting impulse responses include 256 coefficients. The sampling
rate is 1200 Hz for all the reported experiments. Using the identified plant, the modified FXLMS
algorithm shown in Fig. 9.3 (p. 222) (see also Eq. (9.6)) can readily be applied.
The independent radiation mode control implementation of Fig. 9.2 (p. 221) however re-
quires an additional initialization step. Singular value decomposition of the system plant in the
frequency domain is achieved as described by Gauthier and Berry
10
for each frequency. This
gives the radiation modes (source mode, singular values and pressure modes) at each frequency.
A phase optimization algorithm is then applied in the frequency domain to smooth the source
and pressure modes phase responses. Inverse discrete-time Fourier transform is then applied
to obtain the synthesis filters and analysis filters in the time domain for AWFS based on inde-
pendent radiation mode control. Note that using such synthesis and analysis filters, the plant is
9
Voir aussi le chapitre 8.
10
Voir le chapitre 8.
227
uncoupled but not whitened
11
. The synthesis filters
(s)
G

(z) for the first four source modes are
shown in Fig. 9.8 (p. 229). Each group of synthesis filters (there are four groups of 24 filters)
produces one of the source mode at the reproduction source array. The analysis filters for the
four pressure modes are shown in Fig. 9.9 (p. 229). Each group of analysis filters (there are
four groups of 4 filters) transforms the physical acoustical pressures in the pressure mode ba-
sis. Interestingly, the synthesis and analysis filters show a sharp concentrated time response :
time leakage is reduced in comparison with other SVD filters presented by other researchers
[Bai et Elliott, 2004]. This is mostly marked for the first and forth radiation modes filters. As
one can note, for the first source and corresponding pressure mode, the 24 synthesis filters and
the 4 analysis filters are very similar. This supports the original hypothesis [Gauthier et Berry,
2006] that the first radiation mode typically corresponds to an approximation of sound pres-
sure at the sensor array. The second and third radiation modes correspond to sound pressure
gradients at the sensor array, while the forth radiation mode corresponds to a finite approxi-
mation of second-order mixed spatial derivatives at the sensor array. Harmonic results in the
hemi-anechoic chamber will clearly support these observations.
Results of AWFS are compared to sound field reproduced by classical WFS. Figure 9.10 (p.
230) shows the reproduced impulse responses (from the virtual source to the monitoring sensor
array shown in Fig. 9.4 (p. 224)). The transfer function units are [1/m] since we divide a sound
pressure [Pa] by a virtual monopole amplitude [Pa m]. The virtual source is a spherical source
located at x
o
= [0, 4, 0] m. Clearly, the direct field of the reproduced impulse responses approach
the target impulse responses (also shown in the figure). After the direct wave front passage,
appears the reflection from the floor appears and, instants later, the low frequency echo of the
hemi-anechoic chamber impinges the monitoring array. This echo is caused by the chamber
which is hemi-anechoic only above as 150 Hz. Moreover, an other physical imperfection of
the WFS reproduced sound field appears : the direct wavefront has an undesirable coloration
(the impulse is spread over 2 or 3 samples, passing from positive to negative values), possibly
caused by the loudspeaker response or the WFS approximations. Equalization of the WFS direct
wavefront was considered by [Corteel, 2006a].
Figures 9.11 (p. 230) and 9.12 (p. 231) shows that AWFS can effectively compensate for
discrepancies between the target wave field and the reproduced wave field.
Figure 9.11 (p. 230) first shows the learning curves of the AWFS algorithms. The criterion
E
LS
is the moving average of the quadratic summation of the instantaneous reproduction error at
11
Considérez le chapitre 8 à ce sujet.
228
50 100 150 200 250
−0.2
−0.1
0
A
m
p
.
Source mode #1
50 100 150 200 250
−0.1
0
0.1
A
m
p
.
Source mode #2
50 100 150 200 250
−0.1
0
0.1
A
m
p
.
Source mode #3
1 64 128 192 256
−0.2
−0.1
0
0.1
A
m
p
.
Source mode #4
Samples
Figure 9.8 First synthesis filters
(s)
G

(z) in
the time domain for the source modes #1 to
#4 in the hemi-anechoic chamber. Each plot
includes the 24 synthesis filters to create the
given source mode with the 24 reproduction
sources. Each filter includes 256 coefficients.
50 100 150 200 250
−0.2
0
0.2
A
m
p
.
Pressure mode #1
50 100 150 200 250
−0.4
−0.2
0
0.2
0.4
A
m
p
.
Pressure mode #2
50 100 150 200 250
−0.2
0
0.2
A
m
p
.
Pressure mode #3
1 64 128 192 256
−0.2
0
0.2
A
m
p
.
Pressure mode #4
Samples
Figure 9.9 Analysis filters
(a)
G

(z) in the time
domain for the pressure modes #1 to #4 in the
hemi-anechoic chamber. Each plot includes the
4 analysis filters to catch the pressure mode
with the 4 pressure sensors. Each filter includes
256 coefficients.
the error sensor array (i.e. the moving average of e
T
M
(n)e
M
(n)). The AWFS algorithms all work
to minimize this criterion down to a point imposed by the regularization parameter λ (see Eqs.
(9.5) and (9.6)). Clearly, all the AWFS algorithms reduce the E
LS
criterion after convergence,
with respect to the fixed WFS solution. The convergence coefficient α was set to 0.00001 for
the modified FXLMS algorithm. For the independent radiation mode control algorithm, the
convergence coefficients were set to α
1
= 0.0001, α
2
= α
3
= 0.0004 and α
4
= 0.002 for the
four radiation modes. The penalization parameter for the FXLMS algorithm was set to λ = 0
and λ = 20. For the reproduced sound field obtained with the modified FXLMS (see Fig. 9.12
(p. 231)), we used λ = 20. The penalization parameters for the AWFS based on independent
radiation mode control were λ
1
= 2, λ
2
= λ
3
= 0.2 and λ
4
= 0.1. The penalization parameters
229
1
2
3
4
5
6
7
8
0.02
0.04
0.06
0.08
−0.5
0
0.5
I
m
p
.

r
e
s
p
o
n
s
e

[
1
/
m
]
Time [s]
Direct and target
wave fronts
Floor
reflection
Low frequency
reflection
Monitor no
Figure 9.10 Reproduced (thick gray lines) and
virtual (thin black lines) impulse responses at
the monitoring sensor array (shown in Fig. 9.4
(p. 224)) for WFS with the system in the
hemi-anechoic chamber.
0 2 4 6 8 10
10
−2
10
−1
10
0
10
1
E
L
S
(
n
)
Time [s]
WFS
AWFS, FXLMS, λ=0
AWFS, FXLMS, λ=20
AWFS, SVD
Figure 9.11 Learning curves for the error
sensors using FXLMS and independent
radiation mode control algorithms with the
system in the hemi-anechoic chamber.
impose a plateau for E
LS
after convergence, as it can be seen in Fig. 9.11 (p. 230). Note that the
E
LS
criterion is not normalized so that although the WFS reproduced sound field approach the
target sound field, a criterion of E
LS
of nearly one is observed.
Although these learning curves show that the algorithms are effective and that reproduc-
tion errors are reduced at the central sensor array (see Fig. 9.4 (p. 224)), it does not show what
happens outside the error sensor array. The impulse responses (from the virtual source to the mo-
nitoring sensor array shown in Fig. 9.4 (p. 224)) reproduced by AWFS are shown in Fig. 9.12
(p. 231). Clearly, the imperfections of WFS shown in Fig. 9.10 (p. 230) are partly corrected
by AWFS even outside the error sensor array (note that monitors #4 and #5 correspond to two
of the error sensors). Both the modified FXLMS and independent radiation mode control algo-
rithms reduce these imperfections. The floor reflection is attenuated and the low frequency echo
disappears from the sound field reproduced by AWFS. Beyond simply reducing the undesirable
room effects in the reproduced sound field, the direct sound field reproduced by AWFS is closer
to the target wave field than the sound field reproduced by WFS (both in terms of amplitude
and time-delay). Therefore, AWFS compensates for the room effects, for the loudspeaker colo-
rations and, possibly, for some classical WFS approximations which introduce physical errors
in the reproduced sound field.
A closer comparative study of Fig. 9.12(a) and (b) highlights some distinctions between
230
1
2
3
4
5
6
7
8
0.02
0.04
0.06
0.08
−0.5
0
0.5
Monitor no Time [s]
I
m
p
.

r
e
s
p
o
n
s
e

[
1
/
m
]
1
2
3
4
5
6
7
8
0.24
0.26
0.28
0.3
−0.5
0
0.5
Monitor no Time [s]
I
m
p
.

r
e
s
p
o
n
s
e

[
1
/
m
]
(a)
(b)
Figure 9.12 Reproduced (thick gray lines) and
virtual (thin black lines) impulse responses at
the monitoring sensor array (shown in Fig. 9.4
(p. 224)) for AWFS ((a) : FXLMS algorithm
with λ = 20, (b) : independent radiation mode
control) with the system in the hemi-anechoic
chamber.
−0.6 −0.3 0 0.3 0.6
10
−1
10
0
Normalized energies of the errors
−0.6 −0.3 0 0.3 0.6
10
−1
10
0
−0.6 −0.3 0 0.3 0.6
10
−1
10
0
−0.6 −0.3 0 0.3 0.6
10
−1
10
0
x
1
[m]
Position #1
Position #2
Position #3
Position #4
Figure 9.13 Normalized energies of the error
signals at each monitoring microphone for four
virtual source positions in the hemi-anechoic
chamber. Position #1 : x
o
= [0, 4, 0], position
#2 : x
o
= [−4, 0, 0], position #3 :
x
o
= [0, 1.5, 0] and position #4 :
x
o
= [−1.19, −0.91, 0]. ¯ denote WFS errors,
◦ : errors of AWFS by FXLMS and : errors
of AWFS by independent radiation mode
control.
231
the FXLMS and independent radiation mode control realizations of AWFS. The independent
radiation mode control algorithm achieves a better sound field reproduction at the farther mo-
nitoring sensors. This is clearly visible for the direct sound field reproduced by independent
radiation mode control, in which case the negative sign excursion of the impulse responses one
or two samples after the direct wave front passage is drastically reduced. This is caused by the
possibility to fine tune each of the radiation mode with the independent radiation mode control-
ler realization of AWFS. For the FXLMS case, the higher-order radiation modes are often too
much penalized and their possible beneficial contribution in the sound field reproduction process
is greatly diminished.
A different representation of the results allows for a general comparison between WFS and
the two AWFS algorithms in terms of the reproduction error reduction as function of space.
This is shown in Fig. 9.13 (p. 231) where the normalized energies of the errors at each of the
monitoring microphones are computed from the differences between the virtual and reproduced
impulse responses (IRs) shown in Figs. 9.10 (p. 230), 9.12 (p. 231) and others, measured for
different virtual source positions. The normalized energies are computed as the sums of the
quadratic error signals (differences between virtual IRs and reproduced IRs in the time domain)
over the length of the IRs normalized by the total quadratic sum of the virtual IR, divided by the
number of monitoring microphones. The normalization is thus achieved by division by the mean
virtual IR energies of the monitoring microphones. According to the results shown in Fig. 9.13
(p. 231), the AWFS algorithms reduce on the average the reproduction errors in comparison
with WFS by controlling the reproduction error at the four error sensors (two of which are
monitors number #4 and #5). As suggested in previous theoretical publications
12
, AWFS based
on independent radiation mode control effectively provides a larger reproduction region of since
the higher order modes are included in the controller in that case. Note that the size of the
effective control region is also blurred by the fact that this type of representation includes all
the frequencies at once. AWFS by modified FXLMS provides a significant reproduction error
reduction at the two central monitoring microphones, but the reproduction errors are not so small
for the other monitoring microphones. AWFS performs better than WFS for all the reported
virtual source positions.
12
Pour l’instant, on se réfère au chapitre 8 et à la référence [Gauthier et Berry, 2006].
232
Harmonic AWFS
The on-line harmonic AWFS system was tested for a similar environment. In comparison to
broadband experiments, it is difficult to visualize the passage of the reproduced wave front in
the case of an harmonic wave field. It is however easier to observe the on-line stability of the
algorithm and evaluate the size of the effective control region at several frequencies.
According to the FRF shown in Fig. 9.7 (p. 226), the following frequencies were selected for
on-line AWFS : 95 , 160 , 220 , 310 and 400 Hz. The 95 and the 310 Hz were selected for their
peculiar responses in the FRF while the other frequencies were selected to cover the frequency
range below the source array spatial aliasing frequency (roughly 634 Hz).
After the 24 4 system was identified with two-coefficients adaptive FIR filters, the algo-
rithms were initialized. This includes the SVD of the plant transfer matrix for each frequency
along with phase and amplitude calibration of the microphones. Examples of source modes and
pressure modes are shown at 220 Hz in Figs. 9.14 (p. 234) and 9.15 (p. 234). Several observa-
tions can be drawn : (1) the pressure modes correspond to simple multipole patterns (monopole,
two orthogonal dipoles and a quadrupole) at the error sensor array and (2) these modes are
similar to the theoretically reported radiation modes [Gauthier et Berry, 2006]. Several experi-
mental tests have also shown that plant decoupling is effective and robust : each radiation mode
controller doesn’t influences the other independent controllers. It was also observed that a null
sound pressure is produced at the sensor array when only the second synthesis filters
(s)
G

(z)
are excited [Gauthier et Berry, 2006]. We recall that the second synthesis filters are obtained
from the system plant null space. They are fixed and they create zero sound pressure at the error
sensors.
For the modified FXLMS algorithm, the convergence coefficient α was set to 0.01 for all
frequencies while the penalization parameter λ was fixed to 0.1 (except at 220 Hz were λ = 1).
The AWFS algorithm based on independent convergence coefficients and penalization of the
radiation mode control algorithm parameters were adjusted to obtain a similar residual error
level than for the FXLMS but the higher-order radiation modes were less penalized than for the
FXLMS algorithm when possible, to increase the quality of the reproduction outside the error
sensor location [Gauthier et Berry, 2006]. This was achieved using either an identical parameter
λ
m
= λ for all radiation mode or λ
m+1
< λ
m
. The coefficients used in the experiments are
shown in Tab. 9.1.
233
0 5 10 15 20 25
−0.5
0
0.5
A
m
p
.
σ
1
= 3.9461
Source modes
0 5 10 15 20 25
−0.5
0
0.5
A
m
p
.
σ
2
= 0.68892
0 5 10 15 20 25
−0.5
0
0.5
A
m
p
.
σ
3
= 0.65553
0 5 10 15 20 25
−0.5
0
0.5
Source number (l)
A
m
p
.
σ
4
= 0.084841
Real
Imaginary
Figure 9.14 First four measured source modes
at 220Hz in the the hemi-anechoic chamber.
Pressure mode 1 Pressure mode 2
Pressure mode 3 Pressure mode 4
Figure 9.15 Measured pressure modes at
220Hz in the hemi-anechoic chamber. , sensor
position ; , positive real part ; , negative real
part ; +, positive imaginary part ; , negative
imaginary part. Symbol diameter illustrates the
magnitude of the corresponding value. Dashed
lines : equivalent computed free field
directivity.
Freq. [Hz] α
m
λ
m
95 0.02, 0.2, 0.2, 1 0.01, 0.01, 0.01, 0.01
160 0.02, 0.2, 0.2, 2 0.1, 0.1, 0.1, 0.1
220 0.02, 0.2, 0.2, 2 0.1, 0.1, 0.1, 0.1
310 0.02, 0.1, 0.1, 0.2 0.1, 0.1, 0.1, 0.1
400 0.02, 0.1, 0.1, 0.2 0.1, 0.01, 0.01, 0.001
Tableau 9.1 Convergence coefficients and regularization parameters for harmonic AWFS
based on independent radiation mode control in hemi-anechoic space.
234
To evaluate the performance of the sound field reproduction algorithms outside the error sen-
sor location, the linear monitoring array, along x
1
, including 8 microphone positions (separated
by 17.5 cm) was used to evaluated E
LS
after convergence for each of these monitoring posi-
tions. The corresponding criterion E
LS
(n) is the moving average of e
i
(n)
T
e
i
(n)/(d
i
(n)
T
d
i
(n))
where d
i
(n) is the desired signal and i, the monitor position number (see Fig. 9.4 (p. 224)). The
results are summarized in Fig. 9.16 (p. 236) where the colormap axis represents E
LS
at each of
the monitor position along x
1
. The WFS performance is reduced in comparison with the adap-
tive algorithms. This highlights the main interest of AWFS. Using the FXLMS algorithm, the
error is effectively reduced near the error sensors. However, as frequency increases, the control
region is spatially reduced. This is a well-known phenomenon in active noise control and it is
also a consequence of the overly penalized higher-order radiation modes when λ = 0.1. Moreo-
ver, the maximum convergence coefficient that ensures the FXLMS algorithm convergence is
limited by the inverse of the first radiation mode singular value so that higher-order modes have
not reached convergence in the results of Fig. 9.16 (p. 236)
13
. A uniform penalization parameter
also blocks the convergence of the higher-order modes (with smaller singular values) since a
large penalization parameter in comparison to the singular value, blocks the convergence of the
corresponding mode [Elliott, 2001; Gauthier et Berry, 2006]. Using the independent radiation
mode control algorithm, each radiation mode is individually tuned. This produces (Fig. 9.16 (p.
236)) a larger control region at the highest frequency (specially visible at 400 Hz) since control
of the higher-order radiation modes implies control of higher-order spatial derivatives of the
sound field at the error sensor array (see Fig. 9.15 (p. 234)). At lower frequencies, as the wa-
velength increases, the first radiation mode is dominant over the entire monitoring sensor array
so that the importance of the higher-order modes is reduced. As example, at 95 Hz and 160 Hz
the acoustic wavelengths are 3.6 m and 2.14 m respectively while 400 Hz implies a 0.86 m wa-
velength. This explains why the FXLMS algorithm create a large effective control region at low
frequencies : the first radiation mode covers a wider region of space with long wavelengths.
Along with the possibility to fine tune the convergence properties of each radiation mode, the
SVD-based algorithm involves less computation that the FXLMS during each sampling period :
the computation time is approximately reduced by two.
Other virtual source positions were tested to verify the effects of distance and angular po-
sition on active sound field reproduction by AWFS. Similar observations apply : (1) the AWFS
algorithms perform better than WFS and (2) at higher frequency the SVD-based implementation
implies a larger effective control region outside the error sensor array (as already shown in Fig.
9.16 (p. 236) for 400 Hz).
13
Voir le chapitre 8 à ce sujet.
235
-0.5
0
0.5
95 160 220 310 400

WFS

x
1

[
m
]
-0.5
0
0.5
95 160 220 310 400
AWFS by FXLMS
-0.5
0
0.5
95 160 220 310 400
Freq. [Hz]
AWFS by ind. radiation mode control
x
1

[
m
]
x
1

[
m
]
0 0.05 0.1 0.15 0.2 0.25
E
LS
Figure 9.16 Normalized E
LS
criterion at the
monitoring sensors for various frequencies and
harmonic reproduction algorithms after
convergence in the hemi-anechoic chamber.
From top to bottom : WFS, AWFS based on
FXLMS and AWFS based on independent
radiation mode control. The measurement
points are denoted by dots. Thick dashed lines
are the 0.1 contour lines, thin dashed lines are
the 0.25 contour lines and thin solid lines are
the 0.5 contour lines.
Figure 9.17 Experimental AWFS setup in the
laboratory space.
236
9.5.3 Standard laboratory space and reverberation chamber
This section summarizes the results obtained for the laboratory space and the reverberation
chamber. As these two reproduction environments enhance the room on effect on WFS, only
parts of the results are shown to support the effectiveness of AWFS to compensate for room
effect. The system in the standard laboratory space is shown in Fig. 9.17 (p. 236).
Broadband AWFS
Since the rooms’ IRs were longer than for the hemi-anechoic space, the identified IRs and
control filters where selected to have 512 coefficients for the laboratory space and 1024 for
the reverberant chamber (instead of 256 in the hemi-anechoic chamber) with an average over
200 realizations at a sampling rate of 1200 Hz. The resulting synthesis and analysis filters are
shown in Figs. 9.18 (p. 238) and 9.19 (p. 238) for the laboratory space. Once again, a phase
optimization algorithm is applied in the frequency domain to smooth the source and pressure
modes phase responses before inverse discrete-time Fourier transform. Moreover, a bandpass
filter (forth-order Butterworth, 60 Hz to 540 Hz) is applied to all synthesis and analysis filters
to reduce DC components that tend to appear in long SVD filters. Clearly the responses of
the synthesis and analysis filters are longer than for the hemi-anechoic room. These filters are
again concentrated impulses and showa reduced time-leakage. The radiation modes still provide
a finite approximation of pressure, perpendicular pressure gradients and second-order mixed
spatial derivative of pressure at the error sensor array. This will become clear with the harmonic
results.
Measured impulse responses reproduced by classical WFS are shown in Fig. 9.20 (p. 239)
for the laboratory space and in Fig. 9.21 (p. 239) for the reverberant chamber. It is possible to
distinguish the direct wave front reproduced by WFS and the floor reflection. The late parts of
the responses are blurred by multiple reflections from the concrete irregular ceiling, furniture,
distant objects and hard walls. The difference between the WFS reproduced sound field and
virtual sound field at the monitor sensor array is seriously increased in comparison with WFS in
the hemi-anechoic room.
AWFS was tested to reduce the reproduction errors at the four error microphones. For AWFS
by FXLMS in laboratory space, the convergence parameter α was set to 0.000002, and the
penalization parameter λ was set to 0 or 30. For AWFS by independent radiation mode control,
237
100 200 300 400 500
−0.1
−0.05
0
0.05
A
m
p
.
Source mode #1
100 200 300 400 500
−0.05
0
0.05
A
m
p
.
Source mode #2
100 200 300 400 500
−0.04
0
0.04
A
m
p
.
Source mode #3
1 128 256 384 512
−0.1
0
0.1
A
m
p
.
Source mode #4
Samples
Figure 9.18 First synthesis filters
(s)
G

(z) in
the time domain for the source modes #1 to
#4 in the laboratory space. Each plot includes
the 24 synthesis filters to create the given
source mode with the 24 reproduction sources.
Each filter includes 512 coefficients.
100 200 300 400 500
0
0.2
0.4
A
m
p
.
Pressure mode #1
100 200 300 400 500
−0.2
0
0.2
A
m
p
.
Pressure mode #2
100 200 300 400 500
−0.1
0
0.1
A
m
p
.
Pressure mode #3
1 128 256 384 512
−0.4
0
0.4
A
m
p
.
Pressure mode #4
Samples
Figure 9.19 Analysis filters
(a)
G(z) in the
time domain for the pressure modes #1 to #4
in the laboratory space. Each plot includes the
4 analysis filters to catch the pressure mode
with the 4 pressure sensors. Each filter includes
512 coefficients.
the individual convergence coefficients were set to α
1
= 0.0000075, α
2
= α
3
= 0.00003 and
α
4
= 0.00015, and the penalization parameters were set to λ
1
= 2, λ
2
= λ
3
= 0.2 and λ
4
= 0.1.
For AWFS by FXLMS in the reverberant chamber, α = 0.0000005, and λ was set to 0 or 50.
For AWFS by independent radiation mode control, the individual convergence coefficients were
α
1
= 0.0000125, α
2
= α
3
= 0.00005 and α
4
= 0.00025, and the penalization parameters were
set to λ
1
= 4, λ
2
= λ
3
= 0.4 and λ
4
= 0.04. The convergence coefficients are smaller than for
the hemi-anechoic case because the size of the control filters is increased.
The reproduced impulse responses by AWFS are shown in Figs. 9.22 (p. 240) and 9.23 (p.
240). The imperfections of WFS shown in Figs. 9.20 (p. 239) and 9.21 (p. 239) are partly correc-
238
1
2
3
4
5
6
7
8
0.02
0.04
0.06
0.08
−0.5
0
0.5
Monitor no Time [s]
I
m
p
.

r
e
s
p
o
n
s
e

[
1
/
m
]
Direct wave front
Floor
reflection
Figure 9.20 Reproduced (thick gray lines) and
virtual (thin black lines) impulse responses at
the monitoring sensor array (shown in Fig. 9.4
(p. 224)) for WFS with the system in the
laboratory space.
1
2
3
4
5
6
7
8
0.02
0.04
0.06
0.08
−0.5
0
0.5
Monitor no Time [s]
I
m
p
.

r
e
s
p
o
n
s
e

[
1
/
m
]
Figure 9.21 Reproduced (thick gray lines) and
virtual (thin black lines) impulse responses at
the monitoring sensor array (shown in Fig. 9.4
(p. 224)) for WFS with the system in the
reverberant chamber.
ted by AWFS even outside the error sensor array. Both the modified FXLMS and independent
radiation mode control algorithms reduce these imperfections for the two reproduction spaces.
Remarkably, the room compensation is achieved over a wide time range. Again, more than sim-
ply reducing the undesirable room effect in the reproduced sound field, AWFS more closely
reproduces the direct sound field than WFS. One notes that the AWFS algorithm based on inde-
pendent radiation mode control creates a larger room compensation region along the monitoring
microphone array.
The normalized energies of the errors at each of the monitor microphones are shown in Figs.
9.24 (p. 241) and 9.25 (p. 241) for the laboratory space and reverberant chamber respectively.
The AWFS algorithms reduce on the average the reproduction errors in comparison to WFS
by controlling the reproduction errors at the four error sensors. AWFS based on independent
radiation mode control effectively gives a larger reproduction region as the higher order modes
are included in the controller in that case. As for AWFS in the hemi-anechoic space, AWFS
by modified FXLMS results in a small reproduction error at the two central monitoring micro-
phones, but the reproduction errors are not reduced for the other monitoring microphones. This
again highlights the benefits of AWFS based on independent radiation mode control. AWFS
performs better than WFS for all the reported virtual source positions in the two reproduction
environments.
239
1
2
3
4
5
6
7
8
0.02
0.04
0.06
0.08
−0.5
0
0.5
Monitor no Time [s]
I
m
p
.

r
e
s
p
o
n
s
e

[
1
/
m
]
1
2
3
4
5
6
7
8
0.46
0.48
0.5
−0.5
0
0.5
Monitor no Time [s]
I
m
p
.

r
e
s
p
o
n
s
e

[
1
/
m
]
(a)
(b)
Figure 9.22 Reproduced (thick gray lines) and
virtual (thin black lines) impulse responses at
the monitoring sensor array (shown in Fig. 9.4
(p. 224)) for AWFS ((a) : FXLMS algorithm
with λ = 20, (b) : independent radiation mode
control) with the system in the laboratory.
1
2
3
4
5
6
7
8
0.02
0.04
0.06
0.08
−0.5
0
0.5
Monitor no Time [s]
I
m
p
.

r
e
s
p
o
n
s
e

[
1
/
m
]
1
2
3
4
5
6
7
8
0.88
0.9
0.92
0.94
−0.5
0
0.5
Monitor no Time [s]
I
m
p
.

r
e
s
p
o
n
s
e

[
1
/
m
]
(a)
(b)
Figure 9.23 Reproduced (thick gray lines) and
virtual (thin black lines) impulse responses at
the monitoring sensor array (shown in Fig. 9.4
(p. 224)) for AWFS ((a) : FXLMS algorithm
with λ = 0, (b) : independent radiation mode
control with λ
m
= 0) with the system in the
reverberant chamber.
Harmonic AWFS
For the sake of brevity, the harmonic AWFS results are only reported for the laboratory
space. Consistent results were obtained for the reverberant chamber. According to the typical
FRF shown in Fig. 9.7 (p. 226), the following frequencies were selected for on-line AWFS :
133 , 160 , 220 , 280 , 340 and 400 Hz.
Examples of pressure modes are shown for 220 Hz in Fig. 9.26 (p. 243). Again the radiation
240
−0.6 −0.3 0 0.3 0.6
10
−1
10
0
Normalized energies of the errors
−0.6 −0.3 0 0.3 0.6
10
−1
10
0
−0.6 −0.3 0 0.3 0.6
10
−1
10
0
−0.6 −0.3 0 0.3 0.6
10
−1
10
0
−0.6 −0.3 0 0.3 0.6
10
−1
10
0
x
1
[m]
Position #1
Position #2
Position #3
Position #5
Figure 9.24 Normalized energies of the error
signals at each monitoring microphone for four
virtual source positions in the laboratory space.
Position #1 : x
o
= [0, 4, 0], position #2 :
x
o
= [−4, 0, 0], position #3 : x
o
= [0, 1.5, 0]
and position #5 : x
o
= [2.8289, −2.8234, 0]. ¯
denote WFS errors, ◦ : errors of AWFS by
FXLMS and : errors of AWFS by
independent radiation mode control.
−0.6 −0.3 0 0.3 0.6
10
−1
10
0
Normalized energies of the errors
−0.6 −0.3 0 0.3 0.6
10
−1
10
0
−0.6 −0.3 0 0.3 0.6
10
−1
10
0
−0.6 −0.3 0 0.3 0.6
10
−1
10
0
x
1
[m]
Position #1
Position #2
Position #3
Position #4
Position #1
Figure 9.25 Normalized energies of the error
signals at each monitoring microphone for four
virtual source positions in the reverberant
chamber. Position #1 : x
o
= [0, 4, 0], position
#2 : x
o
= [−4, 0, 0], position #3 :
x
o
= [0, 1.5, 0] and position #4 :
x
o
= [−1.19, −0.91, 0]. ¯ denote WFS errors,
◦ : errors of AWFS by FXLMS and : errors
of AWFS by independent radiation mode
control.
241
Freq. [Hz] α
m
λ
m
133 0.01, 0.1, 0.1, 0.5 0.1, 0.01, 0.01, 0.001
160 0.02, 0.1, 0.1, 0.5 0.1, 0.01, 0.01, 0.001
220 0.02, 0.2, 0.2, 0.5 0.1, 0.01, 0.01, 0.001
280 0.02, 0.1, 0.1, 0.5 0.1, 0.01, 0.01, 0.0005
340 0.02, 0.1, 0.1, 0.5 0.1, 0.01, 0.01, 0.001
400 0.02, 0.1, 0.1, 0.5 0.1, 0.01, 0.01, 0.001
Tableau 9.2 Convergence coefficients and regularization parameters for harmonic AWFS
based on independent radiation mode control in laboratory space.
modes correspond to simple multipole patterns : monopole, two orthogonal dipoles and tesseral
quadrupole at the sensor array. This supports the previous and general remarks on the radiation
modes for various theoretical reproduction space [Gauthier et Berry, 2006].
For AWFS by the modified FXLMS algorithm, the convergence coefficient α was set to
0.01 for all frequencies while the penalization parameter λ was fixed to 1 (except at 133 Hz and
160 Hz where α = 0.0005 and 0.005 respectively). The AWFS algorithm based on independent
radiation mode control convergence coefficients and penalization parameters were then adjusted
to reach a roughly similar residual error level at the error sensors than for the FXLMS but each
higher-order radiation modes were less penalized than for the FXLMS algorithm when possible
to increase the performance outside the error sensor location [Gauthier et Berry, 2006]. This
was achieved using either λ
m
= λ or λ
m+1
< λ
m
. The used coefficients are shown in Tab. 9.2.
The results are summarized in Fig. 9.27 (p. 243), for a virtual source in x
o
= [0, 4, 0], where
the color axis represents the already described E
LS
normalized criterion at each of the monitor
position along x
1
. As one can note, the WFS performance is reduced in comparison with the
other algorithms. As for the hemi-anechoic results, using the FXLMS algorithm, the error is
effectively reduced near the error sensors. However, as frequency increases, this control region
is spatially reduced. On that matter, most of the detailed comments and explanations for the
hemi-anechoic chamber results apply. The AWFS based on independent radiation mode control
advantageously produces, as shown in Fig. 9.27 (p. 243), a larger control region since the higher-
order radiation modes typically imply higher-order spatial derivatives at the error sensor array
(see Fig. 9.26 (p. 243)). Even more clearly than for the hemi-anechoic chamber results, the
AWFS algorithm based on independent radiation mode control systematically enlarges the ef-
fective reproduction region in comparison with AWFS based on the modification of the FXLMS
algorithm.
242
Pressure mode 1 Pressure mode 2
Pressure mode 3 Pressure mode 4
Figure 9.26 Measured pressure modes at
220Hz in the laboratory. , sensor position ; ,
positive real part ; , negative real part ; +,
positive imaginary part ; , negative imaginary
part. Symbol diameter illustrates the magnitude
of the corresponding value. Dashed lines :
equivalent computed free field directivity.
-0.5
0
0.5
133160 220 280 340 400
WFS
x
1

[
m
]
-0.5
0
0.5
133160 220 280 340 400
AWFS by FXLMS
-0.5
0
0.5
133160 220 280 340 400
AWFS by ind. radiation mode control
Freq. [Hz]
x
1

[
m
]
x
1

[
m
]
0 0.05 0.1 0.15 0.2 0.25
E
LS
Figure 9.27 Normalized E
LS
criterion at the
monitoring sensors for various frequencies and
harmonic algorithms after convergence in the
laboratory. From top to bottom : WFS, AWFS
based on FXLMS and AWFS based on
independent radiation mode control. The
measurement points are denoted by dots. Thick
dashed lines are the 0.1 contour lines, thin
dashed lines are the 0.25 contour lines and thin
solid lines are the 0.5 contour lines.
243
9.5.4 Importance of the higher order radiation modes
The importance of the higher order radiation modes is highlighted by a specific set of experi-
ments with broadband off-line AWFS. Figure 9.28 (p. 245) shows the normalized energies of the
reproduction errors for WFS, AWFS and AWFS by independent radiation mode control where
only a limiter number of radiation modes are controlled. This was measured in the standard
laboratory space for the virtual source position located in x
o
= [0, 4, 0]. As expected, AWFS
by independent radiation mode control approaches AWFS by FXLMS when the first radiation
mode is the only controlled mode. As the number of controlled radiation mode increases, the size
of the effective active sound field reproduction region increases thus supporting the assumption
that higher order radiation modes tend to provide a larger control region.
The size of the active sound field reproduction effective region is shown in Fig. 9.29 (p. 245)
in relation to the acoustic wavelength. In this figure, several harmonic AWFS algorithms with
w
WFS
=

0 are presented for a harmonic wave field at 400 Hz in laboratory space. The WFS
solution is forced to zero to only illustrates the effects of the individual radiation modes one
to four. Clearly, when AWFS based on independent radiation mode control includes only one
radiation mode, the results correspond to AWFS by FXLMS. When the number of higher order
modes included in AWFS based on independent radiation mode control increase, the size of the
effective control region increases from a quarter wave length (one radiation mode) to half the
wave length (four radiation modes). This supports the previous observation on the importance
of the higher radiation modes to enlarge the effective active sound field reproduction region. The
adaptation coefficients and penalization parameters are identical to those of Tab. 9.2.
9.5.5 Modification of the FXLMS algorihtm for AWFS
The radiation modes obtained from plant SVD correspond to finite approximations of pres-
sure, orthogonal pressure gradients and tesseral quadrupole (second-order mixed derivative) at
the sensor array. This is supported by the experimental pressure modes shown in Figs. 9.15 (p.
234) and 9.26 (p. 243). At the light of these results, it is possible to suggest a simple modifica-
tion to the FXLMS algorithm for AWFS that automatically takes into account the higher order
spatial derivatives at the error sensor array using a transformation matrix T (see Fig. 9.3 (p.
222)) different than the identity matrix. We recall that all the previously reported experiments
with AWFS based on FXLMS used T = I. This matrix can be used to simultaneously evaluate
244
−0.6 −0.4 −0.2 0 0.2 0.4 0.6
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
2
3
4
x
1
[m]
N
o
r
m
a
l
i
z
e
d

e
n
e
r
g
i
e
s

o
f

t
h
e

e
r
r
o
r
s
WFS
AWFS, FXLMS, λ=30
AWFS, SVD, 4 modes
AWFS, SVD, mode 1 only
AWFS, SVD, modes 1,2 and 3
Figure 9.28 Normalized energies of the error
signals at each monitoring microphone for
different AWFS realizations. Square denote
WFS errors, circles AWFS by FXLMS
(λ = 30), AWFS by independent radiation
mode control, ♦ AWFS by AWFS control of
the first radiation mode only and ±by AWFS
control of the first to third radiation modes.
−0.5 0 0.5
10
−2
10
−1
10
0
10
1
x
1
[m]
E
L
S

(
m
o
n
i
t
o
r
s
)
AWFS, FXLMS
SVD with first mode only
SVD with modes 1 to 3
SVD with all modes
λ/2 →
λ ≈ 0.8575 m
← λ/4
Figure 9.29 Normalized E
LS
criterion at the
monitoring sensors for harmonic algorithms at
400Hz after convergence in the laboratory
space using AWFS with w
WFS
= 0. The wave
length and some corresponding fractions are
included.
the pressure, first-order spatial derivatives of sound pressure and second-order mixed spatial
derivative of sound pressure at the sensor array so that the plant response is not from 24 loud-
speakers to 4 microphones but from 24 loudspeakers to 4 sound field components. In this case,
the inherent problem of higher order radiation mode convergence in the FXLMS algorithm for
AWFS with T = I can be overcome. Note that this modified adaptive algorithm still works with
a fully-coupled system. Examples of such transformation matrix for active noise control using
spatially weighted error signals or for modal control are given by [Fuller et al., 1996] and [Kuo
et Morgan, 1996].
A broadband experiment was conducted using a matrix T defined by
T =
_
¸
¸
¸
¸
_
1 1 1 1
4 0 0 −4
0 4 −4 0
12 −12 −12 12
_
¸
¸
¸
¸
_
(9.10)
so that the FXLMS algorithm now works with pressure error, two gradients errors (multiplied
by 4) and a second-order mixed spatial derivative (multiplied by 12). The amplification of the
245
−0.6 −0.4 −0.2 0 0.2 0.4 0.6
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
2
3
4
x
1
[m]
N
o
r
m
a
l
i
z
e
d

e
n
e
r
g
i
e
s

o
f

t
h
e

e
r
r
o
r
s


WFS
AWFS, FXLMS, λ=50
AWFS, SVD
AWFS, T−FXLMS, λ=200
Figure 9.30 Normalized energies of the error signals for the modified FXLMS in the
reverberant chamber. Squares denote WFS errors, circles errors of AWFS by FXLMS (λ = 30,
with 512 coefficients), errors of AWFS by independent radiation mode control with 512
coefficients, and + errors of AWFS by FXLMS using pressure, pressure gradient and double
derivative control with T ,= I in Fig. 9.3 (p. 222).
finite gradients and second-order mixed difference was needed so that each corresponding errors
have roughly similar amplitudes. If a normalized FXLMS algorithm (where each of the ML
filtered reference signals are normalized [Kuo et Morgan, 1996; Elliott, 2000]) was used in
replacement of Eq. (9.6), such amplification would have been useless. A convergence coefficient
α = 0.000001 was used along with a penalization parameter λ = 200 for the reverberant
chamber.
The resulting reproduction errors, expressed as normalized energies of the differences bet-
ween target IRs and reproduced IRs at the monitor microphones, are shown in Fig. 9.30 (p.
246) for the reverberant chamber. The FXLMS algorithm with T ,= I reaches a performance
very similar to the SVD-based algorithm. Higher order radiation modes are better controlled
than with the original FXLMS. For the laboratory space (not shown in the figures), the FXLMS
algorithm using T ,= I (as defined by the last equation) reduced the reproduction errors. But in
comparison to the FXLMS with T = I, the size of the effective region was not as large as for
AWFS based on independent radiation control.
In this modified FXLMS algorithm, the contribution and penalization of each individual
radiation mode are not achieved using independent convergence and penalization parameters
but using the transformation and scaling matrix T. It thus seems that the FXLMS algorithm
using T ,= I is a potential complementary implementation for AWFS. This would be more
246
effective than AWFS based on independent radiation mode control when the electroacoustical
plant impulse responses are too long to obtain convenient SVD synthesis and analysis filters.
Such a realization of AWFS with FXLMS working with finite spatial differences could be the
subject of further experiments and investigation as it is potentially simpler than AWFS based
on independent radiation mode control. The reported results using the transformation matrix T
should be regarded as a glimpse into a set of new possibilities.
9.6 Conclusion
This paper has investigated the objective performances of adaptive wave field synthesis
(AWFS) to compensate for the room effects or any sound field reproduction errors, on wave
field synthesis (WFS) in experimental situation. The basic idea of AWFS is a simple combi-
nation of active noise control principles and classical WFS based on the Kirchhoff-Helmholtz
integral. Such a combination is entirely contained in the AWFS general cost function [Gauthier
et Berry, 2006]
14
which consists of minimization of the reproduction errors (typically caused by
the room response
15
or the system limitation [Corteel, 2006a]) at several points in space, along
with a regularization that penalizes the adaptive solution departure from the classical WFS so-
lution. This penalization is the major originality in the AWFS solution in comparison with other
sound field reproduction techniques based on active sound control and adaptive filtering.
The results presented in this paper show that the AWFS system successfully achieves active
sound field reproduction in more or less reflective spaces : hemi-anechoic chamber, standard
laboratory space and reverberant chamber. These experiments validate the AWFS concept and
demonstrate the physical possibility of progressive sound field reproduction in reflective rooms.
For the three rooms, it was shown that AWFS based on modified FXLMS and AWFS based
on independent radiation mode control reduce the reproduction errors with respect to WFS re-
production errors in the reproduction region bounded by the circular reproduction source array.
AWFS based on independent control provides an extended effective area of sound field repro-
duction since each radiation mode convergence is independently adjusted so that higher order
modes converge in the allowed time. Since these higher-order modes are of great importance to
enlarge the effective reproduction region, the possibility to control them independently is a ma-
jor advantage of AWFS based on independent radiation mode control in comparison to modified
14
Voir aussi les considérations exposées au chapitre 8 de cette thèse.
15
Tel que montré au chapitre 4.
247
FXLMS, which does not allow such independent control of each radiation mode convergence.
From the set of experiments reported, the following conclusions can be drawn :
– On the basis of a dedicated harmonic AWFS experiment, the increase of effective control
region have been mostly noticed for higher frequency where the effective control region
while including the first four radiation modes reaches a little more than half the wave
length.
– A modification to the FXLMS algorithm for AWFS including an error transformation
matrix T showed to increase the performance of FXLMS algorithm close to independent
radiation mode control. This is an interesting compromise which should be subject of
further research.
– The choice between the FXLMS algorithm with an error filtering matrix T and inde-
pendent radiation control algorithm based on plant SVD depends on the situation : they
provide similar performances but the SVD-based algorithm allows for easier tuning of
each of the radiation mode while the FXLMS algorithm with T ,= I might be more
convenient for systems having long impulse responses.
One of the original contributions from these results is that they establish, for the first time to
the authors knowledge, the validity of the AWFS concept based on independent radiation control
(including SVD broadband filters) for broadband impulse reproduction by the way of controlled
experiments. Bai and Elliott already considered SVD plant decoupling for cross-talk cancelation
[Bai et Elliott, 2004], but their paper was limited to theoretical investigations. Moreover, at the
heart of the AWFS concept, is the definition of an a priori solution (WFS) which, to the authors
knowledge, was never used nor experimentally tested within an adaptive signal processing or
active noise control architecture. Although the broadband application of AWFS was already
theoretically considered in a previous paper
16
, this paper on experimental AWFS confirms the
practical interest of AWFS.
The reported experiments were performed with a specific reproduction source and error
sensor configuration. However, AWFS is not limited to a specific configuration. These experi-
ments with AWFS were performed to evaluate the method. AWFS could be tested with different
configurations or for different practical problems : sound environment reproduction, mock-up
with sound field simulation system, etc. A typical AWFS extension would for exemple include
more loudspeakers and more error sensors. Indeed, we expect that a larger effective reproduc-
tion region is achievable with a compact sensor array which would includes more sensors, like
a dense circular microphone array. Three-dimensional configurations of either loudspeaker or
16
On parle du manuscrit présenté au chapitre 8.
248
microphone arrays could also be implemented within the AWFS framework.
The tested AWFS system and implementation should be regarded as proto-AWFS. Indeed,
before AWFS can be used for a practical application, several modifications should be done. As
an exemple, to reduce the obstruction of the error sensors in the listening area, the control filters
can be calculated off-line for the needed virtual source positions and saved, after which the error
sensors can be removed. An example of effective bank of compensation filters for WFS direct
sound field equalization has been reported by [Corteel, 2006a]. On that matter, AWFS could
be used for WFS direct sound field equalization as described by [Corteel, 2006a]. Moreover,
several adaptive algorithms could be applied to AWFS, such as frequency domain adaptation,
sparse adaptation, etc. [Elliott, 2001] to improve the convergence properties of the algorithm
or to reduce the computational burden. The modified FXLMS algorithm with an error-filtering
matrix T is also a promising compromise.
Future research on AWFS should be conducted within a specific practical application such as
sound environment reproduction or sound reproduction in a dedicated listening room to evaluate
the potential of the method in real situations, possibly using more reproduction sources and more
error sensors. In this specific case, AWFS and the corresponding algorithms should also be tested
and evaluated on the basis of subjective performance, that is sound localization, sound quality
or preference tests. The effects of the amount of penalization and the effect of the modelling
delay on perception should also be addressed.
In a time when more and more researchers are working on spatial sound using multichannel
electroacoustical devices for multimedia applications, it is worth noting that the current period
will decisively influence the next generation of spatial sound reproduction systems and corres-
ponding aural culture (examples of considerations for spatial aural culture are given by [Blesser
et Salter, 2007]). As [Altman, 1992] judiciously pointed it for the very specific case of cinema
sound in the 1930s, a similar examination of the current situation in spatial sound is needed.
This discussion should take place within more general multidisciplinary debates and investiga-
tions on the very fundamental problem of conflictual visions implied by either a representation
or a reproduction paradigm in multimedia displays.
249
Acknowledgments
This work has been supported by NSERC (Natural Sciences and Engineering Research
Council of Canada), NATEQ (Fond Québecois de la Recherche sur la Nature et les Techno-
logies), VRQ (Valorisation Recherche Québec) and Université de Sherbrooke. This research
has been conducted in collaboration with CIRMMT (Centre for Interdisciplinary Research in
Music Media and Technology, McGill University). The authors acknowledge the contribution
of Emmanuel Corratgé who contributed to the construction of the harmonic AWFS system and
to the harmonic experiments.
250
CONCLUSION
«Often called “distortions”, on the theory that sound recording is a science of reproduction
rather than an art of representation, the variables introduced by sound’s material heteroge-
neity, along with the system constituted to record (that is, represent) it, lie at the very heart
of film sound.» R. Altman
Par le biais de cette citation de Rick Altman [Altman, 1992], on retrouve une évocation plus
complexe du point initial de l’introduction de cette thèse, à savoir l’apparamment insoluble et
toujours actuel problème lié à la dualité entre les notions de reproduction et de représentation
en restitution sonore, quelle qu’elle soit. Dans la mesure où cette thèse inscrit son propos dans
un contexte scientifique, il est clair que la discussion qui suit et la mise en contexte des notions
développées dans les chapitres précédents ne peuvent que se dévouer principalement au premier
axe mentionné par Altman : la science de la reproduction. Dans les paragraphes qui suivent, on
accorde tout de même une certaine place aux deux visions.
C’est ainsi que la proposition d’Altman, quoique présentant des intentions résolument tour-
nées vers le son au cinéma, saisit parfaitement un dilemme fondamental de la restitution sonore.
En pratique, il est en effet bien connu que la reproduction sonore optimale – selon, par exemple,
un concensus d’auditeurs – d’une impression auditive donnée est difficilement possible dans la
mesure où tous les sujets exposés à l’environnement sonore restitué porteront des appréciations
et des jugements subjectifs qui différont tous autant qu’ils sont. Les impressions sont discu-
tables, variables et multiples. Et ce, d’autant plus que le responsable de la reproduction sonore
donnée – dans la lignée des pratiques en studio – tente de représenter sa propre expérience,
(réelle ou imaginée), et toute la singulière individualité qu’elle transporte, d’un événement, ou
environnement, sonore. Le point critique qui doit être saisi dans cette remarque est en fait celui
de la comparaison à une référence mobile : variable et multiple. Tous et chacun comparent la
restitution à une certaine référence : à leur propre expérience toutes différentes même dans le
cas original, si cas orignal il y a. Et puis, par concision, nous n’évoquons ni les critiques usuelles
envers la notion d’«original» [Sterne, 2003] ni, si cet original existe, les débats autour de ce que
251
cette appellation désigne exactement : stimulus physique quantifiable ou perception auditive.
Le constat de Altman est en parfait accord avec les pratiques actuelles ou passées pour
l’enregistrement de la musique sur support fixe et en cinéma. Il participe même aux défini-
tions et évolutions de ces pratiques : c’est une affaire de représentation d’environnements ou
d’événements sonores, réels ou fictifs, souvent narratifs. C’est ainsi que, systématiquement, les
ingénieurs du son exagèrent les dynamiques sonores, filtrent les enregistrements, torturent les
dimensions relatives des sources sonores, caricaturent des sonorités connues, caviardent les im-
perfections et remplacent même certains sons vrais par d’autres faux
17
, mais qui, lors d’une
projection cinématographique, collent mieux avec le corpus visuel ou accentuent affections et
perceptions de l’auditeur. Tout ça, donc, dans le but de rejoindre un idéal de représentation.
D’une part du côté du créateur et d’une autre part du côté de l’audience et de ses attentes. Qui
plus est, ces deux extrêmes et leurs écoutes respectives sont influencés par leurs cultures, leurs
connaissances et leurs goûts [Schafer, 1977; Altman, 1992; Blesser et Salter, 2007]. C’est une
affaire d’esthétique, voire de style.
Par contre, avec quelques considérations contextuelles, on dégage vite cet apparent dilemme
de la representation et de la reproduction de toutes apories : deux paradigmes, deux contextes.
S’il est tout à fait pertinent de miser sur une démarche de représentation et d’accentuation au
cinéma, dans les jeux vidéos, en situation de concert amplifié et en musique enregistrée comme
il le fut proposé au paragraphe précédent, d’autres contextes sont en faveur d’une démarche
scientifique, objective, de reproduction physique.
C’est donc, finalement, une affaire de contexte et de référence. Référence perçue ou réfé-
rence physique, immuable et quantifiable.
Par delà ces traditions bien plus propres à la représentation qu’à la reproduction, la repro-
duction physique de champs acoustiques ou d’environnements sonores se taille en fait une niche
notable et en parfaite relation de différenciation avec les approches de représentation citées plus
haut. Peut-être de façon bien moins courante dans l’univers du cinéma ou des studios, on trouve
plusieurs recherches récentes sur la reproduction physique, et non sur la représentation, d’en-
17
Dans ce cas bien précis, il est convenu de parler de bruitage. Quoique cette pratique ne date pas d’hier, elle
reste d’actualité et contamine même les dimensions sonores des jeux vidéos actuels qui misent sur un bassin
d’échantillons pour créer une trame sonore interactive. Les bruiteurs doivent alors imiter des sons de pas dans la
neige, sur le bois, dans la rue et toute une pléthore d’autres événements sonores avec des objets et accessoires
parfois bien loin de la réalité à laquelle ils seront associés.
252
vironnements sonores bruyants tels ceux des voitures [Leuridan, 2000; Genuit et Bray, 2002;
Perisse et al., 2003; Janssens et al., 2003], des simulateurs de bangs supersoniques [Epain et al.,
2004] ou des simulateurs de cabines d’avion
18
. Dans la plupart de ces cas, c’est un contexte de
recherche scientifique (par exemple psychoacoustique) ou de développements technologiques
(réduction de bruit, design vibro-acoustique, etc.) qui dicte une approche de reproduction phy-
sique. Cette façon d’aborder le problème découle directement du contexte. Dans le premier cas,
soit une recherche de nature scientifique, on cherche à contrôler les conditions d’expérimenta-
tions : elles doivent être quantifiables, fixes, immobiles par rapport à une référence qui hérite
des mêmes adjectifs. Dans le second cas, la reproduction physique de champs acoustiques est
souvent sollicitée comme outil de conception ou comme outil d’évaluation de la qualité sonore
[Becker et Sapp, 2001; Vecchio et al., 2003; Weber et al., 2003; Sorrentino, 2003; Bellmann,
2003; Keller et al., 2006]. Cet outil permet alors d’écouter, a priori, l’environnement sonore
ou le bruit d’un produit avant même la fabrication des premiers prototypes. Un autre exemple
typique de cet outil est l’écoute d’effets acoustiques simulés pour un produit existant donné, on
évalue alors des modifications possibles pour ce même produit. Cette méthode, de plus en plus
courante [Leuridan, 2000; Sottek, 2003; Perisse et al., 2003; Falch et al., 2003; Genuit et Bray,
2002; Janssens et al., 2003], permet d’amenuiser l’ampleur plus classique des problématiques
vibro-acoustiques en ingénierie mécanique, soit la correction a posteriori des problèmes sonores
découverts lors des premiers essais avec les premiers prototypes. Ces correctifs a posteriori im-
pliquent une boucle d’essais et d’erreurs parfois trop coûteuse. Qui plus est, elle permet d’éviter
une conception vibro-acoustique à l’aveugle. Typiquement, cette méthode est un fin métissage
de mesures vibro-acoustiques sur des produits ou des prototypes existants et de modélisations
théoriques diverses (quoique plus couramment basées sur des modèles de sources et de chemin
de transfert, sur la SEA [«Statistical Energy Analysis»], etc.). On note à ce sujet la proximité
technique de telles approches, synthèses physiques de bruits, d’environnements sonores ou de
lieux, avec les techniques de synthèse sonore en musique qui se basent sur la modélisation phy-
sique d’instruments de musique ou d’objets mécaniques [Cook, 2002]
19
. Qu’est-ce qui dans ces
exemples favorise donc une approche de reproduction physique ? La réponse est simple : on
cherche une reproduction sonore prévisionnelle sur la base de paramètres physiques connus et
18
[Morelli, 1995; Begault, 1998; He et al., 1998; Weber et al., 2003; Sorrentino, 2003; Bellmann, 2003; Sottek,
2003; Krebs et al., 2003; Hamann et al., 2004; Hsiao et al., 2004; Rizzi et Sullivan, 2005; Keller et al., 2006;
Chevret et al., 2006; Shi et al., 2006]
19
La modélisation physique d’instruments de musique ou d’objets mécaniques vibrants est aussi de plus en plus
utilisée pour le jeu vidéo pour lequel la trame sonore doit être à la fois crédible et interactive. La modélisation
physique pour la synthèse de sons permet par exemple la génération de bruits de pas bien plus variés et dynamiques
que de tels bruits qui seraient uniquement basés sur des enregistrements sonores de pas en différents lieux, sur
différentes surfaces. De tels exemples sont décrits par Cook [Cook, 2002].
253
contrôlables dans une démarche d’ingénierie de la conception, et on se doit de pouvoir établir
un lien paramétrique clair et explicite entre les variables de conception et une perception sonore
subjective individuelle.
On revient donc à la référence comme contexte différenciateur pour la représentation et la
reproduction. Comme on vient de le voir pour la reproduction, la référence est externe, inva-
riable et unique, définie sur une base de paramètres physiques. Lors de telles réalisations, on se
doit par contre de valider physiquement la reproduction : évaluation objective de la reproduc-
tion par rapport à ce qui doit être reproduit. Les imprécisions physiques, ou les «distortions va-
riables» comme les appelle Altman, devront donc être acceptées comme telles dans un contexte
de reproduction et, ultimement, la perception résultante, ou plutôt, les perceptions individuelles
résultantes seront peut-être influencées par de telles distortions mais elles seront, au moins, rap-
portables à une base de paramètres objectifs qui permettent par exemple des modifications de
design ou l’établissement d’une observation dont la scientificité ne peut être mise en doute.
10.1 Structure de la conclusion
Cette conclusion est divisée en quelques sections thématiques. Dans un premier temps, une
discussion générale des résultats est exposée à la section 10.2. En une telle section, on tente
de fournir une discussion intégrant tous les chapitres de cette thèse tout en ouvrant chacun des
thèmes spécifiques vers des améliorations ou des axes de recherche complémentaires possibles.
Suivant ce rappel des résultats et observations, un résumé général situe l’originalité principale
de la recherche tout en identifiant les mécanismes de recherche qui furent à l’oeuvre pour ce
projet de doctorat (section 10.3). Plusieurs perspectives de recherche pour des travaux hypothé-
tiques ou futurs sont énoncées et mises en contexte aux sections 10.4 et 10.5 dans lesquelles
on aborde d’abord des perspectives techniques spécifiques puis des perspectives technologiques
plus génériques qui touchent les axes que nous souhaiterions développer.
10.2 Discussion et rappel des résultats
L’ensemble des observations et des résultats présentés dans cette thèse sont maintenant pas-
sés en revue. On favorise une vision large qui mise sur une série de questions de recherche et
qui, en plus de formaliser le raisonnement proposé dans cette thèse, suivent les divisions par
254
chapitre de la thèse.
Dans un premier temps, il fut possible de répondre à une première question générale, à savoir
quelles sont les techniques de reproduction de champs acoustiques, par l’entremise d’une revue
de littérature complète (chapitre 2). Cette revue, en proposant d’abord une classification géné-
rale, recouvre l’ensemble des techniques de spatialisation sonore. Dans un contexte de simula-
tion de champs acoustiques, une distinction fut posée entre le problème intérieur et extérieur, se-
lon la position relative de l’audience par rapport aux sources acoustiques de reproduction. Dans
le cadre des problèmes intérieurs de reproduction, les deux techniques les plus classiques sont
la WFS et l’Ambisonie. Tel que montré à la section A.6, les équations de l’Ambisonie peuvent
être obtenues à partir de la WFS suivant un certain nombre de conditions et hypothèses. C’est
ainsi que l’Ambisonie est un cas particulier et limité de la WFS. Le point faible de l’Ambisonie
découle de son application approximative dans la pratique courante. Souvent, les utilisateurs
ne connaissent pas les fondements de l’Ambisonie et les hypothèses fondamentales ne sont pas
respectées. Aussi, les deux hypothèses de base de l’Ambisonie classique ne sont que très peu
souvent respectées : situation de reproduction définie par un champ libre et ondes planes comme
sources de reproduction. La WFS souffre elle aussi de certaines de ces hypothèses de base, no-
tamment celle comme quoi le lieu de reproduction est aussi un champ libre. Ce sont donc les
points faibles des techniques de reproduction de champs acoustiques les plus communes.
Suivant un intérêt initial plus marqué pour la WFS, il fut nécessaire de se questionner sur
la qualité objective de la reproduction par WFS dans une situation réelle, un studio d’écoute
dans notre cas. Des mesures de réponses impulsionnelles reproduites au niveau d’une antenne
de moniteurs furent effectuées pour différentes positions de sources virtuelles (chapitre 4 et an-
nexe C). Les réponses résultantes démontrent clairement que la WFS parvient à reproduire le
champ direct du champ acoustique à reproduire. Par contre, suivant le passage du champ direct,
les ondes diffractées et réfléchies par le lieu de reproduction creusent un écart majeur entre le
champ acoustique à reproduire et le champ reproduit. Typiquement, ces artéfacts trouvent écho
dans les fonctions de réponse en fréquence mesurées : colorations remarquables et indésirables,
apparition de formants de salle et de crevasses dans les réponses en fréquence. Toutes ces obser-
vations forment des points qui sont devenus des axes d’amélioration possible de la reproduction
de champs acoustiques à l’aide du contrôle actif. Par contre, si de telles mesures de champs
acoustiques reproduits étaient à refaire, différents aspects devraient être améliorés : un nombre
plus important de sources virtuelles, couvrir une plage de distances de sources virtuelles plus
vaste pour évaluer la courbure des fronts d’ondes reproduits, procédure d’évaluation subjective
simultanée et mesures spatiales de la réponse acoustique de la salle afin d’identifier avec cer-
255
titude la présence des modes de résonance ou des formants de salle. Il reste que les résultats
présentés au chapitre 4 sont nettement suffisants pour illustrer les défaillances de la WFS en
salle sur une base de critères objectifs.
La troisième question de recherche fut par la suite posée afin d’évaluer l’hypothèse initiale
du projet : à savoir s’il est possible d’utiliser des techniques issues du contrôle actif du bruit pour
l’amélioration de la reproduction de champs acoustiques. Dans cette perspective, le chapitre 5
présente des résultats de simulations théoriques. Le problème de la reproduction de champs
acoustiques fut alors posé, pour une cavité rectangulaire en trois dimensions (voir section A.1),
comme une fonction coût visant la minimisation de la somme des erreurs quadratiques de repro-
duction en un certain nombre de points de l’espace avec une échantillonnage spatial régulier. À
la lumière de ces simulations préliminaires, il fut vite possible de conclure que la minimisation
des erreurs de reproduction permet effectivement de reproduire une onde progressive virtuelle.
Du coup, ces simulations illustrent la possiblité physique de produire des champs acoustiques
progressifs dans des lieux dont les dimensions et le temps de réverbération correspondent aux
recommandations typiques pour les salles d’écoute disposant de systèmes stéréophoniques à
plus de deux voies. Ce qui constitue une première originalité de cette thèse. Cette orginalité
est aussi renchérie par des considérations au niveau des mécanismes physiques impliqués dans
la reproduction d’ondes progressives dans des espaces clos. Il fut montré que ces mécanismes
varient selon le rapport de la fréquence d’intérêt à la fréquence de Schroeder. La conclusion
essentielle de ce premier chapitre d’originalité est simple : les techniques de contrôle actif du
bruit peuvent être transposées vers le problème de la reproduction de champs acoustiques. Des
informations complémentaires sont aussi présentées à la section A.1 et à l’annexe B.
Alors que l’hypothèse favorisant l’usage des techniques de contrôle actif du bruit dans un
contexte de reproduction de champs acoustiques fut validée, la question nécessitant une consi-
dération est celle concernant la méthode d’hybridation entre la WFS et le contôle actif afin
d’améliorer les performances objectives de la WFS. Cet aspect fut d’abord touché au chapitre
6 dans lequel l’«Adaptive WFS» (AWFS) fut définie comme une minimisation de la somme
des erreurs quadratiques de reproduction et une pénalisation de Tikhonov avec solution a priori
[Hansen, 1998]. Pour intégrer le contrôle actif à la solution WFS fixe, la solution a priori de
l’AWFS est, justement, la WFS. Dans un contexte de reproduction de champs acoustiques, et
peut-être même dans un contexte plus large (acoustique, vibration, problèmes inverses en acous-
tique, contrôle actif du bruit), c’est une des plus importantes originalités de cette thèse. Comme
chapitre de définition de l’AWFS, le chapitre 6 a présenté une vision extérieure à l’AWFS : en
passant par un certain nombre de simulations, une étude comparative fonctionnant cas par cas,
256
selon la géométrie, a offert une première validation de l’idée de l’AWFS sans toutefois fournir
une analyse détaillée de l’AWFS.
Ce qui amène la quatrième question de recherche : à savoir quels sont les mécanismes
propres à l’AWFS. Et cela, dans le but éventuel d’en tirer profit, que ce soit au niveau de la
conception d’un système d’AWFS, de la compréhension des facteurs et paramètres d’impor-
tance ou au niveau des réalisations en traitement du signal. Les mécanismes fondamentaux
de l’AWFS furent étudiés au chapitre 7 (et aussi à la section A.3 à la page 302) avec la dé-
composition en valeurs singulières du système électroacoustique. Ce chapitre a mis en relief
l’importance du contrôle indépendant des modes de rayonnement entre les sources de repro-
duction et les capteurs de l’erreur de reproduction. Tel qu’illustré à la section A.3, les modes
de rayonnement d’ordre plus élevés sont d’une importance remarquable dans l’élargissement de
la zone de réduction de l’erreur par l’AWFS. Quoique ce premier contact avec les mécanismes
internes propres à l’AWFS fut suffisant pour poursuivre les recherches, différentes dimensions
mériteraient d’être étudiées plus en profondeur : considérations tridimensionnelles, effet théo-
rique de paramètres de régularisation indépendants pour chacun des modes de rayonnement
20
et
influences de la configuration géométrique des antennes de sources et de capteurs de l’erreur.
Suivant la définition de l’AWFS et la compréhension de ses mécanismes fondamentaux
propres, la cinquième question de recherche approche les applications pratiques et concerne
les élaborations des algorithmes de traitement du signal adaptatif pour la réalisation de l’AWFS
dans le domaine temporel. Ces algorithmes furent définis au chapitre 8. Des modifications au
«leaky FXLMS» classique amènent son équivalent pour l’AWFS. Les propriétés de convergence
de cette version modifiée du FXLMS sont proches de la version originale et sont notamment ca-
ractérisées par une lente convergence des modes d’ordre supérieur puisque le coefficient de
convergence maximal est essentiellement borné par le premier mode de convergence de l’algo-
rithme. Pour la configuration étudiée dans cette thèse, les modes d’ordre supérieur correspondent
à des dérivées spatiales d’ordre supérieur au niveau des capteurs de l’erreur et permettent donc
l’élargissement de la zone effective de reproduction active de champs acoustiques. C’est dans
cette mesure que l’AWFS basée sur le contrôle indépendant des modes de rayonnement devient
des plus intéressantes : elle permet le fin contrôle des propriétés individuelles de convergence de
chacun des modes et les modes d’ordre supérieur peuvent donc converger en un temps conve-
nable. Ainsi, pour ce second algorithme d’AWFS, même si les erreurs de reproduction rési-
duelles aux capteurs de l’erreur sont comparables à celles du cas traité par FXLMS modifié,
20
Cet aspect ne fut pas abordé dans le chapitre 7 mais sut mériter notre attention lors des simulations en traitement
du signal en AWFS et lors des expérimentations (chapitres 8 et 9).
257
la zone effective est élargie dans l’espace. Les modes d’ordres supérieurs (auxquels corres-
pondent de plus faibles valeurs singulières) présentent en effet des erreurs de reproduction bien
plus négligeables dans l’erreur totale au niveau des capteurs de reproduction que le premier
mode qui domine l’erreur de reproduction au niveau de ces mêmes capteurs. Ces observations
sont en accord avec celles posées au chapitre 7. Au-delà des thèmes abordés au chapitre 8, il
est aisé d’en imaginer d’autres dignes d’attention : études spécifiquement dédiées au couplage
des modes de rayonnement avec la dégradation de la décomposition en valeurs singulières,
études des variations des modes de rayonnement en fonction de la fréquence, développement
d’autres algorithmes de réarrangement des modes de rayonnement, développement d’autres al-
gorithmes (domaine fréquentiel, filtres en treillis, «warped FIR», etc.) et étude de linéarité de
l’adaptation. Une réalisation dans le domaine fréquentiel est surement celle qui est la plus digne
d’intérêt dans l’immédiat. Elle permettrait possiblement l’usage d’un paramètre de pénalisation
variable en fonction de la fréquence. En effet, pour l’instant, l’intensité de la pénalisation n’est
pas seulement déterminée par le paramètre de régalurisation, mais bien par sa valeur relative à
la valeur singulière correspondante (voir l’annexe A). C’est ainsi qu’un paramètre indépendant
de la fréquence, tel que posé dans cette thèse, introduira une pénalisation variable en fonction de
la fréquence, selon l’évolution fréquentielle des valeurs singulières. La réalisation de l’AWFS
avec un algorithme dans le domaine fréquentiel permettrait possiblement de compenser cette
variabilité.
Ces algorithmes créés pour l’AWFS permettent le passage de la théorie à la pratique et donc,
de se questionner sur l’efficacité de l’AWFS expérimentale. C’est le dernier thème de cette thèse
qui fut présenté au chapitre 9. Deux types de réalisations sont sollicités pour l’évaluation expé-
rimentale de l’AWFS : AWFS en ligne pour des champs harmoniques et AWFS hors ligne pour
des champs à large bande (toujours limitée par le repliement spatial). Les expérimentations en
AWFS harmonique ont permis de mieux visualiser la taille de la région de reproduction efficace
en fonction de la fréquence. Il fut observé, en accord avec les pratiques en contrôle actif du
bruit, que la taille de la région de reproduction efficace est plus grande en basses fréquences
qu’en hautes fréquences et que, principalement, l’algorithme d’AWFS basé sur le contrôle in-
dépendant des modes de rayonnement offre la possibilité, comme suggéré plus tôt, d’élargir la
taille de cette région, même en plus hautes fréquences, en permettant la convergence des modes
de rayonnement d’ordres supérieurs par le biais de coefficients de convergence plus élevés pour
ces modes, autrement, ralentis ou surpénalisés. Soit un avantage notable de cet algorithme. Pour
vérifier l’efficacité de l’AWFS à reproduire un champ acoustique et à atténuer l’effet du lieu de
reproduction, chacune de ces deux réalisations fut testée dans trois lieux différents (voir la sec-
tion C.4.3 à la page 401). Les lieux choisis partent d’un espace semi-anéchoïque, d’effet réduit,
258
à un espace de laboratoire quelconque, d’effet mixte entre champ direct et réverbéré au niveau
des capteurs de l’erreur, puis à une chambre réverbérante, d’effet majeur aux capteurs de l’erreur
qui sont alors dominés par le champ réverbéré. Dans les trois lieux, les réalisations à large bande
ou harmonique de l’AWFS ont su améliorer la reproduction de champs acoustiques et réduire
l’effet du lieu de reproduction en comparaison avec la WFS et ce, de façon remarquable. Ce qui
valide les hypothèses posées tout au long de cette recherche, rejoint l’objectif principal de cette
recherche et confirme l’intérêt des idées originales inclues dans la définition de l’AWFS. On
note aussi une bonne consistance entre les résultats présentés dans ce chapitre concernant les
expérimentations et les formes théoriques des modes de rayonnement présentées dès le chapitre
7. En plus des algorithmes développés au chapitre 8, une simple modification supplémentaire
de l’algorithme FXLMS pour l’AWFS fut effectuée à la lueur des acquis issus de l’AWFS ba-
sée sur le contrôle indépendant des modes de rayonnement. Cette modification simple permet
de contrôler les modes de rayonnement d’ordre supérieur tout en évitant la décomposition en
valeur singulière du système électroacoustique. C’est une piste de recherche intéressante pour
la suite des travaux sur l’AWFS.
Parmi les dimensions évoquées dans les deux derniers chapitres, une d’entre elles mérite-
rait une attention qui devrait se concrétiser pour parachever les développements sur l’AWFS.
On rappelle d’abord l’intérêt de pénaliser de façon indépendante les modes de rayonnement
en AWFS par le biais des λ
i
. En pratique, ce paramètre est un paramètre d’utilisation laissé à
la discrétion de l’utilisateur qui pourrait alors passer de la WFS classique à l’AWFS ou à une
sorte d’Ambisonie modifiée et réalisée en boucle fermée (voir la section 7.8.1 à la page 160 à ce
sujet). Cette possibilité ajoute une avantageuse flexibilité à l’AWFS en pratique. Par contre, l’ef-
fet des paramètres indépendants de pénalisation n’est pas nécessairement simple et clairement
concevable pour un utilisateur. On pourrait ainsi penser à une régle de déduction des paramètres
indépendants de régularisation à partir des valeurs singulières des modes de rayonnement et
d’un paramètre de pénalisation utilisé pour le premier mode. Un exemple simple serait (à la
lumière des considérations sur les facteurs de filtrage à la section A.3.4) : λ
i
= λ
1
σ
2
i

2
1
où les
σ
i
pourraient être les valeurs singulières moyennes en fréquence. L’utilisateur ne fixerait alors
qu’un seul paramètre : λ
1
. Ce genre de régle mériterait d’être validé en pratique, autant selon
un point de vue objectif que subjectif. Une autre règle de déduction des paramètres de pénali-
sation pour chaque mode de rayonnement pourrait être la suivante : λ
i
= σ
2
i
. Elle est inspirée
des propriétés des facteurs de filtrage (section A.3.4). Par contre, toutes ces règles réduisent
potentiellement la flexibilité inhérente au contrôle indépendant des modes de rayonnement, soit
l’ajustement, au besoin, des paramètres de chacun des modes.
259
Figure 10.31 Modèle dynamique du couplage entre recherche (connaissances),
développement technologique (applications) et innovation (ventes) selon Stokes et Nicolas
(2006). Dans le cadre de cette thèse, on part de la WFS vers l’AWFS en sollicitant des
connaissances fondamentales existantes.
Dans l’ensemble, c’est ce qui complète le rappel et la discussion des résulats. Les points
discutés et ouverts sur des considérations futures étaient très proches des réalisations effectuées
lors de cette thèse. Ils peuvent donc être vérifiés facilement avec les moyens actuels. Les sections
suivantes soulignent l’originalité de la recherche selon une vision plus gobale et posent des bases
d’idées qui s’assemblent pour former des perspectives de recherche plus larges dans la lignée
de l’AWFS.
10.3 Résumé du processus et des originalités de la recherche
Une façon simple et élégante de comprendre la dynamique et les mécanismes de recherche
impliqués dans le cadre de ce projet consiste à projeter les activités de recherche réalisées sur un
modèle dynamique général de la recherche, du développement et de l’innovation. Cette approche
permet aussi de souligner, tout en les structurant, la contribution et l’originalité propres aux
travaux présentés. Un tel modèle est exposé à la figure 10.31 (p. 260) qui présente, de bas en
haut, les transformations possibles des trois types (connaissances, applications et ventes) selon
cinq processus différents identifiés au centre de la figure.
Pour l’amélioration de la reproduction de champs acoustiques à l’aide du contrôle actif, le
260
point de départ est la synthèse de champs de type WFS, soit une technologie connue. De là, par
une recherche appliquée, l’AWFS est atteinte grâce à des connaissances mathématiques exis-
tantes (problèmes inverses [Hansen, 1998], régularisation de Tikhonov avec ou sans solution a
priori [Hansen, 1998] et décomposition en valeurs singulières de matrices [Lancaster et Tisme-
netsky, 1985]). En parallèle à la WFS, on peut aussi classer l’Ambisonie et le contrôle actif du
bruit dans les technologies et connaissances existantes qui ont marqué la naissance de l’AWFS.
Le projet passe donc principalement par deux transformations d’applications et de connais-
sances pour rejoindre une technologie originale. On note aussi que la définition de l’AWFS a
permis d’établir des connaissances améliorées au sujet de liens numériques et conceptuels pos-
sibles entre WFS et Ambisonie (chapitre 7). Ce qui, dans l’optique du modèle de la figure 10.31
(p. 260), ajoute une troisième transformation dans le projet d’amélioration de le reproduction
de champs acoustiques. Les originalités principales de cette thèse et les points diacritiques sont
donc disposées le long de ces trois axes de transformations de techniques et de savoirs connus.
10.4 Intégration des résultats de recherche aux pratiques actuelles en reproduction
spatiale du son, considérations pratiques et ouvertures diverses
Cette section offre des pistes de discussion au sujet de l’intégration possible de l’AWFS ou
des connaissances produites dans l’état actuel des pratiques et des technologies de spatialisation
sonore. Différentes pistes sont abordées. En comparaison avec la section 10.2 qui a présenté des
possibilités très proches des travaux présentés dans cette thèse, la présente section favorise un
point de vue plus large et moins strict.
10.4.1 De la WFS vers la AWFS
Depuis quelques années, soit même après le commencement de ce projet de recherche en
2003, la WFS a gagné en visibilité et en usage en dehors des sphères de recherche auxquelles
elle était initialement inscrite. C’est ainsi que l’on note l’existence de compagnies (IOSONO,
Sonic Emotion etc.) offrant des solutions WFS commerciales et même, depuis peu, des logiciels
libres pour la WFS («Wonder» et «BruteFIR» par exemple ; «Wonder» est l’interface graphique
et le programme qui génère les opérateurs de la WFS alors que «BruteFIR» effectue le filtrage
en temps réel à des fréquences d’échantillonnage audio). Ces dispositions récentes ont favorisé
la popularité des systèmes WFS.
261
Même si, dans cette thèse, l’AWFS fut élaborée sur des plateformes comme Matlab, il se-
rait possible et intéressant de convertir ces programmes en équivalents plus courants. On pour-
rait, par exemple, d’abord intégrer les capacités des «Java Sound Applets»
21
dans Matlab pour
ensuite penser à une application d’AWFS entièrement construite en Java. Une des limitations
actuelles de l’AWFS à large bande vient de sa réalisation en temps différé. Cet obstacle pour-
rait être aisément contourné par, justement, toute la reconstruction des codes informatiques de
l’AWFS. Dans la mesure où le système présenté dans cette thèse fut développé pour les pilotes
ASIO, il est tout à fait pensable d’imaginer une version de l’AWFS qui soit plus proche du
«streaming» en temps réel avec des pilotes à plusieurs pistes comme ASIO. Une telle approche
permettrait le départ et l’arrêt de fonctions indépendantes interagissant avec les pilotes ASIO
en temps réel. Cette dimension constitue une piste de développement qui pourrait être explorée
pour la popularisation de l’AWFS. Il est aussi probable que ces possibilités soient intégrées aux
suites du projet (voir la section 10.5 sur les ouvertures de recherche à court et à moyen terme).
Dans ces optiques de développement, il est pensable d’imaginer la combinaison de l’AWFS
aux applications plus populaires de la WFS.
10.4.2 Utilisation de plusieurs antennes de microphones compactes en AWFS et
encombrement de la zone d’écoute
Le système principal présenté dans cette recherche était centré autour d’une antenne com-
pacte faite de quatre capteurs. Des simulations et des analyses par décomposition en valeurs
singulières furent par contre aussi réalisées pour d’autres configurations d’antennes de micro-
phones.
Parmi ces autres vérifications, on trouve l’exemple de plusieurs antennes de microphones
compactes mais séparées dans l’espace. En termes concrets, on pense par exemple à deux an-
tennes compactes de quatre microphones (comme celle étudiée dans la thèse) disposée en des
zones plus ou moins éloignées (éloignées en ce sens où le critère d’échantillonnage spatial ne
serait pas respecté). Une telle configuration serait en fait une réponse à une critique évidente que
peut recevoir le système d’AWFS présenté dans cette thèse : à savoir l’encombrement central
de l’antenne des capteurs de l’erreur. Dans la mesure où cette thèse avait comme objet principal
l’élaboration et l’étude d’une technique de reproduction physique, cette critique reste secon-
21
Voir le site http ://www.jsressources.org à ce sujet.
262
daire. Par contre, l’utilisation de plusieurs antennes compactes (encore plus denses que celles
utilisées dans cette thèse, on pense par exemple au microphone à quatre capsules de «Sound
Field Research») permet de dégager une zone d’écoute tout en sondant l’erreur de reproduction.
Plus spécialement et par le biais de simulations théoriques, la décomposition en valeurs
singulières de systèmes à plusieurs antennes de microphones compactes a démontré des pro-
priétés remarquables. Les modes de rayonnement restent tous comparables aux composantes
Ambisoniques (telles que développées au chapitre 7). On observe par contre des couples de
composantes Ambisoniques à chaque antenne compacte. Par exemple, si le premier mode de
rayonnement correspond à l’évaluation de la pression en phase aux deux antennes compactes,
le deuxième mode correspond quant à lui à l’évaluation de la pression hors-phase aux deux an-
tennes compactes. Et il en est de même pour les autres modes de rayonnement : les gradients en
phase aux deux antennes forment un mode de rayonnement alors que les deux mêmes gradients
hors-phase aux deux antennes forment typiquement le mode de rayonnement suivant. Ces ob-
servations supportent et élargissent les liens entre WFS, AWFS et Ambisonie tout en soulignant
des avenues de recherche possibles pour l’Ambisonie plus classique. Qui plus est, les modifica-
tions finales de l’algorithme FXLMS pour l’AWFS (chapitre 9) peuvent toujours être réalisées
à partir de l’allure des modes de rayonnement obtenus par la SVD du système.
Il est fort à parier que l’usage de plusieurs antennes de microphones compactes pourrait, dans
le cas de système d’envergure plus importante, élargir la zone efficace de l’amélioration de la
reproduction tout en libérant de l’espace d’écoute. Pour améliorer des réalisations pratiques, on
peut aussi penser à l’usage d’antennes de microphones très compactes, commerciales
22
ou non.
De telles antennes ou grappes de microphones sont tellement compactes que l’encombrement
peut être réduit de façon significative. Si l’antenne devient très compacte, avec des distances
de séparation de l’ordre du centimètre, l’appariement en phase des microphones devient plus
critique et mériterait des considérations supplémentaires.
Une autre implication de l’usage d’antennes de microphones compactes est liée avec l’échan-
tillonnage spatial qui s’améliore avec la compacité croissante de l’antenne (réduction des dis-
tances de séparation). Des études analytiques et théoriques au niveau du repliement spatial im-
pliqué par des sources de reproduction dont la distance de séparation est plus importante que
celle associée aux capteurs de l’erreur devraient aussi être entreprises dans l’optique des possibi-
lités mentionnées. Il est ainsi peut-être possible de repousser la fréquence de repliement spatial
de la reproduction de champs acoustiques par contrôle vers les hautes fréquences sans devoir
22
Le microphone Ambisonique de «Sound Field Research» semble encore tout désigné.
263
user d’une densité de sources de reproduction qui défie la pratique.
10.4.3 Murs de haut-parleurs et acoustique des salles variable
Comme on les retrace souvent dans les livres et les publications en acoustique des salles,
certains systèmes électroacoustiques sont proposés comme des solutions au problème d’acous-
tique des salles variable [Berkhout et al., 1993; Jouhaneau, 1997; Kuttruff, 1999] : prolongement
artificiel ou changement du temps de réverbération [Kleiner, 1990; Kawamura et al., 1993; Ber-
khout et al., 1993; Poletti, 2003], etc. Typiquement la WFS avait déjà été proposée pour la
production d’une acoustique des salles variable avec des considérations spatiales plus fines que
celles des solutions proposées auparavant. Dans certains cas, on imagine des grilles de haut-
parleurs disposées sur des murs qui permettent alors la synthèse en temps réel de réflexions
acoustiques virtuelles [Blesser et Salter, 2007]. Il ne devient pas seulement question d’ajou-
ter une réverbération à une prise de son effectué sur scène, mais bien de modifier la réflexion
des lieux pour créer des réflexions virtuelles qui sont dictées par l’incidence des ondes directes
sur la paroi active, peu importe leurs provenances. On parle vraiment d’acoustique des salles
virtuelles.
Les grilles, ou les murs, de haut-parleurs et de microphones ont été, dans le cas de recherche
spécifique [Bravo et Elliott, 2004], utilisés pour la synthèse d’un champ de pression acoustique
diffus sur un plan faisant face à un échantillon de partition devant subir une mesure de trans-
mission dans des conditions de laboratoire typiques : entre une chambre réverbérante et une
chambre semi-anéchoïque (ou anéchoïque). L’objectif est alors de compenser pour les imper-
fections de la chambre réverbérante qui, habituellement, ne respecte pas la définition de champs
diffus nécessaire à la mesure de perte par transmission.
Les notions propres aux développements de l’AWFS proposées dans cette thèse pourraient
éventuellement être modifiées pour de telles applications. C’est une piste de recherche envisa-
geable.
264
10.4.4 Reproduction de champs acoustiques par réduction de la diaphonie et modification de
l’AWFS
Une des limitations de l’AWFS vient de l’adaptation du système qui implique la présence de
microphones de mesure dans l’espace de reproduction. Une solution à ce problème est basée sur
l’adaptation de l’AWFS à la réduction de la diaphonie appliquée à la reproduction de champs
acoustiques. La solution est simple, au lieu de tenter de reproduire un champ virtuel prescrit,
on cherche à reproduire une pression blanche à un seul des quatre microphones, les autres ne
devant pas voir de pressions acoustiques à leurs membranes. On réduit donc la diaphonie entre
les microphones. Si l’opération est répétée autant de fois qu’il y a de microphones (supposons
encore M), les M groupes de filtres de contrôle résultants peuvent être par la suite alimentés
par M signaux quelconques qui sont en fait les signaux désirés aux microphones. Cette seconde
opération ne nécessite plus la présence des microphones dans l’espace de reproduction lors de
la restitution et règle donc possiblement le problème de l’encombrement. Cette approche peut
être d’autant plus facile à utiliser que l’application est spécifique (pour une installation fixe).
Elle pourrait, par exemple, tout à fait remplir les besoins de la reproduction d’environnement
bruyants tels qu’exposés plus loin.
10.4.5 Simplifications pour des usages Ambisoniques courants
Étant donné le lien clair entre les composantes Ambisoniques classiques issues de trans-
formations spatiales de champs acoustiques à reproduire et reproduit sur la base de séries de
Fourier-Bessel (harmoniques cylindriques) et l’analyse de systèmes électroacoustiques à l’aide
de la décomposition en valeurs singulière (SVD), il semble que des recherches pourraient être
guidées par la possibilité de fournir des composantes Ambisoniques adaptées à des configura-
tions pratiques réelles. En effet, les équations Ambisoniques viennent d’un modèle théorique
simplifié à l’extrême : sources de reproduction sans coloration créant des ondes planes et espace
de reproduction infini. Avec la SVD, il serait possible d’extraire les composantes Ambisoniques
à partir d’un système réel identifié. C’est une piste de développement qui prend naissance grâce
aux travaux élaborés dans cette thèse.
265
10.4.6 Type de sources de reproduction
Même si le concept d’amélioration de la reproduction de champs acoustiques par AWFS fut
validé expérimentalement avec un système de haut-parleurs électrodynamiques, d’autres sources
électroacoustiques pourraient être utilisées pour l’AWFS. Certaines de ces sources, comme les
panneaux électroacoustiques, ont déjà offert d’excellents résultats au niveau de l’appréciation
subjective de la WFS. Des sources acoustiques misant sur la vibration de panneaux ou de pa-
rois murales avec des actionneurs inertiels ont déjà aussi offert de bons résultats en WFS. Point
remarquable à ce sujet : toutes ces sources électroacoustiques s’éloignent bien plus que les
haut-parleurs électrodynamiques avec cabinet du modèle utilisé à la base du développement de
la WFS, soit la source ponctuelle. L’AWFS pourrait donc potentiellement compenser toutes ces
erreurs supplémentaires de différence entre le modèle de source et la source réelle de reproduc-
tion pour la WFS. Dans une voie opposée, des sources électroacoustiques linéaires verticales
23
appartiennent à un autre type de sources de reproduction qui, contrairement aux deux précé-
dents, s’approche des modèles de sources linéaires de la WFS
24
. Ce genre de sources pourrait
aussi être utilisé pour l’AWFS. Par contre, en comparaison avec des haut-parleurs électrodyna-
miques, tous les autres types de haut-parleurs mentionnés sont bien plus dispendieux. Ce qui
peut donc limiter leurs usages courants dans un contexte de WFS ou d’AWFS.
10.4.7 Application à la stéréophonie et à la réduction de la diaphonie
Plusieurs savoirs qui proviennent du développement et de la définition de l’AWFS pourraient
être transférés à la réduction de la diaphonie pour deux haut-parleurs et deux capteurs de l’erreur
de reproduction (aux positions des oreilles de l’auditeur) comme on le retrouve dans le Stéréo-
Dipole [Kirkeby et al., 1998], dans les travaux de Bai [Bai et Elliott, 2004], notamment, et
dans plusieurs cas généraux [Ward et Elko, 1999; Kirkeby et al., 1999; Kim et al., 2002]. Par le
découplage du système par SVD, on recoupe les travaux de Bai [Bai et Elliott, 2004] qui mérite-
raient une démonstration expérimentale et des études plus appronfondies. On note d’emblée que
les résultats théoriques et expérimentaux présentés dans cette thèse supportent l’intérêt du pré-
conditionnement du système tel qu’exposé par Bai qui avait, originalement, limité ses parutions
à des considérations théoriques. C’est ainsi que les variantes des algorithmes de réarrangement
de la disposition des modes de rayonnement avant la production des filtres temporels correspon-
23
La corporation Bohlender Graebener fabrique par exemple des sources verticales de presque deux mètres.
24
Certaines adaptations de la WFS seraient tout de même à prévoir.
266
dant aux filtres de synthèse et aux filtres d’analyse (voir le chapitre 8) pourraient être appliqués
à l’approche de Bai qui, selon nos suppositions, devraient grandement améliorer la qualité des
filtres de découplage et de blanchiment utilisés par Bai. Dans tous les cas, ce transfert des acquis
au niveau de la création des filtres de découplage devrait être étudié pour en évaluer le poten-
tiel dans un contexte de réduction de la diaphonie pour un système à deux haut-parleurs et deux
capteurs de l’erreur. L’algorithme modifié de FXLMS pour l’AWFS fonctionnant sur la base des
différences spatiales finies (chapitre 9) pourrait aussi être sollicité pour ce genre d’applications.
10.4.8 Aspects de recherche divers
Parmi les points de recherche présentés dans cette thèse, et de façon plus pointue, certains
aspects techniques ou théoriques précis pourraient faire l’objet de nouvelles recherches ou d’ap-
profondissements. La liste suivante présente les plus importants de ces points sans toutefois les
décrire de façon aussi fine que dans les paragraphes précédents.
– Étude de la relation entre l’expansion en valeurs singulières d’une fonction continue (et
son équivalent discret utilisé au chapitre 7) appliquée en acoustique avec les descriptions
de champs transformés (Fourier-Bessel, harmoniques sphériques, etc) pour la reproduc-
tion de champs acoustiques [Hansen, 1998; Williams, 1999; Poletti, 2000, 2005].
– Étude de la décomposition en valeurs singulières pour des antennes de sources planes ou
sphériques et des antennes de capteurs en trois dimensions.
– Étude de la décomposition en valeurs singulières pour des systèmes de reproduction en
trois dimensions (antennes de sources et de capteurs). Il serait intéressant d’étendre un
lien plus général (en passant par l’expansion en valeurs singulières) avec les théories
générales en deux (et trois) dimensions de la reproduction et de la description de champs
acoustiques [Poletti, 2000]
– Approfondissement de la méthode de construction de filtres de découplage et des filtres
du noyau d’une matrice par décomposition en valeurs singulières.
– Études paramètriques sur l’effet des paramètres généraux du contrôleur AWFS (nombre
de coefficients, etc.).
– Approfondissement de l’utilité et de l’usage de l’algorithme FXLMS pour l’AWFS basée
sur les différences spatiales finies.
Les connaissances acquises lors de cette recherche ont aussi donné naissance à des idées qui
ne sont pas liées directement à la reproduction de champs acoustiques mais qui pourraient faire
267
l’objet de recherches à caractère fondamental, de développements technologiques et d’intérêts
commerciaux considérables. La liste suivante présente une courte description de quelques idées
de recherche. Les propositions demeurent générales pour éviter une divulgation systématique
d’idées originales.
– Création de réverbération artificielle diffusée sur des canaux synthétisés à partir du noyau
des fonctions de transfert directes d’un système de reproduction sonore (5.1, etc.).
– Création de canaux de diffusion de sons d’ambiance ou de sons diffus à partir du noyau des
fonctions de transfert directes d’un système de rerproduction sonore (5.1, etc. ou même
les systèmes utilisés pour la reproduction d’environnements sonores).
– Analyse de réseaux de microphones, utilisés en prise de son [Rumsey, 2001; AES Staff
writer, 2005], par le biais de la décomposition en valeurs singulières.
– Réduction de la diaphonie par filtrage adaptatif lors de la prise de son multipiste en si-
multané (application aux enregistrements de batterie ou même à la prise de son pour la
reproduction et la synthèse d’environnements sonores bruyants).
– Méthode de synthèse optimale de filtres du noyau et des filtres des modes de rayonnement
d’un système électroacoustique.
– Application des méthodes de traitement de l’image numérique pour la localisation d’irré-
gularités et l’identification de motifs dans des mesures vibratoires ou acoustiques.
– Pour la pénalisation dans les problèmes inverses en général : étude des fonctions de base
des courbes en L (voir un exemple à la figure 5.4 (p. 91)) et des liens avec l’usage de la
condition de Picard pour l’établissement d’un paramètre de pénalisation optimal dans les
problèmes inverses en acoustique.
Ces deux listes, nullement exhaustives, devraient être considérées comme des fatras d’idées
qui évoquent un mince aperçu des possibilités connexes aux travaux présentés dans cette thèse.
La section suivante trace des pistes pour de futures recherches qui ne seraient pas spécifiquement
influencées par l’AWFS mais dans lesquelles on peut aisément inscrire la suite de nos travaux
de recherche.
268
10.5 Perspectives de recherches futures
Sans verser dans la vaticination, les recherches entreprises par une pléthore de chercheurs
de par le monde et la disponibilité de plus en plus marquée des systèmes de WFS
25
suggèrent
quelques interprétations possibles quant au futur plus ou moins immédiat de la reproduction du
caractére spatial de l’audition. Ce qui distingue ce qui est présenté ici de ce qui fut proposé aux
sections précédentes, vient du fait que ces perspectives correspondent à des thèmes que nous
souhaiterions développer dans les prochaines années.
L’ensemble des branches possibles pour des recherches futures sur le sujet peut se diviser en
deux. D’abord des solutions génériques plus proches de la reproduction de la musique et du ci-
néma qui doivent être adaptées à plusieurs situations et configurations tout en se connectant sur
un système de transmission ou d’échange de données multimédia brutes pour fin de reproduc-
tion. Ensuite, des solutions plus spécifiques qui doivent tenir compte d’un contexte très précis
d’utilisation et d’un cahier des charges tout aussi précis et particulier. Pour le deuxième type,
des travaux de recherche et de développement doivent être entrepris pour chacun des cas traités.
Cette voie semble riche en terme de problèmes de recherche et en découvertes potentielles.
Ainsi, en guise d’exemple du second type, si une des applications, et un des contextes parti-
culiers d’usage, de la reproduction physique de champs acoustiques fut liée à un outil de concep-
tion aux premiers paragraphes de cette conclusion, elle peut aussi être utilisée comme produit de
vente et de démonstration des effets de traitements acoustiques optionnels auquel des acheteurs
doivent faire face. On pense par exemple à une forme nouvelle d’auralisation (d’«auralization»
en anglais qui équivaut à «visualisation» mais dans le domaine auditif) qui impliquerait des
sources acoustiques couplées à des imitations visuelles et spatiales d’environnements donnés.
La différence avec l’auralisation classique vient alors de l’usage de haut-parleurs plutôt que
de casques d’écoute. C’est un axe de recherche que nous souhaiterions développer dans un
futur immédiat. Ce genre de travaux, qui se branchent sur un problème spécifique, doit être
alimenté par des besoins commerciaux ou industriels concrets qui proviennent carrément de
l’industrie. Dans ce cas, les difficultés et opportunités rencontrées peuvent surgir par l’existence
de contraintes pratiques sévères ou de compromis possibles étant donné la spécificité du cas et
les points essentiels qui méritent une attention.
25
On note plus spécialement une montée de l’intérêt pour la WFS depuis un ou deux ans : de plus en plus de
chercheurs en Amérique du Nord dédiés à ce thème, projets d’étudiants de premier cyle, disponibilité de logiciels
libres de WFS, parutions de brochures de vulgarisation, etc.
269
10.6 Conclusion
Cette thèse fut dédiée à la description de l’amélioration physique de la reproduction de
champs acoustiques à l’aide du contrôle actif. Les hypothèses de départ étant la proximité de la
synthèse de champs acoustiques de type WFS et du contrôle actif du bruit dans un paradigme
plus général de reproduction de champs acoustiques, les objectifs – atteints comme on peut le
prouver en liant les chapitres et la conclusion de cette thèse aux objectifs posés au chapitre
3 – furent alors définis comme une possible combinaison de ces savoirs et techniques pour
l’amélioration de la reproduction de champs acoustiques.
La solution donnée en réponse à ces objectifs et, implicitement, à ces questions de recherche
s’est cristalisée dans la définition de la reproduction de champs acoustiques de type AWFS, soit
la WFS adaptative. Le caractère scientifique et les originalités de cette thèse se sont assemblés
tout au long des travaux pour former un ensemble. Dans une perspective plus générale, on note
principalement trois originalités technologiques qui se démarquent des autres points d’origina-
lité. De ces trois originalités principales, deux découlent de la première qui, elle, est la définition
de l’AWFS par le biais d’un objectif de minimisation de l’erreur de reproduction en des points
de l’espace tout en évitant tout éloignement par rapport à la solution de type WFS, posée a
priori. De là suivent les deux autres originalités majeures. Premièrement l’analyse des proprié-
tés de l’AWFS et l’établissement de sa réalisation pratique sur la base de la décomposition en
valeurs singulières du système et, deuxièmement, la création d’un lien conceptuel entre AWFS,
WFS et Ambisonie. Qui plus est, ces concepts furent validés expérimentalement : un système
fut construit et testé.
Si l’on considère ces travaux de recherche dans un contexte historique plus vaste de repro-
duction du son, de spatialisation sonore ou même d’«architecture auditive» (pour utiliser un
néologisme d’actualité) [Blesser et Salter, 2007], on doit conserver à l’esprit que ces travaux
s’inscrivent dans une vaste et riche suite historique [Sterne, 2003; Blesser et Salter, 2007] qui,
tel que proposé en cette conclusion, génèrera tout autant de nouveautés et de recherches dans un
avenir proche et plus lointain. Et ce, d’autant plus que l’intérêt pour la spatialisation sonore est
en croissance à tous les niveaux : académique, commercial, résidentiel, etc. Les progrès en cette
voie ne pourront se faire que par l’accumulation de recherches telle que celle présentée par cette
thèse. C’est un travail de durée qui doit impliquer maints chercheurs talentueux de plusieurs
disciplines.
270
Ce qui, indirectement, évoque une des difficultés remarquables pour la suite des recherches
sur la reproduction spatiale du son : soit l’établissement et l’achèvement de projets multidisci-
plinaires. Quoique le terme soit en vogue et que le nombre de programmes de subventions qui
encouragent de tels types de recherche, la recherche multidisciplinaire et ses rouages internes
restent peuplés de difficultés et d’entraves diverses. En soit, la recherche, ou les travaux, multi-
disciplinaire devrait, elle-même faire l’attention de recherches et d’études favorisant différents
points de vue : historique, pédagogique, etc.
Quoiqu’il en soit, à la lueur des résultats et publications impliqués dans la production de
cette recherche, la reproduction spatiale du son semble dotée d’un avenir prometteur et digne de
travaux futurs.
271
BIBLIOGRAPHIE
AES (2003) Binaural audio in the era of virtual reality – A digest of research papers presented at recent
AES conventions, Journal of the Audio Engineering Society, vol. 51, no 11, p. 1066–1072.
AES STAFF WRITER (2005) Multichannel audio systems and techniques, Journal of the Audio Enginee-
ring Society, vol. 53, no 4, p. 329–335.
AES TECHNICAL COMITTEE ON MULTICHANNEL AND BINAURAL AUDIO TECHNOLOGY (2001)
Multichannel sound systems and operation, Audio Engineering Society.
AHMAD R., KUNDU T. (2005) Modeling of phased array transducers, J. Acoust. Soc. Am., vol. 117,
no 4, p. 1762–1776.
AHN S.S., VOLTZ P.J. (1996) Convergence of the delayed normalized LMS algorithm with decreasing
step size, IEEE Transactions on Signal Processing, vol. 44, no 12, p. 3008–3016.
AHNERT W. (1987) Complex simulation of acoustic sound fields by the Delta Stereophony System (DSS),
Journal of the Audio Engineering Society, vol. 35, no 9, p. 643–652.
ALLISON R.F. (1976) The sound field in home listening rooms, II, Journal of the Audio Engineering
Society, vol. 24, no 1, p. 14–19.
ALTMAN R. (1992) Sound theory – Sound practice, AFI Film reader.
APEL A., RÖDER T., BRIX S. (2004) Equalization of wave field synthesis systems, Convention paper
6121, AES 116th convention.
ASANO F., SWANSON D.C. (1995) Sound equalization in enclosures using modal reconstruction, J.
Acoust. Soc. Am., vol. 98, no 4, p. 2062–2069.
AUDIO ENGINEERING SOCIETY (1981) 100 years with stereo : The beginning, Journal of the Audio
Engineering Society, vol. 29, no 5, p. 368–372.
AUSTIN L. (2001) Sound diffusion in composition and performance practice II : An interview with Am-
brose Field, Computer Music Journal, vol. 25, no 4, p. 21–30.
272
BAI M.R., ELLIOTT S.J. (2004) Preconditioning multichannel adaptive filtering algorithms using EVD-
and SVD-based signal prewhitening and system decoupling, Journal of Sound and Vibration, vol. 270,
no 4-5, p. 639 – 655.
BAI M.R., LIN C. (2005) Microphone array signal processing with application in three-dimensional
spatial hearing, Journal of the Acoustical Society of America, vol. 117, no 4 I, p. 2112 – 2121.
BAI M.R., TUNG C.W., LEE C.C. (2005) Optimal design of loudspeaker arrays for robust cross-talk
cancelllation using the Taguchi method and the genetic algorithm, J. Acoust. Soc. Am., vol. 117, no 5,
p. 2802–2813.
BALLOU et al. G. (1991) Handbook for sound engineers, Howard W. Sams Company.
BARBOUR J.L. (2003) Elevation perception : Phantom images in the vertical hemi-sphere, Proceedings
of the AES 24th international conference, p. 138–145.
BASTYR K.J., CAPONE D.E. (2003) On the Acoustic Radiation from a Loudspeaker’s Cabinet, Journal
of the Audio Engineering Society, vol. 51, no 4, p. 234–243.
BAYLES F. (1992) Musique acousmatique, Buchet/Castel.
BECKER J., SAPP M. (2001) Synthetic soundfields for the rating of spatial perceptions, Applied Acous-
tics, vol. 62, p. 217–228.
BEGAULT D. (1998) Virtual acoustics, aeronautics, and communications, Journal of the Audio Enginee-
ring Society, vol. 46, no 6, p. 520–530.
BEGAULT D.R. (1994) 3-D sound for virtual reality and multimedia, AP Profesionnal.
BEGAULT D.R. (1999) Virtual acoustics, aeronautics, and communications, Journal of the Audio Engi-
neering Society, vol. 46, p. 520–530.
BELLMANN M. (2003) Evaluation of vibration perception in pasenger vehicles and aircrafts, Acta Acus-
tica, vol. 89, no SUPP., p. S11.
BERANEK L.L. (1954) Acoustics, McGraw-Hill Book Company.
BERG J., RUMSEY F. (2003) Systematic evaluation of perceived spatial quality, Proceedings of the AES
24th international conference, p. 184–198.
BERKHOUT A.J. (1988) A holographic approach to acoustic control, Journal of the Audio Engineering
Society, vol. 36, no 12, p. 977–995.
BERKHOUT A.J., BOONE M.M., DE VRIES D. (1995) Generation of sound fields using wave field
synthesis, an overview, Active 95.
273
BERKHOUT A.J., BOONE M.M., KESSELMAN C. (1984) Acoustic impulse response Measurement : A
new technique, Journal of the Audio Engineering Society, vol. 32, no 10, p. 740–746.
BERKHOUT A.J., DE VRIES D., BOONE M.M. (1980) A new method to acquire impulse response in
concert halls, Journal of the Acoustical Society of America, vol. 68, no 1, p. 179–183.
BERKHOUT A.J., DE VRIES D., SONKE J.J. (1997) Array technology for acoustic wave field analysis
in enclosures, J. Acoust. Soc. Am., vol. 102, no 5, p. 2757–2770.
BERKHOUT A.J., DE VRIES D., VAN DEN OETELAAR B.W. (1999) A wave field extrapolation approach
to acoustical modeling in enclosed spaces, Journal of the Acoustical Society of America, vol. 105,
no 3, p. 1725–1733.
BERKHOUT A.J., DE VRIES D., VOGEL P. (1992) Wave front synthesis : A new direction in electro-
acoustics, Proceedings of the 93rd AES Convention, p. 3379 (F–2).
BERKHOUT A.J., DE VRIES D., VOGEL P. (1993) Acoustic control by wave field synthesis, Journal of
the Acoustical Society of America, vol. 93, no 5, p. 2764–2778.
BETLEHEM T., ABHAYAPALA T.S. (2005) Theory and design of sound field reproduction in reverberant
rooms, Journal of the Acoustical Society of America, vol. 117, no 4 I, p. 2100 – 2111.
BHARITKAR S., KYRIAKAKIS C. (2004) Nonlinear projection algorithm for evaluating multiple listener
equalization performance, Convention paper 6206, Proceedings of the 117th AES Convention.
BHARITKAR S., KYRIAKAKIS C. (sans date) Eigenfiilters for signal cancellation.
BÉLANGER P., BERRY A., ST-AMANT Y., RAJAN S. (2006) Active structural acoustic control of a Bell
407 main transmission, Proceedings of the 62nd American Helicopter Society Annual Forum.
BLAUERT J. (1999) Spatial hearing – The psychophysics of human sound localization, The MIT Press.
BLEDA S., LÓPEZ J.J., ESCOLANO J., PUEO B. (2005) Design and implementation of a compatible
wave field synthesis authoring tool, Convention paper 6402, Proceedings of the 118th AES Conven-
tion.
BLEINSTEIN N. (1984) Mathematical methods for wave phenomena, Academic Press.
BLESSER B., SALTER L.R. (2007) Spaces speak – Are you listening ?, MIT Press.
BLUMLEIN A.D. (1933) Improvements in and relating to sound-transmission, sound-recording and
sound-reproducing systems, British Patent Specification 394,325.
BOONE M.M. (2001) Acoustic rendering with wave field synthesis, ACM siggraph and enrographics
campfire : Acoustic rendering for virtual environments.
274
BOONE M.M., OUWELTJES O. (1997) Design of a loudspeaker system with a low-frequency cardioidlike
radiation pattern, Journal of the Audio Engineering Society, vol. 45, no 9, p. 702–707.
BOONE M.M., VERHEIJEN E.N.G. (1997) Qualification of sound generated by wave field synthesis for
audio reproduction, Convention paper 4457, AES 102nd convention.
BOONE M.M., VERHEIJEN E.N.G., TOL P.F.V. (1995) Spatial sound-field reproduction by wave-field
synthesis, Journal of the Audio Engineering Society, vol. 43, no 12, p. 1003–1012.
BORWICK J. (1988) Loudspeaker and headphone handbook, Butterworths.
BOUCHARD M. (2002) Numerically stable fast convergence least-squares algorithms for multichannel
active sound cancellation systems and sound deconvolution systems, Signal Processing, vol. 82, p.
721–736.
BOUCHARD M. (2003) Multichannel affine and fast affine projection algorithms for active noise control
and acoustic equalization systems, IEEE transactions on speech and audio processing, vol. 11, no 1,
p. 54–60.
BOUCHARD M., QUEDNAU S. (2000) Multichannel recursive-least-squares algorithms and fast-
transversal-filter algorithms for active noise control and sound reproduction systems, IEEE transac-
tions on speech and audio processing, vol. 8, no 5, p. 606–618.
BOULANGER R. (2000) The Csound book : Perspectives in software synthesis, sound design, signal
processing, and programming, The MIT Press.
BRADLEY J.S., SOULDORE G.A. (1995) The influence of late arriving energy on spatial impression,
Journal of the Acoustical Society of America, vol. 97, no 4, p. 2263–2271.
BRANDSTEIN M., WARD D. (2001) Microphone array – Signal processing techniques and applications,
Springer.
BRAVO T., ELLIOTT S.J. (2004) Variability of low frequency sound transmission measurements, J.
Acoust. Soc. Am., vol. 115, no 6, p. 2986–2997.
BREGMAN A.S. (1990) Auditory scene analysis : The perceptual organization of sound, The MIT Press.
BRÜEL P.V. (1951) Sound insulation and room acoustics, Chapman & Hall Ltd.
BRIX S., SPORER T., PLOGSTIES J. (2001) CARROUSO – An european approach to 3D-audio, AES
Convention.
BRUNEAU M. (1983) Introduction aux théories de l’acoustique, Université du Maine.
275
BUCHNER H., SPORS S., KELLERMANN W. (2004) Full-duplex systems for sound field recording and
auralization based on wave field synthesis, Convention paper, AES 116th convention.
BURKHARD M.D., SACHS R.M. (1975) Anthropometric manikin for acoustic research, Journal of the
Acoustical Society of America, vol. 58, no 1, p. 214–222.
CABELL R., PALUMBO D., VIPPERMAN J. (2001) A principal component feedforward algorithm for
active nosie control : Flight test results, IEEE Transactions on Control Systems Technology, vol. 9,
no 1, p. 76–83.
CABELL R.H., FULLER C.R. (1999) A principal component algorithm for feedforward active noise and
vibration control, Journal of Sound and Vibration, vol. 227, no 1, p. 159–181.
CABRERA D., TILLEY S. (2003) Vertical localization and image size effects in loudspeaker reproduction,
Proceedings of the AES 24th international conference, p. 146–153.
CAMRAS M. (1968) Approach to recreating a sound field, Journal of the Acoustical Society of America,
vol. 43, no 6, p. 1425–1431.
CAMURRI A., FERRENTINO P. (1999) Interactive environments for music and multimedia, Multimedia
Systems, vol. 7, p. 32–47.
CAULKINS T., CORTEEL E., WARUSFEL O. (2003) Wave field synthesis interaction with the listening
environment, improvements in the reproduction of virtual sources situated inside the listening room,
Proceedings of the 6th international conference on digital audio effects (DAFX).
CHEN G., SONE T., ABE M. (1996) Effects of multiple secondary paths on convergence properties in
active noise control systems with LMS algorithm, Journal of Sound and Vibration, vol. 195, no 1, p.
217–228.
CHEN G., SONE T., SAITO N., ABE M., MAKINO A. (1998) The stability and convergence characteris-
tics of the delayed-X LMS algorithm in ANC systems, Journal of Sound and Vibration, vol. 216, no 4,
p. 637–648.
CHENG C.I., WAKEFIELD G.H. (2001) Moving sound source synthesis for binaural electroacoustic
music using interpolated head-related transfer functions, Computer Music Journal, vol. 25, no 4, p.
57–80.
CHEVRET P., MAIER R., NOGUES J., PERISSE J., THIRARD C. (2006) Towards virtual sound for air-
craft simulation, Acoustics Bulletin, vol. 31, no 1, p. 25–27.
CHOI J.W., KIM Y.H. (2002) Generation of an acoustically bright zone with an illuminated region using
multiple sources, J. Acoust. Soc. Am., vol. 111, no 4, p. 1695–1700.
276
CHOI J.W., KIM Y.H. (2004a) Active controls for the enhancement of sound field, Proceedings of Active
2004.
CHOI J.W., KIM Y.H. (2004b) Manipulation of sound intensity within a selected region using multiple
sources, J. Acoust. Soc. Am., vol. 116, no 2, p. 843–852.
CHUN I., RAFAELY B., JOSEPH P. (2003) Experimental investigation of spatial correlation in broadband
reverberant sound fields, Journal of the Acoustical Society of America, vol. 114, no 4, p. 1995–1998.
CLOZIER C. (2001) The Gmebaphone and Cybernéphone instrument, Computer Music Journal, vol. 25,
no 4, p. 81–90.
COOK P.R. (2002) Real sound synthesis for interactive applications, A K Peters.
COOPER D.H., BAUCK J.L. (1989) Prospects for transaural recording, Journal of the Audio Engineering
Society, vol. 37, no 1/2, p. 3–19.
CORTEEL E. (2006a) Equalization in an extended area using multichannel inversion and wave field
synthesis, Journal of the Audio Engineering Society, vol. 54, p. 1140–1161.
CORTEEL E. (2006b) On the use of irregurlarly spaced loudspeaker arrays for wave field synthesis,
potential impact on spatial aliasing frequency, Proceedings of the 9th international conference on
digital audio effects (DAFX).
CORTEEL E., HORBACH U., PELLEGRINI R.S. (2002) Multichannel inverse filtering of multiexciter dis-
tributed mode loudspeakers for wave field synthesis, Convention paper 5611, 112th Audio Engineering
Society Convention.
CROCKER M.J. (1998) Handbook of acoustics, John Wiley and Sons.
CROWHURST N.H. (1957) Basic requirements for a stereophonic system, Journal of the Audio Enginee-
ring Society, vol. 5, no 3, p. 129–134.
DAMISCH H. (1987) L’origine de la perspective, Idées et recherches, Flammarion.
DANIEL J. (2001) Représentation de champs acoustiques, application à la transmission et à la repro-
duction de scènes sonores complexes dans un contexte multimédia, Ph.D. thesis, Université Paris 6.
DANIEL J. (2003) Spatial sound encoding including near field effect : introducing distance coding filters
and a viable, new ambisonic format, Proceedings of the AES 23th international conference.
DANIEL J., RAULT J.B., POLACK J.D. (1999) Acoustic properties and perceptive implications of ste-
reophonic phenomena, AES 16th International conference on spatial sound reproduction.
277
DAPELO R., MACELLONI S. (1999) A real time algorithm sterephonic-multi-channel localization of
moving sound sources, Proceedings of the AES 16th international conference, p. 470–477.
DAVIS D., DAVIS C. (1997) Sound system engineering, Focal Press.
DAVIS M.F. (2003) History of spatial coding, Journal of the Audio Engineering Society, vol. 51, no 6, p.
554–569.
DE DIEGO M., GONZALEZ A., FERRER M., PIÑERO G. (2002) Performance comparison of multichan-
nel active noise control equalizers, Proceedings of Active 2002, p. 413–424.
DE VINCI L. (1987) Traité de la peinture, Berger-Levrault.
DE VRIES D. (1996) Sound reinforcement by wavefield synthesis : Adaptation of the synthesis operator
to the loudspeaker directivity characteristics, Journal of the Audio Eng. Soc., vol. 44, no 12, p. 1120–
1132.
DE VRIES D., BOONE M.M. (1999) Wave field synthesis and analysis using array technology, IEEE
workshop on applications of signal processing to audio and acoustics.
DE VRIES D., BOONE M.M. (2003) Experience with a wave field synthesis system based on multi-
actuator panel loudspeaker, Proceedings of the AES 24th international conference, p. 29.
DE VRIES D., BRIX S., HULSEBOS E. (2002) Measurements of church impulse responses using a cir-
cular microphone array for natural spatial reproduction of a choir concert recording, Proceedings of
the 21st AES Conference, p. 153–158.
DE VRIES D., REIJNEN A.J., SCHONEWILLE A. (1994a) The wave field synthesis concept applied to
generation of reflections and reverberation, Convention paper 3813, AES 96th convention.
DE VRIES D., START E.W., VALSTAR V.G. (1994b) The wave field synthesis concept applied to sound
reinforcement : Restrictions and solutions, Convention paper 3812, AES 96th convention.
DELALANDE F. (2001) Le son des musiques, Buchet/Chastel.
DELLER J.R. (1994) Tom, Dick, and Mary discover the DFT, IEEE Signal Processing Magazine, vol. 11,
no 2, p. 36 – 50.
DENES P.B., PINSON E.N. (1963) La chaîne de communication verbale, Les laboratoires du Téléphone
Bell.
DICKASON V. (2000) The loudspeaker design cookbook, Audio Amateur Press.
DOBBINS P.F. (1984) The use of non-ideal microphones in directional arrays, 75th AES Convention, p.
Convention preprint 2062.
278
DRUYVESTEYN W.F., GARAS J. (1997) Personal sound, Journal of the Audio Engineering Society,
vol. 45, no 9, p. 685–701.
EARGLE J. (1986) Handbook of recording engineering, Van Nostrand Reinhold Company.
ELLIOTT S. (2001) Signal processing for active control, Academic Press.
ELLIOTT S.J. (1993) Radiation modes and the active control of sound power, J. Acoust. Soc. Am.,
vol. 94, no 4, p. 2194–2204.
ELLIOTT S.J. (2000) Optimal controllers and adaptive controllers for multichannel feedforward control
of stochastic disturbances, IEEE Transactions on Signal Processing, vol. 48, no 4, p. 1053–1060.
ELLIOTT S.J., BHATIA L.P., DEGHAN F.S., FU A.H., STEWART M.S., WILSON D.W. (1994) Practi-
cal implementation of low-frequency equalization using adaptive digital filters, Journal of the Audio
Engineering Society, vol. 42, no 12, p. 988–998.
ELLIOTT S.J., BOUCHER C.C., NELSON P.A. (1992) The behavior of a multichannel active control
system, IEEE Transactions on signal processing, vol. 40, no 5, p. 1041–1052.
ELLIOTT S.J., NELSON P.A. (1989) Multiple-point equalization in room using adaptive digital filters,
Journal of the Audio Engineering Society, vol. 37, no 11, p. 899–907.
ELMORE W.C., HEALD M. (1969) Physics of waves, Dover.
EPAIN N., FRIOT E., RABAU G. (2004) Indoor sonic boom reproduction using ANC, Proceedings of
Active 2004.
ESCOLANO J., PUEO B., BLEDA S., LÓPEZ J.J. (2005) An approach to discrete-time modelling aura-
lization for wave field synthesis applications, Convention paper 6425, Proceedings of the 118th AES
Convention.
EVANS M.J., TEW A.I., ANGUS J.A.S. (sans date) Spatial audio teleconferencing – Which way is
better ?, diffusé sur Internet.
FAHLINE J.B. (2004) Computing fluid-coupled resonance frequencies, mode shapes, and damping loss
factors using the singular value decomposition, Journal of the Acoustical Society of America, vol.
115, no 4, p. 1474 – 1482.
FAHNLINE J.B. (1995) Active control of the sound radiated by a vibrating body using only a layer of
simple sources, J. Acoust. Soc. Am., vol. 97, no 4, p. 2249–2254.
FAHY F. (2003) Comment on Development of panel loudspeaker system : design evaluation and enhan-
cement [J. Acoust. Soc. Am. 106, 2751-2761 (2001)] (L), Journal of the Acoustical Society of America,
vol. 113, no 1, p. 43–44.
279
FALCH C., NOISTERING M., WARUM S., HÖLDRICH R. (2003) Room simulation for binaural sound
reproduction using measured spatiotemporal impulse responses, Proceedings of the 6th international
conference on digital audio effects (DAFX).
FARINA A., UGOLOTTI E. (1999) Subjective comparison between stereo dipole and 3D ambisonic sur-
round systems for automotive applications, Proceedings of the AES 16th international conference, p.
532–543.
FENG J., GAN W.S. (1998) Broadband active noise compressor, IEEE signal processing letters, vol. 5,
no 1, p. 11–14.
FIELDER L.D. (2001) Practical Limits for Room Equalization, Proceedings of the AES 11th convention.
FIELDER L.D. (2003) Comments on «Analysis of traditional and reverberation-reducing methods of
room equalization», Journal of the Audio Engineering Society, vol. 51, no 12, p. 1186–1192.
FONTANA F., GIBIN L., ROCCHESSO D. (1999) Common pole equalization of small rooms using a two-
step real-time digital equalizer, Proc. 1999 IEEE Workshop on applications of signal processing to
audio and acoustics, p. W99–1,W99–4.
FORD N., RUMSEY F., NIND T. (2003) Evaluating spatial attributes of reproduced audio events using a
graphical assessment language – Understanding differences in listener depictions, Proceedings of the
AES 24th international conference, p. 171–183.
FRAUNHOFER, INSTITUT INTEGRIERTE SCHALTUNGEN (2003) Operation manual for the Fraunhofer
wave field synthesis system, Fraunhofer, IIS, Arbeitsgruppe Elecktronische Medientechnologie.
FREIHEIT R.R. (2003) Active acoustics for music rehearsal rooms, J. Acoust. Soc. Am., vol. 114, no 4,
Pt. 2, p. 2342.
FULLER C.R., ELLIOTT S.J., NELSON P.A. (1996) Active control of vibration, Academic Press.
FUSTER L., LÓPEZ J.J., GONZÁLEZ A., ZUCCARELLO P.D. (2005) Room compensation using multi-
channel inverse filters for wave field synthesis systems, Convention paper 6401, AES 118th convention.
GAO F.X.Y., SNELGROVE W.M. (1992) Adaptive linearization of a loudspeaker, Convention paper
3377, 93rd Audio Engineering Society Convention.
GARAS J. (1999) Adaptive 3D sound systems, Technische Universiteit Eindhoven.
GARAS J., SOMMEN P. (sans date) Adaptive filtering approach to multichannel audio reproduction sys-
tems, diffusé sur Internet.
GARCIA-BONITO J., ELLIOTT S.J., BOUCHER C.C. (1997) Generation of zones of quiet using virtual
microphone arrangement, Journal of the Acoustical Society of America, vol. 101, no 6, p. 3498–3516.
280
GARDNER W.G. (1998) 3-D audio using loudspeakers, Kluwer Academic Publishers.
GAUTHIER P.A., BERRY A. (2006) Adaptive wave field synthesis with independent radiation mode
control for active sound field reproduction : Theory, Journal of the Acoustical Society of America,
vol. 119, no 5, p. 2721–2737.
GAUTHIER P.A., BERRY A., WOSZCZYK W. (2005a) Creative sound projection using compact loud-
speaker arrays, MusicWorks, vol. 93, p. 14–16.
GAUTHIER P.A., BERRY A., WOSZCZYK W. (2005b) Sound-field reproduction in-room using optimal
controle techniques : Simulations in the frequency domain, Journal of the Acoustical Society of Ame-
rica, vol. 117, no 2, p. 662–678.
GAUTHIER P.A., BERRY A., WOSZCZYK W. (2005c) Évaluation objective de la synthèse de champs
acoustiques et recherches récentes sur la reproduction de champs acoustiques en salle, 73 Congrès de
l’ACFAS.
GENEREUX R. (1992) Adaptive filters for loudspeakers and rooms, Convention paper 3375, 93rd Audio
Engineering Society Convention.
GENUIT K., BRAY W.R. (2002) Prediction of sound and vibration in virtual automobile, Sound and
Vibration, vol. 36, no 7, p. 12–19.
GERZON M.A. (1973) Periphony : With-height Sound Reproduction, Journal of the Audio Engineering
Society, vol. 21, no 1, p. 2–10.
GERZON M.A. (1985) Ambisonics in multichannel broadcasting and video, Journal of the Audio Engi-
neering Society, vol. 33, no 11, p. 859–871.
GIOMI F., MEACCI D., SCHWOON K. (2003) Live electronics in Luciano Berio’s music, Computer
Music Journal, vol. 27, no 2, p. 30–46.
GLASGAL R. (2003) Surround ambiophonics recording and reproduction, Proceedings of the AES 24th
international conference, p. 11–20.
GOLUB G.H., VAN LOAN C.F. (1996) Matrix computations, John Hopkins University Press, 3
e
ed.
GOVER B.N., RAYN J.G., STINSON M.R. (2003) Designing a spherical microphone array for the di-
rectional analysis of reflections and reverberation, Convention paper 5862, Proceedings of the 115th
AES Convention.
GOVER B.N., RYAN J.G., STINSON M.R. (2004) Measurements of directional properties of reverberant
sound fields in rooms using a spherical microphone array, J. Acoust. Soc. Am., vol. 116, no 4, p.
2138–2148.
281
GÉRARD A., BERRY A., MASSON P. (2005) Control of tonal noise from subsonic fans. Part 1 : Recons-
truction of aeroacoustic sources from far-field acoustic pressure, Journal of Sound and Vibration, vol.
288, p. 1049–1075.
GRAU O. (2003) Virtual art – From illusion to immersion, MIT Press.
GRIESINGER D. (1995) Design and performance of multichannel time variant reverberation enhance-
ment systems, Active 95.
GRIESINGER D. (1997) The psychoacoustics of apparent source width, spaciousness and envelopment
in performance spaces, Acustica, acta acustica, vol. 83, p. 721–731.
GUILLAUME M., GRENIER Y. (2006) Sound field analysis based on generalized prolate spheroidal wave
sequences, Convention paper, AES 120th convention.
HAMANN S., WALTER W., FINTERWALDER R. (2004) Development of a simulator audio system based
on COTS sound synthesis software, AIAA Modeling and Simulation Technologies Conference, vol. 2,
p. 673–681.
HANSEN C. (1998) Rank-deficient and discrete ill-posed problems, SIAM.
HARTMANN W.M. (1983) Localization of sound in rooms, Journal of the Acoustical Society of America,
vol. 74, no 5, p. 1380–1391.
HARTMANN W.M., WITTENBERG A. (1999) On the externalization of sound images, Journal of the
Acoustical Society of America, vol. 99, no 6, p. 3678–3688.
HATZIANTONIOU P.D., MOURJOPOULOS J.N. (2004) Errors in real-time room acoustics dereverbera-
tion, J. Audio Eng. Soc., vol. 52, p. 883–899.
HE Y., DJORDJEVICH A., LUO F. (1998) Sound rendering and its application in virtual cockpit, Procee-
dings of the International Conference on Signal Processing, vol. 2, p. 1412–1415.
HENRIKSEN F.E. (2002) Space in electroacoustic music : Composition, performance and perception of
musical space, Thèse de doctorat (City University, Londre).
HIYAMA K., KOMIYAMA S., HAMASAKI K. (2002) The minimum number of loudspeakers and its ar-
rangement for reproducing the spatial impression of diffuse sound field, AES Convention.
HONDA S., HAMADA H. (1999) Active noise control around a human’s head using adaptive prediction
method, Active 99, p. 1305–1316.
HORBACH U., BOONE M.M. (1999) Future transmission and rendering formats for multichannel sound,
Proceedings of the AES 16th international conference, p. 409–418.
282
HSIAO F.B., HAN S.Y., HSIEH S.C., WANG L.K. (2004) Sound source separation and identification for
aircraft Cockpit Voice Recorder, Journal of Aerospace Computing, Information and Communication,
p. 466–483.
HULSEBOS E., DE VRIES D. (2002) Parametrization and reproduction of concert hall acoustics measu-
red with a circular microphone array, Convention paper 5579, Proceedings of the 112th AES Conven-
tion.
HULSEBOS E., SCHUURMANS T., DE VRIES D., BOONE R. (2003) Circular microphone array for dis-
crete multichannel audio recording, Convention paper 5716, Proceedings of the 114th AES Conven-
tion.
HULSEBOS E.M. (2004) Auralization using wave field synthesis, Thèse de doctorat, Université Tech-
nique de Delft.
IHLE M., KROSCHEL K., RIEDLINGER R. (2000) A novel noise suppresion algorithm using a very small
microphone array, Convention paper 5252, AES 109th Convention.
ISE S. (1999) A principle of sound field control based on the Kirchhoff-Helmholtz Integral Equation and
the theory of inverse system, Acta Acustica, vol. 85, p. 78–87.
JACQUES R., ALBRECHT B., MELCHIOR F., DE VRIES D. (2005) An approach for multichannel recor-
ding and reproduction of sound source directivity, Convention paper, AES 119th convention.
JAFFE J.C. (2003) Electronic architecture : An acoustician’s approach, J. Acoust. Soc. Am., vol. 114, no
4, Pt. 2, p. 2341.
JANSSENS K., ADAMS M., PONSEELE O.V.D., DEBLAUWE F. (2003) The integration of experimental
models in a real-time virtual car sound engineering environment, Computational and Experimental
Methods, vol. 9, p. 213–222.
JESSEL M. (1973) Acoustique théorique : propagation et holophonie, Masson et cie.
JIN C., BEST V., VAN SCHAIK A., CARLILE S. (2003) Psychoacoustic evaluation of a perceptual
spatial-audio coding technique for speech and noise, Proceedings of the AES 24th international confe-
rence, p. 94–99.
JOT J.M. (1999) Real-time signal processing of sounds for music, multimedia and interactive human-
computer interfaces, Multimedia Systems, vol. 7, p. 55–69.
JOUHANEAU J. (1997) Acoustique des salles et sonorisation, Lavoisier Tec&Doc.
JOUHANEAU J. (2000) Notions élémentaires d’acoustique, électroacoustique, Éditions TEC & DOC.
JUNGER M.C., FEIT D. (1993) Sound, structures, and their interactions, Acoustical Society of America.
283
KABAL P. (1983) Stability Of Adaptive Minimum Mean Square Error Equalizers Using Delayed Adjust-
ment, IEEE Transactions on Communications, vol. CM-31, no 3, p. 430 – 432.
KAHANA Y., NELSON P.A., YOON S. (1999) Experiments on the synthesis of virtual acoustic sources
in automotive interiors, Proceedings of the AES 16th international conference, p. 218–232.
KAWAKAMI F., SHIMIZU Y. (1990) Active field control in auditoria, Applied Acoustics, vol. 31, p. 47–
75.
KAWAMURA A., MATSUMOTO M., NUMAZU H., SERIKAWA M. (1993) The multi-channel sound field
control system in a multi-purpose hall, Applied Acoustics, vol. 38, p. 319–332.
KELLER M., ROURE A., MARROT F. (2006) Acoustic field reproduction for psychoacoustic experi-
ments : application to aircraft interior noise, Proceedings of Active 2006.
KENDALL G.S. (1995a) A 3-D Sound Primer : Directional Hearing and Stereo Reproduction, Computer
Music Journal, vol. 19, no 4, p. 23–46.
KENDALL G.S. (1995b) The decorrelation of audio signals and its impact on spatial imagery, Computer
Music Journal, vol. 19, no 4, p. 71–87.
KIM G.T., LEE B.H. (1990) 3-D sound source reconstruction and field reprediction using the Helmholtz
integral equation, J. Sound Vib., vol. 136, no 2, p. 245–261.
KIM S.M., HAN D., WANG S. (2002) A direct inverse method for cross-talk cancellation in a stereo
reproduction system, Proceedings of Active 2002, p. 425–436.
KIM S.M., WANG S. (2003) A Wiener filter approach to the binaural reproduction of stereo sound,
Journal of the Acoustical Society of America, vol. 114, no 6, p. 3179–3188.
KINSLER L.E., FREY A.R., COPPENS A.B., SANDERS J.V. (2000) Fundamentals of acoustics, John
Wiley and Sons.
KIRKEBY O., NELSON P.A. (1993) Reproduction of plane wave sound fields, Journal of the Acoustical
Society of America, vol. 94, no 5, p. 2992–3000.
KIRKEBY O., NELSON P.A. (1999) Digital filter design for inversion problems in sound reproduction,
Journal of the Audio Engineering Society, vol. 47, no 7/8, p. 583–595.
KIRKEBY O., NELSON P.A., HAMADA H. (1998) The «stereo-dipole» – A virtual source imaging system
using two closely spaced loudpseakers, Journal of the Audio Engineering Society, vol. 46, no 5, p.
387–395.
284
KIRKEBY O., NELSON P.A., ORDUÑA-BUSTAMANTE F., HAMADA H. (1995) Inverse Filter Design
and Equalization Zones in Multichannel Sound Reproduction, IEEE Transactions on speech and audio
processing, vol. 3, no 3, p. 185–192.
KIRKEBY O., NELSON P.A., ORDUÑA-BUSTAMANTE F., HAMADA H. (1996) Local sound field repro-
duction using digital signal processing, Journal of the Acoustical Society of America, vol. 100, no 3,
p. 1584–1593.
KIRKEBY O., ORDUNA F., NELSON P.A., HAMADA H. (1993) Inverse filtering in sound reproduction,
Measurement + Control, vol. 26, p. 261–266.
KIRKEBY O., RUBAK P., JOHANSEN L.G., NELSON P.A. (1999) Implementation of cross-talk cancel-
lation networks using warped FIR filters, Proceedings of the AES 16th international conference, p.
358–365.
KLEHS B., SPORER T. (2003) Wave field synthesis in the real world : Part 1 – In the living room,
Convention paper 5727, AES 114th convention.
KLEINER M. (1990) Subjective perception of sound field simulation and variable acoustics by some
passive and electroacoustic systems, Applied Acoustics, vol. 31, p. 197–205.
KLEINER M., DALENBACK B.I., SVENSSON P. (1993) Auralization – An overview, Journal of the Audio
Engineering Society, vol. 41, no 11, p. 861–875.
KOMIYAMA S., NAKAYAMA Y., ONO K., KOIZUMI S. (2003) A loudspeaker-array to control sound
image distance, Acoust. Sci. & Tech., vol. 24, no 5, p. 242–249.
KORENAGA Y., ANDO Y. (1993) A sound-field simulation system and its application to a seat-selection
system, Journal of the Audio Engineering Society, vol. 41, no 11, p. 920–930.
KREBS W., BUTIKOFER R., PLUSS S., THOMANN G. (2003) Modeling of three-dimensional sound
directivity patterns of helicopters, Acta Acustica, vol. 89, no 2, p. 273–279.
KUHN C., PELLEGRINI R., LECKSHAT D., CORTEEL E. (2003) An approach to miking and mixing of
music ensembles using wave field synthesis, Convention paper 5929, Proceedings of the 115th AES
Convention.
KUO S.M., MORGAN D.R. (1996) Active noise control systems, John Wiley and Sons.
KURIYAMA J., FURUKAWA Y. (1989) Adaptive loudspeaker system, Journal of the Audio Engineering
Society, vol. 37, no 11, p. 919–926.
KUSTER M., DE VRIES D., BEER D., BRIX S. (2005) Structural and acoustic analysis of multi-actuator
panel, Convention paper, AES 118th convention.
285
KUSTER M., DE VRIES D., HULSEBOS E.M., GISOLF A. (2004) Acoustic imaging in enclosed spaces :
Analysis of room geometry modifications on the impulse response, J. Acoust. Soc. Am., vol. 116, no 4,
p. 2126–2137.
KUTSCHBACH H. (2003) Verification for spatial sound systems, Proceedings of the AES 24th internatio-
nal conference, p. 100–107.
KUTTRUFF H. (1999) Room acoustics, Spon press.
LAAKSO T.I., VÄLIMÄKI V., KARJALAINEN M., LAINE U.K. (1996) Splitting the unit delay, IEEE
Signal Processing Magazine, vol. 13, no 1, p. 30 – 60.
LANCASTER P., TISMENETSKY M. (1985) The theory of matrices, Academic Press.
LEBOUCHER E., MICHEAU P., BERRY A., L’ESPÉRANCE A. (2002) A stability analysis of a decentra-
lized adaptive feedback active control system of sinusoidal sound in free space, J. Acoust. Soc. Am.,
vol. 111, no 1, p. 189–199.
LENNOX P.P., MYATT T., VAUGHAN J.M. (1999) From surround to true 3-D, Proceedings of the AES
16th international conference, p. 126–135.
LEURIDAN J. (2000) Towards sound quality engineering of the virtual car : From a computer game to
an engineering tool, Europena Journal of Mechanical en Environmental Engineering, vol. 45, no 2, p.
95–97.
LOKKI T., HIIPAKKA J., SAVIOJA L. (1999) Immersive 3-D sound reproduction in a virtual room, Pro-
ceedings of the AES 16th international conference, p. 172–177.
LÓPEZ J.J., BLEDA S., PUEO B., ESCOLANO J. (2005) A sub-band approach to wave-field synthesis
rendering, Convention paper 6403, Proceedings of the 118th AES Convention.
LOPEZ J.J., GONZALEZ A. (2001) Experimental Evaluation of Cross-Talk Cancellation Regarding
Loudspeakers’ Angle of Listening, IEEE Signal Processing Letters, vol. 8, no 1, p. 13–15.
LU H., WU S. (2003) Helmholtz equation least square method for transient nearfield acoustic hologra-
phy, J. Acoust. Soc. Am., vol. 114, no 4, Pt. 2, p. 2443.
MAHIEUX Y., EMERIT M., HELLEQUIN L., MARRO C. (1997) Optimization of sensor placement for
microphone arrays, 102nd AES Convention, p. Convention preprint 4451.
MAHIEUX Y., TOURNEUR G.L., SALIOU A. (1995) A microphone array for multimedia workstations,
98th AES Convention, Convention preprint 3995.
MALHAM D.G. (2001) Toward reality equivalence in spatial sound diffusion, Computer Music Journal,
vol. 25, no 4, p. 31–38.
286
MALHAM D.G., MYATT A. (1995) 3-D Sound Spatialization using Ambisonic Techniques, Computer
Music Journal, vol. 19, no 4, p. 58–70.
MANIKAS A., PROUKAKIS C. (1998) Modeling and estimation of ambiguities in linear arrays, IEEE
transactions on signal processing, vol. 46, no 8, p. 2166–2179.
MASSA F. (1985) Some personal recollections of early experiences on the new frontier of electroacous-
tics during the late 1920s and early 1930s, Journal of the Acoustical Society of America, vol. 77, no 4,
p. 1296–1302.
MÉDUSE, QUÉBEC (2003) Mois Multi, Pamphlet publicitaire.
MELCHOR F., BRIX S., SPORER T., RODER T., KLEHS B. (2003) Wave field synthesis in combination
with 2D video projection, Proceedings of the AES 24th international conference, p. 30–40.
MERIMAA J. (2002) Applications of a 3-D microphone array, Convention paper 5501, AES 109th
Convention.
MERIMAA J., PULKKI V. (2005) Spatial impulse response rendering I : Analysis and synthesis, Journal
of the Audio Engineering Society, vol. 53, no 12, p. 1115–1127.
MEYER D.G. (1984) Digital control of loudspeaker array directivity, Journal of the Audio Engineering
Society, vol. 32, no 10, p. 747–754.
MITSUKI M., MIYASAKA M., OZAWA K. (2005) Reproduced sound pressure level yielding the maxi-
mum auditory presence : Further study on effects of reproduced SPLs on auditory presence, Acoustical
Sciences and Technologies, vol. 26, no 1, p. 79–81.
MIYAZAKI H., WATANABE T., KISHINGA S., KAWAKAMI F. (2003) Active field control (AFC) electro-
acoustic enhancement system using acoustical feedback control, J. Acoust. Soc. Am., vol. 114, no 4,
Pt. 2, p. 2342.
MIYOSHI M., KANEDA Y. (1988) Inverse Filtering of Room Acoustics, IEEE Transactions on Acoustics,
Speech, and Signal Processing, vol. 36, no 2, p. 145–152.
MIYOSHI M., KANEDA Y. (1991) Active control of broadband random noise in a reverberant three-
dimensional space, Noise Control Eng. J., vol. 36, p. 85–90.
MOORE B.C.J. (1989) An introduction to the psychology of hearing, Academic Press.
MORELLI E.A. (1995) Estimating noise characteristics from flight test data using optimal Fourier smoo-
thing, Journal of aircraft, p. 689–695.
MORGAN D.R. (1980) An analysis of multiple correlation cancellation loops with a filter in the auxiliary
path, IEEE Transactions on Acoustics, Speech, and Signal Processing, vol. 28, no 4, p. 454–467.
287
MORSE P.M. (1953) Methods of theoretical physics, Part I, McGraw-Hill.
MORSE P.M. (1995) Vibration and sound, Acoustical society of America.
MORSE P.M., INGARD K.U. (1968) Theoretical acoustics, McGraw-Hill.
MURPHY D.T., BEESON M.J. (2003) Modelling spatial sound occlusion and diffraction effect using the
digital waveguide mesh, Proceedings of the AES 24th international conference, p. 207–216.
MURRAY J.D. (1984) Asymptotic analysis, Springer-Verlag.
NAKANAYASHI K. (1975) A method of analyzing the quadraphonic sound field, Journal of the Audio
Engineering Society, vol. 23, no 3, p. 187–193.
NEELY S.T., ALLEN J.B. (1979) Invertibility of a room impulse response, Journal of the Acoustical
Society of America, vol. 66, no 1, p. 165–169.
NEHER T., BROOKES T., RUMSEY F. (2003) Unidimensional simulation of the spatial attribute ’en-
semble depth’ for training purposes. Part 1 : Pilot study into early reflection pattern characteristics,
Proceedings of the AES 24th international conference, p. 123–137.
NELSON P.A. (1994) Active control of acoustic fields and the reproduction of sound, Journal of Sound
and Vibration, vol. 177, no 4, p. 447–477.
NELSON P.A. (2001) A review of some inverse problems in acoustics, International journal of acoustics
and vibration, vol. 6, no 3, p. 118–134.
NELSON P.A. (2002) Active control for virtual acoustics, Active 2002, p. 67–90.
NELSON P.A., ELLIOT S.J. (1992) Active control of sound, Academic Press.
NELSON P.A., HAMADA H., ELLIOTT S.J. (1992) Adaptive inverse filters for stereophonic sound re-
production, IEEE Transactions on signal processing, vol. 40, no 7, p. 1621–1632.
NELSON P.A., KAHANA Y. (2001) Spherical harmonics, singular-value decomposition and the head-
related transfer function, Journal of Sound and Vibration, vol. 239, no 4, p. 607 – 637.
NELSON P.A., KIRKEBY O., TAKEUCHI T. (1997) Sound fields for the production of virtual acoustic
images, Journal of Sound and Vibration, vol. 204, no 2, p. 386–396.
NELSON P.A., ORDUÑA-BUSTAMANTE F., ENGLER D., HAMADA H. (1996a) Experiments on a system
for the synthesis of virtual acoustic sources, Journal of the Audio Engineering Society, vol. 44, no 11,
p. 990–1007.
288
NELSON P.A., ORDUÑA-BUSTAMANTE F., HAMADA H. (1996b) Multichannel signal processing tech-
niques in the reproduction of sound, Journal of the Audio Engineering Society, vol. 44, no 11, p.
973–989.
NELSON P.A., ROSE J.F.W. (2005) Errors in two-point sound reproduction, J. Acoust. Soc. Am., vol.
118, no 1, p. 193–204.
NELSON P.A., YOON S.H. (2000) Estimation of acoustics source strength by inverse method : Part I,
conditionning of the inverse problem, Journal of Sound and Vibration, vol. 233, no 4, p. 643–668.
NEW ADVENTURES IN SOUND ART (2003) Sound in space – The use of space in musique and sound
art, New Adventures in Sound Art.
NICOL R., EMERIT M. (1999) 3D-sound reproduction over an extensive listening area : A hybrid method
derived from holophony and ambisonic, Proceedings of the AES 16th international conference, p. 436–
453.
NIELSEN S.H. (1993) Auditory distance perception in different rooms, Journal of the Audio Engineering
Society, vol. 41, no 10, p. 755–770.
NOISTERNIG M., SONTACCHI A., MUSIL T., HOLDRICH R. (2003) A 3D ambisonics based binaural
sound reproduction system, Proceedings of the AES 24th international conference, p. 237–241.
NORRIS J.W. (1999) Creating virtual surround using dipole and monopole pressure fields, Proceedings
of the AES 16th international conference, p. 461–469.
OPPENHEIM A.V., SCHAFER R.W. (1989) Discrete-time signal processing, Prentice-Hall.
ORDUÑA F., ENGLER D., NELSON P.A., HAMADA H. (1995) Subjective evaluation of a virtual source
emulation system, Active 95.
PANOFSKY E. (1975) La perspective comme forme symbolique, Les éditions de minuit.
PARK M., RAFAELY B. (2005) Sound-field analysis by plane-wave decomposition using spherical mi-
crophone array, J. Acoust. Soc. Am., vol. 118, no 5, p. 3094–3103.
PASSELLA K., SHARIF B.S., DOBRUCKI A., HINTON O.R. (2001) The wave field analysis and syn-
thesis of an acoustic field in rooms using the concept of a direction of arrival algorithm, Convention
Paper 5355, Proceedings of the 110th AES Convention.
PELLIGRINI R.S. (2002) Perception-based design of virtual rooms for sound reproduction, Proceedings
of the AES 22nd International Conference on Virtual, Synthetic and Entertainment Audio.
PERISSE J., MAGAND F., HENRY M., CHOUTEAU S., LECLERC N. (2003) SD-Lab : An interactive
sound design simulatori for vehicle interior noise, Acta Acustica, vol. 89, no SUPP., p. S90.
289
PETRAUSCH S., RABENSTEIN R. (2006) Efficient 3D simulation of wave propagation with the functional
transformation method, Proceedings of the 18th Sympoisum of Simulation Technique, ASIM.
PHOTIADIS D.M. (1990) The relationship of singular value decomposition to wave-vector filtering in
sound radiation problems, J. Acoust. Soc. Am., vol. 88, no 2, p. 1152–1159.
PIERCE A.D. (1991) Acoustics – An Introduction to its physical principles and applications, Acoustical
Society of America.
PLEGSTIES J., BAUM O., GRILL B. (2003) Conveying spatial sound using MPEG-4, Proceedings of the
AES 24th international conference, p. 58–65.
POLETTI M. (2003) Control of early and late energy in rooms with the variable room acoustics system,
J. Acoust. Soc. Am., vol. 114, no 4, Pt. 2, p. 2341.
POLETTI M.A. (2000) A unified theory of horizontal holographic sound systems, Journal of the Audio
Engineering Society, vol. 48, no 12, p. 1155–1182.
POLETTI M.A. (2005) Three-dimensional surround sound systems based on spherical harmonics, Jour-
nal of the Audio Engineering Society, vol. 53, no 11, p. 1004–1025.
POLTMANN R.D. (1995) Conversion of the delayed LMS algorithm into the LMS algorithm, IEEE Signal
Processing Letters, vol. 2, no 12, p. 223.
POULIN J. (1957) Son et espace, La Revue Musicale. Vers une musique expérimentale, sous la direction
de Pierre Schaeffer, numéro spécial, vol. 236.
PUDDIE RODGERS C.A. (1981) Pinna transformations and sound reproduction, Journal of the Audio
Engineering Society, vol. 29, p. 226–234.
PUEO B., ESCOLANO J., BLEDA S., LÓPEZ J.J. (2005) An approach for wave field synthesis high power
applications, Convention paper 6428, Proceedings of the 118th AES Convention.
PULKKI V., MERIMAA J. (2006) Spatial impulse response rendering II : Reproduction of diffuse sound
and listening tests, Journal of the Audio Engineering Society, vol. 54, no 1/2, p. 3–20.
RAATGEVER J., BILSEN F.A. (1986) A central spectrum theory of binaural processing. Evidence from
dichotic pitch, Journal of the Acoustical Society of America, vol. 80, no 2, p. 429–441.
RADLOVI
´
C B.D., KENNEDY R.A. (2000) Nonminimum-phase equalization and its subjective impor-
tance in room acoustics, IEEE Transactions on speech and audio processing, vol. 8, no 6, p. 728–737.
RADLOVI
´
C B.D., WILLIAMSON R.C., KENNEDY R.A. (2000) Equalization in an acoustic reveberant
environment : Robustness results, IEEE Transactions on speech and audio processing, vol. 8, no 3, p.
311–319.
290
RAFAELY B. (2004) Plane-wave decomposition of the sound field on a sphere by spherical convolution,
J. Acoust. Soc. Am., vol. 116, no 4, p. 2149–2157.
REITER U., SCHULDT M., DANTELE A. (2003) Determination of sound source obstruction in virtual
scenes, Proceedings of the AES 24th international conference, p. 201–206.
RENAULT S., RYMEKO F., BERRY A. (2000) Active noise control in enclusure with virtual microphone,
Canadian Acoustics, vol. 28, no 3, p. 72–73.
RIEDERER K.A.J. (1998) Repeatability analysis of head-related transfer function measurements, AES
105th convention, preprint 4846.
RIZZI S., SULLIVAN B. (2005) Synthesis of virtual environments for aircraft community noise impact
studies, 11th AIAA/CEAS Aeroacoustics Conference, vol. 4, p. 2291–2306.
ROADS C. (1996) The computer music tutorial, MIT Press.
ROCCHESSO D. (1995) The Ball within the Box : A sound-processing Metaphor, Computer Music Jour-
nal, vol. 19, no 4, p. 47–57.
RÓDENAS J.A., AARTS R.M., JANSSEN A.J.E.M. (2003) Derivation of an optimal directivity pattern
for sweet spot widening in stereo sound reproduction, Journal of the Acoustical Society of America,
vol. 113, no 1, p. 267–278.
ROMANO A. (1987) Three-dimensional image reconstruction in audio, Journal of the Audio Engineering
Society, vol. 35, no 10, p. 749–759.
ROSE J., NELSON P., RAFAELY B., TAKEUCHI T. (2002) Sweet spot size of virtual acoustic imaging
systems at asymmetric listener locations, J. Acoust. Soc. Am., vol. 112, no 5, Pt. 1, p. 1992–2002.
ROURE A., ALBARRAZIN A. (1999) The remote microphone technique for active noise control, Active
99, p. 1233–1244.
RUMSEY F. (2001) Spatial audio, Focal Press.
RUMSEY F. (2002) Spatial quality evaluation for reproduced sound : Terminology, meaning, and a scene-
based paradigm, J. Audio Eng. Soc., vol. 50, no 9, p. 651–666.
SANTILLA
´
N A.O. (2001) Spatially extended sound equalization in rectangular rooms, J. Acoust. Soc.
Am., vol. 110, no 4, p. 1989–1997.
SAUSALITO AUDIO WORKS (sans date) Acoustic Lens Technology for Loudspeakers : An Introduction,
http ://www.SAWonline.com.
291
SAVIOJA L., HUOPANIEMI J., LOKKI T., VÄÄNÄNEN R. (1999) Creating interactive virtual acoustics
environments, Journal of the Audio Engineering Society, vol. 47, p. 675–705.
SCHAFER R.M. (1977) The soundscape – The tuning of the world, Destiny.
SCHAPHORST R. (1996) Videoconferencing and videotelephony : Technology and standards, Artech
House.
SCHEIRER E.D. (1999) Structured audio and effects processing in the MPEG-4 multimedia standard,
Multimedia Systems, vol. 7, p. 11–22.
SCHLEGEL P.A. (1994) Azimuth estimates by human subjects under free-field and headphone conditions,
Audiology, vol. 33, p. 93–116.
SCHOBBEN D.W.E., AARTS R.M. (2005) Personalized multi-channel headphone sound reproduction
based on active noise control, Acta Acustica unified with acustica, vol. 91, no 3, p. 440–449.
SHERBURNE P. (2002) Sound Art/Sound Bodies : Electronic music’s anatomy Lessons, Parachute, , no
107, p. 68–79.
SHI X.L., SHEN W.Q., SONG Z.S. (2006) Research and implementation of a sound simulation system
for flight simulator, Journal of system simulation, vol. 18, no 9, p. 2461–2464.
SNOW W.B. (1953) Basic principles of stereophonic sound, Journal of the SMPTE, vol. 61, p. 567–589.
SNYDER S.D., TANAKA N. (1993) Modification to overall system response when using narrowband
adaptive feedforward control systems, Journal of dynamic systems, measurement, and control, vol.
115, p. 621–626.
SONKE J.J., DE VRIES D., LABEEUW J. (1998) Variable acoustics by wave field synthesis : A closer
look at amplitude effects, Convention paper 4712, AES 104th convention.
SORRENTINO A. (2003) Identification of a vribro-acoustic comfort index for aircraft : The IDEA PACI
project, Acta Acustica, vol. 89, no SUPP., p. S11.
SOTTEK R. (2003) Virtual binaural auralisation of product sound quality importance and application in
practice, Acta Acustica, vol. 89, no SUPP., p. S99.
SOULODRE G.A., LAVOIE M.C., NORCROSS S.G. (2003) Objectives measures of listener envelopment
in multichannel surround systems, Proceedings of the AES 24th international conference, p. 111–122.
SPORER T., KLEHS B. (2004) Wave field synthesis in the real world : Part 2 – In the movie theatre,
Convention paper 6055, AES 116th convention.
292
SPORS S., BUCHNER H., RABENSTEIN R. (2004) Efficient active listening room compensation for wave
field synthesis, Convention paper 6119, AES 116th convention.
SPORS S., KUNTZ A., RABENSTEIN R. (2003a) An approach to listening room compensation with wave
field synthesis, Proceedings of the AES 24th international conference, p. 70–82.
SPORS S., KUNTZ A., RABENSTEIN R. (2003b) Listening room compensation for wave field synthesis,
IEEE International Conference on Multimedia and Expo (ICME).
SPORS S., RABENSTEIN R. (2006) Spatial aliasing artifacts produced by linear and circular loudspea-
ker arrays used for wave field synthesis, Convention paper, AES 120th convention.
SPORS S., RENK M., RABENSTEIN R. (2005a) Limiting effects of active room compensation using wave
field synthesis, Convention paper 6400, AES 118th convention.
SPORS S., SEUBERTH D., RABENSTEIN R. (2005b) Multi-exciter panel compensation for wave field
synthesis, Proceedings of the Annual German Conference on Acoustics (DAGA).
STAFF TECHNICAL WRITER (2005) Loudspeaker array technology, Journal of the Audio Engineering
Society, vol. 53, no 11, p. 1081–1084.
START E.W., DE VRIES D., BERKHOUT A.J. (1999) Wave Field Synthesis Operators for Bent Line
Arrays in 3D Space, Acustica, acta acustica, vol. 85, p. 883–892.
START E.W., ROOVERS M.S., DE VRIES D. (1997) In situ measurements on a wave field synthesis
system for sound enhancement, Convention paper 4454, AES 102nd convention.
START E.W., VALSTAR V.G., DE VRIES D. (1995) Application of spatial bandwidth reduction in wave
field synthesis, Convention paper 3972, AES 98th convention.
STEARNS S.D., DAVID R.A. (1988) Signal processing algorithms, Prentice-Hall.
STEINBERG J.C., SNOW W.B. (1934) Auditory perspective – Physical factors, Journal of the AIEE,
vol. 53, no 11, p. 12–15.
STEINKE G. (1996) Surround sound – The new phase, Convention paper 4286, AES 100th convention.
STERN JR. R.M., COLBURN H.S. (1978) Theory of binaural interaction based on auditory-nerve data
IV. A model for subjective lateral position, Journal of the Acoustical Society of America, vol. 64, no 1,
p. 127–140.
STERNE J. (2003) The audible past – Cultural origins of sound reproduction, Duke University Press.
STEWART G.W. (2001) Matrix algorithms – Volume II : Eigensystems, SIAM.
293
STOUGHTON R. (1993) Source imaging with minimum mean-squared error, J. Acoust. Soc. Am., vol. 94,
no 2, p. 827–834.
STRAUSS M., SONTACCHI A., NOISTERNIG M., HOLDRICH R. (2003) A Spatial Audio Interface for
Desktop Applications, Proceedings of the AES 24th international conference, p. 66–69.
TAKANE S., SONE T. (2004) A new theory for active suppression of reflected sound waves from the
walls based on Kirchhoff-Helmholtz boundary integral equation, Acoust. Sci. & Tech., vol. 25, no 1,
p. 37–44.
TAKANE S., SUZUKI Y., MIYAJIMA T., SONE T. (2003) A new theory for high definition virtual acoustic
display named ADVISE, Acoust. Sci. & Tech., vol. 24, no 5, p. 276–283.
TAKANE S., SUZUKI Y., SONE T. (1999) A New Method for Global Sound Field Reproduction Based on
Kirchhoff ’s Integral Equation, Acustica, Acta Acustica, vol. 85, p. 250–257.
TAKEUCHI T., NELSON P.A. (2002) Optimal source distributions for binaural synthesis over loudspea-
kers, J. Acoust. Soc. Am., vol. 112, no 6, p. 2786–2797.
TAM P.S., RAFAELY B. (2002) Adaptive sound equalisation using constrained frequency-domain filters,
Proceedings of Active 2002, p. 401–412.
THEILE G. (1993) The new sound format “3/2 stereo”, Convention paper 3550a, AES 94rd convention.
THEILE G., WITTEK H. (2004) Wave field synthesis : A promising spatial audio rendering concept,
Acoustical Sciences and Technologies, vol. 25, no 6, p. 393–399.
THEILE G., WITTEK H., REISINGER M. (2003) Potential wave field synthesis application in the multi-
channel stereophonic world, Proceedings of the AES 24th international conference, p. 43–57.
TICHENER P.F. (1992) Adaptive filters for audio – An overview with application examples, Convention
paper 3374, 93rd Audio Engineering Society Convention.
TOHYAMA M., SUZUKI A. (1989) Interaural cross-correlation coefficients in stereo-reproduced sound
fields, Journal of the Acoustical Society of America, vol. 85, no 2, p. 780–786.
TOKUNO H., KIRKEBY O., NELSON P.A., HAMADA H. (1997) Inverse filter of sound reproduction
systems using regularization, IEICE Transactions on Fundamentals Electronics Cummunications and
Computer Sciences, vol. 80, no 5, p. 809–820.
TOOLE F.E. (2006) Loudspeakers and rooms for sound reproduction – A scientific review, Journal of the
Audio Engineering Society, vol. 54, no 6, p. 451–476.
TORICK E. (1998) Highlights in the history of multichannel sound, Journal of the Audio Engineering
Society, vol. 46, no 1/2, p. 27–31.
294
TROCHIMCZYK M. (2001) From circles to nets : On the signification of spatial sound imagery in new
musics, Computer Music Journal, vol. 25, no 4, p. 39–56.
USHER J., WOSZCZYK W. (2003) Design and testing of a graphical mapping tool for analyzing spatial
audio scenes, Proceedings of the AES 24th international conference, p. 157–170.
UTO S., HAMADA H. (1995) Transform domain adaptive audio equalizer for active control of sound
field, Active 95.
VAN DER HEIDE E. (2002) A world beyond the loudspeaker,
http ://utopia.ision.nl/users/heide/world_beyond.html.
VARLA A., MÄ A., MARTIKAINEN I., PILCHNER M., SHOUSTAL R., ANET C. (1999) Design of room
for multichannel audio monitoring, Proceedings of the AES 16th international conference, p. 523–531.
VECCHIO A., POLITO T., JANSSENS K., AUWEARAER H.V.D. (2003) Real-time sound quality evalua-
tion of aircraft interior noise, Acta Acustica, vol. 89, no SUPP., p. S53.
VEIT I., SANDER H. (1987) Production of spatially limited «diffuse» sound field in an anechoic room,
Journal of the Audio Engineering Society, vol. 35, no 3, p. 138–143.
VERHEIJEN E.N.G. (1995) Evaluation of loudspeaker arrays for wave fiels synthesis in audio reproduc-
tion, Convention paper 3974, AES 98th convention.
VERHEIJEN E.N.G. (1998) Sound reproduction by wave field synthesis, Thèse de doctorat, Université
Technique de Delft.
VERONESI W.A., MAYNARD J.D. (1989) Digital holographic reconstruction of sources with arbitrarily
shaped surfaces, J. Acoust. Soc. Am., vol. 85, no 2, p. 588–598.
VERSCHUUR D.J., KAIZER A.J.M., DRUYVESTEYN W.F., DE VRIES D. (1988) Wigner representation
of loudspeaker responses in a living room, Journal of the Audio Engineering Society, vol. 36, no 4, p.
203–212.
VÄÄNÄNEN R., WARUSFEL O., EMERIT M. (2002) Encoding and rendering of perceptual sound scenes
in the CARROUSO project, Proceedings of the AES 22nd International Conference on Virtual, Syn-
thetic and Entertainment Audio.
WANG K., H. GE Y.D. (2001) Adaptive parametric schemes for analysis and synthesis of musical si-
gnals, Journal of the Audio Engineering Society, vol. 49, no 5, p. 353–365.
WARD D.B., ELKO G.W. (1999) Effect of Loudspeaker Position on the Robustness of Acoustic Crosstalk
Cancellation, IEEE Signal Processing Letters, vol. 6, no 5, p. 106–108.
295
WATANABE Y., TOKUNO H., HAMADA H., NELSON P.A. (1999) Sound reproduction for telecommuni-
cations system using auditory cues in virtual acoustic environment, Active 99, p. 1293–1304.
WEBER R., BAUMANN I., FREESE N., KRUSE R., MELLERT V. (2003) Psychoacoustic analysis of
sound in the cabin of passenger aircrafts, Acta Acustica, vol. 89, no SUPP., p. S10.
WIDROW B., WALACH E. (1995) Adaptive inverse control, Prentice-Hall.
WIGHTMAN F.L. (1992) The dominant role of low-frequency interaural time differences in sound loca-
lization, Journal of the Acoustical Society of America, vol. 91, no 3, p. 1648–1661.
WIGHTMAN F.L., KISTLER D.J. (1989a) Headphone simulation of free-field listening. I : Stimulus syn-
thesis, Journal of the Acoustical Society of America, vol. 85, no 2, p. 858–867.
WIGHTMAN F.L., KISTLER D.J. (1989b) Headphone simulation of free-field listening. II : Psychophy-
sical validation, Journal of the Acoustical Society of America, vol. 85, no 2, p. 868–878.
WILLIAMS E.G. (1999) Fourier acoustics – Sound radiation and nearfield acoustical holography, Aca-
demic Press.
WILLIAMS E.G., HOUSTON B.H., HERDIC P.C. (2003) Fast fourier transform and singular value de-
composition formulations for patch nearfield acoustical holography, Journal of the Acoustical Society
of America, vol. 114, no 3, p. 1322 – 1333.
WILLIAMS M. (2003) Multichannel sound recording practice using microphone arrays, Proceedings of
the AES 24th international conference, p. 289–304.
WILSON S. (2003) Information arts : Intersections of art, science, and technology, The MIT Press.
WOSZCZYK W., COOPERSTOCK J., ROSTON J., MARTENS W. (2005) Shake, rattle, and roll : getting
immersed in multisensory, interactive music via broadband networks, Journal of the Audio Enginee-
ring Society, vol. 53, no 4, p. 336–344.
WU S.F., ZHAO X. (2002) Combined Helmholtz equation-least squares method for reconstructing
acoustic radiation from arbitrarily shaped objects, Journal of the Acoustical Society of America, vol.
112, no 1, p. 179 – 188.
YANG J., GAN W.S., TAN S.E. (2003) Improved sound separation using three loudspeakers, Acoustics
research letters online, vol. 4, no 2, p. 47–52.
YOKOTA T., SAKAMOTO S., TACHIBANA H. (2004) Sound field simulation method by combining finite
difference time domain calculation and multi-channel reproduction technique, Acoustical Sciences
and Technologies, vol. 25, no 1, p. 15–23.
296
YON S., TANTER M., FINK M. (2003) Sound focusing in rooms : The time-reversal approach, Journal
of the Acoustical Society of America, vol. 113, no 3, p. 1533–1543.
YOON S.H., NELSON P.A. (2000) Estimation of acoustics source strength by inverse method : Part II,
experimental investigation of methods for choosing regularization parameters, Journal of Sound and
Vibration, vol. 233, no 4, p. 669–705.
ZHAO X., WU S.F. (2005) Reconstruction of vibroacoustic fields in half-space by using hybrid near-field
acoustical holography, Journal of the Acoustical Society of America, vol. 117, no 2, p. 555 – 565.
ZIELI
´
NSKI S.K., RUMSEY F., BECH S., DE BRUYN B., KASSIER R. (2003) Computer games and
multichannel audio quality – The effect of division of attention between auditory and visual modalities,
Proceedings of the AES 24th international conference, p. 85–93.
ZIOMEK L.J. (1995) Fundamentals of acoustic field theory and space time signal processing, CRCPress.
ZMOLNIG J.M., SONTACCHI A., RITSCH W. (2003) The IEM-Cube, A periphonic re-/production, Pro-
ceedings of the AES 24th international conference, p. 21–25.
ZÖLZER U. (1997) Digital audio signal processing, John Wiley & Sons.
ZVONAR R. (sans date) A History of Spatial Music, http ://www.zvonar.com/writing/spatial_music/History.html.
ZWICKER E., FASTL H. (1999) Psycho-acoustics, Springer.
297
ANNEXE A
DÉVELOPPEMENTSTHÉORIQUESCOMPLÉMENTAIRES
Cette annexe rassemble tous les développements théoriques qui ne sont pas présentés dans
le corps de la thèse mais qui demeurent nécessaires au support des propositions et résultats
principaux.
Les sections générales de cette annexe sont : la définition des modes propres d’une salle
légèrement amortie aux surfaces (A.1), l’importance du nombre de conditionnement (A.2), les
développements au sujet du contrôle optimal de type AWFS («Adaptive Wave Field Synthesis»)
(A.3), la décomposition en valeurs singulières de l’AWFS (A.3.3, page 308), les facteurs de fil-
trages pour l’AWFS (A.3.4, page 311) une revue de l’Ambisonie (A.4, page 313), le développe-
ment des opérateurs de la WFS (A.5, page 327) et la transformation des opérateurs fréquentiels
de la WFS vers le domaine temporel (A.7, page 347). La section A.6 présente un lien entre
l’holophonie et l’ambisonie. La section A.8 (page 354) introduit les propriétés générales de la
décomposition en valeurs singulières. La section A.9 présente quelques notions du traitement
du signal pour l’AWFS basée sur le contrôle indépendant des modes de rayonnement.
A.1 Modes propres d’une salle légèrement amortie aux surfaces
Au chapitre 5, un modèle acoustique de salle rectangulaire aux parois légèrement amortis-
santes (d’impédance réelle, soit de réactance nulle et de conductance non nulle) est introduit.
Les paragraphes qui suivent présentent le développement nécessaire à son obtention.
Le développement se base sur l’équation d’onde harmonique homogène et les conditions
298
limites telles que définies au chapitre 5 :

2
p(x) +k
2
p(x) = 0 et (A.1)
∇p(y) n = jkβ(y)p(y) (A.2)
où p [Pa] est la pression acoustique, x [m] une position dans le volume de la salle, y [m] une
position sur les surfaces de la salle, k [rad/s] le nombre d’onde et β l’admittance acoustique
spécifique et adimensionnelle des surfaces de la salle.
Par séparation spatiale de l’équation différentielle (A.1) et pour un trio d’indices modaux
n
x1
, n
x2
et n
x3
décrit par n = (n
x1
, n
x2
, n
x3
), le mode propre n s’écrit
Ψ
n
(x) = Ψ
n
x1
(x
1

n
x2
(x
2

n
x3
(x
3
)/A
n
(A.3)
avec
A
n
=
_
V
Ψ
n
x1
Ψ
n
x2
Ψ
n
x3
dV (A.4)
Comme solution aux équations (A.1) et (A.2), on pose a priori une solution qui ressemble
aux modes propres d’une cavité rigide à la géométrie équivalente
Ψ
n
xi
(x
i
) = cos
_
q
n
xi
πx
i
L
xi
+jφ
n
xi
_
(A.5)
où L
xi
est la longueur de la salle selon x
i
. On cherche q
n
xi
et φ
n
xi
complexes qui devraient
satisfaire l’équation d’onde séparée et les conditions limites.
Dans le problème considéré, l’utilité d’un terme cosinus complexe se démontre aisément en
notant, pour une constante k = k
R
+jk
I
complexe, l’égalité suivante
cos(kx) =
Propagation selon x
¸ .. ¸
e
jkrx
e
−k
I
x
2
+
Propagation selon −x
¸ .. ¸
e
−jkrx
e
k
I
x
2
(A.6)
qui permet l’apparition d’une onde progressive selon x et d’une onde progressive selon −x. Ces
deux ondes progressives présentent aussi une réduction d’amplitude avec la distance, réduction
contrôlée par l’ampleur de la partie imaginaire de k. C’est ainsi que q
n
xi
complexe dans l’équa-
tion (A.5) permet l’apparition de composantes propagatives vers les surfaces alors que le terme
de phase φ
n
xi
permet de décaler le mode en accord avec le système de coordonnées.
En considérant une normale n qui pointe vers l’extérieur du volume de la salle, les conditions
limites, pour x
i
= 0 et x
i
= L
xi
, (équation (A.2)) sont
_
∂Ψ
n
xi
(x
i
)
∂x
i
_
x
i
=0
= [−jkβΨ(x
i
)]
x
i
=0
et (A.7)
299
_
∂Ψ
n
xi
(x
i
)
∂x
i
_
x
i
=L
xi
= [jkβΨ(x
i
)]
x
i
=L
xi
(A.8)
et elles deviennent (avec l’équation (A.5))
tan(jφ
n
xi
) =
jkβL
xi
q
n
xi
π
et tan(q
n
xi
π +jφ
n
xi
) = −
jkβL
xi
q
n
xi
π
(A.9)
Ces deux dernières conditions limites peuvent être combinées pour obtenir
(q
n
xi
−n
xi
)π = −2 arctan
_

i
β
q
n
xi
_
∀ n
xi
(A.10)
avec τ
i
= kL
xi
/π. Si on utilise arctan(x) = x +O(x
3
), la dernière équation devient
(q
n
xi
−n
xi
)π = −2
_

i
β
q
n
xi
_
+O(β
3
) ∀ n
xi
(A.11)
avec β petit. Pour n
xi
= 0, on trouve
q
0
xi
=
_
−2jτ
i
β
π
+O(β
3
) (A.12)
et donc, et en négligeant les puissances supérieures de β, tel qu’utilisé au chapitre 5,
q
0
xi

_
−2jτ
i
β
π
=
1
πj
_
2jβkL
xi
(A.13)
Pour n
xi
,= 0, une approximation supplémentaire doit être utilisée. L’équation (A.11) peut
être écrite comme suit, pour β petit,
π(q
2
n
xi
−q
n
xi
n
xi
) + 2jτ
i
β = q
n
xi
O(β
3
) ≈ 0 (A.14)
Les racines de cette équation quadratique en q
n
xi
sont
q
n
xi

πn
xi
±
_
π
2
n
2
xi
−8πjτ
i
β

=
n
xi
2
±
n
xi
2
¸
1 −
8jkL
xi
β
π
2
n
2
xi
(A.15)
et, avec l’expression en série de Taylor du premier ordre :

1 −x = 1 −x/2, deviennent
q
nxi

n
xi
2
±
n
xi
2

2jkL
xi
β
π
2
n
xi
(A.16)
∴ q
nxi
≈ n
xi

2jβkL
xi
π
2
n
xi
(A.17)
si on prend l’addition pour ± et la soustraction pour ∓.
300
Connaissant les expressions de q
n
xi
, on retrouve finalement l’expression de la phase φ
n
xi
à
partir de la première équation (A.9) (toujours avec arctan(x) = x +O(x
3
))
φ
n
xi
=
τ
i
β
q
n
xi
+O(β
3
) ≈ β
kL
xi
πq
n
xi
(A.18)
∴ Ψ
n
xi
(x
i
) = cos
_
q
n
xi
πx
i
L
xi
+
jβkL
xi
πq
n
xi
_
(A.19)
Les équations (A.5), (A.13), (A.17) et (A.19) forment le schéma modal utilisé au chapitre 5.
A.2 Signification du nombre de conditionnement
Au chapitre 5, on évalue le nombre de conditionnement κ de la matrice d’impédance de
transfert Z pour différents systèmes. Ce nombre fut aussi utilisé en situation expérimentale. Le
nombre de conditionnement de Zest révélateur de la sensibilité du système d’équations linéaires
Zq = p
(rep)
ou Zq = p
(im)
en ce sens que κ(Z) limite les variations de la norme relative de la
solution q en relation avec les normes relatives de faibles variations sur Z, p
(rep)
ou p
(im)
(toutes
deux notées p pour la suite du développement).
Soit le système d’équations linéaires perturbé qui suit
[Z +∆Z] q() = p +∆ p (A.20)
avec q(0) = q. q() est différentiable aux environs de = 0 : dq/d = Z
−1
(∆ p − ∆Zq) et
l’expression en série de Taylor de q() est
q() = q + [dq/d]
=0
+O(
2
) (A.21)
Avec une norme p (notée [[ [[
p
) pour les matrices et les vecteurs [Golub et van Loan, 1996] et
avec la valeur absolue comme norme du scalaire , on trouve (sachant que [[A[[
p
[[x[[
p
≥ [[

b[[
p
pour tout système d’équations linéaires)
[[q() − q[[
p
[[q[[
p
≤ [[ [[Z
−1
[[
p
_
[[∆ p[[
p
[[q[[
p
+[[∆Z[[
p
_
+O(
2
) (A.22)
Comme définition de κ, on utilise cette relation [Golub et van Loan, 1996] : κ(Z) = [[Z[[
p
[[Z
−1
[[
p
,
et sachant que [[ p[[
p
≤ [[Z[[
p
[[q[[
p
, on trouve
[[q() − q[[
p
[[q[[
p
≤ κ(Z)(ρ
Z

p
) +O(
2
) (A.23)
301
avec les variations relatives ρ
Z
et ρ
p
ρ
Z
= [[ [[∆Z[[
p
/[[Z[[
p
(A.24a)
ρ
p
= [[ [[∆ p[[
p
/[[ p[[
p
(A.24b)
L’équation (A.23) illustre la signification et l’importance de κ en terme de sensibilité du système
d’équations linéaire Zq = p. C’est ainsi que toutes variations relatives sur Z ou p limitent la va-
riation relative de la solution q. Pour la reproduction de champs acoustiques telle qu’abordée au
chapitre 5, c’est essentiellement la variation ρ
p
qui fut considérée. Dans ce contexte de travail
plus particulier et propre à la reproduction de champs, un κ important est donc témoignage d’une
situation peu souhaitable en pratique puisque des changements relatifs dans le champ à repro-
duire ρ
p
(im) impliqueraient d’importants changements relatifs dans la solution q. Un κ d’ordre
élevé pourra ainsi amplifier, de plusieurs ordres, les variations dans le champ à reproduire ρ
p
(im)
au niveau des amplitudes des sources q. Telle est donc la signification de κ dans le contexte du
chapitre 5.
A.3 Contrôle optimal et AWFS
On peut imaginer, en complément à la fonction coût de l’équation (5.18) (à la page 89), une
autre fonction coût correspondant à une approche dite de contrôle optimal par AWFS
J
AWFS
= e
H
e +λ(q − q
WFS
)
H
(q −q
WFS
) (A.25)
qui, après développement, prend la forme typique d’une fonction quadratique Hermitienne de q
J
AWFS
= q
H
(Z
(m)
H
Z
(m)
+λI)q − q
H
(Z
(m)
H
p
(im)
+λq
WFS
)
−( p
(im)
H
Z
(m)
H
+λq
H
WFS
)q + ( p
(im)
H
p
(im)
+λq
H
WFS
q
WFS
) (A.26)
dont le minimum se trouve avec les valeurs d’intensité des sources optimales q
(opt)
suivantes
q
(opt)
=
_
Z
(m)
H
Z
(m)
+λI
_
−1
_
Z
(m)
H
p
(im)
+λq
WFS
_
(A.27)
L’équation (A.27) suggère l’interprétation suivante : avec l’accroissement de λ, on passe
d’une approche de minimisation régularisée des erreurs de reproduction (approche qui amène
les erreurs quadratiques à un minimum) jusqu’à une contribution de plus en plus importante de
la solution posée a priori au détriment de la réduction de la contribution de la part de la solution
302
qui minimise l’erreur quadratique seule. Évidemment, en posant q
WFS
=

0 on retrouve une
fonction coût représentative de la minimisation régularisée de l’erreur. En pratique, l’équation
(A.27) est implantée comme suit pour les simulations de l’AWFS dans le domaine fréquentiel
q
(opt)
=
_
Z
(m)
H
Z
(m)
+λI
_
−1
_
Z
(m)
H
p
(im)
_
+
_
Z
(m)
H
Z
(m)
+λI
_
−1
λq
WFS
(A.28)
En cherchant la partie purement optimale de l’équation (A.27)
1
, on trouve l’expression suivante
pour les intensités de sources optimales
q
(opt)
=
_
Z
(m)
H
Z
(m)
+λI
_
−1
_
Z
(m)
H
e
WFS
_
+ q
WFS
(A.29)
où e
WFS
= p
(im)
− p
(rep)
WFS
est l’erreur de reproduction par WFS seule. Même si les équations
(A.28) et (A.29) sont équivalentes, la seconde démontre le travail en parallèle effectué par le
contrôle optimal et la WFS alors que le contrôle optimal tente de réduire l’erreur produite par
WFS. Ainsi, même en appliquant l’AWFS avec les équations (A.28) ou (A.27), les mécanismes
en jeu correspondent à ceux qu’il fut possible de souligner avec l’équation (A.29). Tel que
présenté au chapitre 8, on remarque le même comportement lors de la réalisation de l’AWFS
par traitement de signal adaptatif.
L’équation (A.25) s’applique bien dans le cas où le nombre de capteurs est plus important
que le nombre de sources
2
. On peut également modifier l’équation de contrôle optimal classique
pour le cas où le nombre de capteurs est moindre que le nombre de sources tout en incluant l’idée
de l’AWFS. Le développement se résume comme suit. La fonction coût est la suivante avec des
multiplicateurs de Lagrange

λ
J
AWFS
= (q − q
WFS
)
H
(q −q
WFS
) +

λ
H
e +e
H

λ (A.30)
Les vecteurs gradients complexes sont alors les suivants
∂J
AWFS

λ
R
+j
∂J
AWFS

λ
I
= 2
_
p
(im)
−Z
(m)
H
q
_
(A.31a)
∂J
AWFS
∂ q
R
= 2q
R
−2q
WFS
R
−2

λ
R
Z
(m)
R
+ 2

λ
I
Z
(m)
I
(A.31b)
∂J
AWFS
∂ q
I
= 2q
I
−2q
WFS
I
−2

λ
R
Z
(m)
I
−2

λ
I
Z
(m)
R
(A.31c)
1
Cette partie essentiellement attribuable à la minimisation de l’erreur serait par exemple q
(opt)
Adapt
= q
(opt)
− q
WFS
.
2
Cette même fonction coût peut par contre être utilisée dans le cas où le nombre de capteurs est moindre que
le nombre de sources étant donné que la présence de la régularisation de Tikhonov produit une forme quadratique
Hermitienne définie positive et non pas semi-définie positive comme s’il n’y avait pas de régularisation.
303

∂J
AWFS
∂ q
R
+j
∂J
AWFS
∂ q
I
= 2
_
q −q
WFS
−Z
(m)
H

λ
_
(A.31d)
où les indices R et I représentent les parties réelles et imaginaires des différentes variables,
respectivement.
En posant les équations (A.31a) et (A.31d) égales à

0, on trouve facilement

λ
(opt)
et q
(opt)
qui minimisent la fonction coût de l’équation (A.30)

λ
(opt)
=
_
Z
(m)
Z
(m)
H
_
−1 _
p
(im)
−Z
(m)
q
WFS
¸
(A.32a)
q
(opt)
= q
WFS
+Z
(m)
H
_
Z
(m)
Z
(m)
H
_
−1 _
p
(im)
−Z
(m)
q
WFS
¸
(A.32b)
En développant quelque peu la dernière équation représentative d’une formulation de contrôle
optimal correspondant à l’AWFS, on trouve
q
(opt)
= q
WFS
+Z
(m)
H
_
Z
(m)
Z
(m)
H
_
−1
_
p
(im)
− p
(rep)
WFS
_
(A.33a)
q
(opt)
= Z
(m)
H
_
Z
(m)
Z
(m)
H
_
−1
e
WFS
+q
WFS
(A.33b)
où p
(rep)
WFS
= Z
(m)
q
WFS
fut introduit pour représenter le champ reproduit par WFS aux capteurs
d’erreur et e
WFS
= p
(im)
− p
(rep)
WFS
représente l’erreur de reproduction par la WFS seule. L’équa-
tion (A.33b) expose le fait que les intensités optimales des sources de reproduction (pour un
nombre de capteurs moindre qu’un nombre de sources) ajoutent algébriquement une compo-
sante à q
WFS
de telle sorte que l’erreur de reproduction e soit nulle. Cet ajout (représenté par le
premier terme de la partie de droite de l’équation (A.33b)) correspond à un problème typique
de contrôle optimal (toujours pour un nombre de capteurs moindre qu’un nombre de sources)
de la reproduction de champs acoustiques pour lequel le champ à reproduire serait e
WFS
, soit le
manque à gagner pour la WFS en relation avec le champ à reproduire.
Même si, dans la tradition des études de contrôle optimal, la relation entre le nombre de
capteurs et le nombre de sources détermine l’usage de l’une des deux fonctions coût présentées,
il est possible de se contenter de celle définie par le cas sur-déterminé (M > L, le cas de
l’équation (A.25)) dans la mesure où la matrice Hessienne de cette fonction est définie positive
même si M < L. Ce qui est le cas avec λ > 0 et qui peut s’expliquer facilement en se basant
sur la notion de «définie positive» pour les fonctions quadratiques générales.
Le terme quadratique et la matrice Hessienne de la première fonction coût de l’équation
(A.25) peuvent être développés comme suit
q
H
[Z
(m)
H
Z
(m)
+λI]q = q
H
Z
(m)
H
Z
(m)
q + q
H
λIq (A.34)
304
où Z
(m)
H
Z
(m)
est définie positive si L < M, et semi-définie positive si L ≤ M. Dans les
deux cas, on peut généraliser en notant qu’elle est au moins semi-définie positive et que I est
évidemment toujours définie positive de telle sorte que
q
H
Z
(m)
H
Z
(m)
q ≥ 0 et (A.35a)
q
H
λIq > 0 (A.35b)
∴ q
H
Z
(m)
H
Z
(m)
q +q
H
λIq > 0 ∀ λ > 0 (A.35c)
L’inégalité (A.35c) montre donc que le terme quadratique de la fonction quadratique (équation
(A.25)) de q est bel et bien défini positif même si M ≤ Lgrâce à l’introduction de la pénalisation
(λ) qui, il faut le noter, joue le même rôle que la régularisation de Tikhonov utilisée au chapitre 5
en terme de régularisation de l’inversion de la matrice. Pour cette raison, la fonction coût (A.25)
est utilisée dans tous les cas d’AWFS considérés aux chapitres 6 et 7.
A.3.1 Interprétation mathématique du problème physique de l’AWFS à partir d’un problème
inverse
La minimisation de l’écart d’une solution optimale par rapport à une solution posée a priori
peut être interprétée d’une autre façon si le problème suivant, plus général, est considéré comme
point de départ
Z
(m)
(ω)q(ω) = p
(im)
(ω) (A.36)
alors que la pression p
(im)
(ω) est posée et que l’on cherche q(ω). On suppose que le cas consi-
déré est sous-déterminé (M < L, où M est le nombre de capteurs et L le nombre de sources).
La matrice d’impédance de transfert Z
(m)
M×L
(ω) est décomposée selon ses valeurs singulières (on
laisse tomber la dépendance en fréquences pour alléger la notation) [Elliott, 2001]
Z
(m)
= U
M×M
Σ
M×L
V
H
L×L
(A.37)
où Σest la matrice pseudo-diagonale des valeurs singulières. Les matrices Uet Vsont des ma-
trices unitaires et construites à partir des vecteurs propres des matrices Z
(m)
Z
(m)
H
et Z
(m)
H
Z
(m)
respectivement. Ces deux matrices (Uet V) sont de rang r qui est lui-même égal ou inférieur à
M car M < L. Cette décomposition permet l’introduction des vecteurs de pression à reproduire
(
˜
p
(im)
) et des vecteurs d’intensité des sources (
˜
q) transformés
˜
p
(im)
= U
H
p
(im)
et
˜
q = V
H
q (A.38)
305
L’équation sous-déterminée à résoudre (A.36) peut donc s’écrire comme suit
Σ
˜
q =
˜
p
(im)
(A.39)
Pour trouver une solution à cette équation, il faudrait que le vecteur p
(im)
ne soit constitué
que des premières pressions transformées (il y en a M). Ce qui se formalise comme suit
u
H
i
p
(im)
= 0 ∀ i > r (A.40)
où u
i
représente la colone i de la matrice U. Cette possibilité ne peut survenir que si M ¸ L.
Dans le cas contraire, on doit trouver une solution qui minimise l’erreur quadratique
J =
_
Z
(m)
q − p
(im)
¸
H
_
Z
(m)
q − p
(im)
¸
(A.41)
Ce qui correspond à une approche typique en problèmes inverses sous-déterminés coïncidant,
en partie, à l’équation (A.25).
La solution (il peut y en avoir plusieurs puisque le système d’équation est sous-déterminé),
est la projection de p
(im)
sur u
i
∀ i ¸ r la partie indéterminée est représentée par la contribution
des autres vecteurs v
i
∀ i > r. Il est donc possible d’écrire toutes les solutions comme suit
q =
r

i=1
˜ p
(im)
i
σ
i
v
i
+
L

i=r+1
α
i
v
i
(A.42)
où ˜ p
(im)
i
est la composante i du vecteur de pression à reproduire transformé (
˜
p
(im)
), σ
i
la valeur
singulière i (en ordre décroissant) de la matrice Z
(m)
, v
i
la colonne i de la matrice V et α
i
des scalaires indéterminés qui démontrent, justement, la nature sous-déterminée du problème
de l’équation (A.36) lorsque M < L. r est le rang de la matrice Σ (r ≤ M, avec M < L).
Dans ce cas, la solution q peut prendre, comme les valeurs α
i
qui représentent la contribution
du vecteur source v
i
dans la définition de q, une infinité de valeurs différentes. Ce qui représente
l’indétermination de l’équation (7.16).
Tel qu’exposée à la section précédente, une des approches possibles consiste à trouver une de
ces solutions qui soit la plus proche d’une solution posée a priori. Dans le contexte de l’AWFS,
c’est ce qui correspond à l’équation (A.25). Une approche, plus spécifique dans sa formulation
et présentant un point de vue quelque peu différent de celui exposé à la section précédente,
consiste à minimiser la somme des écarts quadratiques entre les contributions des composantes
de sources v
i
(˜ p
(im)
i

i
∀ i ¸ r et α
i
∀ i > r) et les projections de la solution q
WFS
sur v
i
∀ i.
306
Ce qui revient à poser la fonction coût suivante
J(α
i
) =
r

i=1
_
˜ p
(im)
i

i
−q
H
WFS
v
i
_
2
+
L

i=r+1
_
α
i
− q
H
WFS
v
i
_
2
(A.43)
pour laquelle on trouve un minimum en imposant
α
i
= q
H
WFS
v
i
∀ i > r (A.44)
En considérant les deux équations précédentes, on remarque donc que les r ¸ M premières
contributions des vecteurs v
i
sont entièrement déterminées par la composante de pression à
reproduire transformée ˜ p
(im)
i
et la valeur singulière non-nulle correspondante σ
i
(c’est ce qui
correspond aux termes de la première somme de l’équation (7.16)) alors que les valeurs α
i
correspondent aux projections de la solution posée a priori sur les vecteurs v
i
pour les L −
r autres contributions. C’est ainsi que la solution posée a priori est décomposée sur la base
des v
i
∀ i > r (comme le propose l’équation (A.44)) pour déterminer la valeur, auparavant
indéterminée à l’équation (7.16), des contributions de v
i
dans q.
Même si l’approche de minimisation par rapport à une solution posée a priori présentée
dans cette sous-section propose une interprétation mathématique claire et couramment sollici-
tée en problèmes inverses linéaires, on se base plutôt sur la formulation quadratique introduite
à l’équation (A.25) qui correspond plus à une approche pratique et permet la simple réalisation
d’un algorithme du gradient de type «leaky» sur la base d’une régularisation par optimisation
(l’équation (A.25) correspond en effet à une régularisation par l’introduction d’un nouvel élé-
ment à minimiser, pondéré par λ, alors que l’approche en cette section cherchait plutôt à déter-
miner les valeurs α
i
∀ i > r qui minimisent systématiquement l’écart entre la solution posée
a priori et la solution q de l’équation (A.36)). En agissant ainsi, il devient aisé de modifier des
algorithmes adaptatifs comme le FXLMS.
Par contre, il est montré plus loin que les deux approches (celle basée sur les problèmes
inverses à la section A.3.1 et celle plus proche du contrôle optimal à la section A.3) sont par-
faitement équivalentes et introduisent la notion de contrôle à plusieurs canaux indépendants par
transformation. L’ensemble de cette possibilité est présenté à la section A.3.3 et aux chapitres 7
et 8.
307
A.3.2 Démonstration de l’équivalence de l’AWFS et d’un problème classique des
moindres-carrés
Soit un problème classique des moindres-carrés défini comme suit pour le cas de la repro-
duction de champs acoustiques par contrôle optimal sans pénalisation
min
_
e
H
e
_
= min
_
_
p
(im)
−Z
(m)
q
¸
H
_
p
(im)
−Z
(m)
q
¸
_
(A.45)
où x
H
x = [[x[[
2
2
représente la norme deux (la norme Euclédienne) au carré d’un vecteur x.
Posons maintenant un autre problème représentatif de l’AWFS
min
_
[[e[[
2
2
+λ[[q − q
WFS
[[
2
2
_
= min
_
[[ p
(im)
−Z
(m)
q[[
2
2
+λ[[q −q
WFS
[[
2
2
_
(A.46)
de telle sorte qu’il soit possible, en introduisant deux nouvelles matrices en blocs
ˇ
Z
(m)
=
_
Z
(m)
λI
_
et (A.47a)
ˇ
p
(im)
=
_
p
(im)
λq
WFS
_
(A.47b)
d’écrire l’objectif de minimisation (A.46) comme suit
min
_
[[
ˇ
p
(im)

ˇ
Z
(m)
q[[
2
2
_
. (A.48)
ce qui correspond exactement à la structure du problème classique des moindres-carrés posé à
l’équation (A.45). Ce qui prouve que la minimisation de la somme des erreurs quadratiques avec
une pénalisation de l’écart par rapport à la solution posée a priori demeure un problème simple
des moindres-carrés. Quoiqu’il soit possible d’utiliser l’équation (A.48) pour trouver la solution
optimale qui minimise cette fonction, on se contente d’utiliser l’équation (A.28) pour le calcul
numérique de la solution optimale dans le corps de cette thèse.
A.3.3 AWFS basée sur le contrôle indépendant des modes de rayonnement par
décomposition en valeurs singulières
Dans cette section, on prouve l’équivalence des équations (7.18) et (A.25). Le découplage
des distributions d’intensité de sources de l’AWFS correspondante est par la suite présenté.
308
L’AWFS fut d’abord caractérisée par l’objectif de minimisation de la fonction coût suivante
J
AWFS
= e
H
e +λ(q − q
WFS
)
H
(q −q
WFS
) (A.49)
avec e = p
(im)
− Z
(m)
q. La matrice d’impédance de transfert est encore décomposée en ses
valeurs singulières de telle sorte que son expansion en valeurs singulières soit
Z
(m)
= UΣV
H
avec (A.50a)
U
H
U = UU
H
= I, V
H
V = VV
H
= I, (A.50b)
˜
q = V
H
q,
˜
p
(im)
= U
H
p
(im)
et
˜
p
(rep)
= U
H
p
(rep)
(A.50c)
Les colonnes des matrices Uet Vsont les vecteurs orthonormaux u
i
et v
i
respectivement. u
i
et v
i
sont en fait les vecteurs singuliers de gauche et de droite, pour la matrice Z
(m)
, et forment
des bases orthonormales des espaces vectoriels complexes C
L
et C
M
respectivement. En sup-
posant que le développement est effectué dans le domaine fréquentiel (toutes les matrices et les
vecteurs sont fonction de la fréquence ω), on peut travailler avec les distributions d’intensité de
sources transformées
˜
q et la fonction coût devient d’abord
J
AWFS
(
˜
q) =
_
p
(im)
−Z
(m)
V
˜
q
_
H
_
p
(im)
−Z
(m)
V
˜
q
_

_
V
˜
q −V
˜
q
WFS
_
H
_
V
˜
q −V
˜
q
WFS
_
(A.51)
Étant donné que V est unitaire, on trouve directement
J
AWFS
(
˜
q) =
_
p
(im)
−Z
(m)
V
˜
q
_
H
_
p
(im)
−Z
(m)
V
˜
q
_

_
˜
q −
˜
q
WFS
_
H
_
˜
q −
˜
q
WFS
_
(A.52)
qui peut, en utilisant les pressions transformées (
˜
p
(rep)
et
˜
p
(im)
) et l’expansion en valeurs singu-
lières de Z
(m)
, devenir
J
AWFS
(
˜
q) =
_
U
˜
p
(im)
−UΣ
˜
q
_
H
_
U
˜
p
(im)
−UΣ
˜
q
_

_
˜
q −
˜
q
WFS
_
H
_
˜
q −
˜
q
WFS
_
(A.53)
et puisque la matrice Uest aussi unitaire, on trouve que l’équation (A.49) devient la suivante
J
AWFS
(
˜
q) =
_
˜
p
(im)
−Σ
˜
q
_
H
_
˜
p
(im)
−Σ
˜
q
_

_
˜
q −
˜
q
WFS
_
H
_
˜
q −
˜
q
WFS
_
(A.54)
Le passage de l’équation (A.49) à la précédente illustre deux faits : 1) il est possible de travailler
en composantes d’intensité de sources et de pressions transformées sans changer la nature de la
minimisation et 2) le problème est diagonalisé en un certain nombre de problèmes indépendants
puisque Σest une matrice pseudo-diagonale.
309
Les valeurs des sources transformées qui minimisent la précédente équation sont
˜
q
(opt)
=
_
Σ
H
Σ+λI
¸
−1
_
Σ
H
˜
p
(im)

˜
q
WFS
_
(A.55)
et puisque Σ est une matrice pseudo-diagonale, le problème de contrôle optimal est découplé.
On poursuit le développement pour démontrer la nature d’une telle approche de contrôle indé-
pendant basée sur les transformées de pressions et de sources (ce qui peut en fait correspondre
aux modes de rayonnement de l’antenne de sources couplée à l’antenne de capteurs, voir le
chapitre 7).
On introduit une nouvelle matrice
A = Σ
H
Σ+λI =
_
¸
¸
¸
¸
¸
¸
¸
¸
¸
¸
_
σ
2
1
+λ 0 0
0 σ
2
2
+λ 0 0
.
.
. 0
.
.
. 0 0
.
.
. 0 σ
2
r
+λ 0
.
.
.
0 0
.
.
. 0
0 0 λ
_
¸
¸
¸
¸
¸
¸
¸
¸
¸
¸
_
L×L
(A.56)
où typiquement, le rang r de Z
(m)
est M avec M < L. L’inverse de Ase trouve aisément
A
−1
=
_
¸
¸
¸
¸
¸
¸
¸
¸
¸
¸
_
1/(σ
2
1
+λ) 0 0
0 1/(σ
2
2
+λ) 0 0
.
.
. 0
.
.
. 0 0
.
.
. 0 1/(σ
2
r
+λ) 0
.
.
.
0 0
.
.
. 0
0 0 1/λ
_
¸
¸
¸
¸
¸
¸
¸
¸
¸
¸
_
L×L
(A.57)
et la solution optimale devient
˜
q
(opt)
= A
−1
Σ
H
˜
p
(im)
+λA
−1
˜
q
WFS
. (A.58)
Puisque A
−1
est diagonale et que Σest pseudo-diagonale, le problème est entièrement découplé
et chacun des termes de
˜
q
(opt)
est individuellement défini
˜ q
i
=
_
¸
¸
¸
_
¸
¸
¸
_
σ
i

2
i

i
)
˜ p
(im)
i
+
λ
i

2
i

i
)
˜ q
WFS
i
, ∀ i ≤ r ≤ M
˜ q
WFS
i
, ∀ λ
i
,= 0 et ∀ i > r
0, ∀ λ
i
= 0 et ∀ i > r
(A.59)
310
La dernière équation démontre le mécanisme de contrôle qui est dissimulé sous l’AWFS géné-
rale de l’équation (A.49) (on note aussi qu’il devient possible de régulariser indépendamment
les distributions de sources transformées par λ
i
). Ainsi, seules les r premières transformées de
distributions d’intensité de sources sont utiles pour le contrôle au niveau des M capteurs. De
plus, le reste des distributions d’intensité de sources pour i > r est exclusivement défini par la
solution posée a priori et ce, indépendamment de la pénalisation λ
i
, tant que λ
i
> 0. En bref, la
dernière équation démontre la nature de la redondance qui existe dans tout système de contrôle
actif pour lequel M < L. Ainsi, même en réduction du bruit (en contrôle actif du bruit), il suffit
de placer q
WFS
=

0 pour pouvoir appliquer les mêmes observations que celles qui découlent de
l’AWFS optimale.
Finalement, selon la théorie des matrices, on remarque que si le rang r de la matrice d’impé-
dance de transfert est égal à M (avec M < L), le noyau (ou l’espace nul) de la matrice Z
(m)
est
l’ensemble des vecteurs singuliers v
i
∀ i > r : Ker[Z
(m)
] = Null[Z
(m)
] = ¦q : Z
(m)
q =

0¦.
L’image, ou l’étendue, de la matrice Z
(m)
est quant à elle définie par Ran[Z
(m)
] = ¦ p
(rep)
:
p
(rep)
= Z
(m)
q¦, et pour la matrice Z
(m)
l’étendue correspond en fait au «span» des vecteurs
singuliers u
i
. L’image et le noyau de la matrice jouent des rôles distincts dans l’équation (A.59)
A.3.4 Facteurs de filtrage pour l’AWFS
Pour comprendre l’effet de λ sur la régularisation individuelle des modes de rayonnement,
on utilise la définition des facteurs de filtrage. De façon générale, les facteurs de filtrage f
i
(pour
chaque mode de rayonnement i) déterminent – pour une méthode de régularisation donnée –
l’amortissement ou le filtrage des composantes i de la SVD dans la solution [Hansen, 1998].
Pour la régularisation de type Tikhonov, des formulations explicites des f
i
existent [Hansen,
1998].
La solution AWFS donnée par l’équation (A.59) peut être écrite différemment sous forme
matricielle (avec les dimensions en indice) [Hansen, 1998] :
q
(opt)
L×1
= V
L×L
Θ
L×L

+
]
L×M
U
H
M×M
e
WFS
M×1
+ q
WFS
L×1
(A.60)
avec Θ = diag(f
i
) ∀ i ≤ L. La matrice Σ
+
(issue de la définition du pseudo-inverse) est quant
311
à elle définie comme suit :
Σ
+
=
_
¸
¸
¸
¸
_
1/σ
1
0 0
0 1/σ
2
0 0
.
.
.
0 0 1/σ
M
0
_
¸
¸
¸
¸
_
T
(A.61)
de telle sorte que l’équation (A.60) puisse être écrite avec une sommation
q
(opt)
=
r

i=1
f
i
u
H
i
e
WFS
σ
i
v
i
+q
WFS
=
L

i=1
˜ q
i
v
i
(A.62)

˜ q
i
= f
i
u
H
i
e
WFS
σ
i
+ ˜ q
WFS
i
(A.63)
Les facteurs de filtrage f
i
sont essentiellement attribuables à la méthode de régularisation privi-
légiée (ici, la méthode de Tikhonov généralisée avec une matrice identité comme opérateur de
régularisation) [Hansen, 1998].
Connaissant la solution q
(opt)
selon l’équation (A.59), on trouve les facteurs de filtrage sui-
vants après des développements algébriques :
f
i
=
_
_
_
σ
2
i

2
i

i
)
∀ i ≤ r
0 ∀ i > r et i < L
(A.64)
Dans le cas général de la pénalisation, λ
i
= λ.
Les facteurs de filtrage f
i
varient entre 1 et 0 et expriment la réduction d’importance attri-
buée à la contribution u
H
i
e
WFS

i
de la composante i dans la solution. Un f
i
= 1 implique
une contribution i essentiellement attribuable à u
H
i
e
WFS

i
(atténuation totale de l’erreur de la
WFS, ce qui peut inclure l’annulation totale de ˜ q
WFS
i
) alors qu’un f
i
approchant 0 implique
une contribution essentiellement attribuable à la solution posée a priori ˜ q
WFS
i
dans l’équation
(A.63). Cette transition est plus claire en considérant une écriture équivalente à l’équation (A.63)
[Hansen, 1998] :
˜ q
i
= f
i
˜ p
(im)
i
σ
i
+ (1 −f
i
)˜ q
WFS
i
. (A.65)
Comprenant l’importance des facteurs de filtrage, il est possible de tracer leur forme générique
(équation (A.64)) en fonction de a
i
= λ
i

2
i
(ce qui donne f
i
= 1/(1 + a
i
)) à la figure A.1
(p. 313). Ce type de courbes, propre à la régularisation généralisée de Tikhonov avec solution
a priori, définit les courbes élémentaires qui forment les courbes en L (voir le chapitre 5 et la
référence [Hansen, 1998] à ce sujet).
312
10
−4
10
−2
10
0
10
2
10
4
10
−4
10
−3
10
−2
10
−1
10
0
a
i
f
i
f
i

i
2
/(σ
i
2

i
) avec a
i

i

i
2
f
i
1−f
i
f
i
=1
f
i
=1/a
i
a
i
=
1

f
i
=0.5
Figure A.1 Facteur de filtrage f
i
générique en fonction de a
i
= λ
i

2
i
.
A.4 La théorie derrière l’ambisonie
Comme point de départ, une onde progressive plane doit être reproduite
p
(im)
(R, φ, ω) = Ae
jkRcos(φ−θ)
(A.66)
dans un espace aux coordonnées cylindriques (R, φ, z) où θ est la direction de propagation de
l’onde plane harmonique pour laquelle on suppose une direction de propagation dans le plan
horizontal, ce qui, d’emblée, révèle le principal intérêt technologique de l’ambisonie, soit la
reproduction de la direction d’arrivée du son.
Il est possible d’exprimer le champ désiré sous la forme d’une série de Fourier-Bessel
3
p
(im)
(R, φ, ω) = AJ
0
(kR) + 2A

n=1
j
n
J
n
(kR) cos(n(φ −θ)) (A.67)
que l’on peut transformer ainsi avec une simple identité trigonométrique
p
(im)
(R, φ, ω) = AJ
0
(kR)+2A

n=1
j
n
J
n
(kR) cos(nθ) cos(nφ)+2A

n=1
j
n
J
n
(kR) sin(nθ) sin(nφ)
(A.68)
3
L’équation (A.67) peut être dérivée autrement : à partir des modes de phase puis des modes d’amplitude d’un
champ horizontal infini[Poletti, 2000]. En transformant un champ de pression harmonique en deux dimensions
p(R, φ, ω) en une distribution équivalente de sources planes à l’infini en fonction de φ, il est possible d’écrire
cette distribution périodique de sources (selon φ) par série de Fourier pour trouver le spectre de cette distribution
angulaire. Chaque composante du spectre de la série de Fourier de la distribution de sources planes pondère un
mode de phase ou un mode d’amplitude déterminant la pression sur un cercle à une distance r de l’origine [Poletti,
2000]. L’expansion en modes d’amplitude mène aussi à l’équation (A.67).
313
La fonction J
n
est une fonction de Bessel du premier type et d’ordre n. En pratique, cette série
ne pourra jamais être évaluée jusqu’à n = ∞. Il est conséquemment raisonnable de reformuler
(A.66) sous la forme d’un produit scalaire de deux vecteurs
p
(im)
(r, φ) = Ac
T

h (A.69)

c
T
=

2
_
1/

2 cos(θ) sin(θ) . . . cos(nθ) sin(nθ) . . .
_
(A.70a)

h
T
=

2
_
J
0
(kR)/

2 j cos(φ)J
1
(kR) j sin(φ)J
1
(kR) . . . j
n
cos(nφ)J
n
(kR) j
n
sin(nφ)J
n
(kR) . . .
_
(A.70b)
Les coefficients c
n
sont donc les coefficients de l’expansion et ce sont eux qui déterminent
entièrement la nature du champ original p
(im)
(ils sont les seuls à varier avec θ, la direction de
propagation de l’onde plane à reproduire). Avec ce symbolisme et le jargon ambisonique, on
note que le vecteur c des coefficients de la série représente l’encodage de l’image à reproduire
p
(im)
(R, φ, ω). En situation d’enregistrement ou de prise de son ambisonique, on cherche à
trouver ces coefficients (l’encodage de l’information spatiale qui décrit le champ original). Lors
de la prise de son réelle, on chercherait donc les valeurs suivantes lors de l’opération d’encodage
c
o
= 1 (A.71)
c
1
=

2 cos(θ) (A.72)
c
2
=

2 sin(θ) (A.73)
.
.
.
.
.
.
c
2n−1
=

2 cos(nθ) (A.74)
c
2n
=

2 sin(nθ) (A.75)
.
.
.
.
.
.
Si la pression à reproduire p
(im)
est connue a priori (comme dans le cas de l’onde progressive
plane définie à l’équation (A.66)), l’ensemble des coefficients c
i
sont aisément évaluables à
partir de (A.70a). Malgré le fait que ces coefficients soient tous évaluables, la série devra être
finie pour fin de calcul. Le vecteur c inclura alors 2N + 1 coefficients où N est l’ordre de
troncature de la série de Fourier-Bessel. En pratique, si p
(im)
est un champ réel, on se tourne vers
la captation à l’aide de microphones (c’est la prise de son réelle). Les trois premiers coefficients
de la série (soit c
0
, c
1
et c
2
) correspondent respectivement aux sorties de microphones de type
omnidirectionnel (c
0
) et bidirectionnel (c
1
et c
2
, placés à angle droit). Ainsi, à titre d’exemple,
une onde progressive à reproduire pour laquelle θ = 0 produira un signal aux bornes du capteur
omnidirectionnel et du capteur bidirectionnel pour lequel l’axe est aligné avec la direction de
propagation de l’onde progressive plane à reproduire. Ces trois capteurs devraient théoriquement
314
être situés au même point. Selon les conventions technologiques du format ambisonique, un tel
encodage sera qualifié de premier ordre en deux dimensions et les variables suivantes décrivent
l’encodage d’une direction de propagation θ
W = Ac
o
= A, (A.76)
X =

2Ac
1
= 2Acos(θ) (A.77)
Y =

2Ac
2
= 2Asin(θ) (A.78)
Dans le cas d’un système ambisonique du second ordre en deux dimensions, deux coefficients
d’encodage doivent être ajoutés
U =

2Ac
3
= 2Acos(2θ) (A.79)
V =

2Ac
4
= 2Asin(2θ) (A.80)
Ce type de captation peut aisément être réalisé à l’aide du microphone «Soundfield» spécia-
lement conçu pour la prise de son ambisonique [Rumsey, 2001; Nicol et Emerit, 1999]. En
pratique, il est possible de mesurer seulement les trois coefficients d’ordre zéro et un (du moins,
pour une mesure dans le plan horizontal) puisque les capteurs d’ordres plus élevés ne sont qu’au
stade de la recherche quoique de plus en plus populaires en expérimentation avec des capsules
de microphones peu dispendieuses (on pense par exemple aux antennes de capteurs circulaires).
Inévitablement, la série de Fourier-Bessel représentative de p
(im)
est donc tronquée dans le cas
de la captation réelle d’un champ à reproduire. La troncature est du premier ordre et définit
conséquemment l’étendue spatiale de la convergence de la série de Fourier-Bessel. D’autres dé-
tails théoriques au sujet de la troncature présentent un rapport clair avec la réalisation théorique
et pratique de l’AWFS, soit le sujet principal de cette thèse. Ces aspects sont présentés aux
chapitres 7 et 8.
Maintenant que c est prescrit, il est désirable d’approcher p
(im)
= Ac
T

h par p
(rep)
. Pour
produire p
(rep)
, une série de L haut-parleurs est placée de telle sorte que le réseau équidistant
forme un cercle autour du point d’écoute. On suppose de plus que la distance de ces sources de
reproduction est importante en comparaison avec la longueur d’onde de telle sorte que l’arrivée
des fronts d’onde au point d’écoute puisse être représentée par la superposition d’ondes pro-
gressives planes (chacune d’elles correspond à la position angulaire d’un haut-parleur) au point
d’écoute que l’on suppose au centre du réseau circulaire de haut-parleurs. C’est ainsi que l’on
écrit p
(rep)
(R, φ, ω) aux environs immédiats du point d’écoute
p
(rep)
(R, φ, ω) =
L

l=1
A
l
e
jkRcos(φ−φ
l
)
(A.81)
315
où φ
l
= l2π/L est la position angulaire du haut-parleur l et A
l
est l’amplitude de l’onde plane
produite par le haut-parleur l du total de L haut-parleurs
4
. À leur tour, chacune de ces ondes
planes peut être représentée par une série de Fourier-Bessel
p
(rep)
(R, φ) =
L

l=1
A
l
c
T
l

h =

A
T
C
T

h (A.82)

A
T
= [A
1
. . . A
L
] (A.83a)
C = [c
1
. . . c
L
] (A.83b)
c
l
=

2
_
1/

2 cos(φ
l
) sin(φ
l
) . . . cos(nφ
l
) sin(nφ
l
) . . .
_
T
(A.83c)
Tous les coefficients de la série de Fourier-Bessel attribuables à chacun des haut-parleurs (c
l
)
sont théoriquement évaluables puisque la position angulaire (φ
l
) des haut-parleurs de reproduc-
tion est connue. La matrice C décrit donc le champ spatial produit par l’ensemble des L haut-
parleurs dans la limite de l’approximation des champs des haut-parleurs par des ondes planes.
Connaissant maintenant les définitions du champ à reproduire et du champ reproduit selon leurs
expansions de Fourier-Bessel, le problème de reproduction est posé comme suit aux environs
du point d’écoute
p
(rep)
(R, φ) = p
(im)
(R, φ) ↔

A
T
C
T

h = Ac
T

h (A.84)
Quoique cette appellation peut porter à confusion, la matrice C est aussi baptisée matrice d’en-
codage puisqu’elle encode les contributions

A des sources de reproduction en des coefficients
semblables à ceux utilisés lors de l’encodage du champ à reproduire. Avec (A.84), on cherche

A pour trouver l’amplitude des ondes planes qui doivent être produites par chacun des haut-
parleurs pour approcher le champ p
(im)
par p
(rep)
. On obtient le système algébrique suivant
C

A = Ac (A.85)
qui peut être résolu même si le nombre de haut-parleurs L et le nombre de coefficients 2N + 1
ne permettent pas que Csoit une matrice carrée. Dans cet ordre d’idée, et afin de rester général,
l’équation (A.85) est résolue à l’aide de la définition du pseudo-inverse de C [Golub et van
Loan, 1996; Elliott, 2001]. On trouve ainsi

A = AC
+
c (A.86)
où l’exposant
+
représente la pseudo-inversion. En adhérant à la définition formelle du pseudo-
inverse [Elliott, 2001], la détermination de (A.85) – qui est fonction des dimensions de C et
donc de

A – est automatiquement prise en compte.
4
En pratique la série des amplitudes A
l
donne les gains relatifs entre les sources de reproduction puisque le
reste, dans un contexte audio, est une question d’ajustement de volume.
316
Dans le cas le plus courant, le nombre de sources de reproduction est plus important que
le nombre de coefficients utilisés dans l’encodage du champ à reproduire p
(im)
et du champ
reproduit p
(rep)
. En cette situation, l’équation (A.85) est sous-déterminée et le pseudo-inverse
s’écrit de telle sorte que

A = AC
T
[CC
T
]
−1
c (A.87)
Cette dernière équation représente donc le décodage
5
du champ à reproduire (initialement en-
codé par la définition de c) sur une série de L haut-parleurs de telle sorte que la reproduction
désirée soit atteinte dans la limite théorique des hypothèses de champ libre et de production
d’ondes planes par des sources de reproduction.
En pratique, une des configurations les plus communes en reproduction ambisonique inclut
– au stade du décodage – une ceinture de L haut-parleurs équidistants entre eux et par rapport
au point d’écoute (le centre de la ceinture) de telle sorte que φ
m
= l2π/L. Dans ce cas, les
sources sont géométriquement distribuées sur les pointes d’un polygone régulier dans le plan
horizontal et le pseudo-inverse C
+
devient simplement C
T
/L et le nombre d’opérations attri-
buables à l’inversion de CC
T
est considérablement réduit puisque l’inversion est remplacée par
une simple transposition de moindre dimension. L’équation (A.87) devient donc, pour la plupart
des applications ambisoniques,

A = A
C
T
L
c (A.88)
Le développement précédent forme la base de la technologie ambisonique de reproduction
spatiale du son. Dans cet ordre d’idée, la matrice C
T
/L est habituellement baptisée matrice de
décodage de base pour «basic decoding matrix». Maintes variantes et versions optimisées (du
point de vue physique ou du point de vue perceptif) sont introduites dans la littérature spécialisée
mais vont au-delà des bases nécessaires au développement présenté dans cette thèse. Différentes
méthodes de décodage ambisonique pouvant s’adapter à des configurations de haut-parleurs
commerciales (comme le «surround 5.1», «Lexicon», etc. [Rumsey, 2001]) sont ainsi proposées
et optimisées selon certains critères physiques ou perceptifs. Des corrections de la définition de
l’encodage et du décodage ambisonique qui tiennent compte de la nature sphérique plutôt que
de la nature plane de la rayonnement des sources de reproduction démontrent un accroissement
considérable de la qualité physique de la reproduction sur un espace plus étendu avec un système
ambisonique d’ordre plus élevé [Daniel, 2001]. Il est aussi possible de tenir compte au niveau
de l’encodage du rayon de courbure des fronts d’onde à reproduire.
5
À titre informatif, le décodage ambisonique est parfois présenté comme le principe de réencodage puisque
l’objectif est de retrouver l’encodage c à l’aide des L sources de reproduction.
317
Il est possible d’établir les équations ambisoniques à partir de la formulation de la théorie
de l’holophonie. Pour ce faire, on doit développer l’expression de l’équation (A.88) pour une
source de reproduction l
A
l
=
A
L
c
T
l
c =
A
L
_
1 + 2
N

n=1
[cos(nθ) cos(nφ
l
) + sin(nθ) sin(nφ
l
)]
_
(A.89)
qui donne finalement
A
l
=
A
L
_
1 + 2
N

n=1
cos(n(θ −φ
l
))
_
(A.90)
Après développement, il est possible de montrer que l’équation (A.90) est en fait une fonction
sinc circulaire de (θ − φ
l
) à une constante A près [Poletti, 2000]. Cette équation est utilisée
au chapitre 8. Le reste du lien entre holophonie et ambisonie est présenté à la section A.6, soit
après le développement des opérateurs de la WFS sur la base de l’holophonie.
Interprétation pratique du développement des équations ambisoniques
Maintenant que les équations d’encodage et de décodage de base sont établies pour un sys-
tème ambisonique, les quelques remarques suivantes sont formulées quant aux implications
pratiques attribuables à un tel développement.
Dès le début du développement, l’équation (A.67) présentait une onde progressive plane
sous la forme d’une série de Fourier-Bessel pour laquelle les harmoniques circulaires étaient
évalués par rapport à la direction de propagation de l’onde (θ dans cos(n(φ − θ))). En utilisant
une identité trigonométrique pour transformer l’équation (A.67) en (A.68), la partie attribuable
à la direction de propagation θ a pu être entièrement placée dans le vecteur c alors que la par-
tie attribuable à la position d’intérêt (R, φ) s’est entièrement retrouvée dans le vecteur

h. En
scindant ces deux dépendances angulaires, les coefficients c
i
sont apparus. Ils correspondent
à des motifs de directivité de microphones idéals. À titre d’exemple, les directivités sont pré-
sentées – pour les cinq premiers coefficients (c
0
, c
1
et c
2
donnent un système ambisonique du
premier ordre et l’ajout de c
3
et c
4
donne un système du second ordre) – sur la figure A.2 (p.
319). Ce passage théorique, bien simple, est nécessaire puisqu’il permet l’utilisation de capteurs
dont l’axe principal de directivité ne doit pas nécessairement correspondre avec la direction de
propagation θ. Ce qui permet une réalisation pratique de la prise de son ambisonique avec des
capteurs acoustiques aux directivités prescrites. On note aussi la correspondance entre les motifs
de la figure A.2 (p. 319) et l’allure des modes de pression théoriques et expérimentaux présentés
aux chapitres 7 et 9.
318
30
210
60
240
90
270
120
300
150
330
180 0
c
0
c
1
c
2
c
3
c
4
Figure A.2 Motifs de directivité attribuables
aux cinq premiers harmoniques cylindriques de
l’ambisonie en deux dimensions.
Figure A.3 Partie réelle (à gauche) et partie
imaginaire (à droite) d’une onde progressive
plane représentée par une série de
Fourier-Bessel limitée à N = 4. La série inclut
donc 5 termes pour représenter l’onde plane de
la figure A.5 (p. 320).
En s’attardant à l’encodage d’un champ à reproduire par le biais de la mesure des compo-
santes de c, on note que plus le nombre de coefficients est important, plus la série de Fourier-
Bessel converge sur une large zone de l’espace. Pour supporter cette allégation, les figures A.3
(p. 319) à A.5 (p. 320) présentent les champs de pression avec des séries de Fourier-Bessel plus
ou moins tronquées. Clairement, plus l’ordre de la troncation est élevé, plus la zone spatiale de
convergence de la série est importante. C’est essentiellement ce qui explique la recherche d’un
système ambisonique d’ordre plus élevé qui nécessiterait en fait des capteurs de pression d’ordre
plus élevé. Cet accroissement de la région de convergence provient d’une particularité des fonc-
tions de Bessel du premier type. On sait en fait que pour de très petites valeurs de x, J
n
(x) ≈ x
n
.
Ce qui permet d’exprimer la particularité d’intérêt comme suit :
d
m
Jn(0)
dx
m
= δ
mn
m! et revient à
admettre que la dérivée d’ordre m (évaluée à x = 0) de la fonction de Bessel d’ordre n est nulle
sauf si m = n, dans ce cas, la dérivée en question donne n! à l’origine. Conséquemment, une
série de Bessel permet d’ajuster progressivement et indépendamment les valeurs des dérivées
d’ordre de plus en plus élevé à l’origine. Sachant qu’en augmentant progressivement l’ordre
défini le plus élevé à l’origine, on augmente l’étendue de la définition de la région voisine de
l’origine, on tend – avec l’accroissement de l’ordre de troncation de la série – vers une définition
319
Figure A.4 Partie réelle (à gauche) et partie
imaginaire (à droite) d’une onde progressive
plane représentée par une série de
Fourier-Bessel limitée à N = 8. La série inclut
donc 17 termes pour représenter l’onde plane
de la figure A.5 (p. 320).
Figure A.5 Partie réelle (à gauche) et partie
imaginaire (à droite) d’une onde progressive
plane.
globale et non plus une vers définition uniquement locale, ou voisine, selon une approximation
du premier ordre. Ainsi, soit comme le développement approximatif d’une fonction en série de
Taylor autour d’un point, plus l’ordre de la série est élevé, plus l’approximation sera fiable pour
des points plus éloignés que le point original d’évaluation de la série. Cette remarque au sujet
des contributions spatiales des harmoniques cylindriques de la série Fourier-Bessel est aussi liée
avec l’allure et l’effet des modes de pression présentés aux chapitres 7 et 9.
On peut maintenant illustrer un lien important entre la troncature d’une série de Fourier-
Bessel pour la description ambisonique d’un champ de pression et le changement de nature
de la distribution de sources planes, postées à l’infini, laquelle distribution produirait le même
champ. Le champ original, avant la représentation par série de Fourier-Bessel tronquée, peut
aussi être représenté par une distribution angulaire d’ondes planes en fonction de φ. Cette même
distribution angulaire d’ondes planes peut être représentée par une série de Fourier étant don-
née sa périodicité en fonction de φ, on parle alors de spectre angulaire du champ de pression
décomposé en ondes planes. On remarque en fait, selon Poletti [Poletti, 2000], que la troncature
de la série de Fourier-Bessel correspond exactement à la troncature du spectre angulaire de la
distribution d’ondes planes équivalentes. Plus la troncature est d’ordre faible, plus le spectre
angulaire s’éloignera de l’idéal : c’est-à-dire d’une seule impulsion sur une période de distri-
bution angulaire dans le cas d’un champ plan de pression à reproduire. En augmentant l’ordre
de la représentation de Fourier-Bessel, et donc du spectre angulaire, la distribution angulaire de
sources planes devient plus fine et approche, avec l’accroissement de l’ordre, de plus en plus une
impulsion périodique en φ tout en conservant l’allure d’une fonction sinc circulaire (équation
(7.42)). Dans les cas d’AWFS considérés aux chapitre 6 et 7, il est possible de voir une corres-
320
pondance entre les distributions d’intensité de sources de reproduction et l’ordre de troncature
attribuable à la distribution spatiale des capteurs de l’erreur : on note que les distributions de
sources correspondent, grossièrement, à l’allure de la distribution angulaire tronquée mention-
née en ce paragraphe. Les différences viennent de la proximité des sources de reproduction qui
ne provoquent pas des ondes planes aux capteurs dans les cas présentés au chapitre 6. L’essentiel
des détails à ce sujet est présenté de façon plus précise au chapitre 7.
À titre de complément, les figures A.6 (p. 322) à A.8 (p. 324) présentent des résultats de
simulations de reproduction ambisonique à l’aide de douze sources de reproduction. Tel que
mentionné plus tôt, on assume que les ondes issues des sources de reproduction sont des ondes
progressives planes. Cette approximation demeure valide tant que les sources de reproduction
sont suffisamment éloignées du point d’écoute (soit au centre des champs illustrés). Comme
il est possible de le voir sur ces figures, les gains panoramiques présentent des distributions
différentes selon l’ordre d’encodage du système (voir équation (7.42)). Les champs reproduits
sont, quant à eux, valables sur une zone plus étendue au fur et à mesure que l’ordre de l’encodage
augmente. Encore une fois, il faut garder à l’esprit le fait que cette approximation des ondes
issues des haut-parleurs par des ondes planes est surtout valide au centre des champs illustrés
sur ces trois figures.
321
Figure A.6 Gains panoramiques, champ acoustique à reproduire et champ reproduit pour un
système ambisonique du premier ordre avec 12 sources de reproduction. Chaque courbe
représente le gain d’une des sources pour différentes directions de reproduction.
322
Figure A.7 Gains panoramiques, champ acoustique à reproduire et champ reproduit pour un
système ambisonique du second ordre avec 12 sources de reproduction. Chaque courbe
représente le gain d’une des sources pour différentes directions de reproduction.
323
Figure A.8 Gains panoramiques, champ acoustique à reproduire et champ reproduit pour un
système ambisonique du troisième ordre avec 12 sources de reproduction. Chaque courbe
représente le gain d’une des sources pour différentes directions de reproduction.
324
A.4.1 Ambisonie comme un cas particulier du contrôle optimal de la reproduction spatiale du
son
À partir d’une approche de contrôle optimal dans le domaine des fréquences en incluant les
hypothèses acoustiques (ondes planes) de l’ambisonie de base, il est possible de retrouver les
équations ambisoniques. Ce lien démontre simplement que la reproduction ambisonique tente
de minimiser l’erreur de reproduction ou la somme des amplitudes des sources, selon la nature
de la détermination du système (déterminé ou sous-déterminé). On pourrait donc aussi affirmer
que les technologies ambisoniques forment un cas particulier du contrôle optimal (réalisé en
boucle ouverte et basé sur un modèle approximatif) de la reproduction.
La démonstration suit les étapes suivantes. L’erreur de reproduction se définit ainsi
e(R, φ) = p
(im)
(R, φ) −p
(rep)
(R, φ) (A.91)
soit de la même façon qu’elle fut initialement introduite au chapitre 5, mais en coordonnées
cylindriques cette fois. Adoptons maintenant les hypothèses initiales ambisoniques : 1) c’est
la reproduction de la direction qui nous intéresse, on prend donc un champ à reproduire dé-
fini par une onde progressive plane p
(im)
(R, φ) = Ae
jkRcos(φ−θ)
, 2) on suppose que les sources
réelles de reproduction sont suffisamment éloignées du point d’écoute pour que la pression so-
nore reproduite corresponde à la superposition d’ondes progressives planes dont les directions
de propagation correspondent aux positions angulaires des L sources réelles. Suivant ces hy-
pothèses au sujet de l’approximation par des ondes planes aux environs du centre d’écoute,
l’écriture suivante est proposée, tout comme elle fut introduite à la section A.4
e(R, φ) = Ac
T

h −

A
T
C
T

h (A.92)
Si on transforme cette erreur spatiale de reproduction en un vecteur d’erreur sur les coefficients
c (ce qui revient à diviser l’équation (A.92) par

h)
e
(c)
= Ac
T


A
T
C
T
(A.93)
où e
(c)
est un vecteur ligne de telle sorte qu’il soit possible de formuler une fonction quadratique
représentative de l’intention de minimiser la somme des erreurs quadratiques sur chacun des
coefficients de l’expansion de Fourier-Bessel. Cette fonction quadratique est la suivante
J
c
= e
(c)
e
T
(c)
(A.94)
J
c
= Ac
T
cA−Ac
T
C

A−

A
T
C
T
cA+

A
T
C
T
C

A (A.95)
325
On note que les coefficients de l’expansion (introduite initialement à l’équation (A.66)) sont
toujours réels. Quoiqu’elle puisse paraître loin de la réalité du contrôle actif ou du contrôle opti-
mal, l’idée de minimiser la somme des erreurs sur les coefficients d’une décomposition en série
de Fourier-Bessel n’est pas si étrangère au contrôle optimal. Dans le cas d’étude théorique du
contrôle optimal des perturbations dans des structures vibrantes, il est par exemple très commun
de transformer la réponse d’une structure en une série modale ou même en une expansion poly-
nomiale. Le minimum de la fonction coût est obtenu en remplaçant

A par

A
(opt)
qui se définit
généralement comme suit en contrôle optimal [Elliott, 2001]

A
(opt)
= AC
+
c (A.96)
Ce qui correspond exactement à la solution ambisonique proposée par l’équation (A.86). Conti-
nuons néanmoins la démarche de contrôle optimal classique.
Selon la taille de la matrice C, trois cas particuliers et bien connus en contrôle actif du bruit
se présentent et définissent la nature de la pseudo-inversion.
Si le système est surdéterminé (plus de coefficients que de sources L < 2N +1), le pseudo-
inverse de C donne comme amplitudes optimales

A
(opt)
= A[C
T
C]
−1
C
T
c (A.97)
En pratique, ce cas correspond à la reproduction d’une onde plane prescrite théoriquement et
pour laquelle les coefficients de la série de Fourier-Bessel pourraient être facilement évalués
pour un nombre plus important que la quantité de sources réelles L. Avec une telle situation, il
n’est pas possible d’amener les erreurs e
(c)
à zéro. L’usage du pseudo-inverse représente donc
la minimisation de la fonction coût introduite plus tôt.
Si le système (A.93) est déterminé (autant de coefficients que de sources réelles), les ampli-
tudes optimales sont trouvées par inversion directe (puisque C est une matrice carrée)

A
(opt)
= AC
−1
c (A.98)
En pratique, ce cas particulier correspondrait à une prise de son réelle de L coefficient avec
l’usage de L haut-parleurs. C’est un cas spécifique, ou rare, voire inutilisé, en pratique. Cette
fois, toutes les erreurs e
(c)
peuvent être amenées à zéro.
Le troisième cas, lors de la sous-détermination, correspond à une situation légèrement dif-
férente pour laquelle une infinité de combinaisons possibles (en terme des composantes de

A)
326
peut amener les erreurs de reproduction à zéro. Dans ce cas, le pseudo-inverse donne la solution
unique suivante

A
(opt)
= aC
T
[CC
T
]
−1
c (A.99)
qui minimise en fait la somme des efforts quadratiques (

A
T

A) tout en garantissant que e
(c)
=

0.
Ce troisième et dernier cas présente les équations ambisoniques les plus courantes, c’est-à-
dire celles introduites à l’équation matricielle (A.87). Ce qui démontre bien qu’une approche
ambisonique est en fait une approche de contrôle optimal (de minimisation) des erreurs sur
l’encodage du champ reproduit en relation avec l’encodage de l’objectif défini par le champ à
reproduire sous l’hégémonie des deux hypothèses des ondes progressives planes à reproduire et
produites par les sources réelles de reproduction prises individuellement. L’essentiel des liens
entre AWFS et ambisonie est présenté au chapitre 7.
A.5 Développement des opérateurs de synthèse de la WFS dans le domaine fréquentiel
Cette section présente le développement des opérateurs de synthèse tels qu’ils sont utilisés en
différentes sections de cette thèse. Le développement proposé suit celui de Verheijen [Verheijen,
1998] quoique d’autres développements puissent être réalisés.
Comme point de départ, on considère l’équation intégrale de Kirchhoff-Helmholtz avec les
fonctions de Green d’un milieu homogène (G

)
p(x) =
_
S
_
p(y)

∇G

(x[y) −G

(x[y)

∇p(y)
_
ndS ∀ x ∈ V (A.100)
pour laquelle la présente notation est introduite à la figure A.9 (p. 328). La fonction de Green
est définie comme suit

2
G

(x[y) +k
2
G

(x[y) = −δ(x −y) (A.101a)
∴ G

=
e
jkr
4πr
+ F (A.101b)
où r = [x −y[ et F est une fonction de x qui doit satisfaire l’équation d’Helmholtz homogène.
Afin de développer (A.100), on précise la définition du gradient de la pression comme suit
dp(y)
dn
=

∇p(y) n = jωρ
o
v
n
(y) (A.102)
∵ −

∇p(x) = ρ
o
∂u(x)
∂t
= −jωρ
o
v(x) (A.103)
327
Figure A.9 Notation utilisée pour l’équation
(A.100).
Figure A.10 Notation utilisée pour l’obtention
des intégrales de Rayleigh.
où v
n
(y) est la vitesse particulaire v projetée sur le vecteur n(x) alors que x = y ∈ S. Ce qui
permet la nouvelle écriture de (A.100)
p(x) =
_
S
_
p(y)

∇G

(x[y) n −jωρ
o
v
n
(y)G

(x[y)
_
dS ∀ x ∈ V (A.104)
La dérivée directionnelle de la fonction de Green (

∇G

(x[y) n) se développe comme suit

∇G

(x[y) n = ∇
r
G

(x[y) cos φ (A.105)
=

∂r
_
e
jkr
4πr
+F
_
cos φ (A.106)
Afin de se diriger vers les intégrales de Rayleigh I et II, posons F = 0 pour commencer de telle
sorte que (A.106) devienne

∂r
_
e
jkr
4πr
_
cos φ =
(jkr −1)e
jkr
4πr
2
cos φ (A.107)
L’équation (A.104) devient donc
p(x) =
_
S
_
p(y)
jkr −1
r
2
e
jkr

cos φ −jωρ
o
v
n
(y)
e
jkr
4πr
_
dS ∀ x ∈ V (A.108)
C’est à partir de la dernière équation que les formulations intégrales de Rayleigh I et II seront
élaborées. Ces deux nouvelles intrégrales formeront alors un point de départ pour la dérivation
des opérateurs de synthèse selon la nature des sources de reproduction.
La principale raison qui permet de scinder l’équation (A.104) en deux intégrales de Rayleigh
est conséquence de la nature de l’application, la reproduction de champs acoustiques dans ce
328
cas. On sait en fait que la présence de deux termes (rayonnement monopolaire et rayonnement
dipolaire) dans l’intégrale de Kirchhoff-Helmholtz est attribuable au fait suivant
p(x) =
_
_
_
0 ∀ x / ∈ V
_
S
_
p(y)
jkr−1
r
2
e
jkr

cos φ −jωρ
o
v
n
(y)
e
jkr
4πr
_
dS ∀ x ∈ V
(A.109)
Dans l’intégrale, les deux types de rayonnements (monopolaire et dipolaire) superposés qui
forment une source de Huygens [Jessel, 1973] (ou la «lucarne de Huygens») s’annulent mutuel-
lement pour x / ∈ V de telle sorte que l’équation (A.109) soit vraie.
En synthèse de champs acoustiques, où p(y) provient du champ à reproduire, il n’est pas
nécessaire que p(x) = 0 ∀ x / ∈ V puisque V est essentiellement l’espace d’écoute et ce qui
advient en dehors de V n’est pas profondément influent sur la qualité de la reproduction dans V .
Pour cette raison, il n’est pas nécessaire, ou obligatoire, en WFS pratique d’inclure à la fois les
sources monopolaires et les sources dipolaires sur S. Cela se concrétise avec les deux intégrales
de Rayleigh.
On trouve l’intégrale de Rayleigh I en imposant une forme particulière à S et en définissant
F dans G

.
S devient l’union d’un plan à x
3
= 0 (S
1
) et d’un hémisphère (S
2
) de rayon R. Cette
transformation de S est présentée à la figure A.10 (p. 328). L’ensemble des sources définissant
le champ à reproduire (soit p
(im)
(y)) appartient à l’espace où x
3
< 0 (soit à l’extérieur de
V +S
1
+S
2
6
). On rappelle que, dans le cas de la figure A.10 (p. 328), x
3
⊥ S
1
et x
3
est positif
lorsqu’il pénètre V . Si le rayon R de l’hémisphère S
2
tend vers l’infini, la contribution de S
2
dans l’intégration sur S devient négligeable (en accord avec la condition de Sommerfield) et seul
S
1
, dès lors un plan infini, demeure important dans l’intégration sur S. Suivant ces modifications
de S l’équation (A.100) est maintenant réécrite
p(x) =
_
S
1
_
p(y)

∂n
_
e
jkr
4πr
+F(y)
_

_
e
jkr
4πr
+F(y)
_
∂p(y)
∂n
_
dS ∀ x ∈ V (A.110)
Posons F = e
jkr

/4πr

avec r

, le vecteur miroir de r par rapport à S
1
, de telle sorte que le
6
On utilise l’opérateur + plutôt que ∪ pour représenter l’union des trois objets puisque leur intersection est un
ensemble vide [Jessel, 1973].
329
premier terme de l’intrégrale (A.110) soit nul. Le développement suivant prouve cette allégation
∂F(y)
∂n
=

∂r

_
e
jkr

4πr

_
∂r

∂n
(A.111)
= −

∂r
_
e
jkr
4πr
_
∂r
∂n
(A.112)
= −

∂n
_
e
jkr
4πr
_
(A.113)
∴ p(x) = −
1

_
S
1
jωρ
o
v
n
(y)
e
jkr
r
dS
1
(A.114)
∵ r

= r sur S (A.115)
L’équation (A.114) est l’intégrale de Rayleigh I qui représente le rayonnement d’une distri-
bution continue de sources monopolaires sur S
1
pour reconstruire p(x) ∀ x ∈ V [Junger et Feit,
1993]. On note qu’avec une telle équation p(x) ,= 0 ∀ x / ∈ V .
C’est de la même façon, mais en posant F = −e
jkr

/4πr

, que l’intrégrale de Rayleigh II
est obtenue. La dérivée directionnelle de F se développe, dans ce cas, comme suit
∂F(y)
∂n
=

∂r

_
−e
jkr

4πr

_
∂r

∂n
(A.116)
= −

∂r
_
−e
jkr
4πr
_
∂r
∂n
(A.117)
=

∂n
_
e
jkr
4πr
_
(A.118)
Dans ce cas, (A.110) devient
p(x) =
_
S
1
_
p(y)

∂n
_
e
jkr
4πr

e
jkr

4πr

__
dS
1
(A.119)
=
_
S
1
_
2p(y)

∂n
_
e
jkr
4πr
__
dS
1
(A.120)
et puis finalement
p(x) =
1

_
S
1
p(y)
jkr −1
r
2
e
jkr
cos φdS
1
(A.121)
L’équation (A.121) est l’intégrale de Rayleigh II qui représente le rayonnement d’une distribu-
tion de sources dipolaires sur S
1
.
Ainsi, selon la nature monopolaire ou dipolaire des sources de reproduction, c’est l’intré-
grale de Rayleigh I ou II qui servira de point de départ au développement des opérateurs de
330
synthèse de la WFS. Afin d’alléger le présent document, les développements seront limités aux
cas où les sources de reproduction sont de type monopolaire.
Les intégrales de Rayleigh suggèrent donc qu’il est possible de reproduire un champ acous-
tique pour x
3
> 0 en alimentant convenablement une distribution continue de sources de re-
production. C’est le principe théorique d’holophonie [Jessel, 1973]. En pratique, on ne peut
atteindre un plan de sources infini ni même une distribution continue de sources. Pour cette rai-
son, les prochaines étapes simplifient les intégrales de Rayleigh afin d’obtenir des opérateurs de
synthèse réalisables.
La première simplification concerne l’approximation de l’intégrale de surface par une inté-
grale de ligne. La nomenclature est maintenant légèrement précisée à la figure A.11 (p. 332).
En relation avec l’introduction de cette figure, on remarque simplement qu’un vecteur x décrit
tout point appartenant à V
1
+ S + V
2
, qu’un vecteur y décrit tout point appartenant à la surface
S et qu’un vecteur x

décrit toute position de source virtuelle posée à l’intérieur de V
1
. Toujours
sur cette figure le point S
o
correspond à la position de la source virtuelle, le point M à une des
sources secondaires de reproduction et le point P au point d’évaluation de la reproduction de
la pression p
(rep)
(x). L’indice
o
fait, quant à lui, référence à la projection d’un vecteur ou d’une
dimension dans le plan x
1
−x
3
.
Posons d’abord un champ de pression acoustique à reproduire
p
(im)
(x, ω) = S(ω)D(φ, ϑ, ω)
e
jk|x−x

|
[x −x

[
∀ x ∈ ¦S +V
2
¦ (A.122)
où S(ω) est l’amplitude monopolaire de la source virtuelle et D sa directivité (pour kr ¸1). Si
c’est ce champ p
(im)
(x) qui produit v
n
sur S, le champ reproduit par des sources monopolaires
sur la surface S sera défini comme suit selon l’intrégrale de Rayleigh I
p
(rep)
(x, ω) = −
1

_
S
jωρ
o
v
n
(y)
e
jkr
r
dS ∀ x ∈ V
2
(A.123)
Un plan de sources de reproduction n’est pas une solution pratique, on cherche d’abord à rem-
placer, par approximation, cette intégration de surface par une intégration de ligne (sur la ligne
pointillée horizontale L présentée à la figure A.11 (p. 332)).
Trouvons d’abord v
n
(y) en fonction du champ de pression, de la source virtuelle, défini par
331
Figure A.11 Notation précisée pour l’obtention des opérateurs de synthèse de la WFS.
l’équation (A.122).
jωρ
o
v
n
(y) = S(ω)

∂x
3
_
D(φ, ϑ, ω)
e
jkr

r

_
(A.124)
= S(ω)
_
∂D(φ, ϑ, ω)
∂x
3
e
jkr

r

+D(φ, ϑ, ω)

∂x
3
_
e
jkr

r

__
(A.125)
La dérivée du second terme, entre crochets, se développe ainsi

∂x
3
_
e
jkr

r

_
=
(jkr

−1)
r
2
e
jkr
∂r

∂x
3
(A.126)
=
(jkr

−1)
r
2
e
jkr

cos φcos ϑ (A.127)
La dérivée de la directivité D se développe quant à elle comme suit
∂D
∂x
3
=
∂D
∂φ
∂φ
∂x
3
+
∂D
∂ϑ
∂ϑ
∂x
3
où (A.128a)
φ = arctan
_
x
1
−x
o1
x
3
−x
o3
_
et (A.128b)
ϑ = arctan
_
x
2
−x
o2
_
(x
1
−x
o1
)
2
+ (x
3
−x
o3
)
2
_
(A.128c)
332
Il devient simple de développer ∂φ/∂x
3
et ∂ϑ/∂x
3
∂φ
∂x
3
=
sin φ
r

cos ϑ
(A.129)
∂ϑ
∂x
3
=
−sin ϑcos φ
r

(A.130)
Avec ces nouveaux développements, l’équation (A.125) peut être reformulée comme suit
7
jωρ
o
v
n
(y) = S(ω)
e
jkr

r

_
sin φ
r

cos ϑ
∂D
∂φ

sin ϑcos φ
r

∂D
∂ϑ
+
(jkr

−1)
r

Dcos φcos ϑ
_
(A.131)
Cette équation peut donc remplacer le terme jωρ
o
v
n
dans l’intrégale de Rayleigh I. Plutôt que
de le réaliser tout de suite, on considère l’intrégrale de Rayleigh I comme deux intrégrales de
lignes
p
(rep)
(x) = −
1

_

−∞
_

−∞
jωρ
o
v
n
(y)
e
jkr
r
dx
2
dx
1
=
_

−∞
Idx
1
(A.132)
On s’intéresse à la première intégration I qui est réalisée sur la ligne verticale pointillée croisant
M tel qu’illustré à la figure A.11 (p. 332). De façon générale, cette intrégrale de ligne est écrite
comme suit
I =
_

−∞
f(x
2
)e
j(ϕ(x
2
))
dx
2
(A.133)
En trouvant une approximation à cette intégrale de ligne, le problème technologique de la re-
production de p
(im)
par une distribution de sources sur S par WFS est remplacé par celui d’une
distribution de sources sur une ligne horizontale L ∈ S. En considérant le développement de
jωρ
o
v
n
présenté à l’équation (A.131) et à l’équation (A.133), on trouve les définitions suivantes
pour f(x
2
) et ϕ(x
2
).
f(x
2
) = −
1

S(ω)
r

r
_
sinφ
r

cos ϑ
∂D
∂φ

sinϑcos φ
r

∂D
∂ϑ
+
(jkr

−1)
r

Dcos φcos ϑ
_
(A.134)
e
jϕ(x2)
= e
jkr

e
jkr
= e
jk(r+r

)
∴ ϕ(x
2
) = k(r +r

) (A.135)
Lorsque ϕ ¸ 1, il est possible d’utiliser l’approximation de la phase stationnaire pour
7
Le développement de ces résultats est ici omis pour alléger le texte. Il est possible de supporter ces allégations
en considérant les résultats de Verheijen [Verheijen, 1998]. On note par contre qu’une erreur est présente dans le
développement de Verheijen. Ce dernier assume que la dérivée ∂ϑ/∂x
3
(telle que développée à l’équation (A.130))
est positive alors qu’un accroissement de x
3
implique un angle ϑ positif plus faible pour ϑ > 0 et un angle négatif
plus faible pour ϑ < 0. Il est possible de le prouver par observation de la figure A.11 (p. 332) et en gardant à l’esprit
que x
o
∈ V
1
∴ 0 ≤ cos φ ≤ 1 et −1 ≤ sinϑ ≤ 1. L’erreur de Verheijen n’a pas de répercussion sur le reste du
développement parce que le terme fautif en question est négligé plus loin.
333
remplacer I [Verheijen, 1998; Bleinstein, 1984; Junger et Feit, 1993]
8
comme suit
I ≈ f(x
o
2
)e
jϕ(x
o
2
)
¸
2πj

2
ϕ(x
o
2
)/∂x
2
2
(A.136)
où x
o
2
est le point de phase stationnaire le long de x
2
. Ce qui revient à dire que la contribution la
plus importante à l’intrégrale (A.133) est attribuable au point de phase stationnaire le long de x
2
dans ce cas. Le point de phase stationnaire est trouvé en imposant la dérivée de la phase à zéro :
∂ϕ(x
o
2
)/∂x
2
= 0. Puisque ϕ(x
2
) = k(r +r

) et par observation de la figure A.11 (p. 332), il est
clair que le point de phase stationnaire est atteint lorsque x
o
2
= 0 (ou lorsque y
o
2
= 0 puisque
qu’on évalue la phase ϕ(x
2
) uniquement sur la surface S, soit lorsque x = y ∈ S). On note
aussi que l’on suppose que p
(im)
provient d’une source virtuelle dans le plan horizontal x
1
−x
3
.
Pour évaluer l’approximation (A.134), il faut trouver ∂
2
ϕ(x
2
)/∂x
2
2
et f(x
2
)pour les évaluer à
x
o
2
.
Avec (A.134), f(y
o
2
) se trouve aisément comme suit
f(y
o
2
) = −
1

S(ω)
r

o
r
o
_
sin φ
r
o
∂D
∂φ
+
jkr

o
−1
r

o
Dcos φ
_
(A.137)
∵ ϑ = 0 avec y
o
2
= 0 (A.138)
8
En bref, l’approximation de la phase stationnaire (ou, de façon équivoque, la méthode de la phase stationnaire)
est issue de l’analyse asymptotique [Murray, 1984]. Dans le cas d’une expansion asymptotique d’une intégration
de type Fourier (I(λ) =
_
b
a
f(t)e
jλφ(t)
dt) qui inclut un argument oscillatoire e
jλφ(t)
et une fonction de phase
φ(t) monotonique, certaines expressions (issues des quelques premiers termes de l’expansion asymptotique de
l’intrégrale) proposent une approximation à l’intégration. La méthode de la phase stationnaire intervient lorsque
la fonction de phase présente un ou plusieurs extremums sur le domaine d’intégration. Dans ce cas, ce sont ces
points qui contribuent le plus à I, ce qui permet une approximation telle que présentée dans le texte principal de
cette thèse. Lorsque le point stationnaire (dφ(t)/dt = 0|
t=to
) est d’ordre premier (seule la première dérivée est
nulle) et lorsqu’il ne se trouve pas à l’une des bornes d’intégration, il est possible d’utiliser la formule de la phase
stationnaire [Bleinstein, 1984; Junger et Feit, 1993] comme dans cette thèse. À titre d’exemple, la méthode de la
phase stationnaire peut être utilisée pour trouver l’expansion asymptotique des fonctions de Bessel lorsqu’elles sont
d’abord représentées sous la forme d’intégrales. Elle est aussi sollicitée en rayonnement des structures en champ
lointain [Junger et Feit, 1993].
334
Lorsque kr

o
¸2
9
, c’est le deuxième terme de (A.137) qui domine f(y
o
2
) de telle sorte que
f(y
o
2
) ≈ −
1

_
(jkr

o
−1)
r

o
Dcos φ
_
(A.139)
La recherche de ∂
2
ϕ(x
2
)/∂x
2
2
(utilisée en (A.136)) implique un développement plus fasti-
dieux. Il est très brièvement résumé comme suit
ϕ

(x
2
) =

2
ϕ(x
2
)
∂x
2
2
(A.140)
ϕ(x
2
) = k(r +r

) avec (A.141)
r =
_
(x
1
−y
1
)
2
+ (x
2
−y
2
)
2
+ (x
3
−y
3
)
2
et (A.142)
r

=
_
(x
o1
−y
1
)
2
+ (x
o2
−y
2
)
2
+ (x
o3
−y
3
)
2
(A.143)
∴ ϕ

(x
0
2
) = k
_
r
o
+r

o
r
o
r

o
_
(A.144)
Connaissant maitenant f(x
o
2
), ϕ(x
o
2
) et ϕ

(x
o
2
), il est possible d’écrire (A.132) selon l’approxi-
mation (A.136)
p
(rep)
(x, ω) = −
S(ω)

_

−∞
1
r

o
r
o
_
(jkr

o
−1)
r

o
cos φD(φ, 0, ω)
_
e
jkro
e
jkr

o
¸
¸
¸
_
2πj
k
_
ro+r

o
ror

o
_dx
2
(A.145)
p
(rep)
(x, ω) = −S(ω)
_
j

_

−∞
[(jkr

o
−1) cos φD(φ, 0, ω)]
e
jkro

r
o
e
jkr

o
(r

o
)
2
¸
r

o
r
o
+r

o
1

k
dx
2
(A.146)
Ayant supposé plus tôt que kr

o
¸2, une approximation supplémentaire est introduite ((jkr

o

1) devient jkr

o
)
p
(rep)
(x, ω) = −
S(ω)

_

−∞
1
r

o
r
o
_
(jkr

o
)
r

o
cos φD(φ, 0, ω)
_
e
jkro
e
jkr

o
¸
¸
¸
_
2πj
k
_
ro+r

o
ror

o
_dx
2
(A.147)
p
(rep)
(x, ω) = −S(ω)j
_
jk

_

−∞
cos φD(φ, 0, ω)
e
jkro

r
o
e
jrr

o
r

o
¸
r

o
r
o
+r

o
dx
2
(A.148)
Il est finalement possible d’interpréter l’équation (A.147) de telle sorte que l’on trouve les opé-
rateurs de synthèse. Puisque
e
jro
ro
correspond au rayonnement en x d’une source monopolaire en
9
Dans ce cas, on assume que la source virtuelle est éloignée de la ligne de sources de reproduction. Cette
hypothèse approximative introduit une restriction (distance importante entre la source virtuelle et les sources de
reproduction) qui n’est pas respectée en pratique puisque la position d’une source virtuelle est laissée à la discrétion
de l’utilisateur. Lorsque la source virtuelle devient très proche d’une source réelle, l’hypothèse mentionnée impose
une coloration de +3 dB/octave qui, normalement, ne devra pas êre présente. Cette allégation est supportée par
des simulations introduites à la section 4.3.1 et plus précisément à la figure 4.13 (p. 54).
335
y, il est possible d’établir que l’amplitude monopolaire de cette source serait Q(y, ω) avec
p
(rep)
(x) =
_

−∞
Q(y, ω)
e
jkro
r
o
dx
2
avec (A.149)
Q(y, ω) = −S(ω)j
_
jk

cos φD(φ, 0, ω)
e
jkr

o

r

o
_
r
o
/(r
o
+r

o
) (A.150)
En alimentant une suite de sources monopolaires par une amplitude définie par (A.150), on
obtiendrait donc p
(rep)
(x) qui, dans la limite des approximations de la phase stationnaire et de
kr

o
¸2, devrait correspondre au champ virtuel désiré, soit p
(im)
(x).
Une des conséquences importantes de l’approximation par la méthode de la phase station-
naire est la présence de r
o
(soit la position du point d’écoute P en relation avec la ligne de
sources) dans la définition des amplitudes monopolaires de reproduction (A.150). Ainsi, les
amplitudes en question devraient être modifiées si la position de l’auditeur change. Étant donné
que cette nécessité est peu pratique, la WFS typique inclut une dernière approximation technolo-
gique. Dans l’équation (A.150), la position de l’auditeur essentiellement incluse par la présence
de r
o
est fixée constante et devient x
(ref)
3
de telle sorte que r
o
ne soit plus la position d’écoute
mais simplement la position d’une ligne de référence en face de la ligne de sources de reproduc-
tion. La ligne de référence est séparée de la ligne de sources par x
(ref)
3
mètres. Cette décision
implique que p
(rep)
(x) n’est pas égale à p
(im)
(x) en dehors de cette ligne de référence. Pour
préciser, on note que seule l’amplitude de p
(rep)
(x) ne correspond pas à l’amplitude de p
(im)
(x),
c’est-à-dire qu’il n’y a pas d’erreur sur la phase des champs reproduits en dehors de la ligne de
référence. Le manque en amplitude provient de l’absence des contributions sur la surface ori-
ginale S évoquée par l’intégrale de Rayleigh I pour des sources monopolaires de reproduction
[Verheijen, 1998].
Tel que mentionné plus tôt, le présent développement suivait celui de Verheijen [Verheijen,
1998], à l’exception de l’usage de e
−jωt
dans notre cas. C’est ce qui explique les différences
entre le présent développement et celui de Verheijen. Afin de valider le présent développement,
la figure A.12 (p. 337) présente des simulations en champs libres. Sur ces figures, les sources de
reproduction sont des monopôles discrets représentés par des points noirs et la ligne de référence
est présentée comme un trait pointillé. Le passage d’une formulation continue telle que celle de
l’équation (A.149) à une formulation discrète implique l’approximation suivante
_
b
a
f(x)dx ≈
N

n=1
f(x
n
)∆ avec x
1
= a et x
N
= b (A.151)
où N points sont uniformément distribués entre a et b. ∆ correspond à la distance de séparation
des points. Pour cette simulation, p
(rep)
correspond approximativement à p
(im)
. Ce qui valide le
336
Figure A.12 Simulation de la reproduction par WFS en champ libre (selon le développement
de la section A.5).
présent développement.
Les équations (A.149) et (A.150) représentent donc le champ reproduit et les amplitudes
nécessaires pour le construire dans le cas restrictif de sources de reproduction monopolaires
placées sur une ligne droite. En suivant un développement similaire à celui introduit en ces der-
nières pages, il est possible de trouver les opérateurs de synthèse dans le domaine des fréquences
pour des sources de reproduction de type dipôle et pour des sources placées sur une ligne quel-
conque (ce qui correspond plus à la pratique). Ces développpements ne sont pas présentés ici
mais leurs résultats sont introduits au sein du tableau A.1 à la page 338. Il est important de noter
que chaque cas comporte certaines particularités, autant au niveau de la définition du problème
qu’au niveau de la notation utilisée. De plus, la validité de la définition du champ reproduit est
limitée au plan horizontal.
Afin de préciser l’usage des termes dans chacun des cas, le lecteur est prié de se référer à la
figure A.11 (p. 332) pour une description générale, à la figure A.13 (p. 339) dans le cas d’une
source virtuelle à l’avant des sources de reproduction et à la figure A.14 (p. 339) pour des sources
de reproduction disposées sur une ligne quelconque. On note ainsi que, de façon générale, les
angles φ et ϑ sont utilisés pour décrire la directivité D(φ, ϑ, ω) de la source virtuelle, l’angle α
337
Tableau A.1 Opérateurs de synthèse de la WFS dans le domaine des fréquences
CAS PARTI-
CULIERS DE
REPRODUCTION
AMPLITUDES DES SOURCES (Q(y, ω)) CHAMP REPRODUIT (p
(rep)
(x))
(1) Sources de
reproduction de
type monopôle
disposées sur
une ligne droite.
x
o
∈ V
1
.
−S(ω)j
_
jk

cos φD(φ, 0, ω)
e
jkr

o

r

o
_
x
(ref)
3
/(x
(ref)
3
+r

o
)
_

−∞
Q(y, ω)
e
jkro
ro
dx
2
(2) Sources de
reproduction de
type dipôle dispo-
sées sur une ligne
droite. x
o
∈ V
1
.
−S(ω)j
_
1
2πjk
D(φ, 0, ω)
e
jkr

o

r

o
_
x
(ref)
3
/(x
(ref)
3
+r

o
)
_

−∞
Q(y, ω)jk cos α
e
jkro
ro
dx
2
(3) Sources de
reproduction de
type monopôle
disposées sur
une ligne droite.
x
o
∈ V
2
de
telle sorte que la
source est devant
S.
S(ω)j
_
k
2πj
cos φ
e
−jkr

o

r

o
_
x
(ref)
3
/(x
(ref)
3
−r

o
)
_

−∞
Q(y, ω)
e
jkro
ro
dx
2
(4) Sources de
reproduction de
type monopôle
disposées sur une
ligne quelconque.
x
o
∈ V
1
.
−S(ω)j
_
jk

cos Ψ
e
jkr

o

r

o
_
r
(ref)
o
/(r
(ref)
o
+r

o
)
_

−∞
Q(y, ω)
e
jkro
ro
dl
(5) Sources de
reproduction
de type dipôle
disposées sur une
ligne quelconque.
x
o
∈ V
1
.
−S(ω)j
_
1
2πjk
e
jkr

o

r

o
_
r
(ref)
o
/(r
(ref)
o
+r

o
)
_

−∞
Q(y, ω)jk cos α
e
jkro
ro
dl
sert au calcul de la directivité des sources de reproduction (avec une directivité unitaire dans le
cas des monopôles et avec cos α dans le cas des dipôles) et l’angle Ψ est quant à lui introduit
pour l’évaluation de jωρ
o
v
n
(y
o
) à la position des sources de reproduction. En ce qui a trait aux
distances, r

o
explicite la distance (dans le plan horizontal) entre la source virtuelle et une source
338
Figure A.13 Notation précisée pour
l’obtention des opérateurs de synthèse de la
WFS dans le cas d’une image à reproduire qui
inclut une source virtuelle à l’avant des sources
de reproduction.
Figure A.14 Notation précisée pour
l’obtention des opérateurs de synthèse de la
WFS dans le cas d’une ligne de sources
(monopôles ou dipôles quelconques).
de reproduction, r
o
correspond à la distance (toujours dans le plan horizontal) entre une source
de reproduction et un point de l’espace d’écoute, x
(ref)
3
définit la distance, selon x
3
, entre la ligne
de source L et la ligne de référence (en traits discontinus sur l’ensemble des figures). Finalement
et pour toutes les figures de notation, les indices
o
font référence au plan horizontal pour lequel
la phase ϕ est minimale alors que l’exposant

est utilisé pour spécifier que la variable sous
l’exposant concerne la source virtuelle. Pour les cas (3), (4) et (5) présentés au tableau A.1, on
remarque que la directivité D n’est pas incluse. C’est-à-dire qu’on suppose implicitement que
la source virtuelle est omnidirectionnelle dans ces trois situations.
Pour supporter la validité des opérateurs de synthèse définis au tableau A.1, les figures A.15
(p. 340) à A.18 (p. 341) présentent l’image à reproduire (p
(im)
) et les champs reproduits (p
(rep)
).
Dans l’ensemble de ce développement, les sources - virtuelles ou de reproduction - étaient
toujours décrites par le biais des amplitudes monopolaires Q et S. Dans les autres parties de
cette thèse, les sources étaient décrites par le biais q
(vol)
, c’est-à-dire des sources d’injection de
volume. q
(vol)
était dans ce cas l’amplitude de l’intensité de la source (traduction littérale de
339
Figure A.15 Simulation de la reproduction par WFS en champ libre avec l’utilisation de
dipôles comme sources de reproduction.
Figure A.16 Simulation de la reproduction par WFS en champ libre avec l’utilisation de
monopôles pour la création d’une source virtuelle devant les sources de reproduction.
340
Figure A.17 Simulation de la reproduction par WFS en champ libre avec l’utilisation de
monopôles (distribués sur une ligne quelconque) comme sources de reproduction.
Figure A.18 Simulation de la reproduction par WFS en champ libre avec l’utilisation de
dipôles (distribués sur une ligne quelconque) comme sources de reproduction.
341
«source-strength amplitude») qui peut être aisément reliée à l’amplitude monopolaire comme
suit
q
(vol)
= −
4πQ
jωρ
(A.152)
A.5.1 Reproduction d’ondes planes
Pour la reproduction d’ondes planes, en pratique, les opérateurs de synthèse de la WFS
doivent être modifiés. Quoiqu’il soit possible de redériver les opérateurs de synthèse à partir
du point de départ (la définition d’un champ à reproduire), il est possible de se contenter
10
, par
observation des opérateurs présentés à la table A.1, de modifier quelques termes pour retrouver
les opérateurs de synthèse pour la reproduction d’ondes approximativement planes.
Pour obtenir une approximation d’onde plane en x, on impose un coefficient de correction
d’amplitude qui corrige la réduction d’amplitude attribuable à la distance d’une source ponc-
tuelle
p
(im)
(x, ω) = [x −x

o
[S(ω)
e
jk|x−x

o
|
[x −x

o
[
= r
corr
S(ω)
e
jk|x−x

o
|
[x −x

o
[
(A.153)
Par contre, on note que la correction n’est seulement valide qu’au point x, pour cette raison,
on impose un point de référence x
(ref)
corr
qui, en plus d’appartenir à la ligne de référence, sera
exposé à une amplitude S(ω). On favorisera, comme point de référence, le centre de l’antenne
de reproduction. Dans ce cas, le facteur de correction est r
corr
= [x
(ref)
corr
−x

o
[.
En comparaison avec les opérateurs de la WFS développés plus haut, la seule différence est
attribuable à l’amplitude de la source virtuelle qui devient r
corr
S(ω). Dans ce cas, on retrouve
les opérateurs de synthèse qui produisent l’approximation d’une onde plane d’amplitude S(ω)
pour des sources de reproduction de type monopôle
Q(y, ω) = −r
corr
S(ω)j
_
jk

cos Ψ
e
jkr

o

r

o
_
r
(ref)
o
/(r
(ref)
o
+r

o
) (A.154)
ou dipôle
Q(y, ω) −r
corr
S(ω)j
_
1
2πjk
e
jkr

o

r

o
_
r
(ref)
o
/(r
(ref)
o
+r

o
). (A.155)
Toujours dans la mesure où la source virtuelle est loin des sources de reproduction (pour de
10
On note à ce sujet que la méthode d’approximation par la formule de la phase stationnaire poserait des pro-
blèmes particuliers pour la reproduction d’une onde plane définie a priori.
342
grand r

o
). Par contre, avec de grandes distances de source virtuelle, le terme e
jkr

o
peut introduire
d’importants retards temporels. Pour en réduire l’importance, il est possible de modifier les deux
précédentes équations comme suit pour des sources de reproduction de type monopôle
Q(y, ω) = −r
corr
S(ω)j
_
jk

cos Ψ
e
j(kr

o
−min(kr

o
))

r

o
_
r
(ref)
o
/(r
(ref)
o
+r

o
) (A.156)
ou dipôle
Q(y, ω) = −r
corr
S(ω)j
_
1
2πjk
e
j(kr

o
−min(kr

o
))

r

o
_
r
(ref)
o
/(r
(ref)
o
+r

o
). (A.157)
où min(kr

o
) correspond à la phase minimale (lire aussi la distance minimale) entre la source
virtuelle et toutes les sources réelles de reproduction de telle sorte que la source de reproduction
la plus proche de la source virtuelle hérite d’une phase nulle. Ainsi, la position de cette source
correspond à l’origine de l’onde plane (du moins son approximation) et le point x
(ref)
corr
, au point
de l’amplitude de référence. On note aussi qu’une telle correction du retard temporel est im-
plantée (mais optionnelle) de façon similaire pour les opérateurs de synthèse définis aux lignes
(4) et (5) du tableau A.1 à la page 338.
Les figures A.19 (p. 344) et A.20 (p. 344) présentent des exemples d’application des deux
équations précédentes. Ce qui démontre leur validité. On note que pour ces simulations, contrai-
rement aux cas traités dans le corps de la thèse, les effets de diffraction n’ont pas été réduits à
l’aide de l’application d’une fenêtre pondérant les sources de reproduction situées aux extrémi-
tés de l’antenne puisque l’objectif était d’illustrer la validité des opérateurs de synthèse d’ondes
planes présentés aux équations (A.19 (p. 344)) et (A.20 (p. 344)).
A.6 L’ambisonie à partir des équations générales de la WFS
Il est possible d’exprimer un lien théorique entre les équations génératrices de la WFS (la
formulation intégrale de Kirchhoff-Helmholtz) et l’ambisonie. Ce qui complète donc le triangle
des relations entre AWFS, ambisonie et WFS alors que, dans le corps de cette thèse, au chapitre
7, un lien fut tracé entre AWFS et WFS puis entre AWFS et ambisonie.
On procéde à partir de l’équation (A.108) qui peut exprimer la reproduction d’un champ
acoustique p
(im)
(x) dans un volume V
p
(rep)
(x) =
_
S
_
p
(im)
(y)
jkr −1
r
2
e
jkr

cos φ −jωρ
o
v
(im)
n
(y)
e
jkr
4πr
_
dS ∀ x ∈ V (A.158)
343
Figure A.19 Simulation de la reproduction par
WFS en champ libre avec l’utilisation de
monopôles (distribués sur une ligne) comme
sources de reproduction d’ondes planes.
Figure A.20 Simulation de la reproduction par
WFS en champ libre avec l’utilisation de
dipôles (distribués sur une ligne quelconque)
comme sources de reproduction d’ondes
planes.
où p
(im)
(y) est la pression acoustique à reproduire évaluée à la surface de V et v
(im)
n
(y) est la
vitesse particulaire normale à reproduire évaluée sur la surface S. La nomenclature est donnée à
la figure A.9 (p. 328) où r = [x−y[ et φ n’est pas une coordonnée cylindrique mais l’angle de r
avec la normale n à la surface S. Cette équation, à l’origine des opérateurs de la WFS, implique
deux types de sources de reproduction : des monopôles et des dipôles. C’est la formulation la
plus générale qui soit de la WFS et elle approche ainsi la description holophonique du problème
[Jessel, 1973].
Puisque l’ambisonie est décrite dans un système de coordonnées cylindriques, on transforme
S en surface cylindrique et V en volume cylindrique dont l’axe évolue selon x
3
(un axe perpen-
diculaire au plan horizontal présenté à la figure A.9 (p. 328))
p
(rep)
(x) =
_

0
_

−∞
_
p
(im)
(y)
jkr −1
r
2
e
jkr

cos φ −jωρ
o
v
(im)
n
(y)
e
jkr
4πr
_
Rdx
3

y
∀ x ∈ V
(A.159)
où R est le rayon du cylindre, r est la distance de la source de reproduction en y jusqu’au
point d’observation en x et α
y
est la position angulaire de y selon le système de coordonnées
cylindriques utilisé dans cette section. Il est en de même pour le point x qui sera décrit par une
position angulaire α
x
. La figure A.21 (p. 345) présente les quelques changements de notation
344
Figure A.21 Notation modifiée pour l’obtention de la solution ambisonique à partir de la
formulation de Kirchhoff-Helmholtz à l’origine de la WFS.
nécessaires à la présente démonstration. On applique l’approximation de la phase stationnaire à
l’intégration selon l’axe x
3
_

−∞
_
p
(im)
(y)
jkr −1
r
2
e
jkr

cos φ −jωρ
o
v
(im)
n
(y)
e
jkr
4πr
_
dx
3

_

jk
_
p
(im)
(y)
jkr −1
r
cos φ −jωρ
o
v
(im)
n
(y)
_
e
jkr


r
¸
¸
¸
¸
¸
x
3
=0
(A.160)
où la phase est stationnaire pour x
3
= 0 si on assume que le point d’observation x est dans le
plan x
3
= 0. Dans ce cas, l’équation (A.159) devient
p
(rep)
(x) =
_

jk
R
_

0
_
p
(im)
(y)
jkr −1
r
cos φ −jωρ
o
v
(im)
n
(y)
_
e
jkr


r
¸
¸
¸
¸
¸
x
3
=0

y
∀ x ∈ V
(A.161)
Pour rejoindre les équations de l’ambisonie, on suppose maintenant que le champ acoustique
à reproduire est une onde plane avec une direction de propagation de θ dans le plan horizontal
(x
3
= 0) qu’il est possible d’écrire sous la forme d’une série de Fourier-Bessel
p
(im)
(y) = e
j

k· y
= J
o
(kR) + 2

n=1
j
n
J
n
(kR) cos(n(α
y
−θ)) (A.162)
où R ne représente plus une distance radiale quelconque, comme à la section A.4, mais bien le
rayon du cylindre. C’est la première hypothèse de l’ambisonie. L’équation (A.162) donne donc
l’expression de la pression à reproduire sur un point de la surface S localisé en (R, α
y
, 0).
345
La seconde hypothèse de l’ambisonie est tout aussi simple : les sources de reproduction sont
postées à l’infini. On fait donc tendre R vers l’infini et donc r → ∞ puisque on peut écrire
r = [x − y[ =
_
R
2
+[x[
2
−2R[x[ cos(α
x
−α
y
). Dans ce cas, on note les expressions des
limites qui suivent
lim
R→∞
jkr −1
r
= jk (A.163a)
lim
R→∞
cos φ = 1 (A.163b)
lim
R→∞
e
jkr
/

r =
e
jkR

R
e
−jk|x| cos(αx−αy)
(A.163c)
lim
R→∞
J
n
(kR) =
_
2
πkR
cos
_
kR −(n +
1
2
)
π
2
_
(A.163d)
Pour obtenir la limite de l’équation (A.163b), on remarque simplement que φ →0 avec R →0
puisque dans ce cas r et R (tel que montré à la figure A.9 (p. 328)) se confondent. En ce qui
concerne l’équation (A.163c),