Vous êtes sur la page 1sur 32

Cdric Payet

Section Son
Promotion 2016

Rapport de stage long


Ralisation dun test psycho-acoustique objectif

(source paperblog.com)

Priode : Du 11/05/2015 au 30/05/2015 et du 15/07/2015 au 07/08/2015


Lieu : CMAP, Centre de Mathmatique Appliqu de Polytechnique
cole Polytechnique CNRS, Route de Saclay, 91128 Palaiseau Cedex France

Responsable du stage : Matthieu Aussal

Ecole Nationale Suprieure Louis-Lumire


Anne 2015

SOMMAIRE
Introduction

I - Contexte

1) Le CMAP

a) Activits

b) Le personnel

c) Les personnes encadrant mon stage

2) Laudio 3D

a) Historique de la technique

b) Les principes de la synthse binaurale

c) Le binaural aujourdhui

II - Lexprience

11

12

A) Enjeux

12

B) Les stimuli utiliss

12

C) Les outils utiliss

13

D) Le protocole

17

E) Discussion autour du protocole

17

F) Les sujets

18

G) Rception de lexprience auprs des sujets

18

III - Rsultats de lexprience

19

A) Stro et binaural statique

19

B) Stro et binaural dynamique

22

C) Binaural statique et binaural dynamique

26

D) Discussion autour des rsultats

29

Conclusion

30

Bibliographie

31

Remerciements

31

Annexe

32
2 sur 32

Introduction

Lors de ma deuxime anne au sein de lcole Louis Lumire, jai eu lopportunit de faire
mon stage au Centre de Mathmatiques Appliques de Polytechnique, ou CMAP.

Lorsque jai contact Matthieu Aussal, ingnieur de recherche dans ce laboratoire, pour
une ventuelle collaboration sur mon mmoire de fin dtudes, il ma alors propos un
stage permettant de raliser une exprience psychoacoustique objective. Cette dernire
consiste relever les diffrences de niveaux entre trois conditions dcoute qui sont la
stro, le binaural avec et le binaural sans suivi des mouvements de la tte de lauditeur.
Ce stage a t loccasion pour moi de dcouvrir le milieu de la recherche, qui mtait
totalement inconnu alors que mon projet de mmoire de fin dtudes sancrera dans une
dmarche de recherche. Jenvisage en effet, de travailler autour de la technologie
binaurale et en particulier avec suivi des mouvements de la tte.
Cette exprience reprsente donc pour moi une relle phase prparatoire au mmoire de
troisime anne tout en me permettant de me crer des contacts dans le milieu de la
recherche.

3 sur 32

I - Contexte
1) Le CMAP
a) Activits
Depuis sa cration en 1974, le Centre de Mathmatiques Appliques de lEcole
Polytechnique (CMAP) sest fix comme objectif le dveloppement et lexploration des
mathmatiques en liaison avec des applications.
Louverture du CMAP vers dautres disciplines se manifeste par la varit et la complexit
des thmes de recherche qui sont abords.
Les domaines de recherche du CMAP sont en troite liaison avec des problmatiques
poses en physique, mcanique, chimie, finance et biologie mais aussi dans les domaines
socio-conomiques ou des technologies de linformation.
Le CMAP travaille galement en partenariat avec le Dpartement dEnseignementRecherche en Mathmatiques Appliques de lcole Polytechnique.
Le centre, li aussi au CNRS (le Centre Nationale de la Recherche Scientifique), est un
tablissement la pointe dans ses domaines de prdilections.

b) Le personnel
Les effectifs du CMAP (enseignants-chercheurs, chercheurs permanents, doctorants )
reprsentent environ 70 personnes dont 25 doctorants, ce qui en fait un laboratoire
relativement jeune.
Le CNRS fournit la plus grande partie des chercheurs permanents.
Ces derniers sont gnralement galement enseignants au Dpartement de
Mathmatiques Appliques de lcole Polytechnique.
Nanmoins, certains enseignants-chercheurs peuvent provenir dautres universits.

4 sur 32

Les quipes de recherche se rpartissent selon diffrentes thmatiques :

Modlisation Alatoire et Applications


Analyse non linaire
Automatique
Contrle et Sciences de lInformation
Cellule Informatique et Calcul scientifique,
Equations aux drives partielles pour la physique

Organigramme de mes diffrents interlocuteurs au cours de mon stage

5 sur 32

c) Les personnes encadrant mon stage


Dans le cadre de la thse effectue par M. Matthieu Aussal, ingnieur de recherche dans
lquipe tudiant les quations aux drives partielles pour la physique, des travaux de
recherche concernant des mthodes numriques pour la spatialisation sonore ont t
raliss.
Un moteur binaural, MyBino, a t dvelopp pendant sa thse1 et a t utilis pour les
besoins de lexprience de ce stage.
Jai donc t principalement en contact avec Matthieu Aussal qui a t mon rfrent lors
de la ralisation de lexprience, car cest la personne qui a port la plupart des
recherches sur la spatialisation sonore et le binaural au sein de ce laboratoire.
Lors de mes rencontres avec Matthieu Aussal, jai galement eu loccasion de converser
avec Franois Alouges, qui tait son directeur de thse et est aujourdhui le responsable
de lquipe de recherche EDP pour la physique. Il a pu apporter un troisime regard
plus distanci sur lexprience que je voulais raliser.

- Aussal Matthieu, Mthodes numriques pour la spatialisation sonore, de la simulation la


synthse binaurale, Thse de lEcole Polytechnique, 2014

6 sur 32

2) Laudio 3D
Suite aux progrs de la recherche et au lancement de contenu destin au grand public, la
technologie binaurale, vulgairement appele Audio 3D , profite dun nouvel essor et
des initiatives industrielles se lancent sur le march grand public.

a) Historique de la technique
Le concept du binaural connat ses balbutiements la fin du 19e sicle en France grce
Clment Ader qui invente le Thtrophone. Ce dispositif permet des auditeurs situs
jusqu deux kilomtres de lOpra de Paris dcouter la pice joue.
Cela est rendu possible grce une rampe de microphones place devant la scne et un
tlphone sur chaque oreille des auditeurs.
Ces derniers ont ainsi eu pour la premire fois une impression despace dans un dispositif
de reproduction sonore.

Affiche dpoque promouvant le Thtrophone (source


lesnumriques.com )

Cest Lon Blumlein, ingnieur en lectronique, qui en 1931 utilise le terme binaural
qui signifie en latin deux oreille, pour dcrire un enregistrement sonore.
Lors de lexposition universelle de 1933 Chicago, la compagnie de tlphone amricaine
AT&T a dvoil un prototype de tte mcanique nomm Oscar, avec deux microphones
la place des oreilles. Le public peut alors mettre un casque et couter ce qucoute la
tte artificielle.

7 sur 32

Schma de la tte Oscar dAT&T (source


lesnumriques.com)

Les recherches sur le binaural ne se dveloppent rellement qu partir des annes 70


dans des laboratoires tel que lIRCAM en France.
Ces annes de recherche ont permis non seulement dtudier les problmatiques lies
la captation sonore en binaural mais galement de developper des outils capables de
crer des espaces pour une reproduction binaurale sur casque, ce que lon peut appeler la
synthse binaurale.

b) Les principes de la synthse binaurale


La restitution dun espace sonore, dit 3D , au moyen dun simple casque, prsente
nanmoins encore aujourdhui des imperfections dues la complexit de certains
mcanismes physiologiques lors la localisation dun objet sonore.
Cette localisation met en jeu des phnomnes temporaux, dintensit et spectraux.

- Les diffrences entre les deux oreilles dites interaurales de niveau et de


temps (ILD pour Interaural Level Difference et ITD pour Interaural Time Difference)
Ces diffrences sont lies la distance interaurale, denviron 17cm en moyenne, et la
morphologie de lauditeur. Cette distance joue sur le retard et lintensit du son entre les
deux oreilles.

8 sur 32

La conjugaison des niveaux dintensit et des diffrences de temps permet loreille de


localiser de manire efficace (jusqu 3-4, selon langle dincidence) des sources situes
sur le plan azimutal. Un son est galement localis du ct de loreille layant peru au
niveau le plus lev 2 .
En lvation, la localisation est moins prcise : il nexiste plus de diffrences interaurales
de temps ou dintensit. Ce sont les HRTFs qui dfinissent particulirement la localisation
en lvation.

Representation des ITD (Source Introduction to Head-Related


Transfer Functions (HRTFs), In JAES, 2001)

- Les HRTFs
Les Head-Related Transfer Function (HRTF), regroupent lensemble des dformations
subies par le son depuis la source jusqu notre canal auditif, en modlisant le filtrage du
son par notre corps. Elles sont propres chaque individu dans la mesure ou nous
disposons tous de morphologies diffrentes, sources de dformations, dphasages,
diffractions diverses du son.
Les HRTFs comprennent fortiori les diffrences interaurales de niveau et de temps en
permettant la discrimination avant-arrire et la perception de llvation.
Les HRTFs peuvent tre mesurs ou recrs numriquement3 .
En synthse binaurale les filtres HRTFs, issus de rponses impulsionnelles finies (FIR),
sont employs afin de filtrer numriquement le signal sonore pour le situer dans un point
de lespace.

- Hugonnet & Walder, Thorie et pratique de la prise de son strophonique, 1995

- Aussal, Mthodes numriques pour la spatialisation sonore, de la simulation la synthse


binaurale, Thse de lEcole Polytechnique, 2014

9 sur 32

Schma reprsentant lacquisition et lutilisation dune HRTF (source

www.fks.oeaw.ac)

- Rverbration additionnelle (Room)


La synthse binaurale permet aujourdhui, grce des logiciels comme le SPAT de
lIRCAM de placer des haut-parleurs virtuels dans un espace 360 autour de lauditeur.
Cependant, afin de rendre cet espace plus crdible et cohrent, il est ncessaire davoir
une rverbration de salle additionnelle, configurable dans certains spatialisateurs.
Le choix de cette rverbration peut impacter la localisation des sources et peut
galement permettre dviter la sensation dinternalisation - le fait dentendre tout le
contenu lintrieur de sa tte - inhrente la technologie binaurale.4

- Le suivi des mouvements de la tte


Des travaux de recherches comme ceux de Begault, Wenzel et Anderson ont montr
galement limportance du suivi des mouvements de la tte sur la technologie binaurale.

- Begault, Wenzel, Anderson, Direct comparison of the impact of head tracking, reverberation, and
individualized head-related transfer functions on the spatial perception of a virtual speech source, in
JAES,2001

10 sur 32

En effet, rajouter la possibilit lauditeur de bouger sa tte lors de la lecture dun contenu
binaural permet de rduire considrablement les inversions de localisation avant/arrire.
Dune faon gnrale, les auditeurs ont galement une sensation de ralisme accrue.
Nanmoins, ajouter le suivi des mouvements de la tte est bien plus gourmand en
ressource, car il faut alors faire une convolution en temps rel des sources en fonction du
Head-tracker.
Cela nest pour linstant pas possible sur tous les supports, particulirement les terminaux
les moins puissants en ressources comme les terminaux mobiles.

c) Le binaural aujourdhui
Le binaural est aujourdhui au centre de toutes les attentions.
Le projet de recherche BiLi (Binaural Listening) lanc en janvier 2013 pour une dure de
trois ans runit de nombreux acteurs, universitaires et industriels, afin de proposer des
solutions concernant lindividualisation et la gestion des HRTFs.
Il intresse aujourdhui de plus en plus les producteurs de contenus. Radio France a lanc
Nouvoson, une plate-forme web runissant toutes les productions multicanales et
binaurales du groupe. La plate-forme possde galement un synthtiseur binaural
permettant dcouter une production mix en 5.1 directement au casque.
La monte en puissance de la ralit virtuelle la fois dans le jeux video et dans le
transmdia va trs certainement permettre de voir fleurir de nouvelles productions en
binaurale.
Pour certaines start-up, le binaural est devenu leur fer de lance. 3DSounds Labs, par
exemple, a lanc son casque NEOH permettant dcouter nimporte quel contenu
multicanal sur son casque via une application mobile.
Le binaural est donc aujourdhui en plein essor et cest pour cette raison que jai voulu au
cours de mon stage de deuxime anne, raliser cette exprience.

11 sur 32

II - Lexprience
Mon stage au CMAP sest centr uniquement autour de la ralisation et de lanalyse des
rsultats dun test psycho-acoustique.
En concertation avec mon maitre de stage, jai tout dabord pris deux semaines afin de
faire ltat de lart sur le sujet et dfinir le protocole. Jai ensuite ralis les stimuli.
Puis pendant un mois, jai pu faire passer lexprience une trentaine de personnes pour
ensuite dpouiller les rsultats.

A) Enjeux
Le but de cette exprience tait dtudier les diffrences de niveaux sonores lors dune
coute au casque en stro, en binaural sans suivi des mouvements de la tte que je
qualifie de binaural statique et en binaural avec suivi des mouvements de la tte, que
je qualifie de binaural dynamique.
Lobjectif principal tait de dmontrer lhypothse selon laquelle on couterait en binaural
statique et en binaural dynamique moins fort quen stro.
Cela pouvait constituer un argument supplmentaire en faveur des producteurs de
contenu en binaural et des fabricants de casques incorporant un head-tracter comme
3DSounds Labs et son casque NEOH.
Lexprience consistait donc faire couter du contenu vari aux sujets et de mesurer
lcart de volume entre le mme contenu cout selon les diffrentes conditions
proposes.

B) Les stimuli utiliss


Lide a t de produire du contenu le plus vari possible, qui serait assez reprsentatif de
lensemble de ceux que lon pourrait couter au casque.
Il fallait galement que les extraits soient assez courts afin de ne pas faire durer le test
trop longtemps. Le but tait dviter une fatigue auditive trop marque la fin du test, ce
qui aurait pu biaiser lexprience.

12 sur 32

Jai choisi de raliser cinq types dextraits diffrents dune minute environ:

un reprise rock de Baby you can drive my car des Beatles


un extrait classique de la Symphonie fantastique de Berlioz
un extrait de la pice En attendant Godotde Beckett
une ambiance urbaine aux abords de la gare Saint-Lazare
un ensemble de messages tlphoniques, que lon peut retrouver sur un rpondeur

Jai dcid de mixer ces extraits en leur laissant un maximum de dynamique, afin
damener lauditeur changer son niveau dcoute au cours de la lecture de lextrait.
Jai tout de mme essay de respecter le style musical ou le ralisme de lextrait.

C) Les outils utiliss


Afin de mener bien cette exprience, jai utilis le moins de matriel possible par souci
de transportabilit et de reproductibilit.
Lexprience a donc t mene avec uniquement un ordinateur utilisant le software
MyBino, un moteur/lecteur binaural cod par mon maitre de stage, un casque avec un tricapteur pour le suivi des mouvements de la tte et une souris dont la molette servait
rgler le niveau dcoute.

13 sur 32

- Le moteur binaural MyBino


Dans le cadre de ce stage, jai utilis le moteur binaural conu par Matthieu Aussal dans le
cadre de sa thse et appell MyBino.
Il a t dvelopp sous MATLAB et y intgre un Head-Tracker.
Ce moteur permet la lecture de fichiers audio et vido, multicanaux ou non.

Capture dcran du logiciel MyBino


Il dispose dun lecteur avec un systme
de playlist.
On peut passer indiffremment lun
des trois modes dcoutes.
Deux affichages permettent de monitorer
lexprience : la position du tracker et le
niveau dcoute du sujet

- Le Head Tracker
Les modules prsents proviennent du dtaillant lectronique SparkFun Electronics.
Cette entreprise amricaine confectionne et vend des cartes de dveloppement de
microcontrleurs et des circuits imprims.
Le head tracker ralis est compos de deux cartes et dun logiciel embarqu.

14 sur 32

9 Degrees of Freedom (9DOF) - Razor IMU


Une centrale inertie, ou Inertial Measurement Unit (IMU), est un dispositif lectronique
qui mesure la vitesse, lorientation et les forces gravitationnelles dun objet mobile.
Cet outil utilise une combinaison dacclromtres, de gyroscopes et de magntomtres.
Ceux-ci fournissant des donnes dans les trois axes de lespace, le systme est constitu
de neuf degrs de mesure inertielle, dou le nom de la carte 9 Degrees of Freedom.
Les sorties des capteurs sont traites par le micro-contrleur ATmega328 de Atmel.
Une IMU est gnralement employe en aronautique ou en astronautique.

Carte Razor IMU (source sparkfun.com)

FTDI Basic Breakout


Ce module intgre la puce FT232RL de Future Technology Devices International
permettant la srialisation des donnes afin dtablir une liaison filaire entre lIMU et le port
srie de lordinateur.

Carte FTDI (source sparkfun.com)

Le logiciel embarqu
Le 9DOF associ au logiciel embarqu constitue un Attitude and Heading Reference
System (AHRS).

15 sur 32

A la diffrence dune IMU seule, un AHRS dlivre les informations, tires des donnes
brutes des capteurs de lIMU, sur les dplacements de la tte travers 3 axes, appels
Yaw, Pitch et Roll. Ainsi, il est possible de mesurer les dplacements de la tte 360.

Illustrations du Yaw,Pitch et Roll (source https ://software.intel.com/enus/articles/realsense- overview)

Le casque -Beyerdynamic DT 770- ainsi que le head tracker utiliss pour lexprience

16 sur 32

D) Le protocole
Dans un lieu calme et peu lumineux, les participants devaient couter une squence de
cinq extraits sonores de natures diffrentes dans trois conditions dcoute : en stro, en
binaural statique et en binaural dynamique.
Un tutorial audio a t ralis et chaque participant devait rpondre un questionnaire
la fin du test.
Ce questionnaire5, au travers de questions simples sur chaque extrait, devait permettre de
valider lexprience. En effet, le test tait valide si le sujet avait vritablement cout les
stimuli.
Lensemble dun test dure une quinzaine de minutes.
Les participants taient pris de rgler leur niveau dcoute avant chaque dbut de
squence, et taient libres de le modifier au fil de la lecture afin de conserver une coute
agrable.
Pour cela, une molette de souris tait leur disposition.

E) Discussion autour du protocole


En amont de lexprience, jai du rflchir lors de llaboration du protocole carter le
maximum de biais possibles tout en le gardant suffisamment simple.
Lordre des extraits sonores a, par exemple, t chang pour chaque condition dcoute.
En effet, la rptition de la mme squence trois fois de suite aurait pu crer un effet
dapprentissage des extraits6 sur les sujets, qui auraient t alors moins attentifs lors de la
deuxime et troisime coute.
De la mme faon, lordre des conditions dcoute a t modifi chaque test, afin dviter
de mesurer la fatigue auditive des sujets en plus de la diffrence de niveau dcoute. Ainsi,
la fatigue auditive du test tait cense tre moyenne et devenir ngligeable lors du
dpouillement de lexprience.

- voir Annexe 1

- Ramsey, Zielinski, Bech On Some Baises Encountered in Modern Audio Quality Listening
Tests, in JAES Vol 56 , 2008

17 sur 32

F) Les sujets
En tout, 28 personnes ont particip ce test.
Lensemble de ces personnes ont dclar tre dans un tat de fatigue normale et nont
signal aucun trouble de laudition.
La moiti de ces personnes ont une connaissance du son (musicien ou ingnieur du son).
70% des sujets sont gs de moins de 30 ans, ce qui nest pas reprsentatif de
lensemble de la population mais reprsente bien le coeur de cible de ce genre de
technologie.

G) Rception de lexprience auprs des sujets


Cette exprience a aussi t loccasion pour moi de recueillir des tmoignages auprs de
personnes nayant jamais ou trs peu cout du contenu en binaural.
Pour la plupart des sujets, le binaural avec suivi des mouvements de la tte a t sans
surprise le mode dcoute le plus loign de leur habitude.
Certaines personnes, le plus souvent celles nayant aucune connaissance en matire de
son, nont mme pas senti de diffrence entre la version stro et la version binaurale
statique. Je nai dans le cadre de cette exprience utilis quune seule HRTF, qui na
visiblement pas convenu tout les sujets. Cela confirme bien lide quil ny a pas dHRTF
universelle et quil ncessite un apprentissage lorsque les HRTF ne correspondent pas
la morphologie de lauditeur.
Les sujets ont tous t plus ou moins unanimes sur leur prfrence du binaural statique et
dynamique.
Lextrait de thtre et lambiance urbaine taient les extraits majoritairement prfrs en
binaural, ce qui rapproche dune situation dcoute naturelle.
Lextrait classique tait celui dont les avis taient le plus partag, surement car la
rverbration et la sensation despace en enregistrement classique est primordiale.
En revanche pour lextrait rock et pour lextrait tlphonique, la majorit des personnes
prfrait la version stro, plus proche de ce que lon peut retrouver actuellement.
Cette exprience ma donc bien confirm que laudio 3D tait plus bnfique aux contenus
o la sensation despace est primordiale.

18 sur 32

III - Rsultats de lexprience


Les rsultats de cette exprience se composent de plusieurs graphiques.
En effet pour chaque stimuli et chaque participant, les niveaux de sorties RMS ont t
enregistrs dans un fichier MATLAB.
Ainsi, la diffrence entre deux niveaux dcoute a pu tre dtermine.
Les graphiques reprsents ci-dessous sont donc la diffrence de niveaux dcoute
moyenne pour chaque stimulus.
De plus, un cart-type de la diffrence de ce niveau a t ralis pour chaque graphique.

A) Stro et binaural statique


Lcart affich dans les graphiques suivants est :
Ecart = Volume RMS Stereo - Volume RMS Binaurale statique
- Extrait Rock

Lcart de volume moyen est sur


lensemble de lextrait denviron -0,5
dB.
Cela signifie la version stro a t
coute moins forte de 0,5 dB en
moyenne.

Lcart type des diffrences de


volume observes oscille nanmoins
entre 4 et 9 dB.

19 sur 32

- Extrait Classique

Lcart de volume moyen est sur


lensemble de lextrait denviron -1 dB.
Cela signifie que la version stro a t
coute moins forte de 1 dB en
moyenne.

Lcart type des diffrences de


volume observes oscille
nanmoins entre 6,5 et 11 dB.

- Extrait Tlphone

Lcart de volume moyen est sur


lensemble de lextrait denviron - 1,5
dB.
Cela signifie que la version stro a t
coute moins forte de 1,5 dB en
moyenne.

20 sur 32

Lcart type des diffrences de


volume observes oscille
nanmoins entre 6,5 et 11 dB.

- Extrait Ambiance

Lcart de volume moyen est sur


lensemble de lextrait denviron 1,
5 dB.
Cela signifie que la version stro a
t coute plus forte d1,5 dB en
moyenne.
On saperoit que larrive du train,
30 secondes, correspond au
moment o la version stro a t
coute plus forte de 5dB.

Lcart type des diffrences de


volume observes oscille
nanmoins entre 5,5 et 9 dB.

21 sur 32

- Extrait Thtre

Lcart de volume moyen est sur lensemble


de lextrait denviron 1 dB.
Cela signifie que la version stro a t
coute plus forte d1 dB en moyenne.

Lcart type des diffrences de volume


observes oscille nanmoins entre 6 et
10,5 dB.

B) Stro et binaural dynamique


Lcart affich dans les graphiques suivants est :
Ecart = Volume RMS Stro - Volume RMS Binaurale Dynamique

- Extrait Rock

L c a r t d e v o l u m e m o y e n e s t s u r
lensemble de lextrait denviron -1,5 dB.
Cela signifie que la version stro a t
coute moins forte de 1,5 dB en
moyenne.

22 sur 32

Lcart type des diffrences de


volume observes oscille nanmoins
entre 6,5 et 10 dB.

- Extrait Classique

Lcart de volume moyen est sur


lensemble de lextrait denviron -0,5 dB.

Cela signifie que la version stro a t


coute moins forte de 0,5 dB en
moyenne.

Lcart type des diffrences de volume


observes oscille nanmoins entre 5 et
10,5 dB.

23 sur 32

- Extrait Tlphone
Lcart de volume moyen est sur
lensemble de lextrait denviron - 2 dB.

Cela signifie que la version stro a t


coute moins forte de 2 dB en
moyenne.

Lcart type des diffrences de volume


observes oscille nanmoins entre 5 et 9
dB.

- Extrait Ambiance

Lcart de volume moyen est sur


lensemble de lextrait denviron 0,5
dB.
Cela signifie que la version stro a
t coute plus forte de 0,5 dB en
moyenne.
Au moment de larrive du train 30
secondes, on saperoit que cela
corresponds au moment ou la
version stro a t particulirement
cout plus forte (de 4dB).

24 sur 32

Lcart type des diffrences de volume


observes oscille nanmoins entre 6,5 et
10 dB.

- Extrait Thtre

Lcart de volume moyen est sur


lensemble de lextrait denviron 1,5
dB.
Cela signifie que la version stro a
t coute plus forte de 1,5 dB en
moyenne.

Lcart type des diffrences de


volume observes oscille
nanmoins entre 6 et 11 dB.

25 sur 32

C) Binaural statique et binaural dynamique


Lcart affich dans les graphiques suivants est :
Ecart = Volume RMS Binaurale Statique - Volume RMS Binaurale Dynamique

- Extrait Rock

Lcart de volume moyen est sur lensemble


de lextrait denviron 1,5 dB.
Cela signifie que la version binaurale
statique a t coute plus forte de 1,5 dB
en moyenne.

Lcart type des diffrences de volume


observes oscille nanmoins entre 3 et 10 dB.

- Extrait Classique

Lcart de volume moyen est sur lensemble de lextrait


denviron -0,5 dB.

Cela signifie que la version binaurale statique a t

26 sur 32

coute moins forte de 0,5 dB en


moyenne.

Lcart type des diffrences de volume


observes oscille nanmoins entre 5 et
10 dB.

- Extrait Tlphone

Lcart de volume moyen est sur


lensemble de lextrait denviron 0,5 dB.

Cela signifie que la version binaurale


statique a t coute moins forte de
0,5 dB en moyenne.

Lcart type des diffrences de volume


observes oscille nanmoins entre 5 et
10,5 dB.

27 sur 32

- Extrait Ambiance

Lcart de volume moyen est sur


lensemble de lextrait denviron 1,5 dB.

Cela signifie que la version binaurale


statique a t coute plus forte de 1,5 dB
en moyenne.

Lcart type des diffrences de volume


observes oscille nanmoins entre 5 et 9
dB.

-Extrait Thtre

Lcart de volume moyen est sur


lensemble de lextrait denviron -0,5 dB.
Cela signifie que la version binaurale
statique a t coute moins forte de
0,5 dB en moyenne.

28 sur 32

Lcart type des diffrences de volume


observes oscille nanmoins entre 5 et
10 dB.

D) Discussion autour des rsultats


Dune faon gnrale, la valeur absolue de lensemble des moyennes de diffrences de
niveaux dcoute est infrieure lcart-type de ces diffrences.
Cela signifie donc que les moyennes ne sont pas reprsentatives du phnomne que lon
voulait observer. Lexprience a donc t biaise par dautres facteurs.
En effet, le fait de changer lordre de passage des conditions dcoute chaque
participant ntait surement pas suffisant pour gommer leffet de fatigue auditive.
Observer ce genre dcart type par rapport aux moyennes peut ventuellement signifier
que la fatigue auditive a un plus grand rle que le changement des conditions dcoute sur
le niveau sonore.
De la mme faon, bien que les extraits aient t brasss a lintrieur de chaque
squence dcoute, cela na srement pas permis de ngliger totalement leffet
dapprentissage des extraits. En effet, les sujets avaient tendance couter plus fort lors
de la premire squence , au moment de la dcouverte des stimuli.
Il aurait fallu, pour viter ces biais, raliser lexprience en trois temps distincts, ce qui
aurait permis de laisser le temps aux sujets doublier les diffrents stimuli.
Il aurait galement fallu que le niveau de fatigue des participant soit quivalent chaque
temps de lexprience.
Malheureusement dans le cadre de ce stage, je nai pas pu mettre en place ces conditions
pour des raisons de temps et de logistique.

29 sur 32

Conclusion

Ce stage, bien que les rsultats naient pas t concluants, a t une vritable opportunit
pour moi de voir le nombre de biais possibles et quil faut viter lors de llaboration dun
test psychoacoustique.
De plus, les tapes lors de la ralisation de ce test, notamment la phase de recherche
darticles scientifiques, ont t pour moi une bonne prparation au mmoire de fin dtude
qui devra tre ralis en fin danne.
De la mme faon, ce stage ma apport un certain savoir-tre lors du passage des tests
dont je naurais jamais souponn limportance. En effet, le comportement du testeur un
rle primordiale dans le bon droul du test. Il convient de garder une attitude totalement
neutre sous rserve davoir un sujet qui en pensant bien faire, biaise lexprience .
Ce stage, de par laccompagnement qui a t dcid en accord avec Matthieu Aussal, ma
permis galement dacqurir une plus grande autonomie.
Jai galement pu dvelopper un peu plus mes comptences en MATLAB, un logiciel de
programmation dont javais eu une initiation en cours lors de la deuxime anne.
Jai pu raliser lors de ces tests limportance et la plus value quapporte le binaural
dynamique pour renforcer des contenus o la sensation despace est importante comme
la dramatique sonore, par exemple.
Ce stage a en plus de consolid mon envie de faire mon mmoire de fin dtude sur le
binaural avec suivi des mouvements de la tte, pu me permettre de circonscrire un peu
plus mon sujet et ma problmatique.

30 sur 32

Bibliographie
-

Begault, Wenzel, Anderson, Direct comparison of the impact of head tracking,

reverberation, and individualized head-related transfer functions on the spatial perception


of a virtual speech source, in JAES, 2001

- Hugonnet & Walder, Thorie et pratique de la prise de son strophonique, 1995


- Cheng, Corey ,Wakefield, Gregory , Introduction to Head-Related Transfer Functions
(HRTFs): Representations of HRTFs in Time, Frequency, and Space, in JAES, 2001
- Ramsey, Zielinski, Bech On Some Baises Encountered in Modern Audio Quality
Listening Tests, in JAES , 2008
- Aussal Matthieu, Mthodes numriques pour la spatialisation sonore, de la simulation
la synthse binaurale, Thse de lEcole Polytechnique, 2014

Remerciements
Je tiens remercier toute lquipe du CMAP et toutes les personnes ayant pass mon
exprience. Jespre que les chocolats taient une rcompense assez satisfaisante.

Je tiens remercier particulirement Franois Alouges pour sa sympathie et ses conseils.


Et je tiens videmment remercier Matthieu Aussal de mavoir donn de son temps, de
mavoir conseill chaque tape de ce stage et de mavoir permis davoir de nouvelles
perspectives sur mon sujet de mmoire.

Je tiens remercier Sofia, pour sa voix et sa patiente relecture.

31 sur 32

Annexe
1- Questionnaire de lexprience

32 sur 32