Vous êtes sur la page 1sur 48

Mod` le sonore pour applications interactives

e
St phane Conversy
e
1995

Acoustique et Psycho-Acoustique
1.1 Acoustique
1.1.1 Repr sentation du son
e
1.1.2 Enveloppe damplitude
1.2 Psycho-Acoustique
1.2.1 La hauteur
1.2.2 Le volume
1.2.3 Le timbre
1.2.4 La localisation

8
8
8
10
11
11
11
12
12

Le son et linformatique
2.1 Les Synth` ses Sonores
e
2.1.1 Synth` se additive
e
2.1.2 Synth` se soustractive
e
2.1.3 Synth` se non lin aire
e
e
2.1.4 Synth` se par mod` le physique
e
e
2.2 Exemples dutilisation du son non-parl
e
2.2.1 Les messages cod s
e
2.2.2 Les indicateurs d tat et de contr le
e
o

14
14
14
15
15
16
16
16
17

ENO
3.1 Principe
3.2 Description d taill e
e
e
3.2.1 Les sources et larbre des sources
3.2.2 Lh ritage dattribut
e
3.2.3 Les sources primitives
3.2.4 Les sources de haut-niveau
3.2.5 Lespace sonore

24
24
25
25
25
26
26
27

Intoduction
Intoduction
Le son dans linformatique
Plan

5
5
5
6

Table des mati` res


e

4 Utilisation et extension du mod` le sonore


e
4.1 Les ascenceurs
4.1.1 Description du probl` me
e
4.1.2 Une solution sonore
4.1.3 Les Sheppard-Risset Tones
4.1.4 Le son dascenseur
4.1.5 Utilisation dans les barres de d lement
e
4.1.6 Comparaison avec la solution de Brewster
4.1.7 Conclusion
4.2 Les Environnements
4.2.1 Description du probl` me
e
4.2.2 Une solution sonore
4.2.3 Exemples denvironnement
4.2.4 Construction des sons
4.2.5 Comparaison avec la solution de Brewster
4.2.6 Conclusion
4.3 Les Pi` ces
e
4.3.1 Description
4.3.2 Lalgorithme
4.3.3 Complexit
e
4.3.4 Utilisation

28
28
28
29
30
30
31
32
32
33
33
33
34
36
40
40
40
41
41
44
44

Conclusion

45

D veloppements futurs
e

3.2.6

27

Introduction
Introduction
Dans la vie de tous les jours, nous utilisons tous nos sens pour acqu rir des ine
formations sur le monde qui nous entoure. En particulier, le syst` me visuel nous
e
donne des donn es d taill es sur une partie de ce monde, et le syst` me auditif nous
e
e
e
e
fournit des donn es g n rales qui ne peuvent etre per ues par la vue. La combinaie
e e

c
son de ces deux sens nous donne la plupart des informations importantes sur notre
environnement.
Il est donc int ressant dadapter ces deux vecteurs dinformations que sont la
e
vue et loue a linteraction homme-machine. Ainsi, comme dans un environnement
`
naturel, lutilisation de ces deux sens permettrait davoir un suppl ment dinfore
mation quun seul m dium ne peut nous fournir : pendant que nous concentrons
e
notre attention visuelle, pour editer un document par exemple, nous pourrions sur
veiller l tat dautres processus en t che de fond (arriv e de courrier electronique,
e
a
e

etat dune impression, etc). Cependant, le d veloppement des interfaces homme


e
machine a privil gi laspect graphique au d triment de laspect sonore. Courame e
e
ment, presque toutes les informations sont afch es a l cran, conduisant a une sure ` e
`
charge de l cran. La pr sence des deux m dia pourrait nous aider a pr senter les
e
e
e
` e
informations de la fa on la plus naturelle et la plus efcace possible.
c

Le son dans linformatique


Lutilisation de sons sur les ordinateurs nest pas un fait nouveau, bien quil soit
parfois fortuit. Un des exemples favoris des partisans du son est celui du bruit du
disque dur ou de limprimante. Les utilisateurs peuvent dire quand une op ration
e
de sauvegarde ou de copie a pris n, gr ce au bruit que le disque dur produit. Cela
a
leur permet de faire autre chose pendant que lop ration se d roule. Certes, le son
e
e
doit etre con u de mani` re plus formelle que cet exemple, mais il faut retenir

c
e
quil est un excellent m dium dinformation.
e
L volution de linformatique permet aujourdhui lutilisation de sons dans line
terface. En effet, la plupart des postes de travail r cents comportent des circuits soe
nores sp cialis s, comme les stations NeXT, les Apple Macintosh AV, les Silicon
e
e
Graphics Indigo (SGI) ou m me les PC. De plus, lav` nement du standard MIDI
e
e

6
dans le monde de la musique electronique et des synth tiseurs permet un contr le

e
o
toujours plus facile de ces machines. Malheureusement, ces capacit s ne sont utilie
s es essentiellement que par des musiciens professionnels ou dans les jeux vid os.
e
e
Il est important de noter que nous abordons uniquement la communication sonore dans le sens ordinateur
utilisateur (on exclut ainsi la reconnaissance de la
parole ou de motifs sonores), et que ces sons sont non parl s (pas de synth` se voe
e
cale). Pourquoi exclure lutilisation de textes parl s ? Tout dabord, pr senter des
e
e
informations gr ce a la parole est un processus plut t lent, a cause de sa nature s a `
o
`
e
rielle. De plus, une importante limitation du texte est son manque dexpressivit : il
e
faut souvent plusieurs mots pour d crire quelque chose de simple. Cest pourquoi
e
les interfaces graphiques sont apparues : il est plus facile de rep rer une ic ne parmi
e
o

dautres quun nom dans une liste. Evidemment, la synth` se vocale est parfois utile,
e
comme dans le cas ou il faut communiquer avec des non-voyants. N anmoins, cette
e
discussion ne prend pas en compte cette cat gorie.
e
On peut diviser le monde des sons non-parl s en trois groupes :
e

les alarmes et les avertissements sont des signaux qui ont priorit sur toute autre
e
information. Ils ont pour but dinterrompre les t ches courantes et dalerter
a
un utilisateur que quelque chose requiert son attention imm diate.
e
les messages d tat et de contr le donnent des informations sur une t che qui se
e
o
a
d roule.
e
les messages cod s servent a pr senter des donn es num riques sous forme de moe
` e
e
e
tifs sonores. Ces sons complexes et variables tranchent par rapport aux sons
simples des alarmes ou ceux plus r p titifs des sons de contr les.
e e
o
Ce stage ne concerne que la deuxi` me cat gorie, a savoir celle des messages
e
e
`
d tat et de contr le. Nous etudierons plus loin des cas se rattachant a ces trois cat e
o

`
e
gories, car chacun peut apporter de pr cieux renseignement sur la mani` re dutiliser
e
e
les sons dans une interface.

Plan
Le premier chapitre est une introduction aux concepts et aux termes se rapportant a l tude du son. Nous allons voir ce quest un son, les diff rentes mani` res de
` e
e
e
le repr senter, ses caract ristiques et la mani` re dont nous le percevons. Cette partie
e
e
e
peut etre saut e par les lecteurs familiers du domaine.

e
Le deuxi` me chapitre aborde lunivers de laudio en informatique. Les diff e
e
rents types de synth` ses sonores y sont pr sent es, puis divers syst` mes de sonie
e
e
e
cations sont etudi s.

e
Le chapitre suivant est consacr a une application particuli` re, le serveur Unix
e`
e
ENO. Son principe et une description d taill e y sont expos s.
e
e
e

7
Enn, le dernier chapitre pr sente les travaux effectu s pendant ce stage sont
e
e
pr sent s. Lobjet du stage etait d tudier des m thodes permettant denrichir line
e

e
e
teraction homme-machine gr ce aux sons. Pour cela, nous avons etudi trois proa

e
bl` mes particuliers des interfaces : la navigation par le biais des barres de d lee
e
ment, la gestion des modes dune application et la gestion dun environnement multifen tres. Pour chacun dentre eux, nous avons apport une solution par des algoe
e
rithmes de synth` se sonore. Cette approche se d marque de la plupart des autres
e
e
travaux dans ce domaine par lemploi de techniques de synth` se temps r el, aue
e
jourdhui rendues possibles par la puissance sonore des postes de travail. Lobjectif a plus long terme est de d nir des primitives sonores comparables a celles qui
`
e
`
existent pour la construction dapplications graphiques.

CHAPITRE 1. ACOUSTIQUE ET PSYCHO-ACOUSTIQUE

Chapitre 1

Acoustique et Psycho-Acoustique
Ce chapitre est une introduction aux termes et aux concepts utilis s dans les
e
discussions sur le son et l coute des sons. Dans la premi` re section, nous pr sene
e
e
tons les diff rentes mani` res de repr senter un son, ainsi que ses caract ristiques
e
e
e
e
principales. Dans la deuxi` me section, nous etudions comment un son est per u par
e

c
un etre humain et les retomb es quont ces effets sur la conception dinterfaces so
e
nores.

1.1 Acoustique
1.1.1

Repr sentation du son


e

Les sons sont des variations de pression qui se propagent dans lair. Une des
mani` res les plus r pandues de repr senter le son est de repr senter lamplitude en
e
e
e
e
fonction du temps. On appelle cette repr sentation une forme donde.
e
Le son montr en Figure 1.1 est une sinusode. Ce type de son est rarement rene

contr dans la nature. N anmoins, cette onde a des propri t s math matiques exe
e
ee
e
tr mement pratiques. En effet, gr ce aux travaux de Fourrier [DLH88], on montre
e
a
que les sons complexes, sous certaines conditions (il faut que leur forme donde

Amplitude

Temps

F IG . 1.1 - Une forme donde sinusodale. Ce type de graphe repr sente le son dans

e
le domaine temporel

1.1. ACOUSTIQUE

Amplitude

Frequence

F IG . 1.2 - Le spectre dune sinusode. Ce type de graphe repr sente le son dans le

e
domaine fr quentiel
e

soit p riodique), peuvent etre exprim s comme la somme dun certain nombre de
e

e
sinusodes damplitudes, de fr quences et de phases diff rentes. Gr ce a la transfor
e
e
a `
m e de Fourrier, on peut retrouver ces sinusodes avec leurs caract ristiques respece

e
tives a partir dune forme donde. On peut donc aussi repr senter un son gr ce a son
`
e
a `
spectre (amplitude en fonction de la fr quence). Ainsi, la forme donde de la Figure
e
1.1 peut etre repr sent e par la Figure 1.2.

e
e
Il est important de noter que la transform e de Fourrier permet de passer du
e
domaine temporel au domaine fr quentiel et vice-versa (gr ce a la transform e de
e
a `
e
Fourrier inverse). De plus, il ny a pas de perte dinformation lors de ces deux op e
rations. On peut remarquer que la fr quence est en quelque sorte l inverse du
e
temps : donc une forme donde est une fonction du temps (en ) et le spectre est une
fonction des fr quences (en Hz ou
e
). Dune mani` re plus g n rale, la transfore
e e
m e de Fourrier permet de passer dune repr sentation en fonction dune variable
e
e
a une repr sentation en fonction de linverse de cette variable.
`
e

Avec le th or` me de Fourrier et la transform e de Fourrier, on peut repr senter


e e
e
e
une forme donde complexe de fa on beaucoup plus explicite (cf. Figure 1.3), car
c
on peut voir effectivement la d composition du son en sinusodes.
e

Les composantes fr quentielles dun son sont appel es des partiels. Tr` s soue
e
e
vent, il nexiste aucune relation entre ces partiels, ce qui produit des sons inharmoniques. Cependant, certains sons ont des partiels qui sont des multiples entiers du
partiel de plus basse fr quence (la fr quence fondamentale) : ces sons sont dits hare
e
moniques. Les instruments traditionnels sont g n ralement con us de mani` re a ce
e e
c
e `
quil produisent ce type de sons, et cest ce qui les rend agr ables a ecouter.
e
`
Si lon regarde a nouveau la Figure 1.3, on remarque que les deux composantes
`
sinusodales nont ni la m me amplitude, ni la m me phase. Si lon changeait la

e
e
phase de la deuxi` me composante par exemple, la forme donde ne serait plus du
e
tout la m me. Pourtant, le son entendu serait identique au pr c dent, cest-` -dire
e
e e
a
que la perception dun son ne d pend pas des phases de ses composantes. Le spectre
e
(amplitude = f(fr quence)) est donc plus important que la forme donde.
e

10

CHAPITRE 1. ACOUSTIQUE ET PSYCHO-ACOUSTIQUE

+
Domaine Temporel

=
Partiels

Domaine Frequentiel
F IG . 1.3 - Un forme donde complexe. Le domaine des fr quences est plus facile a
e
`
manipuler

D
S
R

F IG . 1.4 - Une enveloppe ADSR

1.1.2

Enveloppe damplitude

Cependant, cette repr sentation ne tient pas compte de l volution du son au


e
e
cours du temps. En effet, les sons naturels ne stagnent pas, ne serait-ce que parce
quils ont un d but et une n. Un moyen de caract riser l volution de lamplitude
e
e
e
au cours du temps est de tracer lenveloppe damplitude, cest-` -dire le contour de
a
la forme donde (cf. Figure 1.4). La repr sentation la plus r pandue est celle dite
e
e
ADSR (Attack, Decay, Sustain, Release) ; cependant, on nest pas oblig de se lie
miter a quatre segments, ni m me a des segments.
`
e
`
Ce type de repr sentation peut etre adapt au spectre, en d nissant lenveloppe
e

e
e
de chaque partiel (Figure 1.5). Les evolutions relatives de lamplitude de chaque

partiel permettent de caract riser la couleur dun son, autrement dit son timbre.
e

1.2. PSYCHO-ACOUSTIQUE

11

Amplitude

Temps

Frequence

F IG . 1.5 - Un spectre variable au cours du temps

1.2

Psycho-Acoustique

La psycho-acoustique est l tude des ph nom` nes r gissant la perception des


e
e
e
e
caract ristiques dun son par lhomme. La prise en compte des effets psycho-acoustie
ques est n cessaire lors de la conception dune interface sonore. En effet, lignoe
rance de ces effets peut conduire au fait quun utilisateur ne peut diff rencier deux
e
sons, ou ne peut les entendre. On consid` re g n ralement quatre caract ristiques
e
e e
e
psycho-acoustiques : la hauteur, le volume, le timbre et la localisation [Gav90a].

1.2.1

La hauteur

La hauteur correspond a la fr quence, mais sa perception nest pas lin aire par
`
e
e
rapport a la fr quence. Ainsi, tripler une fr quence entre 1 kHz et 3 kHz ne fait que
`
e
e
doubler limpression subjective de hauteur. De plus, la hauteur dun son est inuenc e par son intensit : a moins de 2 kHz, une augmentation dintensit diminue la
e
e `
e
hauteur per ue. Enn, les timbres brillants , cest-` -dire ceux des sons dont les
c
a
hautes fr quences ont une grande energie, paraissent plus haut que les sons sourds.
e

a
En g n ral, notre oreille nest pas absolue , cest-` -dire quils ne peuvent
e e
trouver la fr quence du son quils viennent dentendre. En revanche, beaucoup de
e
gens ont une oreille relative : ils peuvent diff rencier deux sons de hauteurs diff e
e
rentes (bien que certaines soient incapables de dire lequel des deux est le plus haut).
Ces deux derniers faits indiquent quil ne faut pas essayer de communiquer des valeurs absolues avec des hauteurs ; lafchage de l volution dune fonction selon
e
une dimension (que lon associera au temps) est plus appropri e a ce type de m e `
e
dium [Bly90].

1.2.2

Le volume

Le volume correspond a lamplitude dun son selon la relation


`

CHAPITRE 1. ACOUSTIQUE ET PSYCHO-ACOUSTIQUE

12

 
! 
"
#

avec , volume en Sones (une unit subjective), lintensit en dB et


e
e
. Cette relation dit quune augmentation dintensit de 10 dB double le voe
lume.
Les autres facteurs qui inuent sur le volume sont la fr quence et la largeur de
e
bande (ph nom` ne de masquage). Le volume d pend de la fr quence : ainsi, pour
e
e
e
e
une intensit donn e, un son a 1000 Hz naura pas le m me volume quun autre a
e
e
`
e
`
100 Hz. La relation entre le volume et la fr quence est tr` s compliqu e, il suft pour
e
e
e
sen convaincre de se r f rer a [Gav90a]. Quant au ph nom` ne de masquage, il se
ee `
e
e
traduit par latt nuation dun son par un autre. Il d pend des fr quences mises en
e
e
e
jeu par ces sons : pour les sons dont la fr quence tombe dans une bande critique,
e
l nergie est additionn e, alors qu` lext rieur de cette bande, cest le volume qui
e
e
a
e
est additionn . De plus, les sons avec une large bande de fr quence sonnent plus
e
e
fort que ceux avec une bande etroite. Donc si une information doit etre pr sent e

e
e
avec le volume, le son correspondant doit etre assez fort pour eviter le masquage

par des bruits ambiants.


En g n ral, les etres humains ne sont pas capables de juger absolument le voe e

lume dun son. De plus, l chelle des jugements relatifs est limit e a trois niveaux.
e
e `
Ces pauvres capacit s et les ph nom` nes vus plus haut obligent les concepteurs a
e
e
e
`
etre tr` s prudents quant a lutilisation du volume. De plus, il ne faut pas oublier que

e
`
les utilisateurs ont souvent un contr le du volume g n ral dune machine, et quils
o
e e
peuvent de ce fait perdre des informatisons si le niveau est trop bas.

' %
$ &% $

1.2.3

Le timbre

Le timbre occupe une place particuli` re au sein des termes descriptifs dun son,
e
car il nexiste ni d nition pr cise, ni relation math matique qui puisse le caract e
e
e
e
riser formellement. La d nition quen donne lANSI [ano73] est dailleurs plut t
e
o
vague : cest lattribut auditif qui permet de distinguer deux sons de m me hauteur
e
e
et de m me fr quence . Pourtant, le timbre est une des caract ristiques dun son
e
e
les plus imm diates et les plus facilement reconnaissables.
e
Le timbre reste donc en grande partie inconnu.On peut dire quil d pend au
e
moins du spectre et des enveloppes de chaque partiels. Actuellement, les chercheurs
dirigent leur travaux sur la source du son plut t que le son lui-m me, an de mieux
o
e
contr ler ce dernier : cest une approche par mod` le physique, que nous verrons plus
o
e
loin.

1.2.4

La localisation

La localisation est la capacit a d terminer la position dune source sonore dans


e` e
lespace. La localisation droite-gauche se fait gr ce a deux ph nom` nes : la Diff a `
e
e
e
rence Interaurale dIntensit (DII), et la Diff rence Interaurale Temporelle (DIT).
e
e

1.2. PSYCHO-ACOUSTIQUE

13

En fait, comme lhomme dispose de deux oreilles espac es de quelques centim` tres,
e
e
les sons ne sont pas per us de la m me fa on par chaque oreille.
c
e
c
La DIT provient du fait que le son ne met pas le m me temps pour parvenir a
e
`
chaque oreille : il existe une diff rence dont notre cerveau se sert pour construire la
e
perception spatiale. Cette diff rence est dautant plus importante que la source est
e
situ e sur les c t s de la t te (cest-` -dire que la source est proche dune plan passant
e
oe
e
a
par les oreilles et les pieds) et que la source est proche de nous. En effet, plus la
source est eloign e, moins la diff rence temporelle est importante. La DIT est donc

e
e
n gligeable pour les sources eloign es mais utile pour celles qui sont proches.
e

e
La DII quant a elle, est la diff rence per ue entre les intensit s. En fait, elle est
`
e
c
e
due a lombre sonore que cr e la t te dune personne. Si londe une longueur donde
`
e
e
plus grande que la largeur de la t te, la diff rence ne sera pas per ue. En revanche,
e
e
c
si elle est plus petite, une ombre sonore se forme, diff renciant ainsi les sons re us
e
c
par chaque oreille.
Limpression de profondeur est due a laffaiblissement de lintensit du signal et
`
e
a lappauvrissement du spectre. En effet, les fr quences basses voyagent mieux que
`
e
les fr quences plus hautes, dont les pertes sont facilement constatables. Il r sulte de
e
e
ce fait que les sons sourds sont per us plus eloign s que les sont brillants.
c

e
Dautres apects interviennent de mani` re importante dans la localisation, en pare
ticulier la fa on dont les sons sont ltr s par loreille externe, la t te et le haut du
c
e
e
corps. Des syst` mes comme le convoltron [S.H91] mod` lisent ces effets a laide de
e
e
`
ltres, mais ils demandent beaucoup de puissance de calcul.

CHAPITRE 2. LE SON ET LINFORMATIQUE

14

Chapitre 2

Le son et linformatique
Ce chapitre a trait a lutilisation de linformatique pour la cr ation sonore, et a
`
`
e
`
lutilisation du son dans un environnement informatique. Bien que leur formulation
laisse a penser que ces deux parties sont antinomiques, l tude de lune inuence
`
e
l tude de lautre. En effet, linformatique est un outil de mod lisation sonore, et
e
e
les sons cr es sont utilis s par les concepteurs dinterface. Les champs nouveaux
e
e
d couverts gr ce a linformatique nourrissent les besoins sonores des interfaces utie
a `
lis es par cette m me informatique.
e
e
Ce chapitre se compose donc de deux parties : les diff rentes techniques de syne
th` se sonore, puis les diff rentes utilisations du son dans les interfaces.
e
e

2.1 Les Synth` ses Sonores


e
Comme on la vu plus haut, les sons sont des variations de pression dans un milieu elastique. Le signal que repr sente lamplitude en fonction du temps est donc

e
un signal analogique. La num risation de signaux analogiques permet leur traitee
ment par linformatique. On peut donc repr senter le processus de synth` se sonore
e
e
comme un syst` me ing rant une suite de nombres repr sentant un signal, et produie
e
e
sant une sortie correspondant a une transformation math matique de lentr e.
`
e
e
Cette section d crit les diverses classes de synth` ses utilis es par les informae
e
e
ticiens et les musiciens. Pour des informations plus d taill es, voir [Moo90].
e
e

2.1.1

Synth` se additive
e

Le principe de la synth` se additive est d riv du th or` me de Fourrier. Celui-ci


e
e e
e e
dit que toute fonction p riodique peut s crire comme la somme de fonctions sie
e
nusodales de fr quence, damplitude, et de phase diff rentes. Chaque composant

e
e
est tr` s simple a synth tiser, mais leur addition permet de produire des timbres tr` s
e
`
e
e
complexes, tr` s riches et, en th orie du moins, identiques aux instruments simul s.
e
e
e
En effet, il suft danalyser un son pour d terminer chaque composante avec
e
ses caract ristiques respectives, puis de les reproduire a lidentique pour obtenir un
e
`

`
2.1. LES SYNTHESES SONORES

15

son tr` s proche de loriginal. Cest le principe quadopte le phase vocoder, ou voe
coder de phase : on d coupe la bande passante en plusieurs bandes etroites, qui sont
e

analys es ind pendamment (ou presque). On peut reconstruire le signal original en


e
e
utilisant une sinusode par bandes, chose plus facile que dimiter le son en entier.

Le vocoder de phase est aussi utilis pour cr er des effets sp ciaux. En effet, plut t
e
e
e
o
que de rejouer le son original, on peut appliquer un traitement sur certaines de ses
composantes seulement, ce qui peut donner par exemple des voix robotis es.
e
Cette technique est donc tr` s puissante mais elle a un d faut de taille : elle est
e
e
trop gourmande en calculs. Ainsi, pour un son de piano de qualit CD (44,1 kHz),
e
il faut 400 sinusodes pour synth tiser le La le plus grave. Si lon veut une polypho
e
nie de 32 voies, le nombre de partiels a traiter simultan ment reste hors de port e
`
e
e
des techniques actuelles. Cependant, de nouvelles techniques bas es sur des come
posants VLSI voient le jour, et semblent assez prometteuses [SC92].

2.1.2

Synth` se soustractive
e

La synth` se additive produit un son a partir de sinusodes primitives. La syne


`

th` se soustractive est bas e sur lid e compl mentaire de passer un signal complexe
e
e
e
e
dans un ltre an de produire la forme donde voulue. Cest une technique de sculpture, le mat riau etant le son en entr e, le ltre jouant le r le du marteau et du ciseau.
e

e
o
Ce ltre est g n ralement variable dans le temps.
e e
On associe souvent cette technique au principe de mod` le physique, car plue
sieurs instruments fonctionnent de cette fa on. Une corde de violon est une excitac
tion qui est ltr e par le corps du violon, la voix humaine est un bruit modul par
e
e
les cordes vocales...
Tout lart du programmeur est de concevoir des ltres qui imitent le comportement de tel ou tel instrument. Un des exemples les plus r ussis est celui de lale
gorithme de Karplus et Strong [Kev89], qui synth tise des cordes pinc es ou frape
e
p es. Cet algorithme est tr` s simple et peu co teux, et pourtant le son produit parait
e
e
u
r el , acoustique ; en effet, son principe est tel que deux notes identiques
e
jou es a la suite avec un tel algorithme ne sont pas exactement identiques.
e `

2.1.3

Synth` se non lin aire


e
e

Les synth` ses vues pr c demment sont dites lin aires. Elles peuvent etre d e
e e
e

e
crites comme un syst` me recevant une entr e et produisant une sortie. Si pour un
e
e
tel syst` me, une entr e
e
e
produit une sortie et une entr e
e
produit une sortie
, alors une entr e
e
produira une sortie
. Les syst` mes qui ne
e
respectent pas cette r` gle sont dits non-lin aires.
e
e
Les synth` ses non-lin aires sont g n ralement des g n rations de formes dondes
e
e
e e
e e
complexes a partir de formes simples gr ce a des op rations non-lin aires. La syn`
a `
e
e
th` se non-lin aire la plus connue est sans doute la synth` se FM (Frequency Modulae
e
e
tion ou Modulation de Fr quence) de Chowning [Cho73] , popularis e par Yamaha
e
e

0
1(

02) @6 43
7 5 )

)

09(
7 5 (
86 43
(

0
2)

CHAPITRE 2. LE SON ET LINFORMATIQUE

en 1983 avec son DX7. Elle consiste en une fr quence de base


e
(la modulation) :
dul e par une autre fr quence
e
e

B
A

16

(la porteuse) mo-

C
DA

I GE
A W TS Q
C PGX V 2UPA R5 B A  PHFA

avec
la fr quence instantan e a l chantillon ,
e
e ` e
la d viation maximum
e
par rapport a la porteuse, et le taux d chantillonnage.
`
e
Ce type de synth` se produit des spectres complexes, mais les formes donde
e
obtenues ne correspondent pas exactement a un type de son r el pr cis. N anmoins,
`
e
e
e
les m thodes non-lin aires donnent un moyen efcace de contr le de param` tres
e
e
o
e
acoustiques, comme la largeur de bande dun spectre harmonique.

AQ G

I GE
PHFA

2.1.4

Synth` se par mod` le physique


e
e

Les moyens informatiques toujours plus puissants et moins co teux ont peru
mis a un nouvelle forme de synth` se d merger ces derni` res ann es. Certains cher`
e
e
e
e
cheurs ont en effet d crit la source sonore plut t que le son lui-m me. La cr ation
e
o
e
e
de sons acoustiques y a beaucoup gagn car la technique utilis e imite le compore
e
tement dun instrument. En effet, une description compl` te de linstrument est ine
troduite dans lordinateur (un mod` le physique), et une excitation virtuelle lui
e
fait produire un son [Roa94].
Les mod` les math matiques des instruments utilisent g n ralement des syst` mes
e
e
e e
e
d quations diff rentielles. Cependant, leurs r solutions demandent des techniques
e
e
e
dapproximations successives tr` s gourmandes en temps de calcul. Par exemple,
e
les cordes sont mod lis es par le mod` le des masses et des ressorts. De ce fait, la
e e
e
moindre simulation de pincement ou de frottement demande un travail enorme des

calculs complexes. Une technique plus rapide semble cependant emerger et pourrait

avoir des retomb es industrielles dici peu. Il sagit de la technologie Waveguide ou


e
Guide dOnde, dont le principe r soudrait en grande partie les probl` mes de r soe
e
e
lutions d quation diff rentielles [Smi92].
e
e
Malgr cette complexit , cette nouvelle approche est tr` s utile, et son concept
e
e
e
tr` s int ressant pour la conception dinterfaces sonores, comme nous le verrons plus
e
e
loin.

2.2 Exemples dutilisation du son non-parl


e
Il existe plusieurs exemples dutilisation des sons dans linterface homme-machine. On peut rassembler ces cas en deux ensembles : les messages cod s et les
e
messages d tat et de contr le.
e
o

2.2.1

Les messages cod s


e

Les messages sonores cod s sont utilis s comme une alternative au graphique
e
e
pour transmettre des donn es.
e


2.2. EXEMPLES DUTILISATION DU SON NON-PARLE

17

Ainsi, Sara Bly estime que certaines fonctions sont difciles a repr senter gra`
e
phiquement : les fonctions multidimensionnelles, celles variant en fonction du temps,
ou les fonctions logarithmiques [Bly90].
Pour les fonctions multidimensionnelles, Bly utilise sept caract ristiques soe
nores : hauteur, volume, dur e, forme donde, enveloppe dattaque, et addition dune
e
5e et dune 9e harmonique. Lors dun test, elle des donn es a six dimensions sont
e `
pr sent es graphiquement, avec du son ou avec les deux a la fois. Lexp rience
e
e
`
e
montre que lutilisation du son combin e au graphisme augmente sensiblement la
e
capacit dune personne a dire si une variable appartient a un ensemble ou a un
e
`
`
`
autre.
Bly utilise une technique similaire pour les donn es temporelles. Cependant,
e
elle ne fait varier que la hauteur et le volume pour une fonction donn e tout en ate
tribuant a chacune de ces fonctions un timbre qui permet de les diff rencier. Ainsi, il
`
e
est plus facile de comparer l volution relative de deux fonctions au cours du temps.
e
Enn, pour les donn es logarithmiques, elle ne fait varier que la hauteur. En efe
fet, la hauteur est elle-m me une echelle logarithmique si on la repr sente en fonce

e
tion de la fr quence, elle sapplique donc bien a ce type de fonction.
e
`
Mezrich, quant a lui, utilise la technique de Bly pour les donn es d pendantes
`
e
e
du temps : ainsi, les donn es sont pr sent es par des m lodies, dont les notes correse
e
e
e
pondent a leurs valeurs [Bly90]. Comme pour Bly, les tests se sont r v l s concluants :
`
e ee
lutilisation du son permet aux utilisateurs une meilleure distinction des fonctions
que si elles sont afch es avec le graphisme seulement.
e
Ces techniques de pr sentation permettent a des etudiants en chimie non-voyants
e
`

de reconnatre des spectres infra-rouges de diverses substances [Pet90] [Bly90] Les

fr quences des notes entendues correspondent aux fr quences du spectre infra-rouge,


e
e
leur dur e a lintensit des pics. Les notes sont jou es dans lordre d croissant des
e `
e
e
e
fr quences pour la premi` re m lodie, dans lordre d croissant des intensit s pour
e
e
e
e
e
la deuxi` me, et enn toutes ensembles (formant un accord presque toujours dissoe
nant). Ces diff rentes auditions permettent de retrouver les substances correspone
dantes. Ainsi, selon Peterson, L thanol sonne comme une danse extra-terrestre.
e
Le polystyr` ne part dune fugue sombre, pour arriver a un tintement de cristal... .
e
`

2.2.2

Les indicateurs d tat et de contr le


e
o

Les exemples vus pr c demment concernaient la pr sentation de donn es par


e e
e
e
un moyen autre que le graphisme. Cette section aborde lutilisation du canal auditif
pour etendre et enrichir linteraction homme-machine.

SoundTrack
Lune des applications des interfaces sonores est lacc` s aux ordinateurs par les
e
aveugles et mal-voyants. L tude de tels syst` mes est non seulement utile pour les
e
e
non-voyants, mais aussi pour les voyants, car elle montre les chemins a suivre quand
`

18

CHAPITRE 2. LE SON ET LINFORMATIQUE

F IG . 2.1 - Les diff rents types dic nes (repr sentatif, abstrait, semi-abstrait)
e
o
e
l cran est surcharg et que nous devenons nous aussi dune certaine mani` re pare
e
e
tiellement mal voyants.
Ainsi, Edwards propose SoundTrack [Edw90], une interface sonore pour un traitement de texte. SoundTrack utilise a la fois des sons parl s et des sons musicaux.
`
e
L cran est divis en zones correspondant a des menus. Quand le curseur de la souris
e
e
`
passe au-dessus dune de ces zones, un son caract ristique de cette zone est emis :
e

cest une information br` ve de lendroit o` se trouve le curseur. Les sons utilis s
e
u
e
sont des siganux carr s (sons simples a synth tiser) dont la hauteur varie de gauche
e
`
e
a droite et de haut en bas. Si lutilisateur veut plus dinformation, il clique sur la
`
zone survol e et son titre est dict par le synth tiseur vocal. Pour aller plus loin,
e
e
e
lutilisateur double clique sur le menu et se retrouve avec un autre menu.
Lors des tests, il est apparu que la hauteur des signaux n tait pas utilis e. Les
e
e
utilisateurs comptent le nombre de changements de tons (cest-` -dire le nombre de
a
zones travers es), pour savoir o` se trouve le curseur.
e
u
Les Earcons
Dans [BSG90], Blattner, Sumikawa et Greenberg d nissent l quivalent soe
e
nore des ic nes : les earcons. Ils servent a donner des informations sur des objets,
o
`
des op rations ou des interactions informatiques (chier, editer, editer un chier).
e

Les auteurs consid` rent trois classes dic nes (cf. Figure 2.1) :
e
o
repr sentatives : ce sont de simples images famili` res dobjets ou dop rations.
e
e
e
Elles sont facilement reconnaissables, mais malheureusement, tous les objets ou toutes les op rations nont pas de repr sentation picturale evidente.
e
e

De plus, ces images peuvent apporter des informations parasites, car elles
peuvent etre trop d taill es.

e
e
abstraites : ce sont des combinaisons de formes g om triques d crivant un objet
e e
e
ou une op ration qui ne peut etre repr sent e par une image.
e

e
e
semi-abstraites : ce sont soit un m lange dic nes repr sentatives et dic nes abse
o
e
o
traites, soit une ic ne repr sentative tellement simpli e que lon peut la consio
e
e
d rer comme abstraite.
e
Les auteurs admettent que l chelle est continue (il est parfois difcile de classer
e
une ic ne).
o


2.2. EXEMPLES DUTILISATION DU SON NON-PARLE

19

Left Rear Left Front


Burner
Burner

Delete Character

feu
(feu-inondation)
catastrophe
(feu-falaise)
cendres

inflammation

(eau-inflammation)
paleur ou maigreur

F IG . 2.2 - Les compositions dic nes (combinaison, transformation, h ritage)


o
e

Creer

Fichier

Detruire

Chaine de caractere

F IG . 2.3 - Des motifs


Selon eux, les ic nes sont soit des el ments, soit des compositions d l ments.
o
e
ee
Ils pr sentent trois fa ons de cr er des ic nes compos es (cf. gure 2.2) :
e
c
e
o
e
la combinaison : comme son nom lindique, cest un m lange dic nes ;
e
o
la transformation : il sagit dune modication l g` re dune ic ne connue. Les
e e
o
ic nes compos es gr ce a une transformation repr sentent souvent un objet
o
e
a `
e
avec un etat associ (cf. lexemple 2 Figure 2.2) ;

e
lh ritage : cest une transformation telle que lensemble des transformations se
e
rapportant a une ic ne peut sorganiser en arbre hi rarchique. Plus on sen`
o
e
fonce dans larbre, plus la signication dune ic ne se sp cialise. Le syst` me
o
e
e
d criture japonais, dont un exemple est donn Figure 2.2 fonctionne en pare
e
tie gr ce a lh ritage.
a ` e
Blattner reprend ces principes pour ses earcons : les el ments sont des motifs (cf.
e
Figure 2.3) (petites m lodies de deux ou trois notes ais ment reconnaissables par
e
e
leur rythme, leur hauteur, et leur volume), qui peuvent etre combin es, transform es

e
e
ou h rit es.
e e

20

CHAPITRE 2. LE SON ET LINFORMATIQUE

Creer un Fichier
F IG . 2.4 - Une combinaison de motifs

Erreur

Erreur Execution

Erreur Systeme

Fichier Inconnu

F IG . 2.5 - Un exemple dh ritage


e
Ainsi, si un mi crescendo (augmentation du volume) correspond a cr er et si
` e
deux blanches, r et sol correspond a chier, ces deux notes jou es apr` s un mi crese
`
e
e
cendo correspondent a cr er un chier. Cest un exemple de combinaison, comme
` e
pour les ic nes (cf. Figure 2.4)
o
Lh ritage est une peu plus complexe : chaque niveau correspond a un attribut
e
`
( dans lordre hi rarchique : rythme, hauteur, timbre, dynamique et registre ou oce
tave). Les familles de messages sont distingu es avec le rythme (message derreurs,
e
fen tre...). Le deuxi` me niveau est une m lodie jou e au rythme de la famille a lae
e
e
e
`
quelle lobjet appartient. Cette m lodie est jou e avec une sinusode, car cest le
e
e

timbre le plus neutre. Le troisi` me niveau correspond au changement de timbre et


e
a une petite transposition positive. Enn, la dynamique et le registre interviennent
`
dans le dernier niveau. Ainsi, quand on ecoute une earcon on entend : un rythme,

une m lodie, une m lodie avec un timbre diff rent jou e un peu plus haut, puis cette
e
e
e
e
m me m lodie avec un dynamique ou jou e dans un autre registre (Figure 2.5)
e
e
e
La transformation permet de sauter des etapes dans l coute dune earcon.

e
En effet, les utilisateurs experts connaissent au bout dun certain temps le rythme caract ristique dun message derreur par exemple, et ils nont pas besoin dentendre
e
ce rythme dans learcon correspondant. On supprime donc cette etape, lutilisateur

reconnaissant la famille de learcon au rythme de la m lodie.


e
Lavantage de cette structure hi rarchique r side dans le fait que lajout dune
e
e
fonctionnalit ne n cessite pas forc ment lajout dune earcon enti` rement nouvelle :
e
e
e
e


2.2. EXEMPLES DUTILISATION DU SON NON-PARLE

21

ainsi, si une nouvelle erreur syst` me doit etre noti e par une earcon, cette derni` re
e

e
e
h ritera au moins du rythme et de la m lodie de la famille des erreurs syst` me. Lape
e
e
prentissage de nouvelles earcons nest donc pas forc ment difcile.
e
En revanche, il faut bien sentraner au moins une fois a reconnatre les types

dearcons, la famille a laquelle ils se rattachent etc. Les earcons hi rarchiques peuvent
`
e
donc etre class es dans la cat gorie abstraite , n cessitant un effort de la part de

e
e
e
lutilisateur. Bien que lapprentissage de nouvelles earcons ne soit pas obligatoirement difcile, il se peut que leur nature abstraite rende leur reconnaissance plus
difcile si leur nombre est important.

Auditory Icons
Pour pr senter des informations, Bly utilisait les caract ristiques du son en luie
e
m me comme la hauteur, le volume, le timbre etc. Ceci r sultait en des sons qui
e
e
navaient aucune correspondance avec notre environnement naturel. De la m me
e
fa on, les earcons nont aucun analogue dans notre vie quotidienne. Ils n cessitent
c
e
donc un apprentissage.
Pourtant, quand une porte se ferme, nous nentendons pas le son en terme de
hauteur, de volume, ou de timbre... Nous entendons une porte dune certaine taille,
dune certaine mati` re qui se ferme avec une certaine force dans une pi` ce dun
e
e
certain volume. En fait, nous utilisons le son an didentier les ev nements qui
e
lont cr e. Les caract ristiques de bas niveau dun son nous int ressent peu : ce qui
e
e
e
nous importe, ce sont les caract ristiques de la source sonore et de linteraction sur
e
cette source qui a donn naissance a ce son. Donc, si nous raisonnons en termes de
e
`
sources et dinteractions, plut t quen termes du son en lui-m me, nous pouvons
o
e
espr rer communiquer des informations beaucoup plus naturellement.
e
En fait, un son fournit des informations sur des objets interagissant a un endroit
`
dans un environnement. Cette approche sinspire de lapproche ecologique [Gav93]

et est utilis e par Gaver pour ses Auditory Icons (icones auditives) [Gav86]. Les
e
ic nes auditives sont des imitations de sons naturels comme des impacts ou des froto
tements. Le terme imitation est pr ferable au terme reproduction : il ny a
e
nullement besoin dune reproduction parfaite. En effet, ces sons essaient de capturer les principales caract ristiques des sons naturels de telle fa on quelles soient
e
c
ais ment identiables. Ils correspondent en fait aux caricatures graphiques, ou aux
e
dessins anim s, o` certains traits sont accentu s.
e u
e
Dans le syst` me de classication de Blattner, il existe un ordre de facilit dape
e
prentissage. Ainsi, les ic nes repr sentatives sont plus facilement reconnaissable
o
e
que les ic nes semi-abstraites, elles-m me plus facilement reconnaissables que les
o
e
ic nes abstraites. Comme nous lavons vu, la m me hi rarchie peut etre utilis e
o
e
e

e
pour les sons, les earcons etant class es dans la troisi` me cat gorie. Le fait que Ga
e
e
e
ver utilise des sons naturels, que nous avons appris a connatre et a reconnatre, per`

met une repr sentation beaucoup plus directe que les earcons. On peut donc classer
e
les Auditory Icons dans la premi` re et deuxi` me cat gorie (repr sentative et semie
e
e
e
abstraite).

CHAPITRE 2. LE SON ET LINFORMATIQUE

22

Window

CLONG !

File

Window

SHCRRR !

File

F IG . 2.6 - Sonic Finder : S lection et d placement dun chier


e
e
En r alisant le SonicFinder [Gav89], Gaver a impl ment les Auditory Icons sur
e
e
e
linterface du Macintosh. Un exemple dutilisation est celui de la destruction dun
chier (cf. Figure 2.6). Pour d truire un chier sur un Macintosh, on le s lectionne
e
e
dabord en cliquant dessus. Cette action est accompagn e dun son dimpact, ce qui
e
parait naturel. Le type du chier et sa taille sont v hicul s par le bruit du choc. Par
e
e
exemple, un chier texte a un son mat, comme un bout de bois, alors quune application a un son brillant. De plus, plus le chier est gros, plus on a limpression que
lon a tap sur un objet gros (le son est plus grave). Ainsi, le son est d ni gr ce a
e
e
a `
une source (chier, objet) et une interaction (pointer, taper).
Le fait qu` un type dobjet informatique (chier texte, application) correspond
a
un objet dune certaine mati` re (bois, m tal), classe cette repr sentation dans la cae
e
e
t gorie semi-abstraite : le son est reconnu, mais la correspondance doit etre apprise.
e

En revanche, la correspondance entre la taille de lobjet informatique et la taille de


la source sonore est totalement naturelle, donc a classer dans la cat gorie repr sen`
e
e
tative.
Il faut maintenant d placer le chier dans la poubelle, ce qui se r alise en faie
e
sant glisser le chier sur le bureau. Ici, la source na pas chang (cest toujours le
e
m me chier). En revanche, linteraction est pass du type pointer au type glise
e

e
`
ser , il faut donc faire evoluer le son en cons quence. Le son correspondant a laction glisser est un frottement. Mais le changement dinteraction ne change pas
la perception des caract ristiques de lobjet que lon avait acquises lors de la pree
mi` re interaction. Si lobjet est gros, on entend un frottement sur un objet gros. Sil
e
est en bois, on entend un frottement sur du bois. Il est important de diff rencier les
e
caract ristiques de lobjet de celles de linteraction. Ainsi, il doit etre possible de
e

reconnatre le m me objet dans deux interactions diff rentes.

e
e
Gaver utilise aussi ses Auditory Icons dans des t ches de collaboration : ARa
Kola et EAR. [Gav91]. Ainsi, avec la simulation ARKola, il mod lise une usine de
e
soda, dont le but est de fabriquer du cola et de le mettre en bouteille. Mais lusine
est con ue de telle mani` re quil faut au moins deux ecrans pour la surveiller en
c
e

entier. On fait donc collaborer deux personnes, qui doivent sentendre an de g rer
e
au mieux lusine. G n ralement, une t che de collaboration est rendue difcile par
e e
a


2.2. EXEMPLES DUTILISATION DU SON NON-PARLE

23

le fait que lon veut permettre un travail individuel, et le fait que lon doit toujours
penser au but commun. Lapport dun retour dinformation sonore permet datt e
nuer cette fronti` re. Ainsi, dans ARKola, le fait de travailler sur une partie de lusine
e
nemp che pas de se tenir au courant de la partie invisible, gr ce aux sons quelle
e
a
produit. On se tient au courant de l tat global de lusine. Par exemple, on peut tr` s
e
e
bien entendre des sons de bouteilles qui se brisent, et le signaler a son coll` gue pour
`
e
quil corrige le d faut.
e
Avec EAR, les sons sont utilis s pour signaler des ev nements a des personnes
e
e
`
travaillant dans un m me b timent. Ainsi, si un groupe de personnes veut prendre le
e
a
th et aimerait quune personne particuli` re se joigne a eux, elles lui font savoir en
e
e
`
lui envoyant un son de th vers dans une tasse. Le d but dune r union est signae
e
e
e
l e par le son de murmures augmentant en nombre et se terminant par un bruit de
e
maillet. Ces sons ninterrompent pas le travail, et peuvent etre facilement ignor s.

e
De m me, des ev nements relatifs a lutilisation dun Mediaspace peuvent etre sie
e
`

gnal s par des signaux sonores. Ainsi, quand quelquun se connecte sur une cam ra,
e
e
on entend un grincement de porte qui souvre, et quand il quitte la connexion, un
son de claquement de porte se produit. Cet environnement sonore permet a chacun
`
de se tenir au courant des activit s de ses coll` gues
e
e
Enn, le concept d Auditory Icons a et adapt au monde Unix avec le serveur
e
e
ENO [BLG94]. Ce serveur g` re un espace sonore que se partagent plusieurs applie
cations. Ces derni` res cr ent des sources a lint rieur de cet espace et interagissent
e
e
`
e
avec elles. Jai utilis ENO pour mettre en vre mes algorithmes : le prochain chae
pitre lui est consacr .
e

24

CHAPITRE 3. ENO

Chapitre 3

ENO
Ce chapitre est consacr a ENO[BLG94], un serveur audio sur Unix. Il reprend
e`
les principes dapproche ecologique [Gav93] et dAuditory Icons [Gav86] vus dans

le chapitre pr c dent. Dans un premier temps, nous verrons le principe de la struce e


ture du serveur, une description plus d taill e etant donn e en deuxi` me partie.
e
e
e
e

3.1 Principe
Comme nous lavons vu, ENO est bas sur la compr hension de lorigine des
e
e
sons : les sons sont issus de source sonore sur lesquelles une interaction se produit.
Les sources et les interactions sont caract ris es par un type et des attributs, comme
e e
la taille dun objet, ou la force dun impact. Un impact peut etre consid r comme

ee
une interaction el mentaire. Des structures plus complexes peuvent etre construites,
e

en associant plusieurs sons de sources diff rentes (parall` lement ou s quentiellee


e
e
ment), ou plusieurs sons dune m me source dispos e temporellement dun fa on
e
e
c
particuli` re (comme pour produire un effet de rebond).
e
Les sources sont plac es dans un espace sonore (cf. Figure 3.1), ce qui permet
e
non seulement de les distinguer quand plusieurs dentre elles jouent en m me temps,
e
mais aussi de leur attribuer de nouvelles caract ristiques ais ment identiable. Par
e
e
exemple, on peut emettre des messages urgents en premier plan alors que des sons

de surveillance se situeront plut t en arri` re plan. Ou encore, les sons g n r s par


o
e
e ee
une application viennent tous dun m me endroit. Beaucoup de syst` mes d coute
e
e
e
3D ont et r alis s, mais ils demandent beaucoup de ressources mat rielles et sure e e
e
tout n cessitent lutilisation dun casque. La solution retenue dans ENO est un ese
pace sonore en 2D (un plan horizontal), solution sufsante en regard de lusage de
la spatialisation.

3.2. DESCRIPTION DETAILLEE

25
Sources

Arriere

Droite

Avant

Gauche

F IG . 3.1 - Espace sonore dENO.


Root

Room

Group

Object

Node

Sample

Machine

Object

F IG . 3.2 - Structure darbre dENO. Les attributs sont h rit s le long des branches.
e e

3.2

Description d taill e
e
e

3.2.1

Les sources et larbre des sources

L l ment principal de larchitecture de ENO est la source. Ces sources proee


duisent un son gr ce une excitation, ou interaction. Les sources et les interactions
a
ont un type et une ensemble dattributs.
Les sources sont organis es en arbre, ce qui permet de partager des attributs par
e
h ritage, et de contr ler les sources primitives (les sous-sources) par les sources de
e
o
haut niveau (cf. Figure 3.2)

3.2.2

Lh ritage dattribut
e

Les attributs sont h rit s par les sources inf rieures : si un attribut nest pas d e e
e
e
ni par une source, celle-ci reprend la valeur de celui de sa source m` re. Certains
e
attributs sont relatifs, ce qui signie que la valeur dun tel attribut pour une source
est une combinaison des attributs de ses parents. Ce principe reprend celui du syst` me de fen trage X Window : les positions des fen tres a l cran sont d termin es
e
e
e
` e
e
e
par rapport aux positions des fen tres parentes. De m me, dans ENO, le gain nal
e
e
dune source est la somme des gains de ses parents et du gain propre a cette source.
`
Ainsi, on peut contr ler le gain dun ensemble de source en modiant le gain dune
o
source parente commune.

CHAPITRE 3. ENO

26

3.2.3

Les sources primitives

Les sources primitives sont les feuilles de larbre. Elles sont pour linstant au
nombre de trois (leurs attributs sont indiqu s entre parenth` ses) : des objets (taille,
e
e
mat riau), des machines (taille, vitesse, travail maxi, travail mini, rapport) et des
e
echantillons (nom du chier). Il y a deux interactions sur les objets, limpact (force)

et le frottement (force et vitesse), et une sur les machines et les echantillons, la mise

en marche (travail maxi, vitesse) et la lecture (nombres de boucles). Les attributs de


gain, de position en x et en z sont communs a toutes les sources.
`
Lune des difcult s lors de la conception dun tel serveur, est de faire en sorte
e
quil produise des echantillons a une vitesse sup rieure a celle de la fr quence d chan
`
e
`
e
e
tillonage. Sinon, des clics seront audibles lors de la reproduction. Cest pour cela
que les algorithmes de synth` se se doivent d tre performant.
e
e
Gaver a con u deux algorithmes [Gav90b] :
c

les objets : Gaver constate que le son produit par des objets ont le m me spectre
e
pour les deux interactions (impact et frottement). Il d crit donc les objets a
e
`
laide dune banque de ltres qui accentue ces fr quences dont les caract e
e
ristiques d pendent de celles de lobjet (taille et mat riau). Le signal trait
e
e
e
par cette banque est soit une sinusode de courte dur e (impact), soit un bruit

e
blanc (frottement).
les machines : Pour ce son, la synth` se FM est utilis e. En effet, une machine proe
e
duit un bruit qui est assez r p titif et qui semble avoir un mouvement cye e
clique. En utilisant la modulation autour de la porteuse, on peut reproduire
ces caract ristiques.
e
Les sons des objets sont dun grand r alisme, alors que ceux des machines le
e
sont moins. Ceci est d aux approches diff rentes qua eu Gaver pour les concevoir.
u
e
Pour le premier cas, il a etudi le son de plusieurs objets de taille, de forme et de

e
mat riau diff rents, ce qui lui a permis den d nir les principales propri t s. Pour
e
e
e
ee
le deuxi` me cas, il na pas etudi de vraie machine (pour la bonne raison quil y en
e

e
a une multitude et quaucune nest vraiment famili` re a tout le monde). Il sest donc
e `
interess aux caract ristiques quil voulait inclure et a cr e un son qui les reprenait,
e
e
e
sans quil existe vraiment. En fait, limportant nest pas que les sons soient dun
grand r alisme : il suft quon les reconnaisse et que leurs caract ristiques inuent
e
e
r ellement sur le son produit.
e
Par ailleurs, les algorithmes de synth` se des sons dobjets et de machines pere
mettent un contr le des param` tres des sources et des interactions, m me pendant
o
e
e
que le son est jou . Cette particularit donne aux applications un moyen de modier
e
e
en temps r el un son, et de r percuter ainsi un changement d tat du syst` me.
e
e
e
e

3.2.4

Les sources de haut-niveau

Deux types de sources de haut-niveau ont et impl ment s : les nuds et les
e
e
e
groupes. Les nuds sont de simples regroupement de sources sous un anc tre come

3.2. DESCRIPTION DETAILLEE

27

mun, ce qui permet de manipuler le gain et la position de lensemble facilement.


Les groupes sont des nuds qui permettent de jouer des sources de deux fa ons :
c
s quentiellement et parall` lement. Il est pr vu un troisi` me type de s quencement,
e
e
e
e
e
le rebond.

3.2.5

Lespace sonore

Toutes les sources sont positionn es dans lespace sonore, quelque soit leur type.
e
Comme nous lavons vu, cet espace est en deux dimensions : la notion de hauteur
nest pas incluse dans ENO, car elle n cessiterait et des calculs trop importants et
e
le port dun casque (ou lutilisation de quatre hauts-parleurs), contrainte que lon
souhaite eviter.

Le positionnement droite-gauche est obtenu en faisant varier les amplitudes des


canaux st r o : plus un son se situe sur un des c t s, plus l cart de volume entre le
ee
oe
e
haut-parleur droit et gauche est important.
Limpression d loignement fait appel a deux techniques. La premi` re est late
`
e
t nuation du volume en fonction de la distance. Plus le son est faible, plus il nous
e
parat lointain. La deuxi` me part de la constatation que les fr quences graves sont

e
e
moins sensibles a la distance que les fr quences aigues : un son lointain est plus
`
e
etouff . Il faut donc ltrer le son en lui enlevant un certain nombre de ses plus hautes

e
fr quences en fonction de la distance.
e
Ces techniques ont lavantage d tre peu gourmandes en calcul, pour des r sule
e
tats tr` s satisfaisants.
e

3.2.6

D veloppements futurs
e

Les auteurs de ENO pensent rendre celui-ci un peu plus quun simple serveur
dic nes auditives : lint gration de sons parl s, de connexion MIDI avec des syno
e
e
th tiseurs, ou m me dearcons doit etre r alis e. Ceci transformerait ENO en un
e
e

e e
support de toute information pr sent e auditivement.
e
e

28

`
CHAPITRE 4. UTILISATION ET EXTENSION DU MODELE SONORE

Chapitre 4

Utilisation et extension du mod` le


e
sonore
Ce chapitre est consacr au travail que jai r alis durant mon stage. Il se die
e e
vise en trois parties, chacune concernant un probl` me particulier dinterface : les
e
barres de d lement, la gestion des modes et la gestion des fen tres. Pour chaque
e
e
probl` me expos , une solution sonore est propos e. La conception des sons et leur
e
e
e
complexit sont analys s. Enn, pour deux de ces probl` mes, Brewster [Bre94] a
e
e
e
des solutions auxquelles sont compar es celles pr sent es ici. Les impl mentations
e
e
e
e
de ces solutions ont et r alis es comme des extensions a ENO.
e e e
`

4.1 Les ascenceurs


Dans cette section, nous allons montrer comment un probl` me dinterface peut
e
etre r gl gr ce a lapport du son, et en particulier gr ce a une ic ne auditive.

e e a `
a `
o

4.1.1

Description du probl` me
e

Nous connaissons tous la barre de d lement, lobjet interactif qui permet de


e
faire d ler une vue dun document trop grand pour tenir enti` rement a l cran (cf.
e
e
` e
Figure 4.1). On peut lutiliser de diff rentes fa ons. Lutilisateur peut cliquer sur les
e
c
` ches du haut et du bas, cliquer sur la zone de d lement ou faire glisser lascene
e
seur a lendroit d sir . Ces manipulations ne sont pas sans probl` me :
`
e e
e
Se trouver hors de la zone de d lement : Quand on manipule lascenseur, on peut
e
etre amen a sortir de la zone qui prend en compte le d placement. Le fait de

e
e
sortir de cette zone annule leffet escompt , cest-` -dire attribuer une noue
a
velle position a lascenseur. Lors du rel chement du bouton de la souris, le
`
a
texte ne d lera pas : lutilisateur, qui peut tr` s bien ne pas s tre aper u de
e
e
e
c
sa mauvaise manipulation, ne comprendra pas ce qui sest pass .
e

4.1. LES ASCENCEURS

29

Ascenceur
Zone de defilement

Contour de lascenceur

F IG . 4.1 - Une barre de d lement


e

F IG . 4.2 - Effet de bond sur place : lascenseur saute de part et dautre du curseur
en F, G et H

Etat de la position : Lors du d lement, il est difcile de rep rer sa position dans
e
e
le document.
Les sauts : On a vu que lon pouvait manipuler lascenseur en cliquant dans la zone
de d lement. Ceci d place lascenseur selon une valeur arbitraire, en g n e
e
e e
ral l quivalent dune page. Si le d placement est grand par rapport a la taille
e
e
`
de lascenseur, celui-ci fait des bonds . Si le pointeur se trouve entre deux
bonds, lascenseur saute au-dessus du curseur ind niment, car pour une poe
sition, il est au-dessus du curseur, et pour lautre il est au-dessous (gure 4.2).
Lutilisateur, qui regarde d ler son document, ne saper oit pas quil regarde
e
c
toujours les deux m me pages : a partir dun certaine vitesse de d lement il
e
`
e
ny a gu` re de diff rences entre les pages, et il est souvent difcile den ree
e
connatre une.

Ces trois probl` mes sont dus au fait que la manipulation et le contr le sollicitent
e
o
tous les deux la vision. En effet, il faut surveiller ce que lon fait sur la barre de
d lement, et regarder le document pour savoir o` lon en est dans le d lement.
e
u
e
Malheureusement, la vue nest pas partageable : on ne peut concentrer son attention
visuelle que sur une seule chose. Comme de toute fa on la surveillance du document
c
est obligatoire dans cette op ration, il faut un autre moyen de surveiller la barre.
e

4.1.2

Une solution sonore

On a vu que le m dia visuel est occup par la surveillance du document. Poure


e
quoi ne pas utiliser le son pour surveiller l tat de la barre de d lement ? Cest la
e
e

`
CHAPITRE 4. UTILISATION ET EXTENSION DU MODELE SONORE

30

Amplitude

Amplitude

log(Frequence)

log(Frequence)

F IG . 4.3 - Composition dun Sheppard-Risset Tone : pour un son qui monte , les
partials glissent en suivant la courbe en cloche.

solution que je propose : une imitation du son dun ascenseur. Ce son utilise une
illusion acoustique d couverte par Sheppard et Risset : les Sheppard-Risset Tones
e
[Ris77].

4.1.3

Les Sheppard-Risset Tones

Tout le monde connat des illusions doptique, comme la roue du carrosse qui

tourne a lenvers au cin ma. Pourtant, bien peu de gens connaissent leurs analogues
`
e
sonores. Les Sheppard-Risset Tones en sont un : ce sont des sons qui nous donnent
e
limpression de monter ou de descendre en hauteur ind niment.
Comment sont-ils fabriqu s ? Ils se composent de plusieurs partiels (cf. Chae
pitre 1) dont le spectre semi-logarithmique suit une courbe en cloche. Il suft de
faire glisser ces partiels tout en conservant la forme de la courbe pour obtenir
cet effet. Prenons lexemple dun son qui monte (Figure 4.3). Les partiels graves ont
une amplitude faible, ce qui fait que leur arriv e se fait progressivement, sans
e
que lon sen aper oive. De m me, les partiels les plus aigus disparaissent subrepc
e
ticement. Pourtant, inconsciemment, le mouvement de ces partials nous font croire
que le son monte, alors que globalement il reste a la m me fr quence. On peut donc
`
e
e
utiliser ce son ind niment tout en ayant limpression quil evolue.
e

4.1.4

Le son dascenseur

Pour synth tiser un tel son, il suft donc d mettre des partiels a des fr quences
e
e
`
e
pr cises et de les faire evoluer. Il y a plusieurs param` tres :
e

e
La fr quence de base Cest la fr quence moyenne du son. Plus cette fr quence est
e
e
e
basse, et plus le son evolue dans les fr quences graves.

e
La direction Cest le sens de d placement des partiels, a droite ou a gauche.
e
`
`
La vitesse Cest la vitesse de d placement des partiels.
e
Le nombre de partiels
La r partition des partiels Cest le rapport entre un partiel et son voisin (slon une
e
echelle logarithmique).

4.1. LES ASCENCEURS

31

Pour cet algorithme, jai approxim la forme de cloche par une pyramide : les
e
calculs sont plus simples, pour des r sultats similaires. Le son produit est une sorte
e
de buzz , imitant plut t imparfaitement le son dun ascenseur r el (on dira que
o
e
cest un ascenseur de Star Trek), mais limportant nest pas l` : ses caract ristiques
a
e
sont int ressantes pour lutilisation souhait e.
e
e
Il faut maintenant faire correspondre aux caract ristiques du son des attributs
e
qui puissent sadapter a sa source, a savoir le d placement de lascenceur. La fr `
`
e
e
quence de base sert a d terminer l tage auquel se trouve lascenceur : plus la fr ` e
e
e
quence est haute, plus lascenceur sera haut. La direction de d placement des pare
tiels correspond a la direction de marche de lascenceur. Enn, on d termine la hau`
e
teur du b timent dans lequel evolue lascenceur en nombre d tages.
a

e
La vitesse, le nombre des partiels et leur r partition ne font pas partie des attrie
buts de haut-niveau de lascenceur. Les deux derniers parce quils ne correspondent
a rien intuitivement et que leur variation nest pas tr` s signicative. Il faut donc les
`
e
xer : pour un son simulant bien les Sheppard Tones, six partiels au moins sont n e
cessaires. Utiliser plus de partiels napporte rien et rend le son p nible. Leur r pare
e
tition ne doit pas etre trop etendue, sous peine de couvrir trop de spectre, et donc de

ne plus pouvoir utiliser la fr quence de base efcacement. Un rapport de 1.2 entre


e
les fr quences semble la bonne solution. Quant a la vitesse, elle nest pas un attribut
e
`
s mantique : seule une valeur x e et bien choisie permet lefcacit des Shepparde
e
e
Risset Tones (si elle est trop rapide ou trop lente, leffet de glissement est annul ).
e
Comme les partiels sont au nombre de six, il faut calculer six sinusodes par

echantillons. Mais lutilisationde tables pr alablement calcul es ne p nalise pa trop

e
e
e
la performance de lalgorithme. De plus, lutilisation dune pyramide a la place dune
`
cloche permet des calculs plus rapides.

4.1.5

Utilisation dans les barres de d lement


e

Le premier probl` me etait de savoir si lon se trouvait toujours dans la zone de


e

d lement. Avec lusage dun son, quelquil soit, il est facile de le r soudre : il suft
e
e
en effet de produire un son lorsque tout marche bien, et de laisser place au silence
lorsque lutilisateur nest plus dans la zone ad quate. On utilise ici le fait que le
e
moyen de contr le du document est diff rent de celui de la surveillance de la barre.
o
e
Cest dailleurs la justication principale de lutilisation du son dans les interfaces.
Le troisi` me probl` me est celui des sauts de lascenseur de part et dautre du
e
e
curseur. En utilisant les Sheppard-Risset Tones, on connait a tout instant la direc`
tion de d placement. Donc si lon fait correspondre le d placement de lascenseur
e
e
graphique avec celui de lascenseur sonore, leffet de bond se traduira par un va-etvient sonore entre descente et mont e.
e
Le second probl` me (d terminer la position de la vue dans le document) est r e
e
e
solu par la fr quence globale du son. En associant une fr quence grave au d but
e
e
e
du document et une fr quence haute a sa n, il suft de d nir l cart de fr quence
e
`
e
e
e
entre deux pages et de jouer la fr quence interm diaire correspondant a la position
e
e
`

`
CHAPITRE 4. UTILISATION ET EXTENSION DU MODELE SONORE

32

de lascenseur. Pour ce qui est du choix des fr quences, il y a deux alternatives :


e
1. soit les fr quences de base sont x es une fois pour toutes, quelles que soit
e
e
la taille du document, et lon adapte l cart a celle-ci. Ceci convient bien aux
e
`
documents de petites taille. Malheureusement, pour les gros documents, on
ne pourra pas suivre efcacement le d placement de lascenseur, car la diff e
e
rence de hauteur entre deux pages ne sera pas assez importante.
2. soit l cart est x et lon d nit les fr quences de base en fonction du nombre
e
e
e
e
de pages. Ici, il faut d nir un ecart sufsamment important pour arriver a dise

`
cerner deux pages voisines. Mais encore une fois, les gros documents donneront des fr quences de base soit trop basse (difcilement audible), soit trop
e
haute (difcilement supportable).
Le fait que le son utilise les Sheppard-Risset Tones nous fait pencher vers la premi` re solution. En effet, le probl` me etait limpossiblit de d terminer la direction
e
e

e
e
de d placement dans un gros document. Mais les Sheppard-Risset Tones indique
e
justement ces d placements : si lon se d place, la hauteur globale evolue peu, mais
e
e

limpression de d placement est pr sente. Le fait de xer les hauteurs de d but et


e
e
e
de n permet dapprendre les positions relatives pour tous les ascenceurs : pour un
son de telle fr quence, lutilisateur saura o` il se trouve, quelle que soit la taille du
e
u
document.

4.1.6

Comparaison avec la solution de Brewster

Brewster [Bre94] utilise une earcon pour sonoriser la barre. Le timbre des sons
est celui dun orgue electronique. Le d lement vers le haut se traduit par un son

e
aigu (assez fort pendant un court instant pour pr venir lutilisateur, puis plus faible),
e
un son grave traduisant un d placement vers le bas. Cette technique permet d viter
e
e
les sauts et la sortie de zone. En ce qui concerne la position, comme pour lascenceur, on lui fait correspondre une hauteur de son.
Les deux m thodes sont a peu pr` s equivalente. Lapport de celle pr sent e ici
e
`
e
e
e
est le fait quelle est plus intuitive au niveau du d placement : les Sheppard-Risset
e
Tones donnent vraiment limpression que lon descend ou que lon monte, alors que
le rapport entre les deux hauteurs utilis es par Brewster est articiel.
e

4.1.7

Conclusion

Le son pr sent r pond donc aux probl` mes pos s. Cependant, m me sil a un
e
e e
e
e
e
c t plus naturel que celui de Brewster, il reste assez articiel : malgr ses attributs
oe
e
de haut niveau, il se classe a la limite des ic nes auditives. Enn, il faudrait une ex`
o
p rimentation contr l e aupr` s des utilisateurs pour r ellement evaluer cette teche
oe
e
e

nique.

4.2. LES ENVIRONNEMENTS

33

4.2 Les Environnements


4.2.1

Description du probl` me
e

Un des probl` mes bien connus des interfaces graphiques est la gestion des modes.
e
Les modes sont les etats dun syst` me qui correspondent a des interpr tations diff
e
`
e
e
rentes dune m me action dun utilisateur. Par exemple, dans VI, l diteur de texte
e
e

UNIX, le fait de taper un d dans le mode editer afchera un d , alors que


taper un d en mode commande actionnera la commande delete (effacement). Le probl` me avec les modes est que lutilisateur peut, soit avoir manqu
e
e
l v nement relatif au changement de mode, soit lavoir oubli . Par exemple, dans
e e
e
le premier cas, une personne qui ne sait pas tr` s bien taper au clavier ne regarde pas
e
l cran, et peut ne pas sapercevoir du changement. Dans le deuxi` me cas, si lon
e
e
abandonne son ordinateur un moment, pour une pause par exemple, on peut revenir
en oubliant le mode dans lequel on la laiss .
e
Plusieurs d fauts dinterface sont des probl` mes de mode :
e
e

Les botes de dialogue modales : Ce sont des objets graphiques dont on doit soc
cuper avant toute autre chose : toute action qui ne leur est pas destin e nest
e
pas prise en compte. Ainsi, si dans un traitement de texte, une bote souvre

demandant une conrmation dune action (bouton ok et cancel ), toute


touche du clavier autre que Enter ou tout clic de souris autre que sur les boutons de la bote sera perdu.

Les fen tres Dans certains gestionnaires de fen tres, il suft de positionner le cure
e
seur au-dessus dune fen tre pour la rendre active. Ceci implique que si pour
e
une raison ou une autre, le curseur glisse sur le fond d cran ou sur une autre
e
fen tre sans que lutilisateur ne sen aper oive, les actions de ce dernier ne
e
c
seront pas redirig es vers lapplication propri taire de la fen tre voulue.
e
e
e
Plusieurs solutions graphiques ont tent de r soudre ces probl` mes. Malheureue
e
e
sement, cest justement le fait que ces solutions soient graphiques, donc surchargeant ce m dia, qui les rende inefcaces.
e

4.2.2

Une solution sonore

Ici encore, lutilisation du son peut r soudre en partie le probl` me des modes.
e
e
On a vu que les erreurs de lutilisateur etaient dues soit a une inattention, soit a un

`
`
oubli. Le fait que loubli soit une des causes implique que la notication de l tat du
e
syst` me doit etre permanente. Lun des avantages du graphisme est que ce m dia se
e

e
pr te bien a la notication permanente : une ic ne ou une couleur diff rente nest
e
`
o
e
pas perturbante. Malheureusement, ces informations sont souvent insufsantes, car
elles ne sont pas afch es au point dattention.
e
Le probl` me est d mettre un son en continu sans pour autant quil devienne
e
e
insupportable. En sinspirant de lapproche ecologique, il mest apparu que lon

`
CHAPITRE 4. UTILISATION ET EXTENSION DU MODELE SONORE

34

pouvait utiliser des sons de notre environnement naturel. Lorsque lon se trouve immerg dans une environnement sonore, si celui-ci nest pas perturbant ou ennuyeux,
e
on a tendance a ne plus faire attention aux sons emis : leur perception tombe en
`

arri` re-plan de notre conscience. En revanche, un changement notable de cet ene


vironnement fait remonter sa perception en avant-plan de notre conscience.
Le probl` me des fen tres peut donc etre r solu gr ce a des environnements soe
e

e
a `
nores. En effet, si a chaque fen tre on associe un environnement, le changement de
`
e
fen tre active saccompagne du changement de lenvironnement actif correspone
dant. Comme les sons sont emis en permanence, on ne peut pas se tromper de fe
n tre.
e
Quant au probl` me des modes, sa r solution d coule du pr c dent. On a vu que
e
e
e
e e
lon pouvait diff rencier les applications a laide denvironnement. Les sons emis
e
`

tombent dans larri` re-plan de notre conscience. Pour avertir dun changement de
e
mode, il suft de modier l g` rement lenvironnement, de mani` re a ne pas faire
e e
e `
croire que lon a chang dapplication. La modication fait revenir la perception
e
des sons en avant-plan de notre conscience. Le but recherch , cest-` -dire pr venir
e
a
e
lutilisateur, est bien atteint. Mais cette modication doit etre permanente, pour ne

pas que lutilisateur oublie le mode dans lequel il est.


Ainsi, on d nit deux etats pour un environnement : calme et perturb . Par exeme

e
ple, le mode normal dun traitement de texte est l dition : lorsque lon ecrit, on ene

tend un environnement calme. Lappartition dune bote de dialogue se traduit par la

perturbation de lenvironnement. Tant que la boite reste a l cran, emp chant l di` e
e
e
tion, lenvironnement reste perturb . D` s que le probl` me est trait e, lenvironnee e
e
e
ment revient en mode calme (gure 4.4).

4.2.3

Exemples denvironnement

Actuellement, jai impl ment deux environnements :


e
e
La Mer Cet environnement simule un bors de mer. En mode calme, on entend des
sons de vagues se brisant sur la gr` ve. Quand lenvironnement est perturb ,
e
e
le soufe du vent sy ajoute.
StarWar Cet environnement simule le bruit dun vaisseau spatial. En mode calme,
on entend la combustion dun r acteur et des bips evoquant les sons dun ore

dinateur de Star Trek. En mode perturb , les sons pr c dant sont gard s, mais
e
e e
e
des sons de lasers, dexplosions et dautres vaisseaux sont ajout s, donnant
e
limpression que lon assiste a une bataille spatiale.
`
Il est tr` s important de soigner la conception des sons, car ils per us continuee
c
ment. Sils sont ennuyeux a ecouter, les utilisateurs voudront les supprimer. En ce
`
qui concerne lenvironnement StarWar, pour linstant, la technique utilis e est l chane
e
tillonnage, cest-` -dire que ces sons ont et pr c demment enregistr s. Malheureua
e e e
e
sement, a cause de cette technique, ces sons ne sont pas vari s ce qui fait que ra`
e

4.2. LES ENVIRONNEMENTS

35

vaisseau

vagues

vagues+vent

F IG . 4.4 - Utilisation dEnvironnements Sonores. En A, le pointeur est sur une application produisant un son de vaisseau spatial. En B, le pointeur est sur le fond :
aucun son nest produit. En C, il sagit dune autre application, dont lenvironnement est la mer. En D, lenvironnement est perturb a cause de lapparition
e `
dune bote de dialogue modale.

pidement la monotonie sinstalle. Je compte synth tiser prochainement les sons de


e
cet environnement pour pouvoir les contr ler et eviter cette monotonie.
o

Pour lenvironnement Mer, les sons de vagues et de vent sont synth tis s, ce
e e
qui les rend tr` s vari s. On peut contr ler la taille et la forme des vagues, ainsi que
e
e
o
la nature de la plage sur laquelle elles s chouent. En tirant au hasard pour chaque
e
vague ses caract ristiques, on produit des sons tous diff rents. Pour le vent, on d e
e
e
nit sa force, et les ecarts de soufe sont calcul s au hasard en fonction de cette force.

e
Ce son est continu et ne n cessite aucun contr le pour le rendre vari , a moins que
e
o
e `
lon ne veuille quil forcisse ou quil faiblisse.
Il reste beaucoup de sons naturels a imiter, qui nont pas et impl ment faute
`
e
e
e
de temps. N anmoins, on peut d j` penser a certains environnements comme :
e
ea
`
La Nature : Chants doiseaux en mode calme, et vent en mode perturb ;
e
Le Monde Sous Marin : Bruit de fond, de bulles et de sonar en mode calme, sir` ne
e
de sous-marin en mode perturb ;
e
etc.

Il est evident que lenvironnement StarWar nest pas naturel au sens propre

(de plus, il ny a pas de bruits dans lespace). Mais cest un son qui na pas besoin
d tre appris : tout le monde dans sa vie a vu un lm ou une s rie avec des vaisseaux
e
e
spatiaux. Ce genre de sons est a rapprocher des genre sound de Cohen [Coh93],
`

`
CHAPITRE 4. UTILISATION ET EXTENSION DU MODELE SONORE

36

qui construit des correspondances entre les ev nements informatiques et les sons
e
associ s provenant de la t l vision ou du cin ma. De plus, comme on la vu, ces sons
e
ee
e
ne doivent pas etre des imitations parfaites, le fait que lon puisse les reconnatre

facilement suft.

4.2.4

Construction des sons

Jai cr e deux algorithmes de synth` se : les vagues et le vent. Ce sont essentiele


e
lement des bruits blancs (cest-` -dire contenant tout le spectre possible) ltr s par
a
e
un ltre IIR ( Innite Impulse Response ou ltre r cursif) variable au cours du
e
temps. On peut d nir un ltre passe-bande, cest-` -dire laissant passer certaines
e
a
fr quences du spectre par l quation :
e
e

0 h) a 0 8g f) a f@5 U0 ( eX HE b` )


c
7 5 c 7 I c a d c( a Y
I uvX d
X a E
I A r EwDUS vua V
T a X
a W a V
X d s
r i
p
qa W d


avec :

 V7
ts 7
 Y
r

est la fr quence d chantillonnage, le i` me echantillon de sortie, le i` me


e
e
e
e
echantillon dentr e, la fr quence qui est accentu e par le ltre, et la largeur du

e
e
e
pic de fr quence accentu e. Il suft de faire varier les deux derniers param` tres (
e
e
e
et ) pour avoir un bon contr le sur le ltre :
o

x
9(

x
D)

`
tant quil reste des echantillons a produire
calculer B(n) et f(n)

`

si B(n) ou f(n) a change par rapport a literation precedente
calculer R, G, b1 et b2
calculer y

jouer lechantillon y
nsi
n = n+1
n tantque

Les vagues
Pour le bruit de vague, jai retenu trois enveloppes :
Volume : il est contr l par cinq points r partis le long du son (gure 4.5. La vague
oe
e
grossit dabord (volume haut), puis s crase sur la plage (volume haut) : il faut
e

4.2. LES ENVIRONNEMENTS

37

Volume
(19,80)

(1,100)

(40,80)

(100,1)

(27,15)

Temps

F IG . 4.5 - Enveloppe de volume. Lunit de labscisse est le pourcentage de la lone


gueur du son et lunit de lordonn e le pourcentage du volume maximum.
e
e
Frequence

(1,77)

(36,1000)

(100,1000)

(25,77)
Temps

F IG . 4.6 - Enveloppe de fr quence. Lunit de labscisse est le pourcentage de la


e
e
.
longueur du son et lunit de lordonn e est le
e
e

uy

bien s parer ces deux pics, donc on y ajoute un trou . Enn, la vague meurt.
e
Les coordonn es des cinq points sont indiqu es sur la gure 4.5.
e
e

La fr quence : a son arriv e, la vague gronde, do` un son grave. Ensuite, la vague
e
`
e
u
s crase, produisant un son plus aigu. On peut donc r aliser cette enveloppe
e
e
avec quatre points (gure 4.6).
La largeur de bande : plus la larguer de bande est grande, plus on a une impression de bruit . Quand la vague s crase, il faut simuler le frottement sur le
e
sable : une bonne fa on de le faire est dintroduire plus de bruit a la n du son
c
`
(gure 4.7).

Le bruit blanc est synth tis en tirant des valeurs au hasard. Le son nal est proe e
duit par le ltrage du ltre IIR dont les param` tres et suivent les enveloppes
e
de fr quence et de largeur de bande, et dont le volume suit lenveloppe de volume.
e
Pour rester dans la ligne des Auditory Icons, il faut d crire une vague avec des
e
param` tres naturels . Jen ai retenu trois :
e

La taille : elle contr le la dur e du son. Comme les points d nissant les enveo
e
e
loppes se r partissent le long du son selon des pourcentages, la forme globale
e
nest pas chang e.
e

38

`
CHAPITRE 4. UTILISATION ET EXTENSION DU MODELE SONORE
Largeur de Bande

(100,b3)

(36,b2)

(25, b1)
(1,50)
Temps

F IG . 4.7 - Enveloppe de bande de fr quence. Lunit de labscisse est le pourcene


e
tage de la longueur du son et lunit de lordonn e est le
e
e
. Les varient entre
400 Hz et 4000 Hz. Leur valeurs d pendent du param` tre forme de la vague
e
e

x7

uy

La forme : cest un param` tre qui contr le les valeurs des ordonn es des trois dere
o
e
niers points de lenveloppe de largeur de bande. Il ne correspond pas a une
`
entit descriptible dune vague, mais il sert a introduire un peu de vari t :
e
`
ee
deux vagues de formes diff rentes ne niront pas de la m me fa on. Le proe
e
c
bl` me est de cr er 3 valeurs (
e
e
) a partir dune seule (la forme). Il suft
`
de dire que chaque peut prendre quatre valeurs: 64 permutations sont donc
possible entre les . Soit

! 9 0 9UD7
7 7

T
 x  x
i 22PA 

x7

x7

w% V s

. Chaque
est donn e par :
e

I 4HE

x7

avec
nale de

est donc compris entre z ro et trois. La valeur


e

I 0 x 5 s E a 4  x 7
$$

ce qui donne quatre valeurs possibles :400Hz, 800Hz, 2400Hz et 4000Hz.


La plage : ce dernier param` tre ne fait pas partie de la source, mais de linteraction,
e
cest-` -dire de l crasement de la vague sur la plage. Il peut prendre quatre vaa
e
leurs correspondant a la nature de la plage (sable, graviers, galets, rochers...).
`
Il agit en fait sur le bruit : la valeur tir e au hasard est maintenue plus ou moins
e
longtemps (elle est maintenue pendant plage echantillons, plage etant com

pris entre 1 et 4), modiant ainsi le bruit obtenu.


En cr ant des sons de vagues successives avec des caract ristiques taille et forme
e
e
tir es au hasard, on peut simuler la mer.
e
Le son obtenu est a comparer avec celui de machines de ENO. On a vu que
`
ces machines nexistaient pas r ellement, et les sons produits n taitent pas dun
e
e
grand r alisme. Cependant, en les entendant on les associe imm diatement a une
e
e
`
machine, dont les caract ristiques sont transmises par celles du son. On obtient un
e

4.2. LES ENVIRONNEMENTS

39

F IG . 4.8 - Le Vent :courbe des fr quences. Le vent repr sent a gauche est plus
e
e
e`
faible que celui de droite.
r sultat similaire avec le bruit des vagues : on reconnait tout de suite la nature du
e
son, et on sait si une vague est plus grosse quune autre, ou quelles nont pas les
m me formes.
e
Le vent
La simulation du bruit du vent fait appel aux m me techniques que pour les
e
vagues. Le m me ltre est utilis , mais on xe la largeur de bande (` 60Hz) pour ne
e
e
a
faire varier que la fr quence stimul e, selon une enveloppe de fr quence similaire
e
e
e
a celle des vagues (cest-` -dire des points reli s par des droites) dont les points ont
`
a
e
e
des coordonn es choisies au hasard. Ainsi, au temps correspond une fr quence
e
et au temps
une fr quence
e
. La fr quence instantan e au temps est
e
e
interpol e lin airement entre
e
e
et
:

ec
 2h
c

c u Dc I c d
e
c
fA 5 c didd  Dcd A a huFgE  A
A  e
I ec
 2hA h DdgE whA fE
e c I c c
ec
 2fA

ec
 Dd

ec
 Dd 

c
fA

Quand
, on recommence en initialisant a la valeur de
`
et a celle
`
de
, et en choisissant de nouvelles valeurs au hasard pour
et
.
Les valeurs
et
choisies au hasard d pendent du param` tre force du
e
e
vent, dont la valeur maximum est 100 :

e
e
 Dc A  2c
c
fA  Dd
ec

ec
 DDA

jG3 $ s
ec
$ ii 22PA a PwD 5 $ b  DfA
s a ST
ST k s
jG3 c
ec
$ l
$ ua I i 22id $ s E a Pw2 5 d   2h

e
 2c A

et

est un nombre choisi au hasard compris entre 0 et 1. Plus le vent est fort, plus
les variations sont rapides et importantes, donc plus les diff rences entre et
e
sont petites et plus les diff rences entre
e
et
sont grandes. Des exemples de
trac s denveloppe sont donn s en gure 4.8. Le fait que lon choisisse des valeurs
e
e
au hasard permet dobtenir des effets de soufe tr` s vari .
e
e

ec
 Dd

c
m

ec
 DfA

jG3
Pw2

c
2A

Complexit des algorithmes


e
Ces algorithmes n cessitent une op ration cosinus et une exponentielle a chaque
e
e
`
modication du ltre, ce qui est relativement co teux. N anmoins, il est possible de
u
e
diminuer le nombre de ces op rations, en diminuant le nombre de changement de
e

40

`
CHAPITRE 4. UTILISATION ET EXTENSION DU MODELE SONORE

param` tres du ltre, surtout quand ces variations ne sont pas signicatives. De plus,
e
lemploi dune table pr calcul e du cosinus peut r duire encore le temps de calcul.
e
e
e

4.2.5

Comparaison avec la solution de Brewster

Brewster [Bre94] propose une solution pour le probl` me des fen tres : a chaque
e
e
`
fen tre est associ un timbre distinct. Un son continu est jou avec peu de volume
e
e
e
pour ne pas etre ennuyeux quand une fen tre est active. Lors dun changement de

e
fen tre, un son plus fort est jou de fa on a etre s r que lutilisateur a et averti.
e
e
c `
u
e
La solution pr sent e ici est plus naturelle, dans la ligne des ic nes auditives.
e
e
o
De plus, elle r soud le probl` me des modes.
e
e

4.2.6

Conclusion

Les environnements sonores permettent de diff rencier les applications et deux


e
etats de chaque application, ce qui semble sufsant : il suft que lutilisateur sache

que lapplication nest pas dans son etat normal. On pourrait repr senter des de
e
gr s dans l tat de perturbation dun syst` me et associer des sons aux diff rents
e
e
e
e
degr s. Cependant, cela n cessiterait un apprentissage pr cis de chaque environe
e
e
nement, donc un effort de la part de lutilisateur. Il faudrait aussi trouver plusieurs
sons pour chaque environnement, t che relativement difcile voire impossible.
a
Par ailleurs, on peut trouver dautres utilisationspour ces environnements. Ainsi,
Gaver sugg re lutilisation de sons naturels pour aider a la navigation dans un syse
`
t` me dont la repr sentation graphique occupe une surface sup rieure a celle dun
e
e
e
`
ecran [GS93]. Si lon dispose des environnements sur cette surface et que le vo
lume de chacun est inversement proportionnel a la distance qui le s pare du curseur,
`
e
lutilisateur peut se rep rer facilement et agr ablement.
e
e
Enn, le son du vent peut servir a faire passer des informations telles que le d bit
`
e
dune connexion. Par exemple, si lon sonorisait Netscape, la violence du vent serait
fonction de la vitesse de chargement dun document.

4.3 Les Pi` ces


e
On a vu dans le chapitre 2 que lapproche ecologique consistait a d nir un son

` e
comme une interaction de mat riaux a un endroit dans un environnement. Cette sece
`
tion concerne limpl mentation dun environnement dans ENO, les pi` ces. Dans
e
e
ENO, les sons sont produits comme si la source etait a lair libre. Dans une pi` ce,
`
e
les sons sont transform s, comme si les sources etaient enferm es. Ainsi, on dise

e
tinguera les sources non seulement par le son quelles produisent, mais aussi par
lenvironnement dans lequel il se produit.
La correspondance entre une pi` ce et une fen tre graphique permet de mieux
e
e
g rer un environnement multi-fen tres. Si un son est jou , la fa on dont il est transe
e
e
c
form peut nous aider a rep rer la fen tre dans laquelle se trouve la source lorigine
e
`
e
e
de ce son. Imaginons que lon entende le son dun choc dun maillet sur un bout de

`
4.3. LES PIECES

41

bois. Selon que celui-ci est plus ou moins r chi, on peut dire quil provient dune
e e
fen tre plus ou moins grande. Si la r exion est sourde, cest que le son provient
e
e
par exemple dune fen tre en arri` re plan, ou de telle application.
e
e

4.3.1

Description

Un son produit dans une pi` ce a des caract ristiques diff rentes dun son produit
e
e
e
dans un environnement sans obstacle. Dans un endroit clos, le son se propage et
vient frapper les murs. Ceux-ci r chissent tout ou partie du son, comme le ferait
e e
un miroir avec de la lumi` re. Il y a donc un echo plus ou moins marqu selon les
e

e
dimensions de la pi` ce. Pour simuler le chemin des ondes sonores dans une pi` ce,
e
e
il existe plusieurs techniques dont :
`
Le lancer de rayons : A linstar de son homologue visuel, le lancer de rayons sonore consiste a calculer les chemins des ondes de la source a nos oreilles.
`
`
Les ltres : Cette technique consiste a simuler le fond sonore restant apr` s le son
`
e
initial a laide dune banque de ltres [Moo83].
`
Les calculs mis en jeu lors du lancer de rayons sont enormes et ne peuvent faire

lobjet dune impl mentation permettant le temps r el.


e
e
La deuxi` me solution, si elle est moins ambitieuse, est donc plus raisonnable et
e
largement sufsante pour nos besoins. Les concepteurs de lalgorithme sont partis
de la constatation qu` partir dun moment assez court, lenchev trement des ondes
a
e
r chies par les murs etait tel quil etait compl` tement inutile de calculer avec pr e e

e
e
cision ces r exions, comme pouvait le faire le ray-tracing. Il est plus facile de sie
muler le bruit ambiant r sultant avec une batterie de ltres aux caract ristiques jue
e
dicieusement choisies.

4.3.2

Lalgorithme

Les types de ltres utilis s sont au nombre de deux :


e
Le ltre en peigne passe-bas : Un ltre en peigne (ou comb lter) est un ltre IIR
[DLH88] comportant une ligne a d lai de echantillons et un retour de co` e

efcient
(gure 4.9). Intuitivement, il permet de simuler un echo qui

baisse progressivement en intensit . Un ltre en peigne passe-bas (ou lowe


pass comb lter) est un ltre dans lequel est ins r un ltre passe-bas : selon
ee
la valeur du coefcient de retour , on peut simuler une d coloration du sie
gnal r echi (gure 4.9).
e

p
s qo

so

Le Allpass Filter : ce ltre a la particularit de laisser passer toutes les fr quences,


e
e
cest-` -dire que le spectre nest pas modi (gure 4.10). En revanche, les
a
e
phases des fr quences sont chang es en fonction de ces fr quences, ce qui se
e
e
e
traduit par un etalement temporel du son, rendant celui-ci plus r aliste.

42

`
CHAPITRE 4. UTILISATION ET EXTENSION DU MODELE SONORE

x(n)

y(n)

-D

x(n)

y(n)

-D

g2

+
Z

-1

g1

F IG . 4.9 - Un Filtre en Peigne (en haut) et un Filtre en Peigne Passe-Bas (en bas)
x(n)

-g

y(n)

1-g 2

-D

F IG . 4.10 - Un Allpass Filter


x(n)

P1

P2

P3

P4

P6

P5

+
A
g

y(n)

F IG . 4.11 - Banque de Filtres pour une pi` ce.


e

`
4.3. LES PIECES

43

On peut simuler un echo avec une batterie de ltres en peigne et le faire passer

dans le allpass lter pour l taler et simuler lenchev trement des ondes evoqu plus
e
e

e
haut. Les auteurs de cet algorithme [Moo83] ont constat que lemploi de six ltres
e
en peigne sufsait a rendre r aliste le son obtenu. Les ltres sont dispos s comme
`
e
e
le montre la gure 4.11. On fait passer le signal dans les six ltres en peigne dont
les valeurs de et sont diff rentes, puis la somme des signaux de sortie est trait e
e
e
par le allpass lter. Le signal obtenu est pond r par , et le signal initial par :
ee
le son nal est la somme des deux sons.
Pour rester coh rent avec le principe dENO et des Auditory Icons, il faut contr e
o
ler les pi` ces par des caract ristiques naturelles . Jen ai retenu trois :
e
e

so

Vo

La largeur et la profondeur : La largeur et la profondeur servent a d nir la taille


` e
de la pi` ce. De cette taille d pend la longueur de la r verb ration. De plus,
e
e
e
e
elles d nissent les limites des positions des objets contenus dans la pi` ce.
e
e
Ces positions sont donc relatives, et d crivent des pourcentages : un objet de
e
position
dans une pi` ce de position
e
est en fait a
`
.

5 t va r $ E
u

I
Dt ) 5 t
t
x r aE w(
I $ s ysws $
$

I t(
Dt ) HE

coloration

La texture des murs : Elle permet de d nir la


e
sons (perte de certaines fr quences).
e

des r exions des


e

Moorer [Moo83] avoue que son algorithme pr sente quelques d fauts, en partie
e
culier lextr me d pendance du r sultat par rapport aux variables des ltres. Ainsi,
e
e
e
lid al serait que les d lais des ltres en peigne soient tous premiers entre eux,
e
e
pour etre s r quaucun ph nom` ne de r sonnance ne se produise. Cependant, le fait

u
e
e
e
que ces param` tres se doivent d tre variable rend tr` s difcile la v rication de
e
e
e
e
la primalit . N anmoins, les ph nom` nes observ s ne sont pas trop g nants. Une
e e
e
e
e
e
r partition de 1:1.5 des diff rences entre les d lais semblent donner des r sultats
e
e
e
e
satisfaisants. Intuitivement, la largeur et la profondeur inuent sur la dur e de la
e
r verberation, et sur sa rapidit a arriver. Ces param` tres subjectifs sont contr l s
e
e`
e
oe
par les d lais . Leurs valeurs sont calcul es en fonction du p rim` tre de la pi` ce.
e
e
e e
e
Sachant que la largeur et la hauteur maximum est 100, la formule donnant les
en ms est :

x n

d[1] = 1+((largeur+profondeur)/3);
diff = 2+d[1]/8;
for( i = 2; i=6;i++)
d[i] = d[i-1]+diff;
diff = diff*1.5;

est compris entre 1 et 70 ms, et la diff rence de d part entre 2 et 10 ms : ces


e
e
valeurs permettent dobtenir des sons r alistes.
e
La coloration d pend des coefcients des ltres en peigne passe-bas : plus ils
e
sont grands, plus les fr quences hautes sont att nu es. Sachant que la texture a une
e
e e
valeur comprise entre 1 et 10, la formule donnant la valeur des coefcients est :

 n

o

g1[1] = (wall*90)/1000.0;

44

`
CHAPITRE 4. UTILISATION ET EXTENSION DU MODELE SONORE

x(n)

-D

y(n)

F IG . 4.12 - Un Allpass Filter a Une Multiplication


`
diff = 0.016;
for( i = 2; i=6;i++)
g1[i] = g1[i-1]+diff;

d s E {0 o
z

Le ltre en peigne passe-bas est un ltre IIR dont le coefcient global est
. Pour que ce ltre soit stable, il faut que ce coefcient soit inf rieur a 1. En se
e
`
donnant un coefcient
global a tous les ltres en peigne (an de leur donner
`
. est x a 0,83.
e`
un comportement coh rent), on peut calculer :
e
Les valeurs des param` tres du ltre allpass sont xes :
e
et le delai est
de 6 ms.
Une convention a et d cid e pour la restitution du son dans ENO: le son origie e e
nal est localis selon la m thode vue dans le chapitre consacr a ENO, tandis que le
e
e
e`
son d a la r verb ration nest pas localis (il semble provenir du fond de lespace
u` e
e
e
sonore).

~
{
$ o  oo o 4o }o
 a  0 0

I o

p
s |o

4.3.3

Complexit
e

Le ltre en peigne passe-bas n cessite deux multiplications et deux additions.


e
Comme il y a six ltres de cette sorte, il faut douze multiplications et douze additions pour la banque enti` re. Le ltre allpass requiert trois multiplications et deux
e
additions sous la forme montr e gure 4.10. Cependant, il existe une autre forme n e
e
cessitant moins de calcul (gure 4.12) : une seule multiplication et trois additions.
Le co t total de lalgorithme s l` ve donc a treize multiplications et quinze addiu
ee
`
tions.

4.3.4

Utilisation

Le concept de pi` ce peut etre utilis pour etablir une analogie avec celui des fee

n tres graphiques. Cependant, dautres applications peuvent faire lobjet demploi


e
de pi` ces. Ainsi, Gaver donne lexemple dun message electronique arrivant dans
e

une bote aux lettres [Gav86] : le son jou nous renseigne sur la nature du message

e
(texte, application...) et sur ses caract ristiques (taille...). L cho accompagnant ce
e
e
son peut t moigner du taux de remplissage de la bote au lettres ( cho large, seme

e
blant provenir dune pi` ce vide = bote vide). Le d placement dun chier sur un
e

e
disque peut aussi nous renseigner sur le taux doccupation du dique, suivant l cho
e
accompagnant le choc du chier sur le disque.

`
4.3. LES PIECES

45

Conclusion
Dans ce stage, des solutions sonores ont et apport es a plusieurs prob` me dine
e
e
teraction homme-machine. Ces solutions sinspirent du concept des ic nes audio
tives [Gav86]:
1. Les ascenceurs : gr ce aux Sheppard-Risset Tones, ils permettent de savoir la
a
direction de d placement et de se rep rer dans le document.
e
e
2. Les environnements : ces sons continus pallient le probl` me des modes. Ils
e
sont con us de mani` re a pr venir lutilisateur dun changement de mode et
c
e ` e
a fournir un contr le continu sur le mode courant dun syst` me. Mais ils per`
o
e
mettent aussi daider a la gestion dun environnement multi-fen tres.
`
e
3. Les pi` ces : con ues pour r soudre le probl` me des fen tres, elles peuvent
e
c
e
e
e
etre employ es pour dautre usages, en particulier pour informer dun taux

e
doccupation.
Bien quelles aient et cr ees dans un but pr cis, certaines des solutions ont
e e
e
dautres usages. Cependant, des tests aupr` s dutilisateurs doivent etre effectu s,
e

e
an de v rier leur efcacit .
e
e
De plus, des recherches doivent etre men es pour etendre le domaine des sons

pr sent s ici. Ainsi, la cr ation dautres environnements permettrait den avoir un


e
e
e
nombre sufsant a proposer aux applications, et de pouvoir g rer au mieux les sys`
e
t` mes multi-fen tres. Ou encore, des etudes pouss es de sons complexes a synth e
e

e
`
e
tiser (eau qui coule, par exemple) doivent etre faites an de couvrir un plus large

panorama de sons naturels [Gav93].


Enn, des effets (comme la distorsion, ou leffet Doppler pour les sources qui
se d placent) et leur utilisation pourraient etre etudi s et faire lobjet dune impl e

e
e
mentation dans ENO.

46

BIBLIOGRAPHIE

Bibliographie
[ano73] anonymous. Ameican national psychoacoustical terminology. Technical
Report S3.20, American National Standards Institute, New York, 1973.
[BLG94] Michel Beaudouin-Lafon and William W. Gaver. ENO: Synthesizing
Structered Sound Spaces. In Seventh Annual Symposium on User Interface Software and Technology (UIST94), pages 4957, November 2-4
1994.
[Bly90] Sara Bly. Communicating with sound. In Proceedings of CHI90 Conference on Human Factors in Computing Systems, volume 4, pages 5.4
5.10. ACM, April 1990.
[Bre94] Stephen Anthony Brewster. Providing a Structured Method for Integrating Non-Speech Audio Into Human-Computer Interfaces. PhD thesis,
University of York, 1994.
[BSG90] Meera M. Blattner, Denise A. Sumikarwa, and Robert M. Greenberg.
Earcons and Icons: Their Structure and Common Design Principles. In
Proceedings of CHI90 Conference on Human Factors in Computing Systems, volume 4, pages 5.485.74. ACM, April 1990.
[Cho73] John Chowning. The synthesis of complex audio spectra by means of frequency modulation. Journal of the audio Engineering society, 21:526
534, 1973.
[Coh93] J. Cohen. Kirk here: Using genre sounds to monitor background activity. In Adjunct Proceedings, ACM Conference on Human Factors in
Computing Systems, pages 6364. ACM, April 24-29 1993.
[DLH88] David J. DeFatta, Joseph G. Lucas, and William S. Hodgkiss. Digital
Signal Processing: A System Design Approach. Wiley, 1988.
[Edw90] A. Edwards. Soundtrack. In Proceedings of CHI90 Conference on Human Factors in Computing Systems, volume 4, pages 5.305.46. ACM,
April 1990.

BIBLIOGRAPHIE

47

[Gav86] William W. Gaver. Auditory Icons : Using Sound in Computer Interfaces.


In Proceedings of CHI86 Conference on Human Factors in Computing
Systems, volume 2, pages 167177. ACM, 1986.
[Gav89] William W. Gaver. The SonicFinder: An Interface That Uses Auditory
Icons. In Proceedings of CHI89 Conference on Human Factors in Computing Systems, volume 4, pages 6794. ACM, 1989.
[Gav90a] William W. Gaver. Acoustics and Psychoacoustics. In Proceedings of
CHI90 Conference on Human Factors in Computing Systems, volume 4,
pages 2.12.15. ACM, 1990.
[Gav90b] William W. Gaver. Synthetizing Auditory Icons. In Human Factors in
Computing Systems, INTERCHI93, pages 228325. ACM, April 24-29
1990.
[Gav91] William W. Gaver. Sound Support For Collaboration. In Second
European Conference on Computer-Supported Collaborative Work (ECSCW91), pages 293308, September 24-27 1991.
[Gav93] William W. Gaver. What In The World Do We Hear? An Ecological Approach to Auditory Event Perception. Journal of Ecological Psychology,
5(1), 1993.
[GS93] William W. Gaver and R. B. Smith. Auditory Icons in Large-Scale Collaborative Environments. In Human-Computer Interaction - Interact90,
pages 725740. D. Diaper and D. Gilmore and G. Cockton and B. Shackel, 1993.
[Kev89] Kevin Karplus and Alex Strong. Digital Synthesis of Plucked-String and
Drum Timbres. In The Music Machine, pages 467479. Curtis Roads,
1989.
[Moo83] James A. Moorer. About this reverberation business. Computer Music
Journal, 7(3):615, 1983.
[Moo90] F. Richard Moore. Elements Of Computer Music. Prentice Hall, 1990.
[Pet90] Ivars Peterson. Some labs are alive with ... the sound of data. In Proceedings of CHI90 Conference on Human Factors in Computing Systems,
volume 4, pages 5.125.14. ACM, April 1990.
[Ris77] Jean-Claude Risset. Paradoxes de hauteur. In IRCAM Report no. 10. IRCAM, 1977.
[Roa94] Curtis Roads. Initiation a la synth` se par mod` les physiques. Les cahiers
`
e
e
de LIRCAM, pages 145169, 1994.

48

BIBLIOGRAPHIE

[SC92] Julius O. Smith and Perry R. Cook. The Second-Order Digital Waveguide
Oscillator. In Proceedings of the International Computer Music Conference, 1992.
[S.H91] S.H. Foster and E.M. Wenzel and R.M. Taylor. Real Time Synthesis of
Complex Acoustic Environment. In IEEE Workshop on Applications of
Signal Processing to Audio and Acoustics. IEEE, October 20-23 1991.
[Smi92] Julius O. Smith. Physical modelling using digital waveguides. Computer
Music Journal, 16:7491, 1992. Special issue on physical modelling.