Vous êtes sur la page 1sur 6

SETIT 2009

5th International Conference: Sciences of Electronic,


Technologies of Information and Telecommunications
March 22-26, 2009 TUNISIA

Comparaison des diffrents Algorithmes de


Dbruitage du Signal de Parole pour les Aides
Auditives Binaurales
Fathi KALLEL*, Dhouha DAOUD *, Amira DERBEL *, Mohamed GHORBEL *
et Ahmed BEN HAMIDA*
* Laboratoire dElectronique et des Technologies de lInformation (LETI), ENIS, Sfax, TUNISIE
kfathi@olfac.univ-lyon1.fr
dhouha8184@yahoo.fr
amiraderbel06@yahoo.com
mohamed_ghorbel2001@yahoo.com
Ahmed.Benhamida@enis.rnu.tn
Rsum: Dans ce papier, diffrentes techniques de dbruitage du signal de parole bases sur les mthodes de la
soustraction spectrale, du filtrage adaptatif de Wiener et de la transforme en ondelettes sont prsentes. Une tude
comparative de ces diffrents algorithmes en termes du taux damliorations du SNR et de conservation de la diffrence
du temps interaural (ITD) est effectue. En effet, une amlioration du SNR implique une meilleure intelligibilit de la
parole, dautre part, une conservation de lITD permet une meilleure audition binaurale et par suite une meilleure
localisation spatiale des sources de parole et de bruit.
Les rsultats trouvs montrent bien que la mthode de dbruitage par la transforme en ondelettes est la mthode la plus
efficace en terme damlioration du SNR et en terme de la conservation de la diffrence de temps interaurale.
Mots cls : Appareillage binaural, filtre de Wiener, soustraction spectrale, transforme en ondelettes.
meilleure localisation des sources. Ceci peut tre assur
par un appareillage binaural: Aide auditive binaurale.

INTRODUCTION
La surdit ou bien le dysfonctionnement du systme
auditif est un handicap qui peut tre parfois grave pour
ltre humain. Trois types de surdit sont ainsi
distingus: les surdits de transmission, les surdits de
perception et les surdits mixtes rassemblant les deux
premires [THO 04]. La surdit de transmission qui
touche loreille externe ou moyenne est due une
atteinte du conduit auditif, du tympan ou des osselets.
Elle apparat lorsquil y a entrave au passage des ondes
sonores. Ce type de surdit peut tre remdi grce un
appareillage mdical : La prothse auditive.

En effet, plusieurs techniques de dbruitage du


signal de parole tels que la mthode de la soustraction
spectrale, le filtrage adaptatif de Wiener et la
transforme en ondelettes sont dveloppes et le choix
entre ces techniques de rehaussement dpend des
donnes disponibles et des caractristiques du signal
porteurs de linformation. Ceci nous parat difficile
dans le cas de la parole qui est considre comme un
signal non stationnaire ayant des allures inattendues
avec des lentes variations en basses frquences et des
variations brusques en hautes frquences [MEA 97].

Dautre part, on se trouve toujours dans un


environnement bruit, et par la suite la perception de la
parole diminue considrablement et la localisation
spatiale des sources de parole et de bruit devient moins
prcise. Do on a besoin dun traitement spcifique
qui amliore la qualit de la perception de la parole en
diminuant le niveau de bruit et qui assure une
localisation meilleure des sources [FAS 99].

Dans ce papier, on commence par prsenter le


principe de lappareillage binaural. Dans le deuxime
paragraphe on prsente le principe de trois algorithmes
de dbruitage du signal de parole: La mthode de la
soustraction spectrale, la mthode de filtrage de Wiener
et la mthode de transforme en ondelettes. Enfin, on
prsente les rsultats de la mise en uvre et de
comparaison de ces diffrentes en termes de qualit du
signal et de conservation de la diffrence interaurale.

Devant ces contraintes, un traitement spcifique du


signal de parole est ncessaire afin doffrir au
malentendant une meilleure qualit de la parole et une

-1-

SETIT2009

1. Appareillage binaural

environ 0.26 ms [MOU 06].

1.1. Synoptique de lappareillage binaural

Si le signal est dans la direction dintrt, a veut


dire que la diffrence de marche entre les deux
microphones est nulle

Afin de bnficier dune audition binaurale, deux


aides auditives sont utilises: lune au niveau de
loreille droite et lautre au niveau de loreille gauche.
Ces deux aides auditives sont pilotes par deux
processeurs de traitement qui sont en communication
permanente et qui assurent le traitement du signal de
parole provenant des diffrents microphones intgrs
dans les deux aides auditives [VIS 04].

= d.cos()=0

= /2

Le dlai induit par cette diffrence de marche est


donc dfinie par = .cos() (en s) avec

d
c

En pratique, lITD sera calcule par la fonction


dautocorrlation du signal reu par les deux prothses.
Cette fonction est dfinie la formule suivante :

La figure suivante montre le principe de traitement


du signal de parole pour une aide auditive binaurale.

(2)
Traitement droit

Traitement gauche

Le maximum de ressemblance entre ces deux


signaux correspond au maximum de Cx,x(r). Si notre
signal est noy dans un bruit, cette mthode peut nous
aider connatre la puissance de bruit o il ny a pas
dinformation utile: cette quantit correspond au
minimum des puissances entre les deux voies pendant
cette diffrence de marche.

2. Algorithmes pour le dbruitage du signal


de parole

Figure 1. Synoptique de lappareillage binaural


Ce type dappareillage permet damliorer la qualit
des sons, lintelligibilit dans le bruit et la sensation de
sonie. Pour permettre aux algorithmes de traitement
du signal dexploiter lensemble des caractristiques
des ondes sonores parvenant chacune des oreilles, un
traitement de signal multi-sources tel que la distance
entre deux oreilles sera considr gale d= 20cm
pourrait amliorer et optimiser les performances
obtenues par des sujets portant des aides auditives.

Il existe diffrents algorithmes de dbruitage du


signal de parole. Ici, on sintresse aux trois mthodes
suivantes : La mthode de la soustraction spectrale, la
mthode de filtrage de Wiener et la mthode de
transforme en ondelettes [DON 00].
2.1. Technique base sur la soustraction spectrale
Le principe de base de cette mthode est de
soustraire lamplitude du spectre de bruit partir de
celui de la parole bruit [BOL 79]. Une estimation du
signal de bruit est mesure durant les priodes de
silences (durant lactivit de non parole dans le signal).

1.2. Diffrence de temps interaurale


LITD est un indice binaural significatif pour la
perception spatiale des sons puisquil permet de savoir
localiser la source en fonction de la diffrence de
marche du signal. Ce paramtre est considr
primordial dans notre tude qui vise tudier un
algorithme de dbruitage pour une prothse binaurale,
do la ncessite dtudier leffet des diffrentes
algorithmes sur cet indice binaural [GUI 02].

Le schma du code implment base de la


soustraction spectrale nutilise aucune
dtection
dactivit de parole pour estimer le bruit, qui est
suppos tre stationnaire, et son spectre est estim par
la 1re trame de lentre [THI 01]. On suppose aussi que
le signal de parole et le bruit sont additifs et non
corrls.

Physiquement, des erreurs sur l'ITD de l'ordre de 30


microsecondes sont perceptibles [VIS 04], donc un
modle gnrique bas sur une moyenne de l'ITD d'un
grand nombre d'individus ne peut convenir tout le
monde (les amplitudes de variation de l'ITD atteignant
quelques millisecondes).
La diffraction du son dans lair implique que lITD
soit plus lev en basses frquences quen hautes
frquences. La limite basse frquence est donne par
lquation suivante :
(1)
ITD=1.5*d *cos() / C
Avec langle dincidence (en rad), d la
distance interaural (en m) et C est la clrit du son
dans lair (en m/s). La limite est pour environ 1500 Hz:
en dessous, lITD vaut environ 0.38 ms, au-dessus

Figure 2. Synoptique de dbruitage par Soustraction


Spectrale
-2-

SETIT2009


Cela pose videmment le problme de la dtection


des zones de silence et de parole. Une erreur dans cette
dtection entrane forcment une erreur dans
lestimation du spectre du bruit.

Estimation de la SNR (Signal to Noise Ratio)


[OPP 79].

2.3. Technique de rehaussement base sur la


dcomposition en ondelettes

2.2. Technique de rehaussement base sur le filtrage


adaptatif de Wiener

Lide de la transforme en ondelettes est de


pouvoir faire varier les largeurs en temps et en
frquences dune fonction tout en la translatant le long
du signal et elle permet aussi de mesurer les variations
dans le temps des composantes frquentielles
(spectrales) dun signal (Figure 5) [MAL 99].

Un filtrage est rendu adaptatif en traitement de


parole si ses paramtres, les coefficients, sont modifis
selon un critre donn, ds quune nouvelle valeur du
signal devient disponible. Ces modifications doivent
suivre lvolution des systmes dans leur
environnement aussi rapidement que possible
[COH 02].

La transforme en ondelettes dune fonction f en un


point (t,w) du plan temps-frquences ne dpend donc
que des valeurs de reprsentation temporelle f(t) et
reprsentation frquentielle F(w) dans le rectangle de
Heisenberg [AUG 96] centr en (t,w).

Si on dispose dune entre y(n) ainsi que de la


rponse dsire (rfrence) d(n) et lerreur e(n), qui est
la diffrence entre d(n) et la sortie du filtre (n), sert
contrler (adapter) les valeurs des coefficients du filtre.

Figure 5. La rsolution temps-frquences de la


transforme en ondelettes
Figure 3. Principe dun filtre adaptatif
Pour avoir un signal dbruit, on le transforme en
ondelettes, puis on limine toutes les rsolutions, les
coefficients suprieurs un certain seuil dtermin par
diffrentes manires [MIS 96].

En pratique, il sagit de trouver le filtre linaire


stationnaire qui donne la meilleure approximation de
(n) partir de y(n). Le signal et le bruit sont deux
processus alatoires stationnaires [NAJ 98].

Ensuite, on reconstruit le signal


coefficients restants (figure 6) [COI 98].

Figure 6. Synoptique utilis pour le dbruitage par


transforme en ondelettes

Figure 4. Diagramme de rduction du bruit propos


Le signal bruit est filtr ainsi que lenveloppe est
dtecte aprs un redressement double alternance
(pour avoir la valeur absolue) et un filtrage passe bas
(200Hz). Puis, lenveloppe bruite est multiplie par
une fonction spcifique de pondration entre 0 et 1
selon la valeur du SNR estim (figure 4). Alors les
deux composants majoritaires dans lalgorithme
propos sont :


avec les

3. Protocole exprimental
Tout
un
processus
exprimental
permet
lenregistrement des scnes sonores pour avoir des
scnes en tenant comptes des conditions de laudition
binaurale qui est trs proche de laudition naturelle
(liste de Lafon). Lenregistrement se fait dans la salle
audiomtrique parfaitement isol de lhpital Edouard
Herriot Lyon-France. La figure suivante montre le

Le calcul de la fonction de pondration qui


dpend de lestimation de la SNR
-3-

SETIT2009
protocole exprimental utilis pour lenregistrement.

[BLA 83]. Ces microphones sont intgrs dans les


conduits auditifs de la tte artificielle (figure 7). (n)
est le signal estim aprs lalgorithme de dbruitage.
Un minimum de cette fonction montre
meilleure semblance entre les deux signaux.
-3

une

Comparaison entre les diffrents algorithmes

x 10

S.spectrale
F.Wiener
T.ondelette

4.5
4

3.5

EQM

3
2.5
2
1.5
1

Figure 7. Protocole exprimental

0.5
0
-20

4. Comparaison entre les diffrents


algorithmes de dbruitage

-15

-10

-5

0
SNR(db)

10

15

20

Figure 9. Comparaison de lEQM

On considre un signal de parole extrait de la liste


de Lafon (squence en rouge), puis on lui ajoute un
bruit afin davoir une valeur du SNR= -5dB. La figure
7 montre les signaux rsultats (en bleu) obtenus
respectivement par application des algorithmes de
dbruitage bas sur la mthode de la soustraction
spectrale, le filtrage adaptatif de Wiener et le
dbruitage par transforme en ondelettes.

4.1.2. Evaluation du SNR


Le rapport signal sur bruit
calcul de la faon suivante :

du signal bruit est

SNR=10. Log (Ps/Pb)


s2(n) =

Avec Ps =

|S (f)| 2 : La

puissance du signal original

b2(n) =

Pb=

B (f) |2: La puissance

de bruit.
Cette mtrique permet dobtenir lvolution de
rapport signal sur bruit du signal dbruit (SNR final)
en fonction de celui du signal bruit (SNR initial).
Cette volution nest pas linaire pour tous les
signaux bruits, donc le pourcentage damlioration est
un facteur ncessaire pour savoir si un tel algorithme
est performant ou non.
Comparaison entre les diffrents algorithmes
25
S.spectrale
F.Wiener
T.ondelette

20

Figure 8. Comparaison des algorithmes pour un


SNR=-5db

SNR final(db)

15

Puisque lamlioration ne se fait pas de la mme


manire pour tous les algorithmes explors, lutilisation
des mtriques dvaluation entre eux est indispensable
pour distinguer la plus adaptable toutes les conditions
dans lesquelles se trouve le malentendant

10

-5

-10
-20

4.1. Les mtriques dvaluation


4.1.1. Erreur quadratique moyenne
Cette fonction scrit sous la forme suivante :
EQM =

-15

-10

-5

0
5
SNR initial(db)

10

15

20

Figure 10. Evolution du SNR final en fonction du SNR


initial

4.1.3. Pourcentage damlioration de la SNR


Si on suppose que linformation est trs claire dans
un bruit tel que le SNR=40dB

O s(n) est le signal original gnr par la liste


Lafon enregistre laide de deux microphones dans
des conditions qui sapproche de laudition relle

Donc le pourcentage damlioration scrit sous


-4-

SETIT2009
La figure 10 montre que lEQM varie entre les
valeurs 0.0045 et 0.0005, c'est--dire que les diffrents
types dalgorithmes permettent de minimiser lerreur
quadratique moyenne.

cette forme :
Amlioration(%)=

* 100

Comparaison entre les diffrents algorithmes

Dans une telle application, en diminuant la valeur


du SNR initial entrane une augmentation de la
puissance du signal bruit Py. Dans ce cas, un meilleur
rehaussement du signal ncessite une diminution de la
puissance du signal dbruit Ps ainsi quune diminution
de la distance LSD : ceci est interprt dans la figure 11
pour les diffrentes mthodes de dbruitage.

100

Amelioration de la SNR (%)

S.spectrale
F.Wiener
T.ondelette

50

-50
-20

-15

-10

-5

0
5
SNR initial(db)

10

15

En fixant le SNR initial (Py fixe), la figure 11


montre que lalgorithme de rehaussement par
transforme en ondelettes est la plus efficace
puisquelle possde le minimum de LSD.

20

Figure 11. Comparaison de lAmlioration en (%)


4.1.4. Distance Logarithmique Spectrale
Cette fonction permet de calculer la moyenne de la
distance logarithmique spectrale entre le signal dbruit
et le signal bruit gnr avec un SNR bien dfini.On
peut crire donc que :
LSD=

2(n) =

Ps =

| (f)| 2 : la puissance

estime de la moyenne du signal dbruit

y2(n) =

Et Py =

|Y (f)| 2: la

puissance de la moyenne de signal bruit.


Le calcul de cette quantit se fait aprs la
composition du signal dentre sur des trames de
courtes dures chevauches entre elles par des fentres
de dure gale 8ms (N=128). Cette composition
permet davoir un quasi stationnarit du signal,
caractristiques inchanges suivant cette dure, est
impos aussi par les algorithmes de traitement.
Comparaison entre les diffrents algorithmes
12
S.spectrale
F.Wiener
T.ondelette

10

LSD

0
-20

-15

-10

-5

0
SNR(db)

10

15

20

Figure 13. Influence de lalgorithme de dbruitage


sur lITD

Figure 12. Comparaison de la distance LSD


2.1. Observations

Si on sintresse maintenant valuer la capacit du


malentendant localiser la source du son aprs la phase
de rehaussement, ceci sexplique par la conservation de
lITD du signal bruit avec celui rehauss. La figure 12
montre la variation de lITD pour diffrents SNR avant

Aprs valuation, on constate que dans les deux


figures 8 et 9 le dbruitage par transforme en
ondelettes possde la meilleure amlioration du SNR.
-5-

SETIT2009
(courbe bleu) et aprs (courbe verte) lapplication de
lalgorithme de dbruitage respectivement par la
mthode de la soustraction spectrale, le filtrage
adaptatif de Wiener et le dbruitage par la transforme
en ondelettes.

[FAS 99] H. Fastl, E. Zwicker, Psychoacoustics, Springer


Verlag, 2nd. Ed. Edition, 1999.
[GUI 02] Guillaume LeNost.partie1, Modlisation de
fonctions de transfert acoustiques de ttes humaines
(HRTF) et application l'individualisation de la synthse
binaurale, 2002.

On remarque que la diffrence interaurale du signal


dbruit par la mthode du dbruitage par la
transforme en ondelettes est la plus proche de celle du
signal bruit sauf dans le cas o SNR trs faible. On
peut dire alors quil sagit vraiment dune meilleure
localisation du signal reu aprs rehaussement.

[MAL 99] Mallat S. A wavelet tour of signal processing,


Academic Press, 1999.
[MEA 97] Mead C. Killion, Chapitre Hearing Aid
Transducers, John Wiley & Sons, Encyclopedia of
Acoustics, volume 4, 19791991, 1997.
[MIS 96] M.Misit, Y.Misit, G. opperhein and J.M.Poggi,
Threshold selective using Steins Unbiased Risk Estimate,
12 Mars 96.

5. Conclusion
Dans cet article, nous avons tudi et valid trois
diffrentes mthodes de rehaussement du signal de
parole pour la rhabilitation de la surdit par les aides
auditives.

[MOU 06] Mouba and S. Marchand, A


Localisation/Separation/Respatialisation System
on Unsupervised Classification of interaural
Proceedings
of
the
Digital
Audio
Conference,Montreal, Quebec, Canada, 2006

Une tude comparative a t ralise et montr la


supriorit de lalgorithme de dbruitage base de la
transforme en ondelettes en termes damlioration du
SNR et de conservation de la diffrence de temps
interaurale. Ceci pour but dtablir le meilleur choix
de lalgorithme qui sera utilis dans des travaux futurs
dimplmentation sur DSP dans une finalit de
validation du dbruitage sur une plateforme temps rel.

Source
Based
Cues,
Effects

[NAJ 98] Najim. M , Filtrage optimal, Edition 1998.


[OPP 79] Oppenheim J.S. Lim. Enhancement and bandwidth
compression of noisy speech. Proc. IEEE, Dec. 1979.
[THI 01] Thiemann, Acoustic Noise Suppression for Speech
Signals using Auditory Masking Effects, Master's thesis,
McGill University, Montreal, 2001.

A lissue de cet article, nous soulignerons


simplement quun travail important reste faire pour
sassurer de la compatibilit des algorithmes proposs
en prenant galement en compte les modules de
traitement du signal standards dune prothse auditive
binaurale. Les interactions entre les diffrentes tapes
du traitement peuvent produire une modification du
retard interaural et par consquence perdre la
possibilit de localiser la source. Dautre part, il faut
sassurer que, du point de vue du malentendant, la
qualit sonore finale est acceptable et exempte de tout
dfaut gnant.

[THO 04] Thomas F., Traitement Numrique du Signal


acoustique pour une Aide aux Malentendants, thse,
2004.
[VIS 04] Viste H. Binaural Localization and separation
techniques, PhD thesis, Ecole Polytechnique Fdrale de
Lausanne, 2004.

BIBLIOGRAPHIE
[AUG 96] Auger F., P. Flandrin, P. Gonalvs and
O. Lemoine, Time-frequency toolboxfor use with Matlab
Tutorial, CNRS (France), Rice University (USA),19951996.
[BLA 83] J. Blauert, Spatial Hearing: the psychophysics of
Human Sound Localization, MIT Press, 1983.
[BOL 79] Boll S.F., Suppression of acoustic noise in speech
using spectral subtraction, IEEE Trans. Acoust., Speech,
Signal Processing, 27:113120, 1979.
[COH 02] Cohen I., and Berdugo B., Noise estimation by
minima controlled recursive averaging for robustspeech
enhancement, IEEE Signal Process, Lett. 9, 1215, 2002.
[COI 98] Coifman R. and Wickerhauser M., Experiments
with Adapted Wavelet De-Noising for Medical Signals
and Images. In Metin Akay editor, Time-Frequency and
Wavelets in Biomedical Engineering, pp. 323-346, 1998.
[DON 00] Donoho, Denoising by soft thresholding. IEEE
Transaction, 2000.

-6-

Vous aimerez peut-être aussi