Académique Documents
Professionnel Documents
Culture Documents
Séparation de sources
I.1 Introduction
Dans les télécommunications, la qualité vocale est souvent dégradée par la présence de bruits
ambiants, plus particulièrement, dans des cas de faible rapport signal à bruit. Le bruit peut être cause
de fatigue pour le locuteur distant, d’où la nécessité de mettre en place des algorithmes de traitement
de parole. Les traitements d’amélioration de la parole et de réduction de bruit ont pour but
d’améliorer la qualité ou encore l’intelligibilité du signal de parole utile en réduisant le niveau du
bruit ambiant.
La qualité de la communication est souvent fortement dégradée par le phénomène d’écho
acoustique.
Ce chapitre résume les principales caractéristiques de la parole, en particulier sa production et le
phénomène d’audition. Les caractéristiques temporelles et spectrales de certains types de bruits.liés
aux applications de téléphonie mobile seront citées; pour l’écho, on illustrera le phénomène et ses
différents types. Ce chapitre comporte aussi un rappel sur les systèmes de communications mobiles.
I.2.La parole
La parole, manifestation sonore du langage, est sans doute le principal moyen de communication
entre humains. L'avènement des télécommunications, puis du traitement numérique de l'information,
s'est donc naturellement accompagné d'un vaste effort de recherche visant à comprendre les
mécanismes de la communication parlée.
L’analyse de la parole est une étape indispensable à toute application de synthèse, de codage ou
de reconnaissance. Elle repose en général sur un modèle. Il existe de nombreux modèles de parole.
On distingue les modèles articulatoires, les modèles de production, et les modèles
phénoménologiques. Dans le processus de codage, on s’intéresse au modèle de production. On y
décrit la parole comme le signal produit par un assemblage de générateurs et de filtres numériques
(modèle source-filtre). Les paramètres de ces modèles sont ceux des générateurs et filtres qui les
constituent. Le modèle Autorégressif (AR) en est l'exemple le plus utilisé.
Figure I.5 : Bruit blanc gaussien à moyenne nulle et variance égal à 1 (Figure.a), et sa fonction
d'autocorrelation (Figure.b).
Propriétés Types
L’apparition d’écho est un problème bien connu dans les communications longues distance.
Les usages du réseau téléphonique en ont fait l’expérience à cause des imperfections de
l’hybride, un des composants du récepteur téléphonique.
Ce composant est en effet incapable d’empêcher le signal reçu de repartir dans le réseau vers
l’utilisateur qui a envoyé ce signal et qui, du coup, entend son propre écho. Un problème plus
gênant est apparu avec les téléphones mains-libres et les communications multimédia pour
lesquels l’écho du aux réverbérations dans la salle où se trouve le dispositif (Figure I.6). On
parle alors d’écho acoustique [13].
L’acoustique de quasiment tous les locaux est faite de réflexions dues aux murs, au sol et au
plafond. Des échos avec un court délai, de l’ordre d’une dizaine de millisecondes allé et retour,
sont perçus comme une distorsion spectrale ou une réverbération [1].
Des échos distincts sont perçus lorsque le délai aller et retour de la réflexion non atténuée
dépasse quelques dizaines de millisecondes. Dans le cas où le délai s’approche d’un quart de
seconde, l’écho n’est pas atténué et toute conversation claire est rendue impossible. Le fait est
que plus le délai dans une conversation augmente, plus il faut atténuer le signal réfléchi pour
Chapitre I Séparation de sources
garantir un bon confort d’écoute à l’utilisateur. Par ailleurs, des études montrent que quand
l’écho est supprimé, un utilisateur peut supporter un délai plus important que lorsque l’écho est
présent. C’est ce qui a motivé la recherche de dispositifs suppresseurs et annuleurs d’écho
efficaces.
L'écho pour le locuteur (cf. Figure I.7(a)) se produit lorsqu'une certaine partie de son signal
vocal est renvoyée en retour avec un retard suffisant pour que le signal puisse être distingué
d'un effet local normal. L'écho pour l'auditeur survient quand un signal doublement réfléchi
arrive du côté de l'auditeur, avec un retard par rapport au signal original (cf. Figure I.7(b)) [14].
Figure I.7 : Echos pour le locuteur et pour l'auditeur, perçus par l'interlocuteur 1.
La première méthode proposée, appelée suppression d’écho, était basée sur la détection d’une voie :
lorsque le locuteur A se met à parler, une augmentation de gain est observée et la parole est coupée au
locuteur B. La suppression d’écho est de mise en œuvre simple mais s’avère d’une qualité insuffisante.
En effet, cette méthode fait intervenir l’hypothèse, très réductrice, que les deux locuteurs ne parlent
jamais en même temps, assurant ainsi une communication seulement bidirectionnelle et non
simultanée.
L’annulation d’écho acoustique consiste à identifier le chemin d’écho entre le haut parleur et le
microphone. Ceci permet une évaluation de l’écho qui est alors soustrait du signal à envoyer (cf.
Figure I.8). Cette méthode apparaît bien adaptée à la résolution du problème d’écho puisqu’elle permet
une communication bidirectionnelle simultanée.
Le canal acoustique, composé essentiellement en première approximation de retards et
d’atténuations, est généralement modélisé par un filtre de réponse impulsionnelle finie (RIF) F de
taille L. L’annulation d’écho acoustique est un problème d’identification d’un système linéaire F (le
Chapitre I Séparation de sources
canal acoustique) avec entrée connue x(n) : la parole qui provient du locuteur distant, et sortie connue
bruitée d(n) (écho y(n) plus éventuellement parole locale s(n)), suivie d’un traitement correctif
approprié [3].
D’après la figure I.8, le microphone disposé dans l’espace considéré capte à la fois la parole du
locuteur local et celle issue du haut-parleur à cause du couplage acoustique.
Afin d’assurer une communication bidirectionnelle simultanée de qualité, le filtre adaptatif identifie
le canal de couplage acoustique F et fournit une estimation 𝑦^(n) de l’écho acoustique y(n), résultat de
la transformation de l’entrée x(n) envoyée dans le haut parleur par F.
Cette estimation 𝑦^(n), version reconstituée de l’écho, est soustraite du signal d(n) = y(n)+s(n) issu du
microphone. Le signal différence e(n) = d(n) − 𝑦^(n), résultat de cette opération est constitué de
l’écho résiduel er(n) = y(n) − 𝑦^(n) et de la parole local s(n).
La SAS est un cas spécifique de la SS où aucune ou peu de caractéristiques sont connues. Un bon
exemple est celui où l'analyste recherche les sources significatives mais inconnues à l'origine d'un
mélange. Il ne connaît rien des signaux sources omis leur existence. Un exemple pratique est
l'interprétation des électroencéphalogrammes (EEG) et des magnéto encéphalogrammes (MEG). Les
données recueillies sont le résultat d'un mélange de sources associé à certaines régions du cerveau. La
séparation permet l'extraction des sources significatives utiles au spécialiste lors de son diagnostic.
Bien entendu, l'algorithme doit être développé en collaboration avec ce dernier pour que les résultats
obtenus soient utiles.
Dans certaines situations, il est possible d'émettre des hypothèses portant sur le type de sources
que l'on désire reconstraire ou les caractéristiques des canaux de transmission présents. Ces éléments
permettent à l'algorithme développé de converger vers une solution existante partiellement connue.
Les hypothèses au niveau des sources portent généralement sur leurs distributions. Par exemple, il
est possible d'affirmer qu'une certaine source est gaussienne ou laplacienne. Au niveau du canal de
transmission, les hypothèses portent généralement sur les fonctions de transfert. Ces canaux peuvent
être modélisés par des filtres à réponses impulsionnelles finies (RTF) ou à réponses impulsionnelles
infinies (RII). Ces hypothèses limitent l'étendu du problème transformant la séparation aveugle, où
rien n'est en principe connu, en séparation « semi-aveugle ».
La disposition générale d’un environnement de filtrage adaptatif est illustrée par la figure
II.2, où x(n) est le signal d’entrée, 𝑦^(n) est le signal de sortie estimée, d(n) le signal de sortie
désirée (la quantité que l’on veut reproduire) et e(n) le signal d’erreur défini comme étant la
différence entre la sortie désirée et la sortie estimée. Ce dernier est utilisé afin d’établir la
fonction objectif (fonction coût), requise par l’algorithme d’adaptation dans le but de
déterminer la mise à jour appropriée des coefficients du filtre.
Comme montré dans la figure II.2, la conception d’un filtre adaptatif impose la caractérisation de
deux structures principales : la structure de filtrage et la structure d’adaptation.
Chapitre I Séparation de sources
Chapitre II
3.4 Estimation de la DOA
Nous présentons dans cette section les techniques développées pour l’estimation de la direction
d’arrivé. En effet, nous allons décrire brièvement la méthode de base ensuite la technique d’estimation
haute résolution basée sur les méthodes de sous-espaces.
3.4.1 Méthode de base : la transformée de Fourier spatiale
Le transformée de Fourier est la première méthode qui a été utilisée pour détecter les angles d'arrivées
des signaux. Le principe est de réaliser la transformée de Fourier dans l'espace des signaux reçus. Si on
trace cette fonction pour une onde donnée, on obtiendra un pic d'énergie pour la direction dans laquelle se
situe la source, donc dans le cas de la superposition de plusieurs ondes on a des pics pour chaque DOA.
Cette technique nécessite de prendre de nombreux capteurs si on veut arriver à des résultats précis. Dans
[34] Mehrdad Soumekh montre qu'on arrivera à séparer deux ondes planes d'angles 𝜃1 𝑒𝑡 𝜃2 si
Si ces techniques ont longtemps été utilisées pour détecter des sources, en particulier dans les
domaines des radars et des sonars, elles n'offraient pas des précisions suffisantes et il a rapidement
fallu faire appel à des techniques plus puissantes. Ainsi détecter une source avec un réseau de 8
capteurs permet d'avoir une précision de l'ordre de 30 degrés. Dans les années 80 ont donc été
développées les méthodes à haute résolution permettant d'avoir des précisions beaucoup plus
importantes. En effet si Fourier nous permet de déterminer les angles en parcourant une courbe
formée d'autant de points que de capteurs, les méthodes hautes résolution ont un pas qui peut être
aussi faible que désiré.
Chapitre I Séparation de sources
(𝑡) est un vecteur 𝑀 × 1 d'instantané reçu de données de capteur qui sont constituées de signaux et de
bruit additif.
𝐴 est une matrice 𝑀×𝐷 contenant les vecteurs d'arrivée. Un vecteur d'arrivée se compose des
déphasages relatifs aux éléments du réseau de l'onde plane d'une source. Chaque colonne de 𝐴 représente
le vecteur d'arrivée d'une des sources et dépend de la direction d'arrivée, 𝜃𝑑. 𝜃𝑑 est l'angle de direction
d'arrivée pour la 𝑑 ième source et peut représenter soit l'angle de flanc pour des réseaux linéaires, soit
l'azimut et l'angle d'élévation pour des matrices planes ou 3D.
(𝑡) est un vecteur 𝐷×1 de valeurs de signaux source provenant de 𝐷 sources.
Conclusion
Nous avons énuméré les différentes techniques de la formation de faisceaux qui constituent l’une
des applications envisageables des antennes intelligentes. Nous avons présenté les types et les
différents algorithmes de formation de faisceaux. Ainsi nous avons opté pour la technique LCMV.
Les techniques d’estimation de la direction d’arrivé ont été également présentées dans ce chapitre.
Nous avons fait un rappel sur la méthode de base, mais notre intérêt s’est surtout porté sur la méthode
MUSIC. Nous avons élucidé quelques faiblesses et ainsi apporté des améliorations possibles en 54
terme de résolution et complexité de calcul, notamment la méthode root MUSIC utilisant le lissage
spatial dans le cas des signaux corrélés.
En somme, il est primordial de choisir un algorithme de formation de faisceau adéquat, et en
utilisant une version améliorée de la méthode d’estimation de DOA, afin d’exploiter efficacement les
systèmes d’antennes intelligentes.
Nous verrons dans le chapitre 4 l’application et la simulation de ces techniques ainsi que les
résultats de différentes comparaisons.