Vous êtes sur la page 1sur 79

TRAITEMENT NUMERIQUE DU SIGNAL

INTRODUCTION Pourquoi faire du traitement numrique du signal ? Le mot signal dsigne le rsultat de la mesure dune grandeur physique. Sans restreindre en aucune faon notre discours, le rsultat obtenu sera vu comme une fonction du temps. On dira alors que le signal est analogique ou temps continu si la mesure est disponible de faon continue tout instant et numrique temps discret si elle nest observe qu des instants discrets particuliers en gnral rgulirement espacs. Le traitement numrique du signal TNS consiste traiter des signaux temps discret. Lmergence du TNS est lie, comme pour de nombreux autres domaines, au perfectionnement des composants lectroniques. Ce dernier a stimul limagination des scientifiques et des futurologues, engendrant du mme coup de nouveaux problmes et besoins et, avec eux, la ncessit de disposer doutils encore plus puissants. Les microprocesseurs, ddis lorigine aux traitements purement informatiques, ou des fonctions simples de contrle, sont dsormais indispensables en TNS. Ils ont facilit la mise en place dalgorithmes quil aurait t bien difficile de mettre en uvre autrement. Il suffit pour sen convaincre de regarder du ct des applications grand public telles que tlvision haute dfinition, radiodiffusion numrique, tlphonie mobile, applications multimedia, etc. Tous ces services nouveaux utilisent largement le traitement numrique du signal en mettant en uvre des algorithmes parfois extrmement complexes et ncessitant des puissances de calcul considrables. Pour se limiter quelques exemples, on peut citer ple-mle :

la suppression du bruit de fond lors dune transmission tlphonique partir de lhabitacle dune voiture ; le traitement du signal reu en tlphonie mobile ; le codage de limage et de la parole dans un systme de visiophonie ; la reconnaissance et la synthse de la parole ; la dtection de dfauts dans une pice mcanique et la maintenance prventive ; la localisation par sonar des bancs de poissons ; lvaluation par radar des positions et vitesse dune cible ; linversion de profil sismique pour la recherche ptrolire ; lanalyse des vibrations dune plate-forme ptrolire ; lanalyse des signaux lectro-encphalographiques pour laide au diagnostic mdical ; la rception dinformations dlivres par le systme GPS de navigation par satellites ; la synthse lectronique de sons musicaux ; le traitement de signaux acoustiques provenant de plusieurs microphones, etc.

Ces problmes sont loin dtre compltement rsolus et font encore lobjet de recherches. Au-del de la complexit des problmes quil permet daborder, le TNS autorise une grande souplesse dans la phase de mise au point. Les tests sont parfaitement reproductibles. On ne risque pas une drive dans les caractristiques des composants comme cela se passe dans les traitements analogiques. Est-ce dire que ces derniers sont irrmdiablement condamns ? En fait, mme si leur part est en constante rgression, elle ne risque pas de disparatre. Dans certains cas on ne peut sen passer car les phnomnes observs sont trop rapides et, dans

dautres, ils simposent en raison de la simplicit mme du traitement effectuer. Ainsi, si un filtrage passe-bas de type RC suffit, un traitement numrique parat quelque peu luxueux pour sy substituer. Nous ne parlerons pas ici du traitement numrique des images. Ses spcificits font de lui un thme le plus souvent expos ou enseign part. Nota : On entend par image 2D (respectivement 3D) une grandeur qui dpend de 2 (respectivement 3) paramtres. Par exemple le signal constitu par le niveau de gris dans une photographie en noir et blanc peut tre indic par la position (abscisse et ordonne) du point. Aprs avoir dcrit les signaux numriques (transforme de Fourier, thorie de lchantillonnage) 1 , dans le paragraphe 2 nous prsentons les principales proprits temporelles et spectrales des signaux dterministes temps discret. Nous y tudierons en particulier la transforme de Fourier discrte qui est lun des outils de base du TNS. Le paragraphe 3 est consacr aux proprits des filtres linaires, en particulier ceux dcrits par une quation rcurrente, et une brve introduction aux mthodes de synthse de filtres. Le paragraphe 4 est consacr aux signaux alatoires. On y prsente les signaux stationnaires au sens large et leur filtrage, ainsi que les chanes de Markov. On conclut par quelques lments destimation statistique. La dernire partie prsente, pour illustrer ce qui prcde, quelques problmes pratiques de traitement : le changement de frquence, lestimation spectrale, lalgorithme de filtrage adaptatif du gradient stochastique. De nombreuses proprits sont nonces sans donner les hypothses de leur validit. Notre seule excuse est que, dans la majorit des cas rencontrs en pratique, ces hypothses sont satisfaites. Les plus curieux pourront amplement se documenter en consultant labondante littrature existant dans le domaine. 1.1 Gnralits En TNS, linformation manipule se prsente sous la forme dune suite de valeurs numriques issues de lobservation des grandeurs physiques. Cette suite porte le nom de signal temps discret ou signal numrique. Nota : le terme signal numrique est ambigu car il a une signification diffrente en thorie des communications o il dsigne le signal temps continu associ la suite de symboles (typiquement des 0 et des 1) du message numrique. Quand la grandeur observe est une fonction du temps, une opration, dite de numrisation, est ncessaire pour effectuer le passage du signal analogique au signal numrique (figure 1). Elle comporte quatre phases. 1. La grandeur observe doit tout dabord tre transforme en un signal lectrique laide dun dispositif appel transducteur comme par exemple un microphone. Par la suite, nous supposerons la prsence implicite dun tel dispositif dans la chane de numrisation et ne le reprsenterons jamais. 2. Le signal lectrique numriser est ensuite appliqu lentre dun filtre passe-bas idal, dit filtre danti-repliement, dont lutilit sera justifie par le thorme dchantillonnage. Le signal ainsi filtr est not xa(t ).

xa(t ) est appliqu en entre dun convertisseur analogique/numrique CAN qui effectue les deux oprations suivantes.

Figure 1 - Numrisation dun signal : filtrage anti-repliement, conversion analogique numrique

3. Lchantillonnage : on prlve toutes les T secondes les valeurs . T est appele la priode dchantillonnage et son inverse Fe la frquence dchantillonnage. 4. La quantification : les chantillons prlevs sont cods sur un nombre fini de bits (gnralement en complment deux). Ainsi, si les informations numriser proviennent dune tension comprise entre 5 V et + 5 V et que lon effectue une conversion sur 8 bits avec reprsentation en complment deux, la valeur 3 V sera code par :

Quant la valeur maximale 5 V, elle est code par 0111 11112.

Figure 2 - Reconstruction partir des chantillons : conversion numrique analogique, filtrage passe-bas

Aprs numrisation, on dispose donc dune suite de valeurs x (n) qui peuvent tre traites sur calculateur. Dans certains cas, de plus en plus rares, on utilise une architecture ddie (ensemble de registres, additionneurs, multiplieurs, etc.) qui permet dobtenir des vitesses de traitement suprieures mais qui manque singulirement de souplesse par rapport au calculateur.

Aprs traitement, les donnes numriques peuvent tre restitues sous forme dun signal physique appropri (figure 2). Le passage se fait par un signal lectrique obtenu laide dun convertisseur numrique/analogique (CNA) qui fournit un signal temps continu en marches descalier par lintermdiaire dun bloqueur dordre 0. Ce convertisseur est suivi dun filtre passe-bas (en principe de gain unit dans la bande ( Fe /2, Fe /2)). La transformation du signal lectrique en signal utile est ensuite effectue par un dispositif transducteur comme par exemple un haut-parleur. Dans la suite, sauf indication contraire, nous ne tiendrons pas compte de lerreur introduite par lopration de quantification et, quand on parlera de signal temps discret, on fera rfrence la suite numrique .

Contrairement aux exposs faits dans le domaine de lautomatique, nous prenons comme parti pris, sauf cas exceptionnel, de ne jamais faire apparatre le temps de manire explicite. Cela revient supposer que les frquences exprimes en hertz sont normalises ou rduites par rapport la frquence dchantillonnage Fe. Cette faon de procder ne pose aucun problme sauf si le traitement fait intervenir des signaux chantillonns diffrentes cadences. Ainsi, le signal numrique produit par un gnrateur sinusodal de frquence F0 (exprime en hertz) et chantillonn la frquence Fe scrira : , o la frquence rduite est f0 = F0/Fe. Nous allons voir que le thorme dchantillonnage impose de prendre si lon veut reconstruire parfaitement la sinusode analogique de dpart partir de la suite x (n). Par consquent .

1.2 Transforme de Fourier Avant daborder les proprits des signaux numriques, nous rappelons la dfinition de la transforme de Fourier des signaux temps continu. On pourra se reporter aux rfrences [4] [6] . Le signal temps continu xa(t) possde (sous des conditions que nous supposerons remplies) une transforme de Fourier et celle-ci scrit :

o F dsigne la frquence exprime en hertz. Le signal xa(t) est dit stable ou de module intgrable si :

Il est dit dnergie finie ou de carr intgrable si :

Il est dit de puissance finie si :

Les oprations de multiplication et de convolution schangent par transformation de Fourier. Le produit de convolution:

a pour transforme de Fourier

Pour les signaux dnergie finie on a la formule de Parseval qui scrit :

La fonction est appele spectre ou densit spectrale dnergie (dse). Daprs la formule de Parseval, elle sinterprte en effet comme la rpartition de lnergie le long de laxe des frquences. De faon gnrale, on peut dire quun signal qui prsente des variations brutales possde de lnergie dans les frquences leves et son spectre stale vers les hautes frquences. Le spectre dun signal rel est une fonction paire. On dit quun signal est bande limite si son spectre est nul hors dune certaine bande de frquence. Pour les signaux rels cette bande est de la forme ( B, B) et on dit simplement que le signal est de bande B. Pour les signaux priodiques de priode T, qui sont dnergie infinie mais de puissance finie, on peut dfinir une transforme de Fourier au sens des distributions. Le spectre est alors constitu de distributions de Dirac, couramment appeles raies, situes aux frquences multiples de la frquence fondamentale 1/T. Nota : Les distributions sont des fonctionnels linaires dfinis sur un espace particulier de fonctions. La distribution de Dirac est celle qui associe la fonction g (t) de cet espace sa valeur lorigine g (0).

1.3 Thorme dchantillonnage Dans la mesure o une opration de numrisation prcde tout traitement numrique de signaux temps continu, il est naturel de sintresser tout particulirement aux consquences de celle-ci. Le thorme dchantillonnage nonce quun signal rel bande limite B peut tre reconstruit de faon parfaite (on entend par l que lon espre pouvoir reconstituer le signal original temps continu partir de la seule connaissance des chantillons du signal) si la frquence dchantillonnage est suprieure ou gale deux fois la bande B. Le point de dpart de la dmonstration est la formule de Poisson qui dit que tout signal xa(t) temps continu, et possdant une transforme de Fourier note Xa(F), vrifie :

o Fe = 1/T. Remarquons que la fonction a(F) est une fonction priodique de priode Fe qui ne dpend que de la suite des chantillons, ce que lon rsume parfois en disant que lchantillonnage priodise le spectre. En passant aux frquences rduites, cest--dire en posant f = F/Fe, il vient :

La fonction (f) est appele transforme de Fourier temps discret TFtd de la suite x (n) = xa(nT ). Nous reviendrons en dtail sur ses proprits. Notons toutefois que (f) est une fonction priodique de priode 1. La figure 3 reprsente la forme typique de (f) pour un signal rel de bande B, lorsque Fe > 2B, cest--dire pour b < 1/2 o on a pos b = B/Fe. On voit, dans ce cas, que la priodisation ne provoque pas de chevauchements entre les diffrents lobes composant (f ). On doit pouvoir reconstruire de faon parfaite Xa(F ) partir de (f ) et, par consquent, en dduire xa(t ) pour tout t. Plus prcisment, la formule de reconstruction donnant xa(t ) en fonction de la suite x (n) a pour expression :

avec

La frquence minimale 2B permettant une reconstruction parfaite porte le nom de frquence de Nyquist.

Lorsque Fe < 2B lopration de reconstruction parfaite nest plus possible. Les motifs interfrent de faon irrversible : on dit quil y a repliement de spectre. Pour les signaux complexes le rsultat se dduit de la mme faon de la formule de Poisson. Mais, comme le spectre de xa(t ) ne possde plus la symtrie paire, la condition de nonrepliement scrit simplement Cette expression donne bien Exemple signal MIC (modulation par impulsions codes) En tlphonie numrique on chantillonne le signal issu du microphone la frquence de 8 000 Hz. Chaque chantillon est ensuite cod sur 8 bits. Ce qui donne un train dont le dbit binaire est de 64 kbit/s : on le dsigne par le terme de MIC. Profitons de loccasion pour dire que lutilisation de techniques non triviales de traitement du signal permet, sans perte de qualit (selon notre oreille), de rduire ce dbit jusqu 2,4 bit/s : on parle de compression. chantillonnage des signaux bande troite Les signaux couramment utiliss en radiodiffusion ont un spectre qui est localis autour dune frquence F0 trs suprieure la largeur B de leur support en frquence (typiquement, en modulation de frquence, ). Ces signaux sont dits bande troite. En effectuant un chantillonnage une frquence de lordre de B et donc trs infrieure la frquence de Nyquist (qui est suprieure 2F0), on peut satisfaire la condition de reconstruction parfaite. Pour sen convaincre, il suffit de se reporter la formule de Poisson : la priodisation du spectre seffectue bien sans repliement. o W dsigne la largeur totale du support du spectre. pour les signaux rels puisque dans ce cas W = 2B.

Figure 3 - Priodisation du spectre du signal chantillonn 1.4 Phnomne de repliement En pratique, le spectre du signal contient de lnergie des frquences suprieures la frquence de Nyquist, tout simplement parce que cest souvent la frquence dchantillonnage Fe qui est choisie a priori. Il faut garder en mmoire que ce choix dtermine la qualit de reproduction de la source. Ainsi, en tlphonie o on souhaite ne conserver que des frquences allant jusqu 4 kHZ, on a choisi une frquence dchantillonnage de 8 kHz. Par contre, pour les disques compacts, on sest montr beaucoup plus exigeant puisquon a dcid de reproduire fidlement le signal audio-frquence jusquaux limites du spectre audible, soit environ 20 kHz. Cela a conduit prendre une frquence dchantillonnage de 44,1 kHz.

On retiendra le rsultat suivant : si la bande du signal est suprieure Fe/2, et daprs le thorme dchantillonnage, la reconstruction introduit une distorsion. Cette distorsion est rendue minimale si lopration de numrisation est prcde dun filtrage passe-bas de gain unit dans la bande Fe/2. Ce filtrage est dsign sous le terme de filtrage anti-repliement. En pratique, cette opration peut tre avantageusement remplace par un chantillonnage une cadence suprieure deux fois la bande totale du signal (ce qui vite le repliement) suivi dun sous-chantillonnage par un traitement purement numrique 5.1 .

Un phnomne connu permet de comprendre la notion de repliement. Il sagit de leffet stroboscopique observ au cinma avec les roues de chariots que lon voit parfois tourner en sens inverse de celui que lon sattend observer. Lorigine du phnomne se trouve dans le procd denregistrement cinmatographique qui opre la frquence de Fe = 24 Hz (24 images par seconde). Pour simplifier nous supposerons que la roue ne comporte quun seul rayon. Son mouvement peut tre modlis par la fonction complexe . Notons que cette modlisation permet de prendre en compte le sens de rotation suivant que F0 est positif ou ngatif.

Tant que le nombre F0 de tours par seconde est compris entre 0 et Fe/2 = 12 Hz, lil voit tourner la roue dans le bons sens la bonne vitesse. Mais lorsque F0 est compris entre 12 Hz et 24 Hz, la roue se met tourner dans le sens contraire pour atteindre une vitesse apparente nulle lorsque F0 = 24. Puis, lorsque F0 est compris entre 24 Hz et 36 Hz, la roue se remet tourner dans le bon sens mais avec une vitesse apparente qui reste comprise entre 0 et 12 Hz. Lanalyse du spectre fournit lexplication. En effet, le spectre de xa(t ) est constitu dune raie (distribution de Dirac) la frquence F0. La TFtd de la suite chantillonne est donc un peigne de Dirac. Supposons, par exemple, que F0 = 18 Hz, ce qui correspond la frquence rduite f0 = 18/24 = 3/4. La priodisation fait apparatre une raie la frquence rduite 1/4 (figure 4) correspondant la frquence 6 Hz : comme lil ne slectionne, la faon dun filtre passe-bas, que les frquences les plus basses, la roue semble tourner en sens inverse.

Figure 4 - Repliement de spectre : la roue tourne en sens contraire

Une exprience simple permet dexhiber ce phnomne. On chantillonne la frquence Fe un signal sinusodal de frquence variable F0 issu dun gnrateur de signaux. Si on augmente cette frquence F0 de faon continue partir de 0 et que lon coute le signal obtenu partir des chantillons, on constate le phnomne suivant : tant que la frquence F0 est infrieure Fe/2 la hauteur du son suit fidlement celle du gnrateur, lorsque F0 crot de Fe/2 Fe, la hauteur du son, lcoute, se met dcrotre ! La frquence apparente est alors gale Fe F0,

lorsque F0 atteint Fe puis la dpasse, la hauteur du son se met nouveau crotre de 0 Fe/2, etc.

Seul le premier cas correspond une absence de repliement. Dans tous les autres cas, le signal cout ne correspond plus au signal dorigine.

Le phnomne de repliement nest pas toujours nuisible. Ainsi le dcodeur strophonique dun poste rcepteur de radiodiffusion met profit ce phnomne pour sparer les voies gauche et droite.

1.5 Notion de signal alatoire Les volutions temporelles du signal, explicites par exemple par une expression telle que x(n) = a cos (2 f0 n), sont compltement dfinies ds lors que lon connat les deux paramtres a et f0. On dit que ce signal est dterministe. Dans certains cas, et ce ne sont pas les moins frquents, il est impossible de donner une description prcise de lvolution de la grandeur physique observe. Citons en exemple le bruit de fond apparaissant dans tous les dispositifs lectroniques, ou encore le signal produit par de la parole la sortie dun microphone. De tels signaux sont dits alatoires. Pour les dcrire, il faut faire appel la thorie des probabilits. Le signal numrique est alors dfini comme une suite de variables alatoires.

2. Signaux dterministes
2.1 Signaux types 2.2 Transforme de Fourier temps discret 2.2.1 Dfinition 2.2.2 Proprits 2.2.3 TFtd des signaux types 2.2.4 Troncature en temps et ondulations parasites 2.3 Transforme de Fourier court terme 2.4 La TFD : outil de calcul de la TFtd 2.4.1 Calcul pratique de la TFtd 2.4.2 Dfinition de la TFD 2.4.3 Proprits de la TFD 2.4.4 Transforme de Fourier rapide 2.4.5 Filtrage par TFR 2.1 Signaux types Pour caractriser les phnomnes observs, ou encore pour tudier les comportements des systmes de traitement, on a souvent besoin de faire appel des suites de rfrence ou signaux types. Ceci ne surprendra personne puisque cest aussi ce que lon fait dans le domaine du temps continu. Ainsi, lanalyse harmonique dun systme (linaire) consiste caractriser celui-ci en appliquant, en entre, des sinusodes et mesurer, en sortie, lamplitude et la phase de la sinusode obtenue ; de mme, lobservation dun signal pendant un intervalle de temps de dure finie revient le multiplier par une fonction rectangulaire qui vaut 1 sur cet intervalle et 0 sinon ; un filtre linaire est caractris par sa rponse une impulsion unit ou lchelon unit, etc.

Limpulsion unit est dfinie par :

Ce signal na rien voir avec la distribution de Dirac rencontre en temps continu. Cest une suite de valeurs numriques : n prend des valeurs entires.

Lchelon unit est dfini par (figure 5) :

La porte rectangulaire de dure N est dfinie par :

Lexponentielle causale et dcroissante (figure 6) :

Lexponentielle complexe (ternelle) est dfinie par :

o la frquence f0 a une valeur comprise entre 0 et 1. 2.2 Transforme de Fourier temps discret 2.2.1 Dfinition Trouver une reprsentation frquentielle consiste rechercher des priodicits dans un signal et en mesurer les contributions. Cest ce que fait la transforme de Fourier temps discret (en abrg TFtd) qui effectue le produit scalaire entre le signal et lexponentielle complexe exp(2jfn) pour tout f. Sa dfinition est :

La TFtd joue pour les signaux numriques le rle de la transforme de Fourier pour les signaux temps continu. Cest une fonction frquence continue, , priodique de priode 1. Il est dusage de la reprsenter sur un intervalle de longueur 1, savoir ( 1/2, + 1/2) ou (0,1).

Figure 5 - chelon unit

Figure 6 - Exponentielle dcroissante causale avec a rel

La fonction la fonction

sappelle le spectre. Dans la littrature ce terme est parfois aussi associ . Les deux expressions deviennent quivalentes si lon utilise lchelle des .

dcibels en posant

Inversement, on peut calculer x (n) partir de X (f) :

2.2.2 Proprits Les proprits de la TFtd rappellent celles de la transforme de Fourier en temps continu. En particulier on a:

linarit :

dcalage en temps : (1)

Nota : Un dcalage en temps est donc quivalent un dphasage linaire.

dcalage en frquence :

renversement temporel :

conjugaison :

caractre rel :

On dit que X (f) possde la proprit de symtrie hermitienne. Le module et la partie relle de X(f) sont des fonctions paires de f, sa phase et sa partie imaginaire sont des fonctions impaires de f ; convolution : (2)

produit :

Formule de Parseval :

2.2.3 TFtd des signaux types

Limpulsion a pour TFtd X (f ) = 1

Figure 7 - Module de la transforme de Fourier temps discret de la porte rectangulaire pour N = 10

Lchelon unit na pas de TFtd au sens des fonctions. Toutefois on peut la dfinir au sens des distributions mais son expression na que peu dintrt pratique. La suite exponentielle complexe na de TFtd quau sens des distributions :

o dsigne la distribution de Dirac au point (f0 n). Il sagit dun peigne de Dirac de priode 1 dcal sur la droite de f0.

La porte rectangulaire N (n) a pour TFtd :

Cette fonction joue un rle analogue celui de la fonction sinus cardinal dans le cas des signaux temps continu. Comme le signal est rel, cette fonction possde la symtrie hermitienne . Son module est pair, possde un lobe principal de largeur 2/N en 0 et des lobes secondaires de largeur 1/N. Le premier lobe secondaire est 13 dB en-dessous du lobe principal. Nous avons reprsent, en dcibels, le module de gN(f )/N (figure 7) pour N = 10. 2.2.4 Troncature en temps et ondulations parasites La TFtd de la porte rectangulaire permet dexpliquer les ondulations parasites qui apparaissent lorsquon effectue la mesure pratique des spectres des signaux. En effet, chaque fois quon considre un signal sur un intervalle de temps infrieur sa dure totale, cela revient le multiplier par une porte rectangulaire. Du point de vue spectral cette multiplication revient convoluer X (f ) par la fonction gN (f ) qui prsente des lobes. Ceux-ci ne sont pas prsents originellement dans la TFtd du signal mais sont un pur artefact d la troncature en temps. Rsolution spectrale Considrons le signal x (n) = sin (2 f0n), , pour et 0 sinon. Ce signal reprsente un bloc de dure N dun signal sinusodal de frquence f0. Sa TFtd a pour expression:

En utilisant la proprit de dcalage en frquence et en notant gN (f) la TFtd de la porte rectangulaire, on obtient :

Son module (normalis) est reprsent figure 8 pour f0 = 0,2 et N = 10.

Figure 8 - Sinusode tronque pour N = 10 et f0 = 0,2

De faon plus gnrale, lorsque le signal est la somme de K sinusodes de frquences f1, f2 ... fk, son spectre comporte des lobes (principaux) de largeur 2/N situs approximativement aux frquences f1, f2 ... fK. On en dduit que la sparation des maxima sera dautant plus marque que N sera grand. On parle alors de rsolution en frquence. Daprs ce que lon vient de voir, la quantit 2/N, appele limite de Fourier, donne donc un ordre de grandeur de la rsolution f en frquence. Cette quantit doit cependant tre revue la hausse pour peu que les sinusodes soient damplitudes trs diffrentes. Il faut en effet que le lobe principal dune sinusode de faible amplitude ne soit pas compltement masqu par un lobe secondaire dune sinusode de plus forte amplitude. Nous avons reprsent figure 9 la TFtd exprime en dB de la somme de deux sinusodes de frquences f1 = 0,2 et f2 = 0,25. Le nombre de points de signal est N = 80. Par consquent la limite de Fourier est gale 1/40 alors que lcart de frquence est 1/20. Le premier spectre correspond un rapport damplitude de 10 dB entre les deux sinusodes. On y distingue nettement la prsence des deux composantes sinusodales. Par contre, sur le second spectre qui correspond un rapport damplitude de 35 dB, on ne distingue plus la frquence f2. Nous avons not que le fait de ne conserver que N points dune sinusode revient prendre une sinusode de longueur infinie et la multiplier terme terme par la porte rectangulaire, appele dans ce contexte fentre de pondration rectangulaire. Pour amliorer la rsolution on est conduit utiliser dautres fentres de pondration. Une fentre trs utilise en pratique est la fentre de Hamming dont lexpression est h (n ) = 0,54 0,46 cos (2 n / N ). On voit sur le troisime spectre que, pour le mme rapport de 35 dB, la fentre de Hamming amliore notablement la sparation des deux frquences au prix, toutefois, de llargissement des lobes principaux.

2.3 Transforme de Fourier court terme

Considrons un signal {x (n)} somme de trois portions de sinusodes mises des instants successifs. Ses caractristiques sont donnes dans le tableau 1. Amplitude Frquence Instant de dbut Instant de fin sinus 1 1 sinus 2 1 sinus 3 1 0,11 0,23 0,37 20 84 292 196 356 512

Caractristiques dun signal compos de la somme de trois sinusodes dcales

Figure 9 - Spectre de la somme de deux sinusodes de frquence 0,2 et 0,25 avec N = 80

Sa TFtd contient effectivement linformation sur lordre chronologique dans lequel apparaissent ces trois frquences, mais elle se trouve cache dans la phase de cette transforme. Par consquent, si on se borne la visualisation du module de la TFtd, le fait que f1 dmarre avant f2 nous chappe. On peut le vrifier sur le spectre reprsent figure 10.

Figure 10 - Chronogramme et spectre du signal dont les caractristiques sont donnes dans le tableau

Par contre, en divisant la dure totale du signal en sous-intervalles de mme dure, on peut calculer plusieurs spectres qui, affichs cte cte, donnent une reprsentation, appele transforme de Fourier court-terme (TFCT), qui fait apparatre linformation concernant lordre des frquences. Reprenons le signal prcdent. En divisant sa dure de 512 units de temps en 32 tronons de dure 16, on peut calculer 32 spectres qui aboutissent la TFCT de la figure 11. Le niveau de gris y est inversement proportionnel lamplitude du spectre. Lchelle des temps (abscisses) est gradue de 0 511 par pas de 16 points, soit 32 pavs. Lchelle des frquences, en ordonnes, est gradue de 0 1/2. Le plan est dit plan temps-frquence. On y distingue nettement les trois composantes ainsi que les instants de dmarrage et de fin. La hauteur dune tache blanche correspond la largeur du lobe principal dune TFtd, soit ici 2/16. Si on rduit la dure dun sous-intervalle de 16 8, les spectres sont calculs avec moins de points. Par consquent :

la rsolution en frquence est rduite puisque les lobes slargissent ; la restitution des dtails temporels est meilleure car la TFtd effectue une sorte de moyenne en temps sur moins de points.

De faon gnrale, plus la dure du sous-intervalle est petite :


plus il est facile de localiser sur lchelle des temps la prsence dun dtail temporel ; et plus il est difficile de distinguer des frquences voisines.

Remarque : le principal dfaut de la TFCT est dutiliser des fentres rectangulaires qui ont pour consquence de masquer les priodicits longues et, par l mme, les frquences basses. Lide de lanalyse multi-rsolution, ou multi-chelle, sur laquelle nous reviendrons plus loin, est dchantillonner des cadences diffrentes le signal de manire effectuer ltude plusieurs niveaux de rsolution.

Figure 11 - Transformation de Fourier court terme (TFCT)

2.4 La TFD : outil de calcul de la TFtd 2.4.1 Calcul pratique de la TFtd Le calcul pratique de la TFtd, fonction de la variable continue f, ne peut tre fait que pour un nombre fini N de points de signal et sur un nombre fini K (suprieur N ) de points de frquence. En gnral on prend K points rgulirement espacs entre 0 et 1 de la forme f = k/K avec . Considrons en exemple x (n) = exp (2jf0n) avec Lexpression de sa TFtd est : , signal de dure finie.

Calcule aux points f = k/K, elle est constitue de valeurs diffrentes de zro, sauf si f0 est exactement un multiple de 1/K. Ainsi, si N = K = 32 et f0 = 7/32, on obtient 32 valeurs dont une seule nest pas nulle savoir X (7/32). Cest ce qui est reprsent figure 12. Si, par contre, on prend f0 = 0,2 on obtient le rsultat de la figure 13. Les valeurs k/32 ne tombent plus exactement sur les zros de X (f ). On voit sur ces figures quon est loin de la forme en sin (f N)/sin (f ) de la TFtd. Toutefois, pour sen approcher, il suffit daugmenter le nombre K de points de frquence. Le choix de K joue donc sur la prcision du trac du spectre. Rappelons ce propos que le nombre N de points dobservation agit pour sa part sur la rsolution en frquence. Ces deux notions ne doivent pas tre confondues.

Figure 12 - TFtd dune sinusode de frquence 7/32 calcule en 32 points de frquence

Figure 13 - TFtd dune sinusode de frquence 0,2 calcule en 32 points de frquence HAUT DE PAGE 2.4.2 Dfinition de la TFD Dans le calcul de la TFtd on peut, sans perte de gnralit, considrer que K = N. En effet, si K > N, il suffit, pour retomber dans le cas K = N, de complter la suite x (n) par (K N ) zros, ce qui ne change rigoureusement rien la valeur de la TFtd calcule au point k/K (bourrage par des zros). Cela conduit la dfinition suivante : on appelle transforme de Fourier discrte (TFD) de la suite finie {x (0), ..., x (N 1)} la suite finie :

et WN = exp ( 2j/N ). On montre facilement la formule inverse :

appele transforme de Fourier discrte inverse (TFD). La TFD est loutil de calcul de la TFtd. Son succs tient lexistence dalgorithmes rapides dont le plus rpandu est prsent plus loin. HAUT DE PAGE 2.4.3 Proprits de la TFD Lexamen des proprits de la TFD met en vidence de grandes similitudes avec celles de la TFtd. Elle sen diffrencie essentiellement par le fait que les calculs des indices se font modulo N : Nota : on rappelle que n modulo N reprsente le reste de la division entire de n par N.

linarit :

dcalage en temps :

renversement temporel :

conjugaison :

x (n) relle

convolution circulaire : tant donn les suites x (n) et y (n ) et leurs TFD respectives X (k ) et Y (k ), la TFDI de la suite est la suite :

(3)

formule de Parseval :

HAUT DE PAGE 2.4.4 Transforme de Fourier rapide La transforme de Fourier rapide (TFR), introduite en 1961 [5] , est une technique de calcul rapide de la TFD. Lalgorithme de base, qui connat de nombreuses variantes, utilise un nombre de points N = 2p. Pour en utiliser le principe, traitons lexemple simple p = 3. On dcompose la somme en termes de rang pair et de rang impair :

et on ritre le procd avec les deux termes obtenus :

et

...

Le calcul des termes X (k ) peut alors tre schmatis par le diagramme classique reprsent sur la figure 14. La cellule de calcul de base, que lon voit clairement apparatre sur le schma, est appele papillon. Ainsi, partant des chantillons x (0) et x (4) de lexemple choisi, on calcule deux nouvelles valeurs et travers un papillon de calcul . Les indices des termes x (n) apparaissent dans un ordre donn par le codage binaire renvers de n. Ainsi, le terme de rang 4 = 1002 est x (0012) = x (1). On parle dadressage bit reverse. Le tableau 2 donne lensemble des correspondances. valuation du nombre doprations On peut vrifier que le calcul de N points de TFD ncessite additions complexes et (N/2)log2 N N + 1 multiplications complexes. On se contente en pratique de lexpression approche multiplications-additions complexes. Un calcul direct aurait ncessit 2 N oprations de ce type, soit un gain de temps de lordre de N/log2N. Ainsi, pour N = 1024,

lalgorithme de TFR est environ 100 fois plus rapide que la programmation directe de la formule de TFD. En jouant sur les valeurs particulires des , on rduit encore ce nombre doprations. Il est en outre possible deffectuer des dcompositions plus complexes que la dcomposition examine ici en termes de rang pair et impair. Cela fait apparatre des structures de calcul rduisant le nombre doprations au prix dune programmation plus complexe.

Figure 14 - Transformation de Fourier rapide (TFR) : calcul des termes X (k ) Rang Codage binaire Renversement lment 0 1 2 3 4 5 6 7 000 001 010 011 100 101 110 111 000 100 010 110 001 101 011 111 0 4 2 6 1 5 3 7

Correspondance entre rang, codage binaire et renversement 2.4.5 Filtrage par TFR Nous avons vu (relation ( cf. ici )) que la TFDI de la suite Y (k ) = H (k ) X (k) est le signal :

obtenu par convolution circulaire, alors que le produit des TFtd correspond la convolution (relation ( cf. ici )) :

(4) Il nest donc pas possible de raliser un filtrage en utilisant directement la TFD sur des blocs de longueur N. Toutefois, une solution partir de TFD existe et lutilisation de la TFR peut alors fournir un gain de temps apprciable. Soit le filtre de rponse impulsionnelle hN (n ) et soit le signal x (n ). Daprs ( cf. ici ), la valeur en sortie linstant n est donne par :

Si on utilise la TFD, on est tent de faire un produit de la TFD de hN (n ) par celle dun bloc

de taille N extrait de x (n). Mais, comme on vient de le dire, la convolution associe est circulaire et le rsultat est faux. Une solution est deffectuer la suite doprations schmatises de la faon suivante : 1. calcul de la TFD H2N (k ) de la suite {0 ... 0, hN (0) ... hN (N 1)} obtenue en compltant hN (n) gauche par N zros ; 2. Calcul de la TFD X2N (k ) du bloc :

de longueur 2N ; 3. Multiplication terme terme de X2N (k ) par X2N (k ), suivie dune TFDI ;

4. Conservation des N premiers termes du rsultat prcdent : ces termes concident avec les N valeurs donnes par la relation ( cf. ici ) ; 5. Retour en 2 jusqu puisement des donnes du signal x (n). Comparons le nombre dadditions-multiplications complexes (amc) avec celui dun calcul direct. On nglige la premire TFR qui nest pas faite quune fois. A chaque pas on effectue deux TFR (lune directe, lautre inverse) de taille 2N. La charge de calcul est denviron amc pour N points de convolution, quil faut comparer aux N 2 amc dun calcul direct. On en dduit un gain de temps calcul denviron N/log2 (2N). Pour N > 32, la technique par TFR est donc plus rapide. En ralit dautres paramtres doivent tre pris en compte. Le calcul de la TFR fait intervenir des manipulations de pointeurs dans des tableaux, manipulations qui entranent une charge de calcul non ngligeable. La TFR exige en outre de la place en mmoire pour stocker les tableaux de donnes qui sont de taille gnralement suprieure la mmoire du filtre. Il faut aussi noter, et cest peut-tre le point le plus important, que les rsultats sont obtenus avec un retard de lordre de la taille du bloc soit 2N.

3. Filtrage linaire 3.1 Transforme en z, outil dtude des filtres 3.1.1 Dfinition 3.1.2 Proprits de la transforme en z 3.1.3 Inversion de la transforme en z 3.1.4 Exemples de transformes en z 3.2 Filtre dfini par une quation rcurrente 3.3 Introduction aux mthodes de synthse 3.3.1 Introduction 3.3.2 Filtres RIF 3.3.3 Filtres RII Que ce soit pour raliser un traitement utile (slection dune bande de frquence, extraction dun signal dans du bruit ...) ou que ce soit pour modliser des dformations indsirables (transmission travers un canal), on est conduit envisager des transformations sur les signaux. Une faon de dcrire ces dernires est de faire appel la notion de systme (bote noire) ayant une entre et une sortie. Dans le cas des signaux numriques, il faut gnralement entendre par systme un programme qui, partir du signal dentre x (n), engendre le signal de sortie y (n) :

Dans la majorit des cas rencontrs en pratique, les systmes peuvent tre considrs linaires et invariants dans le temps (systme SLI). On entend par systme invariant un

systme dont les caractristiques nvoluent pas avec le temps, une squence dentre produisant la mme squence sortie quel que soit le moment auquel elle est applique. On utilise le plus souvent le terme de filtre pour dsigner un systme SLI. On montre quun filtre numrique a pour quation dentre/sortie une relation de convolution discrte. Si x (n) dsigne le signal numrique dentre et y (n) celui de sortie, on a : (5)

La suite h (n) qui caractrise le filtre est appele sa rponse impulsionnelle (cest en effet la rponse du systme limpulsion unit (n)). Pour un systme, une des proprits principales que lon peut en attendre est sa stabilit. Le type de stabilit envisag ici est dit EBSB (entre borne/sortie borne), cest--dire que le signal de sortie reste born si le signal dentre est lui-mme born. On montre quune condition ncessaire et suffisante de stabilit dun filtre est que la suite h (n ) soit de module sommable, ce qui scrit . Nous verrons que cette condition prend une forme particulirement simple sur la transforme en z de h (n). Lorsque la rponse impulsionnelle est nulle pour n < 0, on dit que le systme est causal. Dans ce cas, le calcul de la sortie y (n ) ne ncessite pas la connaissance des valeurs dentre dindices suprieurs n. Toutefois, en TNS, la causalit na pas de caractre imprieux. Il suffit de faire le calcul en temps diffr en acceptant un certain retard la connaissance, comme le montre la relation entre/sortie :

Daprs la relation ( cf. ici ) la rponse impulsionnelle de ce filtre est h ( 2) = h (2) = a, h ( 1) = h (1) = b et h (0) = c. Ce systme nest donc pas causal. 3.1 Transforme en z, outil dtude des filtres HAUT DE PAGE 3.1.1 Dfinition On appelle transforme en z de la suite x (n ) la fonction de la variable complexe z dfinie par :

Cette expression na de sens que dans une couronne du plan complexe de la forme que nous supposons non vide. Cette couronne dfinit le domaine de convergence de cette somme. Si le signal est causal (x (n ) = 0) pour n < 0 on vrifie que Xz (z ) converge vers z tend vers linfini et donc le domaine de convergence est de la forme z > R1. Lorsque le cercle unit z = exp (2 jf ) appartient au domaine de convergence, X (f ) = Xz (exp 2jf )) est la TFtd de la suite x (n ). Le cercle unit peut tre gradu en valeurs de la frquence f = /2 ou reprsente largument de z. La transforme en z est loutil privilgi de ltude des filtres linaires. Considrons en effet un filtre temps discret de rponse impulsionnelle h (n ), dentre x (n ) et de sortie y (n ). Notons respectivement Hz (z ), Xz (z ) et Yz (z) leurs transformes en z. Si on suppose, en plus, que le cercle unit appartient leur domaine respectif de convergence, alors les Tftd respectives existent.

On montre que pour un filtre linaire les trois relations suivantes sont quivalentes :

Hz (z ) est appel la fonction de transfert du filtre et H (f ) son gain complexe ou rponse en frquence. La fonction G(f ) = H (f ) sappelle le gain du filtre et (f ) = arg {H (f )} sa phase. Le terme de gain en frquence sexplique simplement : si on applique en entre le signal exp (2jf0n ), le signal en sortie a pour expression H (f0) exp (2jf0n ). Ce rsultat est mis profit pour mesurer la rponse en frquence dun filtre (analyse harmonique) : en rgime sinusodal la comparaison des signaux dentre et de sortie fournit le nombre complexe H (f0). On dit quun filtre est sans distorsion damplitude si son gain Hz exp (2jf )] est constant et sans distorsion de phase si sa phase arg [Hz exp (2jf )] est linaire de la forme c0f. On notera que la notion de phase linaire est lie celle de retard pur. HAUT DE PAGE 3.1.2 Proprits de la transforme en z Soit Hz 1(z ) et Hz 2(z ) les transformes en z respectives de h1(n ) et h2(n ) et (D1) et (D2) leurs domaines de convergence respectifs. Les principales proprits sont de la transforme en z sont :

la linarit :

avec comme domaine de convergence

le dcalage en temps :

Le domaine de convergence est inchang ;

La conjugaison :

Le domaine de convergence est inchang. Et donc si h (n ) est rel,

Linversion du sens du temps :

Le domaine de convergence est construit partir des bornes inverses ;

la convolution :

avec comme domaine de convergence

la relation de Parseval :

o on a suppos que le cercle unit C appartenait au domaine de convergence de Hz (z ) ;

la drivation par rapport z ;

Le domaine de convergence est inchang.

La valeur initiale : si h (n) est causale :

HAUT DE PAGE 3.1.3 Inversion de la transforme en z Il est important de comprendre que linversion de la transforme en z ncessite que lon se donne le domaine de convergence. Ainsi, la fonction Hz (z) = 1/(1 az1), il correspond deux suites numriques diffrentes, suivant que lon choisisse z > a ou z < a. La premire est causale et a pour expression :

et la seconde a pour expression :

Ce qui les distingue dans le plan en z nest pas lexpression de Hz (z ) mais le domaine de convergence associ. A titre dexemple, tablissons ce rsultat pour z < a. On a :

o on a utilis la condition a1 z < 1, ainsi que le dveloppement classique pour u < 1 :

Ce calcul est doublement instructif dans le cas o la fonction Hz (z ) est une fraction rationnelle :

on peut sen inspirer pour linversion, aprs avoir effectu une dcomposition pralable en lments simples ; ce sont les modules des racines du dnominateur qui dlimitent les couronnes de convergence. Ainsi, si on a N racines de modules distincts, on a (N + 1) suites diffrentes. Si aucune des racines nest de module 1, on peut mme trouver une couronne de convergence contenant le cercle unit : dans ce cas la suite associe est de module sommable. Si toutes ces racines sont strictement lintrieur du cercle unit, le domaine de convergence stend jusqu linfini et la suite associe est causale.

Dans le cas gnral, la formule dinversion a pour expression :

o C dsigne un contour de Cauchy inclus dans le domaine de convergence. Une faon rapide deffectuer le calcul est de passer par la mthode des rsidus ([6] , thorme de Cauchy). HAUT DE PAGE 3.1.4 Exemples de transformes en z

Limpulsion unit (n ) donne 1 pour tout z. Lchelon unit u (n ) donne :

Lexponentielle causale x (n ) = an u (n ) donne :

La rampe r (n ) = n u (n) donne :

HAUT DE PAGE 3.2 Filtre dfini par une quation rcurrente La dfinition des filtres linaires laide dune quation rcurrente permet den exhiber trs facilement les proprits. Elle correspond en outre la dfinition algorithmique du traitement quils mettent en uvre. On appelle quation rcurrente linaire coefficients constants une expression de la forme :

(6)

Cette forme est analogue, pour le temps discret, aux quations diffrentielles linaires coefficients constants rencontres dans le cas du temps continu. Lorsque a1 = ... = aN = 0, les coefficients b0 ... bM apparaissent, daprs lquation de convolution ( cf. ici ), comme la rponse impulsionnelle du filtre : on dit que le filtre est rponse impulsionnelle finie (RIF). Lorsque les ai ne sont pas tous nuls, on dit que le filtre est rcursif. Si en plus la fraction rationnelle ( cf. ici ) est irrductible, le filtre est dit rponse impulsionnelle infinie (RII). En utilisant la transforme en z et la proprit de retard on dduit de ( cf. ici ) que lquation rcurrente dfinit un filtre qui a pour fonction de transfert : (7)

Les racines du numrateur sappellent les zros de la fonction de transfert et celles du dnominateur ses ples. Si les coefficients an et bm sont rels, les ples et les zros sont soit rels, soit vont par paires de complexes conjugus. Dans ce cas G (f ) = H (f ) est pair et la rponse impulsionnelle est relle.

le

gain

Stabilit et causalit Comme nous lavons dit, si les ples sont de module diffrent de 1, il est possible de choisir un domaine de convergence de Hz (z ) contenant le cercle unit. Dans ce cas, la suite {h (n )} associe est de module sommable et le filtre correspondant est stable. Si tous les ples sont strictement lintrieur du cercle unit, le filtre correspondant est stable et causal.

tude qualitative du gain partir de la position des ples et des zros La gain en frquence est le module de la fonction de transfert lorsque z = exp (2jf ) parcourt le cercle unit. Si on note pk et zk les ples et zros de la fraction rationnelle Hz (z ), le gain sexprime simplement par un rapport des produits des longueurs des segments MZk et MPk o Pk et Zz sont les points du plan complexe daffixes respectives pk et zk et o M daffixe z parcourt le cercle unit :

Supposons que Z1 soit proche du cercle unit. Quand M va passer prs de Z1, le gain va devenir trs faible, voire nul, si z1 est juste gal 1. Ce raisonnement sapplique aussi aux ples, le gain devenant au contraire trs grand (figure 15).

Figure 15 - Forme qualitative du gain partir de la position des ples et des zros HAUT DE PAGE 3.3 Introduction aux mthodes de synthse HAUT DE PAGE 3.3.1 Introduction Le problme de la synthse, tel que nous le restreignons ici, consiste calculer la fonction de transfert Hz (z ) dun filtre partir de son gabarit en frquence, ensemble de spcifications portant sur le gain (plus rarement la phase) du filtre (figure 16). Par exemple, pour un filtre passe-bas, on donnera :

la plus haute frquence de la bande passante fp ; la plus basse frquence de la bande attnue fa ; le taux dondulation dans la bande passante ; lattnuation dans la bande de transition allant de f0 et fa ; le taux dondulation dans la bande attnue.

Figure 16 - Forme typique du gabarit dun filtre passe-bas

Le problme est de synthtiser un filtre dont le gain entre dans le gabarit. Un premier choix va devoir tre fait sur le type du filtre : RIF ou RII. Attention, le fait de ne pouvoir mettre en uvre quun nombre fini doprations ne signifie pas quune ralisation RII est impossible. Ainsi, la mise en uvre du programme : y (n ) = x (n ) + ay (n 1) correspond-elle au filtre de rponse impulsionnelle infinie : h (n ) = an u (n ). De manire gnrale, on retiendra que :

les filtres RIF donnent, pour des caractristiques identiques de gain, une charge de calcul bien suprieure celle des filtres RII ; les filtres RIF peuvent introduire dimportants retards ; les filtres RIF, nayant pas de ple, sont stables sans condition supplmentaire ; les filtres RIF permettent dobtenir une phase linaire 3.1.1 .

Ce paragraphe se limite seulement quelques aspects de la synthse. On trouvera dans la bibliographie des lments indispensables sur la structure des filtres en gard aux bruits de calcul [9] et sur la synthse utilisant des bancs de filtres [20]. HAUT DE PAGE 3.3.2 Filtres RIF La mthode la plus lmentaire de synthse de filtres RIF est la mthode de la fentre. On peut la rsumer de la faon suivante :

on se donne un gain H (f ) thorique ; on en dduit la rponse impulsionnelle (h (n ) ;

on garde un nombre fini N de valeurs de h (n ) ; et on pondre ventuellement (multiplication terme terme), la suite obtenue par une suite w (n ) appele fentre.

Voyons plus en dtail le calcul de h (n ) partir de H (f ). On sait que le gain H (f ) dun filtre dont la rponse impulsionnelle est relle est une fonction relle, paire. Par consquent la TFtd inverse de H (f ) est une suite relle paire ce qui scrit h (n ) = h ( n ). Dautre part, on montre aisment que la TFtd inverse de la fonction Hd (f ) = H (f ) exp (j f ) vrifie hd (n ) = hd ( n 1). De ces remarques on dduit une rgle de calcul des coefficients du filtre, suivant que le nombre N de coefficients retenus est pair ou impair ou pair (figure 17). Pour un nombre impair de coefficients on prend la TFtd inverse de H (f ), tandis que, pour un nombre pair de coefficients, on prend la TFtd inverse de H (f ) exp (j f ). Cela donne :

Dans les deux cas la suite h (n ) obtenue est gnralement infinie. Si on veut faire une implantation directe du filtrage en mettant en uvre la convolution il faut tronquer la suite des h (n ). Cela revient multiplier celle-ci par une porte rectangulaire de largeur K. Dun point de vue spectral, on convolue donc le gabarit dsir par la fonction sin ( f K)/sin (f ), dont les lobes secondaires de largeur 1/K ont pour effet dintroduire des ondulations. Examinons ces effets sur un exemple. Soit raliser le filtre passe-bas de gain reprsent figure 18. En se limitant N = 15 coefficients, on obtient h (n ) = sin (n /2)/n avec n allant de 7 + 7. En prenant le filtre dfini par g (n ) = h (n 7), on obtient un filtre causal qui a le mme gain et dont lexpression est :

Figure 17 - Symtrie de la rponse pour N impair ou N pair

Figure 18 - Gain dun filtre passe-bas demi-bande

Il a donc une phase linaire. Cette proprit est lie au fait que la mthode utilise introduit une symtrie des coefficients qui permet un regroupement des termes 2 par 2. Voyons prsent les effets de la troncature de la rponse impulsionnelle. Nous avons multipli h (n ) par la porte rectangulaire et 0 sinon et donc convolu H (f ) par :

Les lobes de Wr(f ) de largeur 1/15 introduisent des ondulations dans le gain (figure 19). Pour rduire celles-ci on utilise des fentres [10] qui ont des lobes secondaires moins hauts que ceux de la fentre rectangulaire. Mais cela a aussi pour consquence dlargir le lobe principal et donc dlargir la bande de transition. En utilisant la fentre de Hamming dexpression :

on obtient le gain reprsent figure 19. On observe un largissement de la bande de transition accompagn dune rduction des ondulations. Toutefois lamplitude des ondulations ne peut tre rendue arbitrairement petite. On montre que lcart maximal entre le gain thorique et celui du filtre tronqu ne tend pas vers 0 quand K tend vers linfini. Les ondulations persistent tout ordre. Il sagit du phnomne de Gibbs. Ainsi lcart maximal est denviron 0,09 pour la fentre rectangulaire alors quil est de 0,0022 pour la fentre de Hamming. Nous renvoyons la rfrence [10] pour une tude trs complte de lensemble des fentres utilises en TNS.

Figure 19 - Gain dun filtre RIF demi-bande 15 coefficients

La mthode de la fentre est extrmement simple mettre en uvre. Cest la raison pour laquelle elle est assez largement utilise. Ses principaux dfauts sont que les ondulations en bande passante et bande attnue ne sont pas constantes et quelles ne peuvent tre contrles sparment. Lorsquon dsire viter ces inconvnients, des mthodes plus sophistiques sont gnralement retenues pour synthtiser les filtres RIF. Lune des plus courantes, base sur le concept de filtre optimal ondulations constantes de Parks-McClellan [9] , est connue sous le nom de mthode de Rmez. Elle est disponible dans beaucoup de bibliothques de programmes de traitement du signal. HAUT DE PAGE 3.3.3 Filtres RII Il existe trois principales techniques de synthse des filtres RII. La premire consiste partir de filtres analogiques (cest--dire temps continu) en effectuant une approximation des frquences continues par des frquences discrtes. La seconde est base sur un calcul direct des coefficients du filtre. La troisime est btie sur une procdure itrative doptimisation lorsque le traitement analytique direct est trop complexe. Nous allons nous contenter ici de prsenter la mthode de la transformation bilinaire. La mthode de la transforme bilinaire consiste remplacer 1/p par :

dans lexpression de la fonction de transfert dun filtre temps continu (on rappelle que, pour un filtre temps continu, la fonction de transfert est la transforme de Laplace de sa rponse impulsionnelle). La transforme bilinaire est justifie par le fait que 1/p, oprateur dintgration, peut tre approche en temps discret par B (z ). En effet, soit x (t ) une fonction intgrer, xn sa valeur

linstant nT et yn la valeur de son intgrale entre 0 et nT. En utilisant la mthode du trapze, on a lquation rcurrente yn = yn 1 + T (xn + xn 1)/2 qui a pour fonction de transfert B (z ). Si T est suffisamment petit, la distorsion de frquence introduite lors de cette transformation est ngligeable. Dans le cas contraire, il existe des mthodes de compensation. Pour conclure sur la prsentation de cette mthode, indiquons que les trois principaux modles de filtres analogiques utiliss pour synthtiser un filtre numrique, partir de la transforme bilinaire, sont les filtres de Butterworth, de Tchebycheff et de Cauer.

Un filtre de Butterworth a comme fonction de transfert :

avec

et son gain a pour expression

Il na pas dondulation en bande passante ni en bande attnue.

Un filtre de Tchebycheff de type 1 a comme gain :

o On montre que les N ples ont pour affixes :

avec

. . Ce type de

Lamplitude des ondulations en bande passante est constante et vaut filtre na pas dondulation en bande attnue.

Un filtre de Tchebycheff de type 2 a comme gain :

o fa dsigne la frquence de dbut de la bande attnue. On montre que les N ples ont pour affixes :

avec

et o Aa est lamplitude impose en bande attnue. Les N zros zk sont situs sur laxe imaginaire :

Il y a des ondulations en bande attnue mais pas dondulation en bande passante.

Un filtre de Cauer ou elliptique a comme gain :

o Rn est une fonction rationnelle de Tchebycheff. L caractrise lattnuation dans la bande de transition. Les filtres de Cauer prsentent des ondulations constantes en bande passante. Il y a des ondulations en bande attnue. Ces filtres sont dfinis partir de tables. Remarque : les mthodes de synthse ne doivent pas seulement se satisfaire de contraintes de gabarit. Elles doivent aussi prendre en compte limplantation finale de lalgorithme de filtrage. Ainsi, la prsence darrondis dans la reprsentation des coefficients introduit :

des phnomnes derreurs systmatiques que lon dsigne par bruits de calcul ; mais aussi de possibles instabilits lorsquon a affaire des filtres rcursifs.

Ces effets peuvent tre particulirement sensibles lorsque les processeurs utiliss travaillent en virgule fixe. 4. Signaux alatoires

4.1 Quelques rappels de 4.2 Notion de processus 4.3 Processus alatoires 4.3.1 Dfinitions 4.3.2 Ergodicit 4.3.3 Proprits 4.3.4 Filtrage 4.4 Chanes de 4.4.1 Chanes de Markov : 4.4.2 Chanes de Markov 4.5 lments destimation 4.5.1 Objet de la 4.5.2 lments de comparaison des 4.5.3 Estimation des moindres 4.5.4 Mthode des 4.5.5 Mthode du maximum de 4.5.6 Approche baysienne

probabilits alatoire SSL

Markov dfinitions caches statistique statistique estimateurs carrs moments vraisemblance

Comme nous lavons soulign prcdemment, les signaux manipuls en pratique ne peuvent tre que rarement reprsents comme des fonctions, ou comme solution dune quation diffrentielle ou rcurrente ou tout autre moyen mathmatique . On parle alors de signaux alatoires la connaissance desquels on accde travers des informations telles que moyenne, puissance moyenne, etc. qui sont dordre statistique. Cest la raison pour laquelle le fondement de ltude des signaux alatoires est la thorie des probabilits. 4.1 Quelques rappels de probabilits En thorie des probabilits (cf. [3] [9] ) on part dun ensemble dsignant lensemble des preuves. Un vecteur alatoire X de dimension p est dfini comme une application de dans . Se donner sa loi de probabilit cest se donner, pour tout pav b contenu dans probabilit que . Deux cas sont intressants en pratique :

, la

X prend ses valeurs dans un ensemble discret de valeurs. Sa loi est caractrise en se donnant la probabilit de chacune de ces valeurs : on dit que X et un vecteur alatoire discret ; X prend ses valeurs dans un continuum de par une expression de la forme : et la probabilit que est donne

o pX (x1, ..., xp) est une fonction positive, dfinie sur Son intgrale sur

, appele densit de probabilit.

est gale 1. On dit parfois que le vecteur alatoire X est continu .

Pour ne pas alourdir les notations, donnons quelques dfinitions en nous limitant au cas o X possde une densit de probabilit et o p = 2. Soit donc le vecteur alatoire (X1, X2) de densit pX (x1, x2). On montre que la variable alatoire X1 a pour densit de probabilit :

Dans ce contexte cette relation est appele loi a priori ou loi marginale.

On dit que X1 et X2 sont indpendantes si

La densit de probabilit de la loi conditionnelle de X1 connaissant X2 est donne par :

Si les deux variables sont indpendantes, on vrifie que la loi conditionnelle est gale la loi a priori.

La moyenne de X est le vecteur dterministe dont les composantes ont pour expression :

Si E (Xk ) = 0, on dit que Xk est centre. De faon plus gnrale on appelle moment dordre n de la variable alatoire Xk la quantit :

La covariance entre X1 et X2 est la quantit dfinie par :

cov(X1, X1) sappelle la variance de X1. On la note var(X1).

On dit que X1 et X2 sont non corrles si et seulement si cov(X1, X2) = 0. Si X1 et X2 sont indpendantes alors elles sont non corrles. En gnral la rciproque est fausse mais elle est vraie dans le cas gaussien.

On dit que la variable alatoire X est uniforme sur (a, b) si sa densit de probabilit est constante sur lintervalle (a,b). Elle a pour expression et 0 sinon.

On dit que X est gaussien si sa densit de probabilit a pour expression :

o x = (x1 x2)T, M = (m1 m2)T et C = (cij) une matrice symtrique, positive de dimension montre que E (Xk ) = mk , var (Xk ) = ckk et cov(X1, X2) = c12. Si cov(X1, X2) = 0, X1 et X2 sont indpendantes. Nota : det (C) dsigne le dterminant de la matrice carre C et AT la transpose de A. On dit quune matrice M est positive si pour tout vecteur a, le scalaire aTMa est positif. HAUT DE PAGE 4.2 Notion de processus alatoire Dans beaucoup de cas pratiques les phnomnes ont une forme si imprvisible quils semblent dus au hasard. On les dit alatoires. Pour modliser un phnomne alatoire (cf. [5] [6] ) on lui associe non plus un signal mais tout un ensemble de signaux que lon peut voir comme le rsultat dune infinit dexpriences rptes lidentique. videmment on ne peut pas rpter lidentique une infinit dexpriences. Mais loutil ainsi introduit permet de dcrire la grandeur observe par des proprits globales portant sur tout lensemble. Ainsi, on pourra supposer par exemple que toutes les trajectoires ont une moyenne nulle et une valeur efficace identique. Mathmatiquement un signal (on dit aussi processus) alatoire est une famille de variables alatoires indices par le temps n. On le note X (n ) (en omettant la rfrence lpreuve ). Il peut tre vu :

; On

soit, pour une preuve fixe 0, comme une simple fonction du temps x (n, 0) appele trajectoire (figure 20), soit, pour un instant fix n0, comme la variable alatoire X (n0).

Figure 20 - Trajectoires dun processus alatoire ( temps continu)

Voyons tout dabord quelques dfinitions.

Pour tout nombre K et pour toute suite dinstants (n1 ... nK ), lensemble des lois de probabilits du vecteur [X (n1 ... X (nK )] caractrise le processus X (n ) : on appelle cet ensemble la loi temporelle du processus. Soulignons que la donne de la loi temporelle ne permet pas de dterminer lquation des trajectoires. On appelle moyenne dun processus alatoire linstant n, lesprance mathmatique de la variable alatoire X (n ). Cest une fonction dterministe qui dpend a priori de n: m (n ) = E (X (n )) Si m (n ) = 0 pour tout n, on dit que le processus est centr.

On appelle suite ou fonction dautocovariance (certains auteurs parlent improprement dautocorrlation) la covariance entre les variables alatoires X (n1) et X (n2). Elle a pour expression :

o ltoile (*) dsigne le complexe conjugu. Bien sr, dans le cas de processus rel, il nest pas utile de le faire apparatre. Dans tous les cas, cest une fonction dterministe qui dpend la fois de n1 et de n2. Dans certains cas il est possible de dcrire le signal alatoire par la donne de sa loi temporelle. En voici trois exemples.

Une suite de variables alatoires indpendantes et identiquement distribues (iid) a une loi temporelle qui sobtient simplement tout ordre partir de (5.3) et de la donne de la loi de X0 de lune dentre elles. Un processus alatoire est gaussien si, pour tout nombre K dinstants, la loi de (X (n1), ..., X (nK)) est gaussienne. Dans ce cas, on vrifie aisment que la loi temporelle est uniquement caractrise par la donne de la moyenne et de la fonction dautocovariance.

Pour un processus alatoire de Markov la loi temporelle sexprime partir de la donne des probabilits de transition entre tats .

Hormis quelques cas particuliers tels que ceux cits prcdemment, il est trs compliqu de se donner compltement la loi temporelle. On se contente bien souvent des expressions de la moyenne et de la fonction de covariance entre X (n1) et X (n2) qui sont les moments dordre 1 et 2. On peut se demander pourquoi sarrter lordre 2. Il se trouve que la description lordre 2 est suffisante dans le cas gaussien, mais, surtout, elle est lie, comme nous allons lexpliquer, la distribution spectrale de la puissance et cette dernire est au centre des problmes de filtrage linaire. Depuis quelques annes, les chercheurs se sont beaucoup intresss aux statistiques dites dordre suprieur (SOS). Mais, aujourdhui encore les SOS restent un outil peu utilis en TNS. HAUT DE PAGE 4.3 Processus alatoires SSL HAUT DE PAGE 4.3.1 Dfinitions On dit quun processus alatoire est stationnaire au sens large (SSL) (sous-entendu du second ordre) sil vrifie les deux proprits suivantes :

la moyenne est indpendante de n et note m, la fonction dautocovariance ne dpend que lcart de temps k = n1 n2. Nous la notons alors R (k ).

Le mot stationnaire est li au fait que la moyenne et la fonction dautocovariance ne dpendent pas de lorigine du temps. Quand le processus est SSL, on a les dfinitions suivantes :

on appelle puissance la quantit P dfinie par :

comme on envisagera souvent des processus centrs, la puissance est alors la valeur lorigine de la fonction dautocovariance ;

on appelle spectre ou densit spectrale de puissance (dsp) dun processus alatoire SSL la TFtd de la suite R (k).

HAUT DE PAGE

4.3.2 Ergodicit Un processus alatoire peut tre vu comme une infinit de trajectoires correspondant une infinit dpreuves. Cependant, dans un grand nombre de cas pratiques, une seule ralisation du processus est accessible la mesure. Cest pourquoi la classe des processus stationnaires pour lesquels les moments peuvent tre obtenus en effectuant une moyenne temporelle sur une seule trajectoire, joue un rle important en pratique. Lergodicit prcise cette notion. Un processus stationnaire X (n ) est ergodique au second ordre si sa moyenne et sa fonction dautocovariance peuvent tre obtenues en effectuant une moyenne temporelle sur une seule trajectoire et sur un intervalle de temps qui tend vers linfini. En pratique, pour N suffisamment grand, on a :

Dans la suite, sauf indication contraire, nous supposerons que les processus sont ergodiques. HAUT DE PAGE 4.3.3 Proprits

La fonction dautocovariance est positive. Cela signifie que, quel que soit M, la matrice hermitienne (R = RT ) :

est une matrice positive. On note que R est une matrice de Toplitz. Nota : Les lignes parallles la diagonale principale sont constitues de termes constants.

La dsp est une fonction positive :

Si le processus est de moyenne non nulle, on adjoint au spectre une raie lorigine (f = 0) damplitude m2. Cette raie lorigine, qui traduit simplement la prsence

dune moyenne non nulle, porte le nom de composante continue du processus. Si on utilise la distribution de Dirac cela revient prendre pour dfinition du spectre la transforme de Fourier du moment du second ordre. On a effet :

qui a pour transforme de Fourier S (f ) + m2 (f ).

On appelle processus harmonique un signal alatoire dont les trajectoires sont dfinies par lexpression : (8)

o {As } dsigne une suite de P variables alatoires centres, non corrles de variance , {s } une suite de P variables alatoires indpendantes des {As }, de loi uniforme sur (0, 2), et {fs } une suite de P frquences. On montre que X (n ) est SSL, centr et que sa fonction dautocovariance a pour expression :

Sa dsp est donne au sens des distributions par :

Elle est constitue de raies situes aux frquences fk , qui traduisent la prsence de composantes priodiques dans le signal.

De faon semblable au cas dterministe avec lnergie, le spectre reprsente la rpartition (on dit aussi la localisation) de la puissance le long de laxe des frquences et la puissance est donne par :

Ltude des mthodes qui permettent destimer le spectre dun processus alatoire SSL est un domaine important du traitement du signal. Nous y reviendrons dans la suite. Quand un processus alatoire centr a une fonction dautocovariance R (k ) identique 0 pour , sa dsp est une constante. Par analogie avec la lumire blanche, dont le spectre est constant tout le long de laxe des frquences optiques, on dit que ce processus est blanc. Le bruit blanc est larchtype des modles de bruit rencontrs en pratique. Ainsi, dans les

systmes de communication, il modlise lensemble des bruits dorigine thermique qui interviennent dans la chane de transmission depuis lmetteur jusquau rcepteur. Un autre exemple de bruit blanc est le bruit introduit par lopration de quantification. Considrons la quantification uniforme sur N bits. Elle consiste diviser lintervalle crtecrte ( Ac , + Ac ) du signal (suppos centr) en 2N intervalles de mme longueur q = 2Ac /2N et dassocier lchantillon Xn le numro, cod sur N bits, de lintervalle auquel il appartient. A la restitution on remplace ce code par la valeur mdiane de lintervalle. Si on note Xn lchantillon quantifier et Yn la valeur restitue, on a Yn = kq si . On peut alors crire Yn = Xn + en o en reprsente lerreur. en est appel le bruit de quantification. Dans les calculs pratiques, on fait lhypothse que les erreurs en sont des variables alatoires non corrles dont la loi est uniforme sur ( q/2, q/2). On en dduit que E (en ) = 0 et que . En labsence dcrtage, lopration de quantification est donc considre comme quivalente laddition dun bruit SSL centr, blanc de puissance Bq = q 2/12 :

En pratique on ne peut pas garantir labsence dcrtage. Par contre on peut faire en sorte que les amplitudes suprieures Ac soient de probabilit ngligeable. Dans le cas o Xn et un signe alatoire, SSL, centr, de puissance 2 = R (0),on pose Ac = F o F est appel facteur de crte. Ainsi, si Xn est un processus alatoire gaussien, en prenant F = 3 on a une probabilit dcrtage qui est infrieure 1 %. Pour un signal de parole, qui vrifie mal lhypothse gaussienne, on prend F de lordre de 4. En supposant prsent que toutes les amplitudes sont comprises entre F et + F, le pas de quantification a pour expression q = 2F /2N. On en dduit que le rapport signal/bruit de quantification a pour expression :

Une consquence pratique est que le rapport signal/bruit de quantification augmente de 6 dB chaque fois quon ajoute 1 bit de codage. Notons que, sil ny avait pas lopration de quantification, il ne servirait rien de surchantillonner un signal au-del de la frquence de Nyquist (voir thorme dchantillonnage). Par contre, suite lopration de quantification, on montre que, sous lhypothse de blancheur du bruit de quantification, on gagne environ 3 dB sur le rapport signal bruit de quantification si lon double la frquence dchantillonnage. Malheureusement, cette rgle de doublement ne peut tre pousse trop loin car lhypothse de blancheur finirait par ne plus tre vrifie.

HAUT DE PAGE 4.3.4 Filtrage Soit X (n ) un processus alatoire SSL, de fonction dautocovariance RX (k ) et de dsp SX (f ), lentre dun filtre linaire de rponse impulsionnelle h (n ) et de gain complexe H (f ). On montre que le processus alatoire Y (n ) en sortie est lui-mme SSL. Sa moyenne est donne par :

Il est donc centr si le signal dentre est centr. Sa dsp est : (9)

Cette formule sapplique que le signal contienne ou pas une composante harmonique (expression ( cf. ici )). Ainsi, si le signal dentre est le processus harmonique (cf. quation ( cf. ici )), sa dsp a pour expression :

o 2 est la variance de A. On rappelle que la dsp de Y (n ) est donne par :

. En appliquant ( cf. ici ),

Ce rsultat est mis profit dans certains dispositifs de synchronisation pour rcuprer, par filtrage trs troit, une composante harmonique prsente dans le processus observ. Compare la formule des spectres ( cf. ici ), lexpression de la fonction dautocovariance RY (k ) en sortie est plus complique. Si h (n ) dsigne la rponse impulsionnelle du filtre, RY (k ) scrit :

On montre que les processus X (n ) et Y (n ) sont de covariance stationnaire, ce qui signifie que cov(X (n1), Y (n2)) ne dpend que de lcart de temps k = n1 n2. On la note RYX (k ) et son expression est :

HAUT DE PAGE 4.4 Chanes de Markov HAUT DE PAGE 4.4.1 Chanes de Markov : dfinitions Le caractre markovien de signaux alatoires permet dobtenir dintressants rsultats en TNS. Une chane de Markov temps discret [6] est une suite de variables alatoires X (n ) valeurs dans un ensemble fini (e1, ..., eN ) de N valeurs possibles. Le caractre markovien dit que la probabilit pour que X (n ) = ei conditionnellement tout le pass, concide avec la probabilit pour que X (n ) = ei conditionnellement linstant (n 1). Une chane de Markov est donc caractrise par la probabilit conditionnelle dtre dans ltat ej linstant n sachant que lon tait dans ltat ei linstant (n 1), ce que lon note :

Par consquent, pour tout n et tout i, on a

Lorsque aij (n ) est indpendant de n, la chane peut tre reprsente par une matrice A dlments aij ou encore par une machine tats dans laquelle chaque transition est pondre par aij. La figure 21 illustre un processus trois tats e1, e2, e3 et les arcs sont pondrs par les probabilits de transition. Par exemple la probabilit de transition de ltat e1 dans ltat e2 est gale 3/4, et la matrice A, appele aussi matrice Markov (la somme des lments dune ligne est gale 1), scrit :

Si on note pi (n ) la probabilit de se trouver dans ltat ei , linstant n et p (n ) = (p1 (n ) p 2 (n ) ... pN (n ))T, on montre facilement que :

Une chane de Markov est donc caractrise par la donne de la matrice A et du vecteur p(0). Son comportement, en particulier quand n tend vers linfini, dpend, entre autre, de la topologie du graphe, cest--dire des zros de A. Il peut y avoir des cycles, des tats probabilit limite nulle, stationnarit, etc.

Figure 21 - Graphe dune chane de Markov trois tats HAUT DE PAGE 4.4.2 Chanes de Markov caches Dans certains problmes, lobservation est directement modlisable par une chane de Markov X (n ). Cest le cas par exemple en communication numrique lorsquon utilise un codeur lentre duquel on a une suite binaire. Mais il en est dautres o lobservation nest quune version Y (n ) transforme dune certaine chane de Markov X (n ) non visible, la transformation subie par X (n ) ntant a priori ni bijective ni mme dterministe. On parle alors de chanes de Markov caches (CMC) (ou en anglais Hidden Markov Model : HMM). Lexemple qui suit, emprunt [19] , explicite cette notion : un exprimentateur procde un lancer de pices de monnaie. Il nonce un observateur, qui ne le voit pas agir, la suite Y (n ) des rsultats obtenus. Lexprimentateur utilise N pices et choisit alatoirement une pice suivant une procdure dcrite par une matrice markovienne A. Les pices peuvent tre truques, ce qui signifie que la probabilit pour que Y (n ) = y sachant que telle pice a t utilise peut ne pas tre gale 1/2. Dans notre cas la variable y ne peut prendre que K = 2 valeurs, savoir pile ou face. De faon plus gnrale, un modle de CMC est dcrit par :

le nombre N dtats {e1 ... eN } ; le nombre K de valeurs possibles de lobservation {Y1 ... YK} ; la matrice A de transition entre tats :

la loi de probabilit de lobservation connaissant ltat :

et

la probabilit p (0) de ltat initial.

Quelques problmes de base On distingue trois problmes fondamentaux lis la notion de CMC.

Comment calculer numriquement la probabilit dune suite dobservations Y (n ) pour un modle donn de CMC ? La valeur obtenue peut tre utilise comme score dadquation des observations avec le modle et permet donc de choisir parmi plusieurs modles en comptition. tant donn une suite dobservations et un modle de CMC, comment doit-on trouver la suite dtats qui explique au mieux les observations ? Le critre du maximum de vraisemblance peut tre utilis et lalgorithme de Viterbi, bien connu en communications numriques, permet de rsoudre le problme. Comment choisir les paramtres du modle qui maximisent la probabilit (on dit aussi la vraisemblance) de la squence dobservations ? Dans le cas gnral, on ne dispose pas dune expression analytique du rsultat. Cest pourquoi on fait appel des mthodes numriques de maximisation, en particulier lalgorithme esprance-maximisation (EM) [13] .

Exemple dapplication : la reconnaissance de la parole Le domaine de la reconnaissance des formes (RF) est troitement associ celui du traitement du signal. Un dispositif de RF comporte en gnral trois tapes : la mesure dun vecteur de paramtres construits partir du signal, la comparaison de ce vecteur dans une base de rfrence et enfin la dcision. La premire tape utilise largement les outils de TNS. Les chanes de Markov caches en font partie [4] [19]. Comme son nom lindique, la reconnaissance de la parole est un problme de RF et les CMC sont un outil de choix. Lide est la suivante : on considre des mots isols et on associe chacun dentre eux une CMC. Chaque tat est associ grosso modo un morceau du signal correspondant un mot. En fait, pour rduire la taille dun dictionnaire complet de mots, on associe plutt une CMC chaque phonme, sorte dunit sonore du langage parl. Chaque mot est alors le rsultat de la concatnation de plusieurs CMC. Le problme de la reconnaissance peut tre ramen au calcul dune probabilit conditionnelle P (M Y ) caractrisant la validit du modle M relativement aux quantits observes Y. On se retrouve l encore devant un problme de maximum de vraisemblance. La rfrence [19] donne un grand nombre dlments sur lutilisation des CMC en reconnaissance de la parole.

HAUT DE PAGE 4.5 lments destimation statistique Lobjectif de ce paragraphe est de donner un aperu de la problmatique rencontre en estimation statistique et de prsenter quelques mthodes destimation populaires en TNS. Nous ne prtendons nullement puiser le sujet et nous oublions certainement certains aspects fondamentaux. Ce domaine comporte en fait une trs vaste littrature et nous renvoyons le lecteur la rfrence [13] qui en donne une bonne introduction.

HAUT DE PAGE 4.5.1 Objet de la statistique Considrons une exprience alatoire dont la loi de probabilit dpend dun paramtre inconnu . Dans le cas gnral ce paramtre est un vecteur multidimensionnel. Le problme de lestimation statistique est la recherche de mthodes pour valuer partir dune suite {X (1) ... X (n )} dobservations. Plus gnralement, lobjet de la statistique est dinfrer, partir de ces observations, certaines proprits de la loi inconnue, comme par exemple dire si sa variance est suprieure un seuil ou bien encore si cette loi est gaussienne. Le cas le plus simple est celui o la loi de lobservation est compltement spcifie une fois donn le paramtre . On dit alors que le modle est paramtrique. Il nen est pas toujours ainsi. Considrons par exemple lobservation X (n ) = m + W (n ) o m est le paramtre estimer et o W (n ) est une seule de variables alatoires centres de loi inconnue. Dans ce cas, se donner m ne suffit pas dterminer la loi de X (n ). On dit que le modle est non paramtrique. Par contre, si on prcise, dans ce modle dobservation, que W (n ) est une suite de variables alatoires gaussiennes indpendantes, centres, de mme variance 2, le problme devient paramtrique pour le paramtre bidimensionnel = (m 2)T. Dans la suite nous considrons uniquement le cas de lestimation paramtrique dun paramtre de dimension k. HAUT DE PAGE 4.5.2 lments de comparaison des estimateurs On appelle estimateur de , paramtre vectoriel de dimension k, k fonctions (mesurables) de {X (1) ... X (N )}, que nous notons vectoriellement T(X (1) ... X (N )). On utilise aussi le terme de statistique pour dsigner une fonction des observations. Pour comparer entre eux les estimateurs on introduit les quantits suivantes.

On appelle biais de lestimateur T, le vecteur k composantes dfini par :

Dans le cas o la loi de probabilit du vecteur alatoire [X (1) ... X (n )]T possde une densit de probabilit pX (x1 ... xN ; ) la j e composante de b( ) scrit :

En gnral le biais est une fonction du paramtre inconnu . Il est donc lui-mme inconnu. On dit que T est sans biais si, et seulement si, quel que soit , b ( ) = 0. On dit quun estimateur est asymptotiquement sans biais, si b ( ) tend vers 0 quand N tend vers linfini. Cette proprit est tout fait souhaitable car, bien quun estimateur sans biais ne soit pas ncessairement bon, un biais persistant est presque toujours la preuve de performances mdiocres.

On appelle dispersion ou cart quadratique de lestimateur T la matrice de dimension dfinie par :

Cette matrice est positive. On montre que D( ) = cov (T) + b( )bT( ). Par consquent, quand lestimateur est sans biais, sa dispersion est gale sa matrice de covariance. Il faut avoir lesprit que la dispersion reprsente une mesure des fluctuations de T autour de la vraie valeur . En pratique, si on rpte lexprience lidentique un grand nombre de fois, les composantes de T doivent raisonnablement rester dans un intervalle dont la largeur est de lordre de grandeur de la racine carre des lments diagonaux de D( ). Cest pourquoi on adopte la dfinition suivante.

On dit que lestimateur T est meilleur que lestimateur V si, et seulement si quel que soit , DV ( ) DT ( ) est matrice positive.

Malheureusement il nexiste pas destimateur qui soit de dispersion minimale pour toute valeur du paramtre . Cest la raison pour laquelle on est conduit minimiser, plutt que la dispersion, une fonction de risque R (T ; ), dans une classe plus restreinte destimateurs. Signalons quil existe une borne infrieure de la dispersion de tout estimateur, appele borne de Cramer-Rao (BCR). La BCR peut tre vue comme une limite fondamentale la prcision avec laquelle on peut estimer un paramtre . Dans le cas dun estimateur sans biais, on a pour et la BCR est gale F 1( ), o la matrice F( ) a comme lment gnrateur :

F( ) porte le nom de matrice dinformation de Fisher. HAUT DE PAGE 4.5.3 Estimation des moindres carrs A lorigine, la mthode des moindres carrs nest proprement parler de nature statistique. Elle fait appel un modle dterministe du signal dpendant dun paramtre mesurer. On note ce signal S( ). On observe X qui, pour des raisons non explicites, nest quune version dforme de S( ). Lestimateur des moindres carrs consiste prendre comme valeur de celle qui rend minimale la fonction quadratique de cot J ( ) = (X S( ))T (X S( )). Le mrite de son invention revient Gauss qui lutilisa pour calculer le mouvement des plantes, mais aujourdhui, son champ dapplications sest considrablement accru. Le cas le plus simple est celui o le modle de signal dpend linairement de . Dans ce cas la mthode aboutit la construction du meilleur estimateur linaire sans biais. Soit en effet une exprience alatoire dont le modle dobservation est :

On suppose que W (n ) est une suite de variables alatoires, centres, de fonction de covariance R (n1, n2) connue et que hnj est une suite de quantits connues. Pour un chantillon de taille N, la suite des N quations prcdentes peut scrire matriciellement : (10)

o dsigne le vecteur de dimension k estimer et H une matrice connue de dimension . On note C = E (WWT) la matrice de covariance de dimension construite partir de R (n1, n2). On limite la recherche la classe des estimateurs linaires cest--dire de la forme T = AX o A est une matrice de dimension dterminer. On montre que :

est, parmi les estimateurs linaires sans biais, celui qui est de dispersion minimale. Dans le cas o le bruit est blanc, et la matrice de covariance 2 T 1 T C = I. On dduit alors de ( cf. ici ) que T = (H H) H X. Cest lexpression de lestimateur des moindres carrs, dit ordinaire, obtenu lorigine par Gauss et qui correspond lhypothse que le bruit est blanc. Par opposition ( cf. ici ) est dit estimateur des moindres carrs pondrs. Lexpression ( cf. ici ) montre que le calcul de T ncessite la manipulation dune matrice de la matrice H de dimension . Si on veut effectuer le calcul de T au fur et mesure que les donnes X (n ) arrivent, on voit que la taille de cette matrice crot de manire explosive . Dans ces conditions le traitement ne peut pas tre effectu sur calculateur. Heureusement, il existe un algorithme rcursif qui calcule la valeur de T partir de son ancienne valeur et de la dernire valeur reue de X (n ) et qui nutilise que des matrices de dimension finie. Cet algorithme est dit algorithme des moindres carrs rcursifs (MCR). La mthode des moindres carrs stend au cas o le modle dobservation ne dpend plus linairement de . Il suffit de remplacer dans la relation ( cf. ici ) H par S( ) suppose non linaire en . On obtient lquation dobservation X = S( ) + W. Malheureusement, mme sous des hypothses simplificatrices sur W, il nest plus possible dobtenir lexpression analytique dun estimateur sans biais de dispersion minimale. Comme lorigine, lapproche consiste alors dterminer qui rend minimale la fonction quadratique de cot J ( ) = (X S( ))T(X S( )). Sous certaines hypothses de rgularit de S( ), on montre que lestimateur obtenu possde de bonnes performances statistiques. En rgle gnrale la minimisation de J ( ) se fait par des techniques numriques. Une autre famille de mthodes est base sur la dcomposition de la matrice de covariance de X en sous-espaces propres. Ces mthodes, dites de type sous-espace, ont connu un trs fort dveloppement ces dernires annes (MUSIC, ESPRIT, etc. [11] [12]).

Exemple on observe N chantillons {X (1), ..., X (N )} de lexponentielle complexe S (n ; f0) = exp(2jf0(n 1)) de frquence f0. On montre que la valeur de f0 qui minimise :

est donne par :

Cest donc labscisse du maximum de la TFtd de la suite {X (1) ... X (N )}. Dans le cas o on a non plus une mais P frquences valuer, la recherche du minimum ne peut tre effectue que numriquement et est trs coteuse en temps de calcul. Toutefois, le rsultat essentiel retenir est que la solution qui consiste rechercher les P maximum de la TFtd est trs proche de loptimalit lorsque les carts en frquence sont suprieurs la limite de Fourier 2/N. HAUT DE PAGE 4.5.4 Mthode des moments Propose au dpart par Pearson, la mthode des moments est lune des mthodes les plus aises pour la recherche destimateurs. Elle consiste, dans sa forme la plus simple, galer les moments empiriques avec les moments statistiques de mme ordre. Voyons son application dans le cas simple o lchantillon observ {X (1) ... X (N )} est une suite de N variables alatoires iid. On appelle moment empirique dordre m la statistique dfinie par :

On note Sm( ) = E (X m(1)) le moment dordre m de X (1). La mthode des moments consiste rsoudre le systme des k quations aux k inconnues = (1 ... k ) dfini par :

Il existe de multiples variantes de cette mthode, en particulier en prenant des moments de la forme E [fm (X(1))] la place de E [X m(1)] ou encore en prenant un nombre de moments suprieurs k (systme surdimensionn). On montre (sous certaines hypothses de rgularit de la loi de X (1)) que tous ces estimateurs sont asymptotiquement sans biais et de dispersion minimale. Nota : On entend par asymptotiquement que N tend vers linfini. Dans le cas o X (n ) est un signal alatoire SSL (on abandonne lhypothse iid), centr, les statistiques les plus utilises sont de la forme :

qui sont les statistiques empiriques des covariances. En particulier elles sont utilises pour estimer les paramtres dun modle AR (cf. 6.2.3). Ltude de leurs proprits statistiques est beaucoup plus complexe. Toutefois, on montre que, dans le cas de lestimation AR, les estimateurs obtenus sont asymptotiquement sans biais et de dispersion minimale. HAUT DE PAGE 4.5.5 Mthode du maximum de vraisemblance La mthode du maximum de vraisemblance constitue une gnralisation dune ide de Gauss, qui postule que la meilleure valeur du paramtre est celle qui correspond la plus grande probabilit de lvnement observ. On considre une observation dont la loi de probabilit possde une densit not px (x1 ... xN ; ). Lestimateur du maximum de vraisemblance est la valeur de qui correspond au maximum, ce qui scrit :

En probabilit, la fonction px (x (1) ... x (N ) ; ), considre comme une fonction de (x1 ... xN ), est appele une densit de probabilit. Mais en statistique, lorsquelle est considre comme fonction de , elle porte le nom de vraisemblance. Le plus souvent on en prend le logarithme qui porte le nom de log-vraisemblance. Exemple on considre un train binaire que lon modlise comme une suite de variables alatoires iid valeurs dans {0,1}. On pose = P (X (n ) = 1) et on veut estimer partir dune suite de N valeurs. La log-vraisemblance scrit :

Exemple En drivant cette expression par rapport et en lannulant, on obtient lexpression de lestimateur du maximum de vraisemblance :

En gnral, la dtermination de lexpression analytique du maximum est plus difficile, voire impossible, et il faut alors faire appel des techniques numriques de calcul. Certaines sont classiques (algorithme du gradient, algorithme de Newton-Raphson). Une technique plus spcifique, lie au domaine des statistiques, a connu ces dernires annes un essor considrable : lalgorithme dEsprance-Maximisation (EM) [13] . HAUT DE PAGE 4.5.6 Approche baysienne On a dit que la dispersion D( ) ne permettait pas de comparer totalement les estimateurs entre eux. Dans lapproche baysienne, on suppose que toutes les valeurs de ne sont pas galement probables mais quelles sont distribues dans un domaine de , suivant une loi de probabilit connue, appel loi a priori. On peut alors prendre la moyenne de D( ) sur . Ce qui conduit la dfinition du risque baysien. On appelle risque baysien associ lestimateur T la quantit dfinie par :

o q( ) dsigne la densit de probabilit de la loi a priori de . Par dfinition lestimateur baysien est celui qui minimise le risque baysien. On montre quil est donn par lesprance conditionnelle de sachant X(1) ... X(N ), qui se note E ( X (1) ... X (N )). Cest un vecteur k composantes qui a pour expression pour :

Dans le cas gaussien les calculs sont simples. En particulier lestimateur baysien est luimme gaussien. 5. Traitements de signaux

5.1 Traitements 5.1.1 Sur 5.1.2 Banc 5.1.3 Ondelettes 5.2 Estimation 5.2.1 Utilisation 5.2.2 Priodogramme 5.2.3 Modlisation 5.3 Filtrage adaptatif

et de et de du analyse

multicadences sous-chantillonnage filtres multichelle spectre priodogramme moyenn AR

Ce paragraphe ne prtend nullement donner une vue exhaustive des problmes de TNS. Il prsente trois exemples dans le but dillustrer les notions prsentes prcdemment et, pourquoi pas, de susciter lenvie pour certains de se plonger dans limmense littrature consacre ces sujets. 5.1 Traitements multicadences Un systme multicadence est caractris par des cadences de traitement diffrentes en divers points de la chane de calcul. Il y est fait largement appel aux oprations de dcimation et insertion. Dans ce paragraphe nous nous limitons la prsentation de quelques rsultats concernant les bancs de filtres et de leurs liens avec lanalyse multirsolution. HAUT DE PAGE 5.1.1 Sur et sous-chantillonnage Le surchantillonnage dun facteur entier M consiste, sur une suite x (n ), calculer (M 1) valeurs intermdiaires entre deux points conscutifs. Le sous-chantillonnage dun facteur entier M est en quelque sorte lopration inverse : elle consiste calculer, sur une suite x (n ), la suite chantillonne la cadence M fois moins grande. Le thorme dchantillonnage nous enseigne que cette opration ne se rsume pas seulement prlever un chantillon sur M dans la suite initiale. Pourquoi surchantillonner ou sous-chantillonner un signal ?

Des applications trs spcifiques peuvent faire appel ces oprations. Signalons par exemple le changement de frquence : on veut passer de la frquence 44,1 kHz 48 kHz. Une solution est de surchantillonner dun facteur 10 puis de souschantillonner dun facteur 9.

Autre exemple, on veut passer dune reprsentation sur 16 bits une reprsentation sur 14 bits. Ignorer 2 bits conduit perdre 12 dB sur le rapport signal/bruit de quantification. On peut regagner environ 6 dB si on surchantillonne dun facteur 4. On peut mme gagner 6 dB de plus par une mise en forme spectrale du bruit de quantification. Donnons un dernier exemple : lors de la restitution des signaux audio-frquences (parole, musique), le surchantillonnage fournit une solution simple pour ne pas avoir raliser de filtre passe-bas analogique en sortie du bloqueur dordre 0.

Autre domaine privilgi de ces techniques : les traitements multicadences que lon rencontre en particulier dans les bancs de filtres, dans les mthodes de codage en sous-bandes, dans les modulations multiporteuses ou encore dans lanalyse multirsolution. Surchantillonnage Soit la suite x(n ) et Xz (z ) sa transforme en z. Considrons la suite y (n ) = x (n/M) pour n = 0 modulo M et y (n ) = 0 sinon. Cette opration, qui intercale (M 1) zros entre chaque terme du signal x (n ), est appele insertion dun facteur M.

Ltude de son spectre (figure 22) va nous indiquer comment effectuer le surchantillonnage. Avec des notations videntes, la transforme en z de y (n ) est Yz (z ) = Xz (zM ) et sa TFtd Y (f ) = X (Mf ). On retrouve dans lintervalle ( 1/2, 1/2) le spectre de x (n ) rpliqu M fois. On dit quil y a apparition dimages ou frquences-images. Le fait dintercaler des zros la place des vraies valeurs a donc produit des composantes hautes frquences correspondant aux transitions brutales que lon a introduit dans la suite temporelle. Le moyen dobtenir la suite surchantillonne est dappliquer y (n ) un filtre passe-bas idal de gain M dans la bande .

Figure 22 - Effet du sur-chantillonnage pour M = 4

Figure 23 - Effet du sous-chantillonnage : M = 4

Sous-chantillonnage On considre, prsent, la suite y (n ) = x (Mn ) obtenue en ne gardant quun chantillon sur M de la suite x (n ). Cette opration est appele une dcimation de facteur M. On montre que sa transforme en z a pour expression :

o on a pos wM = exp( 2j/M ). En passant la TFtd on obtient :

Cette expression montre que, dans lintervalle ( 1/2, 1/2), Y (f ) est la somme algbrique de M contributions de X (f ) dcales de 1/M qui se traduit par du repliement de spectre (figure 23). Par consquent, pour sous-chantillonner le signal x (n ), il faut, avant lopration de dcimation, effectuer un filtrage de gain M dans la bande repliement de spectre. En rsum on retiendra que :

, ceci afin dviter le

pour surchantillonner un signal x (n ) dans un rapport M, il faut effectuer une insertion de facteur M puis un filtrage de gain M dans la bande ( 1/2M, 1/2M ) pour liminer les frquences-image ; pour sous-chantillonner un signal x (n ) dans un rapport M, il faut effectuer un filtrage de gain M dans la bande ( 1/2M,1/2M ) pour viter le repliement, puis une dcimation de facteur M.

La figure 24 montre les oprations de sur et sous-chantillonnage.

Figure 24 - Oprations de sur et sous-chantillonnage

Comme le montrent les deux quivalences reprsentes figure 25, on peut permuter, dans les oprations de sur et sous-chantillonnage, les oprations de dcimation et insertion avec le filtrage. HAUT DE PAGE 5.1.2 Banc de filtres Un banc de filtres est un ensemble de filtres numriques travaillant en parallle et dcoupant la bande de frquence en K sous-bandes (figure 26). Les applications en sont, par exemple, lanalyse en sous-bandes ou encore le codage en sous-bandes de signaux en vue de leur transmission ou de leur stockage, ou encore le filtrage adaptatif en sous-bandes.

Figure 25 - quivalences sur linsertion et la dcimation

Figure 26 - Banc de filtres

Imaginons tout dabord que le banc soit constitu de filtres passe-bande idaux disjoints de largeur 1/K. Les K signaux en sortie sont bande limite et acceptent donc dtre chantillonns, sans repliement, une cadence K fois plus faible, ce qui rduit dautant le nombre doprations par branche. Malheureusement ces filtres idaux sont RII et lutilisation de filtres RIF pour effectuer le mme traitement se traduit par une perte de slectivit : il y a immanquablement un largissement des sous-bandes et donc du repliement la sortie des dcimateurs. Le problme de la reconstitution parfaite (RP) peut alors snoncer ainsi : existe-t-il un banc de filtres RIF tel que les effets des repliements dans chaque sous-bande se compensent exactement sur lensemble de la bande, de faon ce que la fonction de transfert totale T (z ), dun bout lautre du systme, soit sans distorsion damplitude soit T [exp (2jf )] = Cte et sans distorsion de phase soit arg {T [exp (2jf )]} = c0f ? La rponse est oui mais...

Figure 27 - Schma-bloc quivalent dun banc de filtres

Considrons, en effet, le schma de la figure 27. On montre aisment, partir des relations dquivalence (figure 25), quil est strictement quivalent au schma de la figure 26. Il prsente un bloc dentre et un bloc de sortie comportant un ensemble de dcalages temporels

successifs, appel rseau dphaseur. Les composantes {x1 (n ) ... xK (n )} en sortie du bloc dentre sont dites composantes K-polyphases du signal x (n ). Les blocs nots E(z ) et R(z ) sont des filtres linaires multi-entres/ multi-sorties qui ralisent des relations de la forme :

Avec des notations videntes, ces dernires sont quivalentes la relation matricielle U(z ) = E(z ) X(z ) o E(z ) est une matrice de dimension dont llment (ligne i colonne j ) est la transforme en z de la suite eij (n ). Dans le cas o les filtres du banc sont RIF, E(z ) est une matrice de polynmes. Une solution au problme RP consiste choisir E(z ) et R(z ) inverses lun de lautre. De faon plus gnrale, ltude des matrices de polynmes dont linverse est aussi une matrice de polynmes est au cur du problme des bancs de filtres. Lors de lutilisation de filtres RIF, on est souvent tent dimposer la contrainte supplmentaire que les filtres soient phase linaire. Malheureusement il nexiste quune solution au problme RP qui soit constitu de filtres RIF phase linaire mais ces filtres sont de longueur K : on ne peut donc pas jouer, en augmentant la longueur des filtres, sur leur slectivit en frquence. On peut, par contre, trouver des solutions RIF phase linaire de longueur variable si on se contente de satisfaire la contrainte de non-distorsion de phase, cest--dire arg [T exp(2jf )] = c0f et que lon minimise la distorsion damplitude ou inversement. Si on abandonne dfinitivement la contrainte de phase pour les filtres de banc, il existe une infinit de solutions au problme RP. Une classe importante de solutions est fournie par la classe des matrices para-unitaires dfinies par E(z )ET (z 1) = IK. La recherche de solutions slectives peut alors tre obtenue par optimisation numrique. La rfrence [20] donne une prsentation trs complte de ltat de lart de ces techniques. Indiquons pour conclure que, dans certaines applications, on utilise un dcoupage de la bande de type logarithmique, par exemple en octaves ou en tiers doctave (figure 28).

Figure 28 - Filtres en bande doctaves Nota :

Loctave est gal au logarithme en base 2 du rapport de 2 frquences. Ainsi, si le rapport est 2, on dit que le rapport est de 1 octave. Une attnuation de 30 dB par octave est donc une division de la puissance par 1000 lorsque lon double la frquence. Ceci va nous fournir une transition avec le paragraphe suivant puisquon montre que la transformation en ondelettes discrtes (TOD) peut tre vue comme une analyse par un banc de filtres en bande doctaves. HAUT DE PAGE 5.1.3 Ondelettes et analyse multichelle Les ondelettes ont constitu partir des annes 80 (A. Grossmann et J. Morlet 1984, Y. Meyer, I. Daubechies (1988), S. Mallat 1989, etc.) un sujet de recherche particulirement riche qui a rapidement dbouch sur de nombreuses applications : compression de signal (par exemple le stockage dempreintes numriques effectu par le FBI), restauration denregistrements dgrads, analyse sismique (Y. Meyer), dtection de contours en traitement dimages, etc. Nous avons vu que la transforme de Fourier savrait peu adapte ds quil sagissait de localiser en temps des vnements courts. La TFCT autorise une telle localisation temporelle mais les tranches de temps sur lesquelles sont effectues les analyses de Fourier sont de taille fixe et leffet de fentrage y est important. Lutilisation dondelettes discrtes (TOD) permet de prendre en compte la fois les problmes de localisation frquentielle et temporelle. En effet, lutilisation de la transforme en ondelettes revient prendre des fentres longues en basses frquences et courtes aux hautes frquences. Comme dans le cas de la TFtd, le premier problme est la recherche dune reprsentation de calcul du signal x (t ) par une somme dondelettes Wjk. Chaque Wjk est une version dcale et translate dune mme ondelette. Le calcul des coefficients bjk est appel analyse multirsolution de x (t ) car les bjk contiennent une information la fois frquentielle autour de 2 j et temporelle autour de t = 2 j k. Les Wjk doivent satisfaire la fois des conditions de translation et de dilatation et une condition dorthogonalit, ce qui facilite le calcul de la transforme inverse (comme cest le cas pour les exponentielles complexes dans la TFtd). Cette construction est base sur celle de fonctions dchelle satisfaisant la relation .

Dun point de vue pratique, le calcul des coefficients dondelettes est bas sur un algorithme arborescent. Il consiste choisir une ondelette. Si lon a un signal de support born, londelette de Haar [1 1] satisfait les conditions nonces prcdemment. Lalgorithme rapide (rcursif) de construction est connu sous le nom dalgorithme pyramidal de Mallat. On peut montrer que celui-ci correspond une dcomposition orthogonale par banc de filtres en quadrature (QMF) chaque tape de lalgorithme. Avec sa fentre fixe, la TFCT a une rsolution f en frquence qui est constante sur toute la bande de frquence. Avec la TOD, cest la rsolution relative f /f qui est constante. Dans ce cas, tout se passe comme si on avait un banc de filtres passe-bande construits partir dun mme filtre prototype, mais avec une chelle de frquence variable. Cest pourquoi on parle

alors de reprsentation temps-chelle, la diffrence du terme de reprsentation tempsfrquence utilis par la TFCT. A lexemple de la TFD, il existe pour la TOD des algorithmes de calcul rapide. Nous renvoyons le lecteur la rfrence [18] qui fait une prsentation trs complte de la technique des ondelettes. HAUT DE PAGE 5.2 Estimation de spectre HAUT DE PAGE 5.2.1 Utilisation du priodogramme Soit X (n ) un processus alatoire rel, SSL, centr. On note R (k ) = E [X (n + k ) X (n )] sa fonction dautocovariance et S (f ) sa dsp. De faon gnrale, lestimation se propose dvaluer certaines quantits, comme par exemple la valeur de S (f ), partir dune ralisation dune squence de longueur N du processus. Dans la suite nous notons cette squence {X (0) ... X (N 1)}. On appelle priodogramme la fonction alatoire de dfinie par :

On pourrait penser que IN (f ) est un bon estimateur de S (f ). En fait, il nen est rien. Le priodogramme est bien un estimateur asymptotiquement sans biais de la dsp. Cela signifie que pour N suffisamment grand, IN (f ) fluctue autour de la vraie valeur S (f ). Par contre, lamplitude des fluctuations, qui est donne par la variance de IN (f ), ne tend pas vers 0 quand N tend vers linfini. Plus prcisment on montre que cette variance est de lordre de grandeur de la valeur estimer. En conclusion, si on value sur un temps assez long plusieurs priodogrammes dun processus alatoire SSL, on constate que ces priodogrammes fluctuent autour de la vraie dsp, mais que lamplitude des fluctuations ne dcrot pas quand N augmente. La solution est donc den moyenner plusieurs. HAUT DE PAGE 5.2.2 Priodogramme moyenn On montre quon peut faire tendre la variance vers 0 quand N tend vers linfini, si on opre de la faon suivante :

on segmente lchantillon de longueur N en L sous-intervalles disjoints de longueur M; on calcule les L priodogrammes ;

puis on effectue la moyenne des L priodogrammes.

Cette faon de procder fournit lexpression du priodogramme moyenn : (11)

Cette procdure appelle un certain nombre de remarques.

On montre que la variance de Im(f ) est dautant plus faible que L est grand. En pratique, puisque N = LM, augmenter L revient diminuer M et donc la rsolution spectrale. En conclusion, la rduction des fluctuations se fait au prix dune perte de finesse dans lanalyse frquentielle. Lexpression ( cf. ici ) montre que tout se passe comme si on multipliait les chantillons X (sM + m ) du signal par la fentre de pondration rectangulaire , dont lnergie :

Comme nous lavons dj vu, cela provoque des ondulations parasites lies aux lobes secondaires de TFtd de la fentre rectangulaire. Do lide, l encore, dutiliser une fentre diffrente pour rduire ces ondulations. La consquence est une amlioration du lissage, mais au prix dune rduction de la rsolution en raison de laugmentation de la largeur du lobe principal. Une des fentres trs utilises est la fentre de Hamming dfinie pour par :

o est choisi de faon ce que Nota :

on notera une lgre diffrence avec la fentre de Hamming utilise en synthse de filtre o on doit conserver une symtrie ventuelle des coefficients. Ici, la premire valeur de pondration (0,08) se rpte avec la priodicit M.

Multiplier certains chantillons par des coefficients de pondration petits (environ 0,08 pour les valeurs extrmes de la fentre de Hamming) fait que ces chantillons jouent un rle moindre dans le calcul du spectre. Do lide de Welch de faire chevaucher les sous-intervalles. Le taux de recouvrement le plus couramment utilis est 50 %.

La procdure prsente prcdemment est donc modifie de la faon suivante :


on segmente lchantillon de longueur N en L sous-intervalles de longueur M avec un taux de recouvrement de 50 % ; chacun des L sous-intervalles on applique la fentre de pondration choisie ; en utilisant la relation ( cf. ici ), on calcule, par un algorithme de TFR, L priodogrammes en un nombre fini K de points de frquence f = k /K avec ; puis on effectue la moyenne des L priodogrammes obtenus.

Il lui correspond lexpression :

Nous avons reprsent figure 29 le rsultat dune simulation. Le signal en temps reprsent en a est la ralisation dun processus dont le spectre vrai est reprsent en b. La figure c donne le priodogramme calcul sur N = 1 024 points. La figure d donne le priodogramme moyenn sur L = 7 blocs (recouvrement 50 %) de longueur M = 256. Le calcul des TFR a t fait sur K = 1 024 points. HAUT DE PAGE 5.2.3 Modlisation AR Dans un grand nombre de cas pratiques, on peut modliser les signaux observs comme le signal de sortie dun filtre de fonction de transfert 1/A(z ) :

soit excit par un signal impulsionnel de priode T ; soit par un bruit de puissance 2,

o A (z ) possde un nombre fini de zros. Cela ramne ltude du spectre lestimation dun nombre fini de paramtres (les coefficients de A (z ) et 2 ou T). Cela conduit sintresser lquation rcurrente : (12)

o W (n ) dsigne un signal alatoire rel, centr, stationnaire, blanc de variance 2 et an une suite de coefficients rels. On pose :

On montre que lquation ( cf. ici ) admet une solution unique SSL qui sexprime causalement en fonction de W (n ), si et seulement si les ples de Hz (z ) sont de module strictement infrieur 1. Cette solution a pour expression :

o la suite hk est donne par :

avec h0 = 1. Le signal alatoire X (n ) sappelle un processus alatoire autorgressif (AR) dordre M.

Figure 29 - Signal alatoire et spectres

On montre que les (M + 1) premires valeurs de la fonction dautocovariance R (k ) du signal alatoire X (n ) vrifient le systme de (M + 1) quations linaires : (13)

Ce systme est dsign sous le terme dquation normale ou quation de Yule-Walker. A partir de R ou dune estimation de R, lquation de Yule-Walker permet le calcul des

paramtres an et 2, dont on en dduit, en utilisant la formule ( cf. ici ), une estimation du spectre :

Le problme de lestimation de R, partir dune suite de M valeurs X (0) ... X (N 1), pose le problme de la positivit de la matrice obtenue. Une expression qui garantit ce rsultat est donne par la matrice de Toplitz de dimension construite partir des valeurs :

pour . Le fait que la matrice soit de Toplitz garantit que les coefficients am obtenus en utilisant lquation ( cf. ici ) soient ceux dun polynme dont toutes les racines sont de module infrieur 1. Dautre part, il existe pour ces matrices un algorithme dinversion rapide, appel algorithme de Levinson. Cet algorithme introduit des coefficients dits de rflexion directement lis une structure de filtre appel filtre en treillis. La figure 30 illustre le cas dune modlisation AR dordre 10 dun morceau de signal correspondant la prononciation de la voyelle i . On a superpos le spectre obtenu par priodogramme et le spectre correspondant au modle AR dordre 10.

Figure 30 - Spectres du son i : priodogramme et modlisation AR dordre 10

Avantage du modle AR On envisage parfois aussi des modles de signaux alatoires SSL qui soient la sortie dun filtre de fonction de transfert de type polynomial B (z ) (filtre RIF). De tels signaux alatoires sont dits MA (Moving Average). Plus gnralement les signaux alatoires SSL de type ARMA correspondent une fonction de transfert rationnelle de la forme B (z )/A (z ). Le rsultat fondamental en pratique est que tout signal alatoire ARMA ou MA peut tre approch par un AR suffisamment long. Toutefois, linconvnient majeur de choisir un modle AR est quun signal alatoire dont le spectre prsente des valles profondes va ncessiter, a priori, moins de coefficients si on le reprsente par un modle MA. Lennui est que le calcul des coefficients de la partie MA (polynme B (z )) partir des coefficients dautocovariance estims est un problme non linaire, contrairement la rsolution de

lquation de Yule-Walker. Cest pourquoi on prfre souvent estimer un AR long quun MA court. HAUT DE PAGE 5.3 Filtrage adaptatif Considrons un systme S dentre X (n ) et de sortie Y (n ). On ne fait aucune hypothse particulire sur le systme S. Il peut tre linaire, non linaire, introduire un bruit additif, etc. Le problme rsolu par Wiener est lapproximation de S par un filtre linaire (figure 31).

Figure 31 - Problme du filtrage de Wiener

Un exemple pratique dapplication est celui de lannulation dcho acoustique (figure 32). Le signal X (n ) provenant du haut-parleur arrive sur le microphone. Dans cet exemple, le systme S est le trajet entre le haut-parleur et le microphone avec ses rflexions et son environnement bruit. On souhaite pouvoir lliminer le signal Y (n ) arrivant sur le microphone, de faon ce que le son mis par un locuteur situ devant le microphone ne soit par perturb par Y (n ). En pratique on profite des silences devant le microphone pour calculer lapproximation.

Figure 32 - Problme de lannulation dcho acoustique

On suppose que X (n ) et Y (n ) sont deux signaux alatoires, rels, centrs, SSL et de covariance mutuelle stationnaire, ce qui signifie que la suite E (Y (n + k ) X (n )) ne dpend que de k. On admet tout dabord que les suites et sont connues et on se propose de dterminer le filtre de rponse impulsionnelle finie h = (h (0) ... h (M 1)T qui soit la meilleure approximation de S. On entend par l que h minimise :

reprsente la sortie du filtre (figure 31) et o :

crivons e 2 en fonction de Rx (k ) et Ryx (k ). Il vient :

est la matrice de covariance de X (n ) (elle est symtrique et positive). En annulant la drive de e 2 par rapport h, on obtient le filtre :

qui minimise e 2. Il est appel dans la littrature filtre de Wiener. videmment, dans le cas o S est un filtre linaire de rponse impulsionnelle g (n ) de dure finie M, h (n ) est exactement gale g (n ) et le minimum de e 2 est alors gal 0. La solution trouve ncessite linversion de la matrice Rx . On peut toutefois lviter par mise en uvre dun algorithme de gradient. Considrons lquation rcurrente : (14)

o hp dsigne prsent un vecteur de dimension M obtenu au pas ditration p. Lexpression ( cf. ici ) sinterprte comme la correction, ltape p, de la valeur de hp 1 par un terme proportionnel lcart entre la vraie valeur ryx et la valeur Rx hp 1 obtenue au pas prcdent. Le coefficient > 0 sappelle le pas du gradient.

Nota : la correction va dans la direction oppose au gradient de la fonction dcart

Do le nom de lalgorithme. La rsolution de lquation ( cf. ici ) sobtient par itration. Il vient :

o I dsigne la matrice identit de taille M et A = I Rx. On sait que, si les valeurs propres de A sont de module infrieur 1, Ap tend vers la matrice nulle quand p tend vers linfini. Or, tout vecteur propre de Rx , associ la valeur propre s, est vecteur propre de A associ la valeur propre (1 s ). La condition de convergence scrit donc 1 s < 1. Comme s est positive (en tant que valeur propre dune matrice de covariance), on en dduit que, si 0 < <2/maxs s, lalgorithme converge et fournit le filtre de Wiener. Nous avons suppos jusquici que Rx et ryx taient connus. Malheureusement en pratique ce nest pas le cas. Ils doivent donc tre estims partir des donnes observes. Lalgorithme Least-Mean-Square (LMS) ou algorithme du gradient stochastique, imagin par Widrow, vite le calcul de ces estimations. Lide consiste remplacer, dans lquation ( cf. ici ) :

par sa valeur instantane Paramtres : M, Condition initiale : h = (0,...,0)T Donnes : X (1),X (2),... Y (1), Y (2),... Pour p = M, M + 1, ... (p)=Y (p) XT(p)hp1 hp = hp1 + X(p) (p) Commentaires :

. Lalgorithme scrit alors :

On constate que plus le pas est grand, plus la vitesse de convergence de lalgorithme est grande. On pourrait penser quil suffit donc de prendre pour la plus grande valeur ; on montre cependant que E [e 2 (p)] ne tend pas vers e 2, mais quil y a un dsajustement de la valeur limite. Et ce dsajustement crot avec . Il y a donc un compromis raliser. Le plus souvent on utilise un algorithme de type LMS dans lequel le pas est calcul chaque itration. Comme la valeur de doit tre de lordre de linverse des valeurs propres de Rx et donc comme linverse de la puissance W, la valeur de (p) chaque pas est dtermine partir dune estimation W (p ) ltape p de W [1] . Ce calcul de W (p) peut se faire de faon rcursive partir de lexpression :

o 0 < < 1 est dsign sous le terme de facteur doubli. En effet, plus est voisin de 1, moins on tient compte de W (p 1). Lalgorithme LMS est un algorithme adaptatif : cela signifie quil peut sadapter aux fluctuations ventuelles que pourraient subir les coefficients du filtre. On sort alors du cadre strict de filtres linaires puisque la proprit dinvariance dans le temps nest plus satisfaite. On parle alors de filtrage adaptatif [1] [11] . Le traitement adaptatif des signaux est depuis de nombreuses annes un domaine qui a fourni beaucoup de rsultats et possde un vaste champ dapplications. La figure 33 montre le schma de base dun systme adaptatif. Il est constitu dun processeur qui calcule, partir du signal dentre, du signal de sortie et ventuellement dun signal dentre auxiliaire, la valeur dun critre qui sert ensuite ajuster les paramtres du programme de traitement.

Figure 33 - Schma gnral dun systme adaptatif

Dune faon image on peut dire que tout se passe comme si un exprimentateur effectuait ses rglages aprs avoir valu un certain niveau de qualit compte tenu du signal obtenu en sortie. Lentre auxiliaire sert introduire des donnes supplmentaires concernant le systme ou le signal de sortie. videmment on souhaite que lexprimentateur agisse le plus rapidement possible lorsque le systme scarte de loptimum. Cest pourquoi la charge de calcul est toujours un lment dterminant dans la conception dun systme adaptatif. Dans le cas du filtrage linaire, la notion de traitement adaptatif fait rfrence un filtre dont les coefficients sont ajusts, selon un critre donn, au fur et mesure que le signal arrive. Nous en avons vu un exemple : lalgorithme LMS qui ajuste les coefficients dun filtre RIF

en minimisant lerreur quadratique. Son principal dfaut est de converger lentement vers loptimum. Pour amliorer la vitesse de convergence, on a imagin dautres algorithmes et dautres structures de filtres (filtre RII, filtre en treillis) [11] . Lutilisation des mthodes de filtrage adaptatif se retrouve peu prs dans toutes les applications de TNS. En voici quelques exemples.

Annulation dinterfrences : un lectrocardiogramme abdominal permet de dterminer le rythme cardiaque du ftus. Le problme majeur est celui du rythme cardiaque de la mre qui a une amplitude jusqu 10 fois suprieure celle du ftus. Les techniques de filtrage adaptatif ont fait preuve defficacit pour annuler ce bruit parasite. galisation adaptative : dans le domaine des communications, le signal mis est dform par le canal de transmission. On montre que la prsence des trajets multiples de propagation peut se modliser comme un filtre linaire. Ct rception, une ide simple (sous-optimale) est de raliser, avant lopration de dtection, le filtre inverse. Comme les caractristiques du canal voluent (en parti-culier en tlphonie mobile), ce filtrage inverse doit tre adaptatif. Identification de systmes : citons lexemple de lexploration gophysique. Les couches terrestres agissent de la faon dun filtre dont la rponse impulsionnelle peut servir dceler des changements de milieux gologiques et donc dventuels gisements. Le traitement adaptatif permet didentifier cette rponse au fur et mesure que le signal de vibration mis revient sur les capteurs. Traitement adaptatif dantennes : une antenne est un dispositif constitu de plusieurs capteurs disposs suivant une certaine gomtrie et qui reoit un signal provenant de plusieurs sources. Aux aspects temporels sajoutent donc des aspects spatiaux. Les deux problmes les plus tudis sont la sparation de sources et la localisation de sources.

Dans le problme de la sparation, on essaie dcouter la source se trouvant dans une direction donne. Ce problme est analogue celui du filtrage temporel dont le but est disoler une bande de frquence en attnuant suffisamment les bandes adjacentes. En traitement dantenne, on effectue un filtrage spatial pour attnuer (en temps rel) les directions o se trouvent les sources gnantes. Ce filtrage porte le nom de formation de voies. La ncessit de rendre alors une antenne adaptative est vidente. Glossaire franais-anglais

Adaptatif Adapt Alatoire Analogique

Annulation dcho Antenne AR (Auto-Rgressif) Arrondi (de calcul) Bande attnue Bande troite Banc de filtres Bloqueur dordre 0 Biais Cadence Calculateur CAN (Convertisseur Analogique Numrique) CNA (Convertisseur Numrique Analogique) CMC (Chane de Markov Cache) Complter avec des zros Cramer-Rao (bome) Dsajustement dsp (densit spectrale de puissance) chantillon chantillonnage EBSB (Entre Borne Sortie Borne) EM (Esprance-Maximisation) Fentre Adaptive Matched

Random Analog Echo cancellation Array AR (Auto-Rgressive) Roundoff Stop-band Narrow-band Filter bank Zero order hold Bias Rate Computer ADC (Analog to Digital Converter) DAC (Digital to Analog Converter) HMM (Hidden Markov Chain) Zero-padding Cramer-Rao (bound) Misadjustment psd (power spectral distribution) Sample Sampling BIBO (Bounded Input Bounded Output) EM (Expectation-Maximization) Window

Glossaire franais-anglais Filtre linaire Formation de voies GPS Impulsion Insertion Lissage LMS MA Moyenne mobile

Moindres carrs Moyennage MIC (Modulation par Impulsions Code) Moindres carrs Moindres carrs pondrs MCR (Moindres carrs rcursifs) MESLB (Meilleur estimateur linaire sans biais) Numrique Ondelettes Ondulations Papillon (TFR) Passe-bande Priode dchantillonnage Priodogramme liss Priodogramme moyenn Propres (valeurs)

Quantification Rponse impulsionnelle Repliement Retard RIF (Rponse Impulsionnelle Finie) RII (Rponse Impulsionnelle Infinie) Sous-bande Sous-chantillonnage (SSL) Stationnaire au Sens Large Statistique dordre suprieur Sur-chantillonnage Traitement du signal Treillis (filtre) TFCT (Transforme de Fourier court terme) TFD TFR (Transforme de Fourier rapide) TNS (Traitement Numrique du signal) Tranducteur Vraisemblance Linear filter Beamforming GPS (Global Positioning System) Pulse Expansion Smoothing

LMS (Least-Mean-Square) MA (Moving Average) Least squares Averaging PCM (Pulse Coded Modulation) Least Square Weighted least squares RLS (Best linear unbiased estimator) BLUE (Best linear unbiased estimator) Digital Wavelets Ripples Butterfly (FFT) Band-pass Sampling period Smoothed periodogram Averaging periodogram Eigen (values) Quantization Impulse response Aliasing Delay FIR (Finite Impulse Response) IIR (Infinite Impulse Response) Sub-band

Under-sampling (WSS) Wide Sense Stationary High order statistic (HOS) Over-sampling Signal processing Lattice (filter) STFT (Short Time Fourier Transform) DFT (Discret Fourier Transform) FFT (Fast Fourier Transform) DSP (Digital Signal Processing) Transducer Likelihood Abrviations AR BCR CAN CNA CMC dse dsp EM iid LMS MA MAC Autorgressif Borne de Cramer-Rao Convertisseur numrique Convertisseur analogique analogique numrique Notations mathmatiques Produit de convolution Dcimation dun facteur M Insertion dun facteur M Complexe conjugu de a arg f (x ) ch (x) sh (x) Argument de f (x ), fonction inverse de f (x ) Cosinus hyperbolique de x Sinus hyperbolique de x cest--dire

Chane de Markov cache Densit spectrale dnergie Densit spectrale de puissance Algorithme maximisation esprance-

cov(X, Y ) Covariance entre X et Y Matrice de covariance de T Dterminant de M Suite qui vaut 1 en 0 et 0 sinon Distribution de Dirac au point a

Indpendantes et identiquement cov (T) distribues Least-Mean-Square Moving average Multiplications-additions det (M) (n) f a

complexes MIC Modulation codes par impulsions E() f F n mod N MT N (n ) u (n ) Xz (z ) Esprance mathmatique Frquence rduite (sans dimension) Frquence (Hz) n modulo N Matrice transpose de la matrice M Porte rectangulaire chelon unit Transforme en z de la suite x(n) TFtd de la suite x(n) Variance de X

MUSIC Multiple signal classification RIF RII RF RP SSL SOS TFtd TFD TFR TFCT TNS TOD Rponse impulsionnelle finie Rponse impulsionnelle infinie Reconnaissance des formes Reconstruction parfaite Stationnaire au sens large Statistiques dordre suprieur

Transforme de Fourier temps X (f ) discret Transforme de Fourier discrte var (X ) Transforme de Fourier rapide Transforme de Fourier court terme Traitement numrique du signal Transformation en ondelettes discrtes