Vous êtes sur la page 1sur 71

Analyse par ondelettes

Notes de cours
Master 2 Professionnel IMAT

Université Paul Sabatier - Toulouse III

Jérémie BIGOT

Septembre 2009
2
Introduction

Ces notes de cours sont une présentation succinte des méthodes d’analyse temps-
échelles basées sur des décomposition en ondelettes. Ces techniques ont de très nom-
breuses applications dans les sciences physiques et les sciences de l’ingénieur en par-
ticulier pour l’estimation et la compression de signaux. Ces notes de cours s’inspire
largement du livre de Stéphane Mallat [7] qui est l’une des meilleures références
sur l’analyse de signaux par ondelettes. Les ouvrages suivants, dont on peut trou-
ver les références dans la bibliographie, peuvent également être consultés pour des
applications plus spécificiques de l’analyse par ondelettes ou pour des compléments
mathématiques :

– [1] : applications des ondelettes en statistique,


– [2] : applications des ondelettes en médecine et biologie,
– [3] : applications des ondelettes pour l’analyse des turbulences en physique,
– [4] : applications des ondelettes en analyse numérique
– [5] : un des ouvrages de référence en mathématiques appliquées sur la théorie
des ondelettes
– [6] : analyse de Fourier et applications au filtrage, calcul numérique et onde-
lettes,
– [7], [8] : un des ouvrages de référence sur l’analyse en ondelettes qui présente
de nombreux développements théoriques et pratiques, il s’agit d’un livre très
complet.
– [9] : analyse continue par ondelettes.

3
4
Table des matières

1 Représentations temps-fréquence 7
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2 La transformée de Fourier . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.1 Rappel de quelques propriétés . . . . . . . . . . . . . . . . . . 8
1.2.2 Transformée de Fourier Inverse . . . . . . . . . . . . . . . . . 9
1.2.3 Produit de convolution . . . . . . . . . . . . . . . . . . . . . . 10
1.2.4 Quelques exemples de transformée de Fourier . . . . . . . . . 10
1.2.5 Limitations de la transformée de Fourier . . . . . . . . . . . . 11
1.2.6 Principe d’incertitude d’Heisenberg . . . . . . . . . . . . . . . 12
1.3 La transformée de Gabor . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3.1 Inversion de la transformée de Gabor . . . . . . . . . . . . . . 14
1.3.2 Redondance et noyau reproduisant . . . . . . . . . . . . . . . 15
1.3.3 Taille des boı̂tes d’Heisenberg . . . . . . . . . . . . . . . . . . 15
1.3.4 Quelques exemples de transformée de Gabor . . . . . . . . . . 16
1.3.5 Le problème du choix de la fenêtre . . . . . . . . . . . . . . . 18
1.4 La transformée en ondelettes continue . . . . . . . . . . . . . . . . . . 18
1.4.1 Inversion de la transformée en ondelettes continue . . . . . . . 20
1.4.2 Redondance et noyau reproduisant . . . . . . . . . . . . . . . 20
1.4.3 Taille des boı̂tes d’Heisenberg . . . . . . . . . . . . . . . . . . 21
1.4.4 Quelques exemples de transformée en ondelettes continue . . . 21

2 Transformée en ondelette continue et régularité d’un signal 25


2.1 Analyse de la régularité d’un signal unidimensionnel . . . . . . . . . . 25
2.1.1 Régularité Lipschitzienne . . . . . . . . . . . . . . . . . . . . . 25
2.1.2 Ondelette et nombre de moments nuls . . . . . . . . . . . . . 26
2.1.3 Amplitude des coefficients d’ondelettes et régularité d’un signal 27
2.1.4 Maxima d’ondelettes . . . . . . . . . . . . . . . . . . . . . . . 28
2.2 Analyse de la régularité d’une image . . . . . . . . . . . . . . . . . . 31
2.2.1 Extension de la transformée en ondelette pour des images . . . 31
2.2.2 Transformée en ondelette dyadique bidimensionnelle . . . . . . 31
2.2.3 Régularité Lipschitzienne . . . . . . . . . . . . . . . . . . . . . 33
2.2.4 Détecteur de Canny . . . . . . . . . . . . . . . . . . . . . . . . 33
2.2.5 Maxima d’ondelette pour des images . . . . . . . . . . . . . . 34

5
6

3 Bases d’ondelettes 37
3.1 Bases orthonormées d’ondelettes . . . . . . . . . . . . . . . . . . . . . 37
3.1.1 Quelques rappels sur les bases hilbertiennes . . . . . . . . . . 37
3.1.2 Analyse multirésolution de L2 (R) . . . . . . . . . . . . . . . . 38
3.1.3 Filtres mirroirs conjugués . . . . . . . . . . . . . . . . . . . . 41
3.1.4 Ondelettes orthogonales . . . . . . . . . . . . . . . . . . . . . 42
3.2 Construction de bases d’ondelettes . . . . . . . . . . . . . . . . . . . 44
3.2.1 Liens entre filtres, nombre de moments nuls et régularité de
l’ondelette . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.2.2 Quelques exemples classiques d’ondelettes . . . . . . . . . . . 46
3.2.3 Ondelettes sur un intervalle borné . . . . . . . . . . . . . . . . 47
3.2.4 Ondelettes et bancs de filtres . . . . . . . . . . . . . . . . . . 51
3.3 Bases d’ondelettes pour des images . . . . . . . . . . . . . . . . . . . 53
3.3.1 Bases d’ondelettes séparables et multirésolution en 2D . . . . 53
3.3.2 Algorithme rapide de transformée en ondelettes 2D . . . . . . 54
3.3.3 Quelques exemples de décomposition en ondelettes pour des
images . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4 Approximation, estimation et compression dans des bases d’onde-


lettes 59
4.1 Propriétés d’approximation des bases d’ondelettes . . . . . . . . . . . 59
4.1.1 Décroissance des coefficients d’ondelettes . . . . . . . . . . . . 59
4.1.2 Approximation linéaire de fonctions régulières . . . . . . . . . 60
4.1.3 Approximation linéaire de fonctions non-régulières . . . . . . . 61
4.1.4 Approximation non-linéaire . . . . . . . . . . . . . . . . . . . 62
4.1.5 Quelques exemples d’approximation de fonctions . . . . . . . . 63
4.1.6 Approximation d’images . . . . . . . . . . . . . . . . . . . . . 63
4.1.7 Quelques exemples d’approximation d’images . . . . . . . . . 64
4.2 Débruitage de fonctions 1D . . . . . . . . . . . . . . . . . . . . . . . 64
4.3 Compression d’images . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.4 Problèmes inverses . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
Chapitre 1

Représentations temps-fréquence

1.1 Introduction
Que ce soit en mathématiques ou en physique, la transformée de Fourier a été
pendant longtemps un des outils les plus utilisés pour le traitement du signal. Cette
représentation, basée sur la notion physique de fréquence, est bien adaptée pour
traiter des signaux stationnaires c’est à dire des signaux qui possèdent certaines
propriétés invariantes dans le temps. Par contre, la transformée de Fourier n’est pas
optimale pour la description de phénomènes transitoires et se révèle donc imparfaite
pour l’analyse de la plupart signaux rencontrés en pratique.
La principale limitation de la transformée de Fourier est qu’elle ne permet pas
une description locale (sur une partie finie) d’un signal. Pour remedier à ces limita-
tions, des représentations dites temps-fréquence ont été proposées afin d’analyser un
signal à l’aide d’une transformation paramétrée par deux variables : le temps (ou la
position) et la fréquence (ou échelle). Tout au long de ce cours, nous considérerons
qu’un signal f (t) est une fonction réelle du temps (e.g. R 7→ R) ou bien de l’es-
pace (e.g. R2 7→ R). Une représentation temps-fréquence est une transformation qui
associe à un signal f (t) une fonction réelle de deux variables Tf (x, ξ), où x est le
paramètre de temps ou de position et ξ est le paramètre de fréquence ou d’échelle.
Les représentations temps-fréquence que nous verrons dans ce cours, consistent à
projeter une fonction f sur des fonctions analysantes gx,ξ , ce qui revient à calculer
le produit scalaire :
Z
Tf (x, ξ) = hf, gx,ξ i = f (t)gx,ξ (t)dt.

Les représentations qui nous intéressent sont celles qui permettent :


– d’avoir des propriétés d’invariance par rapport à des transformations simples
d’un signal (translation, dilatation, modulation...)
– d’obtenir des informations sur la structure locale (en temps et en fréquence)
d’un signal
– la reconstruction (exacte) du signal à partir des coefficients Tf (x, ξ)

7
8

Dans le cas uni-dimensionnel (x ∈ R) les valeurs de la fonction Tf (x, ξ) seront


représentées dans le plan temps-échelle. Il s’agit d’une représentation graphique qui
permet de visualiser le contenu temporel (axe des abcisses) et fréquentiel (axe des
ordonnées) des signaux étudiés.
Dans ce chapitre, nous rappelerons quelques propriétés de la transformée de Fou-
rier, puis nous introduirons la transformée de Gabor et la transformée en ondelettes
continue. Quelques exemples simulés seront utilisés pour illustrer les limitations et
les avantages de chaque transformation.

1.2 La transformée de Fourier


Dans ce chapitre, nous travaillerons essentiellement avec des fonctions unidimen-
sionnelles. L’espace L1 (R) Rest l’ensemble des fonctions (réelles ou complexe) qui sont
+∞
intégrables i.e. telles que −∞ |f (t)|dt < +∞. De même L2 (R) est l’ensemble des
R +∞
fonctions de carré intégrable i.e. telles que −∞ |f (t)|2dt < +∞. Nous rappelons que
L2 (R) est un espace de Hilbert pour le produit scalaire :
Z +∞
f (t)g(t)dt,
−∞

pour f, g ∈ L2 (R), et où g(t)qdénote le conjugué de g(t). La norme d’une fonction


R +∞
f ∈ L2 (R) sera notée kf k = −∞
|f (t)|2dt.

1.2.1 Rappel de quelques propriétés


En 1807, Fourier présente un mémoire à l’Institut de France qui propose de
représenter toute fonction périodique comme une somme de sinusoı̈des à différentes
fréquences. C’est le début de l’analyse de Fourier qui va avoir une importance
déterminante en analyse mathématique, en physique et dans les sciences de l’ingénieur.

Définition 1.1 La transformée de Fourier d’une fonction f ∈ L1 (R) est définie


par : Z +∞
ˆ
f (ω) = f (t)e−iωt dt.
−∞

Elle mesure la “vitesse” des oscillations de la fonction f à la fréquence ω ∈ R.


Cette transformation peut être vue comme la projection de f sur des fonctions
analysantes qui sont des “ondes pures” : gx,ξ (t) = e−iξt qui ne dépendent pas du
paramètre de temps x. Celle-ci permet donc d’analyser le contenu fréquentiel d’un
signal. Le théorème de Rieman-Lebesgue assure que :

– f 7→ fˆ est une application linéaire, continue de L1 (R) dans L∞ (R).


– si f ∈ L1 (R) alors fˆ est continue sur R et limω→±∞ fˆ(ω) = 0
9

Parmi les principales propriétés de la transformée de Fourier qui sont souvent


utilisées dans les calculs, on peut citer :

Propriété Fonction Transformée de Fourier


Translation f (t − t0 ) ˆ
e−iωt0 f(ω)
Modulation iω0 t
e f (t) fˆ(ω − ω0 )
Dilatation/Contraction f (t/a) |a|fˆ(aω)
Derivation (p)
f (t) (iω)p fˆ(ω)
Symétrie Hermitienne f (t) ∈ R ˆ
f(−ω) = fˆ(ω)

Si f ∈ L1 (R), f ′ ∈ L1 (R), . . . , f (p) ∈ L1 (R) alors fˆ(ω) = oω→±∞ ( ω1p ). De plus si


Z +∞
|fˆ(ω)|(1 + |ω|)p dω < +∞,
−∞

alors f est p fois continûment différentiable et bornée. La décroissance de fˆ en l’infini


est donc caractéristique de la régularité de f .

1.2.2 Transformée de Fourier Inverse


Il n’est pas évident de définir la transformée de Fourier inverse, car l’espace
L1 (R) n’est pas invariant par cette transformation. L’espace qui est bien adaptée
pour définir et inverser la transformée de Fourier est l’espace L2 (R). Toutefois, il n’est
pas possible de définir “directement” la transforméeT d’une fonction dans L2 (R). Il est
2 1
nécessaire de se restreindre tout d’abord à L (R) L (R) pourT définir correctement
la transformée de Fourier, puis d’utiliser la densité de L (R) L1 (R) dans L2 (R)
2

pour étendre cette transformation et son inverse à L2 (R). Le théorème fondamental


de la transformée de Fourier dans L2 (R) est le suivant (pour de plus amples détails
on pourra se référer à [6]) :
Théorème 1.1 Soit f ∈ L2 (R), on définit alors formellement la transformée de
Fourier et son inverse par :
Z +∞
ˆ
f (ω) = f (t)e−iωt dt
−∞
Z +∞
1
f (t) = fˆ(ω)eiωt dω
2π −∞
Soit f, g ∈ L2 (R), on obtient alors la formule de Parseval
Z +∞ Z +∞
1
f (t)h(t)dt = fˆ(ω)ĥ(ω)dω,
−∞ 2π −∞

et la formule de Plancherel
Z +∞ +∞
1
Z
2
|f (t)| dt = ˆ
|f(ω)| 2
dω.
−∞ 2π −∞
10

Remarque : pour f ∈ L2 (R)\L1 (R), la transformée de Fourier et son inverse sont


définies au sens d’une limite dans L2 (convergence forte dans L2 ) :
Z +∞
ˆ
f (ω) = f (t)e−iωt dt
−∞
Z +T
lim f (t)e−iωt dt
T →∞ −T

1.2.3 Produit de convolution


Définition 1.2 Pour f ∈ L1 (R) et h ∈ L1 (R) le produit de convolution de f et g,
noté f ⋆ h, est défini par :
Z +∞
f ⋆ h(t) = f (t − u)h(u)du.
−∞

Alors, f ⋆ h ∈ L1 (R) est défini presque partout et tel que :


– f ⋆ h = h ⋆ f : commutativité
– dtd (f ⋆ h)(t) = df
dt
⋆ h(t) = f ⋆ dh
dt
(t) : dérivabilité
– f ⋆ δt0 (t) = f (t − t0 ) : convolution avec une masse de Dirac en t0 .
De plus, si l’on note g = f ⋆ h alors :
ˆ ĥ(ω).
ĝ(ω) = f(ω)
Cette propriété est à la base du filtrage linéaire en traitement du signal. En effet,
tout processus de filtrage du type Lf = f ⋆ h où h est la réponse impulsionnelle du
filtre L, peut s’écrire sous la forme d’un filtrage fréquentiel à partir de la transformée
de Fourier inverse :
Z +∞
1 ˆ iωt
Lf (t) = ĥ(ω)f(ω)e dω.
2π −∞
Chaque composante fréquentielle eiωt d’amplitude fˆ(ω) est en effet modulée par
le filtre ĥ(ω). Ainsi, décomposer une fonction comme une intégrale de fonctions si-
nusoidales complexes eiωt permet de calculer directement la réponse d’un filtre Lf
à partir de la donnée des coefficients ĥ(ω).

Remarque : tous ces résultats pour le produit de convolution sont également va-
lables pour l’extension de la transformée de Fourier à L2 (R).

1.2.4 Quelques exemples de transformée de Fourier


• Soit f (t) = 11[−T,T ] (t) la fonction indicatrice de l’intervalle [−T, T ]. Il s’agit d’une
fonction discontinue en −T et +T qui vaut 1 sur [−T, T ] et zéro en dehors de cet
intervalle. Sa transformée de Fourier est une fonction non intégrable :
2 sin(T ω)
fˆ(ω) = .
ω
11

• Une masse de Dirac δt0 (t) au point t0 associe à une fonction sa valeur au point
tR = t0 (une “intégration” d’une fonction régulière par rapport à un Dirac est telle que
+∞
−∞
f (t)δt0 (t)dt = f (t0 )). La masse de Dirac δt0 (t) est une fonction “très localisée”
dans le temps (son support se réduit à t = t0 ) dont la transformée de Fourier est
définie comme (voir [6] pour une définition rigoureuse à partir de la théorie des
distributions) :
δ̂t0 (ω) = e−iωt0 .
• Cosinus et Sinus. Posons cosω0 (t) = cos(ω0 t) et sinω0 (t) = sin(ω0 t). Il s’agit
de fonctions oscillantes à une fréquence unique ω0 ce qui se traduit par deux Dirac
dans la transformée de Fourier en ω0 et −ω0 :
 
cos
ˆ ω0 (ω) = π δ̂ω0 (ω) + δ̂−ω0 (ω)
ˆ ω0 (ω) = π δ̂ω0 (ω) − δ̂−ω0 (ω) .
 
sin
i
• Un filtre passe-bas idéal a une fonction de transfert du type : ĥ(ω) = 11[−ω0 ,ω0 ] (ω)
qui sélectionne les fréquences comprises entre −ω0 et ω0 . Sa réponse inpulsionelle
est donnée par la transformée de Fourier inverse :
sin(ω0 t)
. h(t) =
πt
Comme expliqué précédemment, la transformée de Fourier d’un signal permet
d’obtenir des informations sur son contenu fréquentiel. La Figure 1.1 représente une
sinusoı̈de de fréquence 200 Hz (i.e. ω0 = 400π) observée avec un bruit aléatoire qui
correspond au défaut des instruments de mesure et à la présence de parasites. La
transformée de Fourier de ce signal permet de retrouver la fréquence de la sinusoı̈de
malgrè la présence de ce bruit.
5
500

4
450

3
400

2
350

1
300

0 250

−1 200

−2 150

−3 100

−4 50

−5 0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 50 100 150 200 250 300 350 400 450 500

(a) (b)

Fig. 1.1 – (a) Signal : sinus à 200 Hz + bruit et (b) sa transformée de Fourier pour
les fréquences positives (l’axe des abscisses donne ν = ω/2π)

1.2.5 Limitations de la transformée de Fourier


Le principal inconvénient de la transformée de Fourier est qu’elle ne permet pas
une analyse du comportement local d’une fonction. En effet, les fonctions analy-
santes sont de support infini et il est donc nécessaire de connaı̂tre l’ensemble des
12

valeurs d’une fonction pour pouvoir calculer sa transformée de Fourier. De plus,


cette transformation ne permet pas d’avoir une localisation temporelle du contenu
fréquentiel d’un signal. Par exemple, la Figure 1.2 représente un signal constitué
de deux sinusoı̈des successives de fréquence 10 et 30 Hz (penser à deux notes de
musiques). La transformée de Fourier de ce signal permet de retrouver ces deux
fréquences, mais ne nous informe pas sur la localisation temporelle du changement
de régime dans le signal. De la même façon, la présence d’une discontinuité dans
un signal affecte le comportement de sa transformée de Fourier sur l’ensemble des
fréquences. Par exemple, la transformée de Fourier de la fonction indicatrice de l’in-
tervalle [−T, T ] décroit en 1/ω mais ceci ne permet pas de retrouver la localisation
des deux discontinuités du signal en T et −T .
1 300

0.8

250
0.6

0.4
200

0.2

0 150

−0.2

100
−0.4

−0.6
50

−0.8

−1 0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 50 100 150 200 250

(a) (b)

Fig. 1.2 – (a) Signal : sinus à 10 Hz suivi d’un sinus à 30 Hz et (b) sa transformée
de Fourier pour les fréquences positives (l’axe des abscisses donne ν = ω/2π)

1.2.6 Principe d’incertitude d’Heisenberg


Il semble donc raisonnable de se demander s’il est possible de construire une
fonction f qui soit bien localisée en temps et dont la transformée de Fourier fˆ soit
concentrée dans un petit intervalle de fréquences. Une masse de Dirac au point t0
est une fonction très localisée en temps (son support se réduit à t = t0 ). Toute-
fois, sa transformée de Fourier e−iωt0 est uniformément répartie sur l’ensemble des
fréquences. La décroissance de la transformée de Fourier fˆ dépend de la régularité
de la fonction f . Ainsi, pour construire une fonction f telle que fˆ soit bien loca-
lisée en fréquence, il est nécessaire que f soit suffisamment régulière. Toutefois, les
deux observations suivantes montrent qu’un compromis doit être trouvé entre bonne
localisation temporelle et bonne localisation fréquentielle :
– pour réduire la location temporelle d’une fonction f , il est possible de la
contracter par un facteur s < 1 tout en conservant son énergie (norme L2 )
constante. En effet, si on pose :
 
1 t
fs (t) = √ f ,
s s
R +∞ R +∞ √ ˆ
alors −∞ |fs (t)|2 dt = −∞ |f (t)|2dt. Toutefois, fˆs (t) = sf(st) ce qui montre
13

que la transformée de Fourier de fs est dilaté d’un facteur s. Ainsi, lorqu’on


gagne en location temporelle, on perd en localisation fréquentielle.
– il n’est pas possible de construire une fonction qui soit à support compact et
dont la transformée de Fourier soit également à support compact.

Ces deux remarques illustrent le principe d’incertitude d’Heisenberg qui limite la


possibilité d’une bonne résolution en temps et en fréquence. Le théorème suivant est
une formulation du principe d’incertitude pour le cas unidimensionnel.

RThéorème 1.2 Principe d’incertitude d’Heisenberg : soit f ∈ L2 (R) et kf k2 =


+∞
−∞
|f (t)| dt. On définit la position moyenne temporelle f¯ et la position fréquentielle
2

moyenne ω̄ de f par :
Z +∞
¯ 1
f = t|f (t)|2 dt,
kf k2 −∞
Z +∞
1 ˆ 2
ω̄ = 2
ω|f(ω)| dω.
2πkf k −∞

Les variances autour de ces moyennes sont définies par :


Z +∞
1
2
σt = (t − f¯)2 |f (t)|2 dt,
kf k2 −∞
Z +∞
1
2
σω = 2
(ω − ω̄)2 |fˆ(ω)|2dω.
2πkf k −∞

Alors,
1
σt σω ≥ , (1.1)
2
et cette inégalité est une égalité si et seulement si f est une Gaussienne i.e de la
2
forme f (t) = Aeiω0 t−B(t−m0 ) .

Les variances temporelles et fréquentielles permettent de quantifier l’étalement


(i.e. la localisation) de f et fˆ autour de leur position moyenne. Ainsi, la relation
(1.1) montre que lorsque la précision temporelle augmente, l’incertitude pour la
localisation en fréquence augmente et réciproquement. Pour remedier aux limitations
de la transformée de Fourier, il est donc nécessaire de projeter un signal sur des
fonctions analysantes qui sont bien localisées en temps et en fréquence. Toutefois,
la résolution temps-fréquence de ces fonctions sera nécessairement limitée par le
principe d’Heisenberg.

1.3 La transformée de Gabor


Afin de remedier au problème de la location temporelle de la transformée de
Fourier, Gabor a proposé en 1946 d’utiliser une transformée de Fourier à fenêtre
14

glissante. Cette transformation consiste à calculer la transformée de Fourier sur


une partie du signal sélectionnée à l’aide d’une fenêtre bien localisée en temps. Des
translations successives de cette fenêtre permettent d’analyser localement le com-
portement temps-fréquence du signal. La transformée de Gabor revient à projeter
un signal sur des fonctions analysantes de la forme :

gx,ξ (t) = eiξt g(t − x),

où g ∈ L2 (R) est une fenêtre réelle et symmétrique (i.e. g(t) = g(−t)) qui est
translatée dans le temps par x et modulée par la fréquence ξ. Afin de simplifier les
notations, nous supposerons que kgk = 1 ce qui implique que kgx,ξ k = 1.

Définition 1.3 Pour f ∈ L2 (R) et (x, ξ) ∈ R2 , la transformée de Fourier à fenêtre


glissante est définie par
Z +∞
Gf (x, ξ) = hf, gx,ξ i = f (t)g(t − x)e−iξt dt.
−∞

La fenêtre g(t−x) permet de localiser la transformée de Fourier de f au voisinage


du point x. Lorsque la fenêtre g est une Gaussienne, il s’agit de la transformée de
Gabor. Toutefois, dans ce qui suit, la transformée de Fourier à fenêtre glissante sera
appelée transformée de Gabor (TG) même si g n’est pas une Gaussienne.

1.3.1 Inversion de la transformée de Gabor


La TG est une transformation inversible qui conserve l’énergie du signal comme
le montre le théorème suivant.

Théorème 1.3 Si f ∈ L2 (R) alors (le sens de la formule de reconstruction suivante


dépend des conditions sur f et g) :
Z +∞ Z +∞
1
f (t) = Gf (x, ξ)g(t − x)eiξt dxdξ,
2π −∞ −∞
et +∞ +∞ +∞
1
Z Z Z
2
|f (t)| dt = |Gf (x, ξ)|2 dxdξ.
−∞ 2π −∞ −∞

En utilisant la formule de Parseval, on peut remarquer que la TG peut également


s’écrire sous la forme :
Z +∞
1 ˆ 1
Gf (x, ξ) = hf , ĝx,ξ i = fˆ(ω)ĝ(ω − ξ)ei(ω−ξ)x dω.
2π 2π −∞

La TG peut donc également s’interpréter comme une transformée de Gabor (à un


facteur de phase prêt) de la transformée de Fourier fˆ. Cett remarque montre que
si la fenêtre g est bien localisée en temps autour de t = 0 et si ĝ est bien localisée
15

en fréquence autour de ω = 0, alors les coefficients de la TG peuvent s’interpréter


comme une analyse locale du comportement de f au voisinage du temps x et de la
fréquence ξ. Il faut donc choisir pour la fenêtre g une fonction suffisamment régulière
afin d’avoir à la fois une bonne localisation en temps et en fréquence. Ceci exclue donc
d’utiliser pour g une fonction indicatrice 11[−T,T ] qui est bien localisée en temps autour
de t = 0, mais donc la localisation en fréquence est très mauvaise (décroissance en
1/ω). A l’inverse, les propriétés temps-fréquences de la Gaussienne sont optimales
car celle-ci “sature” l’inégalité d’Heisenberg, ce qui justifie son utilisation pour la
TG.

1.3.2 Redondance et noyau reproduisant


La TG associe à une fonction f ∈ L2 (R) une fonction à deux variables. D’après
la propriété de conservation de l’énergie Gf (x, ξ) ∈ L2 (R2 ). Toutefois, toute fonction
dans L2 (R2 ) n’est pas nécessairement la TG d’une fonction dans L2 (R). Le théorème
suivant montre que ceci provient de la redondance de la TG.

Théorème 1.4 Soit F ∈ L2 (R2 ). Alors il existe une fonction f ∈ L2 (R) telle que
F (x, ξ) = Gf (x, ξ) si et seulement si :
+∞ +∞
1
Z Z
F (x, ξ) = K(x, ξ, x′ , ξ ′)F (x′ , ξ ′ )dx′ dξ ′,
2π −∞ −∞

où est le noyau reproduisant

K(x, ξ, x′ , ξ ′ ) = hgx,ξ , gx′ ,ξ ′ i,

Le noyau K(x, ξ, x′ , ξ ′ ) mesure la corrélation temps-fréquence entre les fonctions


analysantes gx,ξ et gx′ ,ξ ′ . On peut montrer que l’amplitude de K(x, ξ, x′ , ξ ′) est une
fonction décroissante de x − x′ et ξ − ξ ′ qui dépend uniquement de la localisation
en temps et en fréquence (et donc de l’énergie) de g et ĝ. Plus les distances |x − x′ |
et |ξ − ξ ′ | sont grandes, plus l’amplitude de K(x, ξ, x′ , ξ ′ ) diminue. La redondance
peut donc s’interpréter comme le “taux de répétition” de la même information dans
une transformation.

1.3.3 Taille des boı̂tes d’Heisenberg


On définit la variance temporelle σt2 et la variance fréquentielle σω2 de la fonction
gx,ξ par

Z +∞ Z +∞
σt2 = 2 2
t2 |g(t)|2dt,
(t − x) |gx,ξ (t)| dt =
−∞ −∞
Z +∞ Z +∞
1 1
σω2 = 2 2
(ω − ξ) |ĝx,ξ (ω)| dω = ω 2 |ĝ(ω)|2dω.
2π −∞ 2π −∞
16

Etant donné la symmétrie de g et ĝ, on peut facilement remarquer que σt2 et σω2
sont indépendantes de x et ξ. La représentation dans le plan temps-fréquence de la
fonction gx,ξ correspond à une boı̂te d’Heisenberg centrée au point (x, ξ) et d’aire
σt σω (voir Figure 1.3). La taille de cette boı̂te est indépendante de la position x et
de la fréquence ξ, ce qui implique que la résolution temps-fréquence de la TG est la
même dans tout le plan temps-fréquence. La TG correspond donc à des translations
successives en temps et en fréquence d’une boı̂te d’Heisenberg de taille constante.
L’aire minimale de cette boı̂te est limitée par le principe d’incertitude d’Heisenberg :
σt σω ≥ 1/2. Rappelons qu’il y a égalité si la fenêtre g est une Gaussienne, ce qui
justifie ce choix en pratique.

Insérer Figure

Fig. 1.3 – Boı̂tes d’Heisenberg pour la TG dans le plan temps-fréquence pour deux
fonctions analysantes gx,ξ et gx′ ,ξ ′

1.3.4 Quelques exemples de transformée de Gabor


L’intérêt de la TG est de permettre une analyse du comportement local d’une
fonction. Les exemples suivants, pour lesquels la TG peut être calculée explicitement,
illustrent les avantages cette transformation par rapport à la transformée de Fourier.

• Sinusoı̈de : soit f (t) = sin(ω0 t), on peut facilement calculer que :

1 −i(ξ−ω0 )x
ĝ(ξ − ω0 ) − e−i(ξ+ω0 )x ĝ(ξ + ω0 ) .

Gf (x, ξ) = e
2i
Etant donnée que ĝ est localisée autour de ω = 0, l’équation ci-dessus montre que
le maximum de l’amplitude de Gf (x, ξ) se situe au voisinage de ξ = ω0 et ξ = −ω0 .
La phase de la TG permet également de retrouver la fréquence du signal. Toute-
fois, du fait de l’introduction d’une fenêtre d’analyse, la localisation du comporte-
ment temps-fréquence du signal n’est pas parfaite. La TG diminue nécessairement
la résolution alors que pour la transformée de Fourier d’un sinus, on obtient deux
masses de Dirac en ξ = ω0 et ξ = −ω0 . Par contre, la TG permet de repérer les
changements de la fréquence d’un signal au cours du temps. La Figure 1.4 donne la
TG d’un signal constitué de deux sinusoı̈des successives de fréquence 10 et 30 Hz.
L’analyse de l’amplitude et de la phase de la TG permet clairement de mettre en
évidence le changement de fréquence au point t = 0.5.

• Chirps : un chirp est un signal sinusoı̈dale, non-stationnaire dont la fréquence et


l’amplitude sont des fonctions qui sont dépendantes du temps. Ce type de signaux
peut s’écrire sous la forme :

f (t) = A(t) sin(φ(t)).


17

1 100 100

0.8 90 90

0.6 80 80

0.4 70 70

0.2 60 60

0 50 50

−0.2 40 40

−0.4 30 30

−0.6 20 20

−0.8 10 10

−1 0 0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

(a) (b) (c)

Fig. 1.4 – (a) Signal : sinus à 10 Hz suivi d’un sinus à 30 Hz, (b) module et (c)
phase de sa transformée de Gabor Gf (x, ξ). L’axe des abscisses donne la position
x et l’axe des ordonnées représente les fréquences positives pour ν = ξ/2π. Le noir
représente les coefficients de la TG d’amplitude maximale, et le blanc les coefficients
d’amplitude minimale.

Si les fonctions A(t) et φ(t) sont suffisamment régulières et sous certaines hypothèses
sur la fenêtre g, alors on peut montrer que pour ξ ≥ 0

1
Gf (x, ξ) ≈ A(x)ei(φ(x)−ξx) ĝ(ξ − φ′ (x))).
2

Etant donnée la bonne localisation en fréquence de g, l’expression précédente montre


que dans le plan temps-fréquence, les valeurs de Gf (x, ξ) se concentrent autour de
courbes d’équation ξ = φ′ (x). Ces courbes qui sont appelées les arêtes de la TG per-
mettent de retrouver l’expression de φ. La Figure 1.5 illustre ce comportement pour
un Chirp linéaire i.e. dont la fréquence est une fonction linéaire du temps. L’analyse
de signaux qui peuvent se modéliser comme une somme de chirps, d’amplitude et
fréquence variables, est particulièrement utilisée pour le traitement de la parole.

1 100 100

0.8 90 90

0.6 80 80

0.4 70 70

0.2 60 60

0 50 50

−0.2 40 40

−0.4 30 30

−0.6 20 20

−0.8 10 10

−1 0 0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

(a) (b) (c)

Fig. 1.5 – (a) Chirp linéaire (b) module et (c) phase de sa transformée de Gabor
Gf (x, ξ). L’axe des abscisses donne la position x et l’axe des ordonnées représente
les fréquences positives pour ν = ξ/2π
18

1.3.5 Le problème du choix de la fenêtre


Le choix d’une bonne fenêtre est d’une importance cruciale pour l’interprétation
de la TG. Nous avons déjà mentionné qu’une fenêtre Gaussienne permet de réaliser
le meilleur compromis temps-fréquence. La taille des boı̂tes d’Heisenberg qui cor-
respondent aux fonctions Gf (x, ξ) étant constante, la résolution temps-fréquence
de la TG est entièrement déterminée par la résolution de la fenêtre d’analyse g. En
définissant gs (t) = √1s g( st ), il est possible de modifier la résolution de la fenêtre d’ana-
lyse en contractant ou dilatant la fonction g d’un facteur s > 0 tout en conservant
l’énergie des fonctions analysantes. Le choix du facteur s dépend des phénomènes
que l’on soufaite observer. D’après le principe d’incertitude, un compromis s’im-
pose nécessairement entre bonne localisation en fréquence et mauvaise localisation
en temps (et réciproquement). Par exemple, prenons le cas d’un signal composé de
deux sinusoı̈des successives de fréquence ω1 et ω2 . Si le facteur d’échelle s est suffi-
samment grand par rapport à ω1 − ω2 , alors ĝs est bien localisée autour de ω = 0
et la transformée de Gabor permet de bien séparer les deux composantes du signal.
A l’inverse si s est petit par rapport à ω1 − ω2 , alors ĝs est faiblement localisée en
fréquence et la TG ne permet plus de distinguer les deux composantes du signal.
Le signal de la Figure 1.6 est composé de deux sinusoı̈des successives de fréquences
5 Hz et 15 Hz, et de deux masses de Dirac aux points t = 0.3 et t = 0.7. Le choix
s = 0.1 permet de rendre compte du comportement fréquentiel des deux sinusoı̈des,
mais ne nous renseigne pas sur la présence de deux masses de Dirac. A l’inverse, le
choix s = 0.01 permet de localiser précisemment les deux masses de Dirac, mais la
caractérisation du comportement sinusoı̈dal du signal n’est plus satisfaisante.
50 200
4

45 180
3.5

3
40 160

2.5 35 140

2 30 120

1.5 25 100

1 20 80

0.5 15 60

0 10 40

−0.5 5 20

−1 0 0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

(a) (b) (c)

Fig. 1.6 – Limitatons de la TG : (a) Signal : sinus à 5 Hz suivi d’un sinus à 15 Hz


+ deux masses de Dirac, (b) module de sa transformée de Gabor pour s = 0.1, (c)
module de sa transformée de Gabor pour s = 0.01

1.4 La transformée en ondelettes continue


Le but de l’analyse par ondelettes est de construire un outil qui permet de s’af-
franchir du problème du choix de la fenêtre dans la TG, en utilisant des fonctions
analysantes pour lesquelles la taille de la boı̂te d’Heisenberg varie avec la fréquence.
19

Nous verrons par la suite que l’analyse par ondelettes est un outil puissant pour
caractériser simultanément les différentes composantes temps-fréquence d’un signal.

Les premiers travaux sur les ondelettes remontent au début des années 1980.
Grossmann qui travaillait en physique théorique et Morlet un chercheur en traite-
ment du signal ont été parmi les premiers scientifiques à étudier les propriétés de la
transformée en ondelettes continue. Dès leur début, les travaux sur la théorie des on-
delettes sont donc caractérisés par la collobaration entre des scientifiques provenant
aussi bien des mathématiques, de la physique que du traitement du signal. C’est
encore le cas des travaux en cours sur les ondelettes, ce qui explique le succès de cet
outil et sa très large diffusion dans la communauté scientifique.

Une ondelette est une fonction ψ ∈ L2 (R) de moyenne nulle i.e. telle que :
Z +∞
ψ(t)dt = 0.
−∞

Nous supposerons de plus que l’ondelette est normalisée : kψk = 1.Dans l’analyse
par ondelettes, les fonctions analysantes sont définies à partir de translations et
dilatations/contractions de l’ondelette “mère” ψ :
1 t−x
ψx,s (t) = √ ψ( ),
s s
où x ∈ R définit la translation temporelle et s > 0 est l’échelle de dilatation/contraction.
Par définition, l’énergie des fonctions analysantes est constante : kψx,s k = kψk = 1.
Définition 1.4 La transformée en ondelettes continue d’une fonction f ∈ L2 (R)
au point x ∈ R et à l’échelle s > 0 est définie par :
Z +∞
1 t−x
Wf (x, s) = hf, ψx,s i = f (t) √ ψ( )dt.
−∞ s s
• Ondelettes réelles et complexes : dans ce cours, nous nous limiterons à l’étude
des ondelettes à valeurs réelles dans un souci de simplification. Les ondelettes réelles
sont bien adaptées pour la détection de changements brusques dans un signal. Les
ondelettes complexes, appelées également ondelettes analytiques, sont utilisées pour
séparer la phase et l’amplitude des composantes d’un signal. Elles sont en particulier
bien adaptées pour la détection de fréquences instantanées. Pour plus de précisions
sur les ondelettes analytiques, nous renvoyons à [7]. Ainsi, dans tout ce qui suit,
nous supposerons que ψ(t) ∈ R pour tout t ∈ R.

• Relation entre échelle et fréquence : la transformée en ondelettes continue est


une analyse temps-échelle. Elle permet d’avoir des informations sur le comportement
d’une fonction au voisinage du point x et à l’échelle s. Une transformée en ondelettes
peut s’écrire sous la forme d’un filtrage par convolution :
Wf (x, s) = f ⋆ ψs∗ (x),
20

où ψs∗ (t) = √1s ψ( −t


s
). Etant donné que la transformée de Fourier de ψs∗ est égale
√ R +∞
à sψ̂(sω) et que ψ̂(0) = −∞ ψ(t)dt = 0, la transformée en ondelettes continue
(abrégée TOC par la suite) peut s’interpréter comme un filtre passe bande. La
largeur du filtre est déterminée par le facteur d’échelle s.

1.4.1 Inversion de la transformée en ondelettes continue


Le théorème suivant montre que la TOC est une transformation inversible qui
conserve l’énergie du signal si l’ondelette vérifie la condition d’admissibilité suivante :
Z +∞
|ψ̂(ω)|2
Cψ = < +∞.
0 ω
Si ψ vérifie la condition ci-dessus, alors l’ondelette est dite admissible. OnRpeut re-
+∞
marquer que la condition d’admissibilité impose nécessairement que ψ̂(0) = −∞ ψ(t)dt =
0 c’est à dire que l’ondelette soit de moyenne nulle.

Théorème 1.5 Soit ψ ∈ L2 (R) une ondelette admissible, alors pour tout f ∈ L2 (R)
on a (au sens de la convergence forte dans L2 (R))
Z +∞ Z +∞
1 1 t − x dxds
f (t) = Wf (x, s) √ ψ( ) 2 .
Cψ 0 −∞ s s s
De plus, la TCO conserve l’énergie du signal
Z +∞ Z +∞ Z +∞
2 1 dxds
|f (t)| dt = |Wf (x, s)|2 2 .
−∞ Cψ 0 −∞ s

1.4.2 Redondance et noyau reproduisant


Comme la transformée de Gabor, la TOC est une transformation très redondante.
La TOC associe à une fonction f ∈ L2 (R) une fonction Wf (x, s) de deux variables
appartenant à L2 (R × R+ , dxds
s2
). Comme pour la TG, l’ensemble des fonctions de
+ dxds
2
L (R × R , s2 ) qui sont des TOC de fonctions de L2 (R) est caractérisé par un
noyau reproduisant qui mesure la corrélation entre les fonctions analysantes.

Théorème 1.6 Soit F ∈ L2 (R × R+ , dxds s2


). Alors il existe une fonction f ∈ L2 (R)
telle que F (x, s) = Wf (x, s) si et seulement si :
Z +∞ Z +∞
1 dx′ ds′
F (x, s) = K(x, s, x′ , s′ )F (x′ , s′ ) 2 ,
Cψ −∞ −∞ s
où K est le noyau reproduisant

K(x, s, x′ , s′ ) = hψx,s , ψx′ ,s′ i,

Le noyau K(x, s, x′ , s′ ) mesure la corrélation temps-fréquence entre les ondelettes


ψx,s et ψx′ ,s′ .
21

1.4.3 Taille des boı̂tes d’Heisenberg


Supposons que l’ondelette ψ est centrée en zéro, ce qui implique que ψx,s est
centrée au point t = x. La variance temporelle de ψx,s s’écrit alors comme :
Z +∞
(t − x)2 |ψx,s (t)|2 dt = s2 σt2 ,
−∞
R +∞
où σt2 = −∞
t2 |ψ(t)|2 dt. De même, on peut définir la “fréquence moyenne” de ψ̂
par :
+∞
1
Z
ξ= ω|ψ̂(ω)|2dω.
2π −∞

La transformée de Fourier de ψx,s s’écrit comme : ψ̂x,s = sψ̂(sω)e−iωx . La fréquence
moyenne de ψ̂x,s est donc ξ/s et sa variance fréquentielle est par conséquent égale à
Z +∞
1 ξ 2 2 σω2
(ω − ) |ψ̂x,s (ω)| dω = 2 ,
2π −∞ s s
1
R +∞
où σω2 = 2π −∞
(ω − ξ)2 |ψ̂(ω)|2dω. L’énergie temps-fréquence de l’ondelette ψx,s
correspond donc à une boı̂te d’Heisenberg centrée au point (x, ξ/s) de taille sσt
selon l’axe temporel et de taille σω /s selon l’axe fréquentiel. L’aire de cette boı̂te σt σω
reste constante à toutes les échelles, mais la résolution temps-fréquence de l’ondelette
ψx,s dépend du niveau de résolution s (voir Figure 1.7). Contrairement à la TG qui
correspond à un pavage régulier du plan temps-fréquence, la TCO permet d’ajuster
le niveau d’analyse. Il s’agit d’une procédure de “zoom” qui permet d’inspecter le
comportement local d’un signal en réduisant progressivement le paramètre d’échelle
s : de petites valeurs de s diminue l’étalement temporel de ψx,s mais augmente le
support fréquentiel de ψ̂x,s dont le centre est décalé vers de plus hautes fréquences.

Insérer Figure

Fig. 1.7 – Boı̂tes d’Heisenberg pour la TOC dans le plan temps-fréquence pour deux
fonctions analysantes ψx,s et ψx′ ,s′ avec s < s′ .

1.4.4 Quelques exemples de transformée en ondelettes conti-


nue
La TG et la TOC se comportent essentiellement de la même façon pour l’analyse
temps fréquence des signaux. La TOC peut également être utilisée pour caractériser
les fréquences instantanées des chirps, et cette technique a été largement employée
en traitement de la parole. L’intérêt de la TOC est de permettre une analyse locale
des signaux et en particulier de mettre en évidence des comportements irréguliers
(ou singuliers). Elle est en particulier bien adaptée pour caractériser le degré de
régularité d’une fonction. Les deux exemples suivants illustrent les bonnes propriétés
22

des ondelettes pour la détection de singularités dans des signaux (dans les deux cas,
l’ondelette choisie est la dérivée première d’une Gaussienne).

• Deux sinusoı̈des successives + masses de Dirac. La Figure 1.8 donne les valeurs
de la TCO du signal constitué de deux sinusoı̈des successives de fréquences 5 Hz et
15 Hz, et de deux masses de Dirac aux points t = 0.3 et t = 0.7. Ce signal a déjà
été étudié pour illustrer les limitations de la TG. La TCO permet de rendre compte
de toutes les composantes du signal. Les grandes échelles permettent d’analyser la
partie sinusoı̈dale du signal, alors que l’analyse aux fines échelles met en évidence la
présence des deux masses de Dirac.

• Le signal de la Figure 1.9 présente 3 singularités aux points t = 0.3, t = 0.5


et t = 0.8. On peut constater sur la Figure 1.9 que les coefficients d’ondelettes de
grande amplitude se concentrent au voisinage des trois singularités quand l’échelle
s diminue.
4 10

3.5 9

3 8

2.5
7

2
6

1.5
5
1

4
0.5

3
0

2
−0.5

−1 1
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

(a) (b)

Fig. 1.8 – (a) Signal : sinus à 5 Hz suivi d’un sinus à 15 Hz + deux masses de Dirac,
(b) module de sa transformée en ondelettes continue : l’axe des abscisses représente
la position x, et l’axe des ordonnées l’échelle s en coordonnée logarithmique i.e.
− log2 (s)
23

35 10

9.5
30
9

8.5
25

20 7.5

15
6.5

6
10

5.5

5 5
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

(a) (b)

Fig. 1.9 – (a) Signal présentant 3 singularités (b) module de sa transformée en on-
delettes continue : l’axe des abscisses représente la position x, et l’axe des ordonnées
l’échelle s en coordonnée logarithmique i.e. − log2 (s)
24
Chapitre 2

Transformée en ondelette continue


et régularité d’un signal

La transformée en ondelette continue permet d’analyser le comportement local


d’un signal en réduisant progressivement le paramètre d’échelle s. Cette procédure de
zoom est un outil puissant pour détecter et caractériser les irrégularités d’un signal.
Dans ce chapitre, nous montrons que la décroissance des coefficients d’ondelettes
le long des échelles est caractéristique de la régularité Lipschitzienne d’un signal.
Les singularités d’un signal unidimensionnel (discontinuité, dirac, cusp...) ainsi que
les contours dans une image (zones où l’intensité des pixels change brutalement)
peuvent être détectés en suivant la propagation aux fines échelles des coefficients de
grande amplitude de la transformée en ondelette continue. Dans tout ce chapı̂tre,
nous supposerons que les signaux analysés sont des fonctions réelles de L2 (R) ou
L2 (R2 ).

2.1 Analyse de la régularité d’un signal unidimen-


sionnel
2.1.1 Régularité Lipschitzienne
Définition 2.1 Une fonction f ∈ L2 (R) est ponctuellement Lipschitzienne d’ordre
α ≥ 0 au point x0 , s’il existe une constante Cx0 et un polynôme P de degré m = ⌊α⌋
tels que pour tout t ∈ R

|f (t) − P (t)| ≤ Cx0 |t − x0 |α . (2.1)

De plus,
– la régularité Lipschitizienne de f au point x0 est le supremum des α pour
lesquels f est ponctuellement Lipschitzienne d’ordre α en x0 .
– une fonction est dite uniformément Lipschitzienne d’ordre α, si elle satisfait
l’équation (2.1) pour tout x0 ∈ [a, b] avec une constante C qui est indépendante
de x0 .

25
26

Les exposants de Lipschitz permettent de caractériser la régularité d’une fonc-


tion. Si 0 ≤ α < 1, alors P (t) = f (x0 ) et l’équation (2.1) devient :

|f (t) − f (x0 )| ≤ Cx0 |t − x0 |α .

Si la régularité Lipschitzienne de f au point x0 est 0 ≤ α < 1, alors f n’est


pas dérivable au point x0 . Une fonction discontinue au point x0 est de régularité
Lipschitzienne 0 en x0 . De même si f est m = ⌊α⌋ fois continûment dérivable au
voisinage de x0 , alors P correspond au développement de Taylor de f d’ordre m au
point x0 i.e.
m−1
X f k (x0 )
P (t) = (t − x0 )k .
k=0
k!
On peut également montrer que si f est uniformément Lipschitzienne d’ordre α > m
sur un intervalle [a, b], alors f est nécessairement m fois continûment dérivable sur
]a, b[.

2.1.2 Ondelette et nombre de moments nuls


L’exposant de Lipschitz permet de décomposer une fonction f au voisinage d’un
point x0 comme la somme d’un polynôme plus un terme d’erreur dont on peut
contrôler l’amplitude
f (t) = P (t) + ǫ(t),
avec |ǫ(t)| ≤ |t − x0 |α .
Une ondelette est une fonction oscillante de moyenne nulle. Le degré d’oscillation
de l’ondelette permet d’ignorer les parties régulières d’un signal lorsque l’on calcule
sa TOC. Cette propriété se traduit par le nombre de moments nuls de l’ondelette.

Définition 2.2 Une ondelette ψ ∈ L2 (R) a r ∈ N∗ moments nuls si pour tout entier
0≤k<r Z +∞
tk ψ(t)dt = 0.
−∞

Ainsi, une transformée en ondelette permet d’ignorer les polynomes de degré


strictement inférieur à r. En effet, si P est un polynôme de degré m < r alors
pour tout x ∈ R et pour tout s > 0, WP (x, s) = 0. Ainsi, si une fonction est
ponctuellement Lipschitzienne d’ordre α au point x0 et si l’ondelette ψ a r ≥ ⌊α⌋+ 1
moments nuls, alors au voisinage de x0

Wf (x, s) = Wǫ (x, s).

La TOC est donc caractéristique de la régularité Lipschtizienne d’une fonction car


elle permet de supprimer sa composante polynomiale.
27

Pour pouvoir mesurer la régularité Lipschitzienne d’une fonction, il est nécessaire


d’utiliser des ondelettes qui soient suffisamment régulières et qui ont de bonnes pro-
priétés de décroissance en l’infini. Nous dirons qu’une fonction f est à décroissance
rapide si pour tout m ∈ N, il existe une constante Cm telle que pour tout t ∈ R
Cm
|f (t)| ≤ .
1 + |t|m
Il s’agit de fonctions qui décroissent en l’infini plus rapidement que n’importe quel
polynôme. Dans ce qui suit, nous utiliserons des ondelettes à décroissance rapide
avec exactement r moments nuls. Dans ce cas, on montre que ψ peut s’écrire comme
la dérivée d’ordre r d’une fonction θ, appelée noyau i.e.
dr θ(t)
ψ(t) = (−1)r .
dtr
R +∞
telle que θ est à décroissance rapide et −∞ θ(t)dt 6= 0. Pour ce choix particulier
de l’ondelette ψ et à une échelle s donnée, la TOC peut s’interpréter comme une
convolution du signal f par le noyau θs∗ (t) = √1s θ( −t
s
) suivi d’un opérateur différentiel
∗ 1 −t
d’ordre r. En effet, si on pose ψs (t) = √s ψ( s ) alors on a
Wf (x, s) = f ⋆ ψs∗ (x).
r r ∗
Etant donné, que ψ(t) = (−1)r d dtθ(t) ∗
r , on a alors que ψs (t) = s
r d θs (t)
dtr
et donc en
permutant les opérateurs de convolution et de dérivation
dr θ∗ (t) r d
r
Wf (x, s) = sr f ⋆ (x) = s (f ⋆ θs∗ )(x).
dtr dtr
Afin d’avoir une ondelette suffisamment régulière, nous supposerons également
que ψ est r fois continûment dérivable telle que ses dérivées ψ (k) soient des fonctions
à décroissance rapide pour 1 ≤ k ≤ r. Un exemple classique pour la fonction θ est
le noyau Gaussien, et dans ce cas on dira que ψ est une ondelette Gaussienne.

2.1.3 Amplitude des coefficients d’ondelettes et régularité


d’un signal
Les théorèmes suivants montrent que l’évolution de l’amplitude des coefficients
d’ondelettes quand s → 0 est caractéristique de la régularité Lipschitzienne d’un
signal.
Théorème 2.1 Soit une fonction f ∈ L2 (R) uniformément Lipschitzienne d’ordre
α ≤ r sur un intervalle [a, b], alors il existe une constante A telle que pour tout
x ∈ [a, b] et pour tout s > 0
|Wf (x, s)| ≤ Asα+1/2 (2.2)
Réciproquement, si f est bornée et si Wf (x, s) satisfait (2.2) pour un α < r qui n’est
pas un entier, alors f est uniformément Lipschitzienne d’ordre α sur [a + ǫ, b − ǫ]
pour tout ǫ > 0.
28

Théorème 2.2 Soit une fonction f ∈ L2 (R) ponctuellement Lipschitzienne d’ordre


α ≤ r au point x0 , alors il existe une constante A telle que pour tout x ∈ R et pour
tout s > 0
x − x0 α
 
α+1/2
|Wf (x, s)| ≤ As 1 + . (2.3)
s
Réciproquement, si α < r n’est pas un entier et s’il existe une constante A et α′ < α
tels que pour tout x ∈ R et pour tout s > 0
α′ !
x − x0
|Wf (x, s)| ≤ Asα+1/2 1 +

(2.4)
s
alors f est Lipschtizienne d’ordre α en x0 .
Lorsque que l’ondelette ψ est à support compact égal à [−C, C], les conditions
(2.3) et (2.4) sont plus faciles à interpréter. Le cone d’influence de l’ondelette ψ au
point x0 est défini comme l’ensemble des points (x, s) dans le plan temps-échelle tels
que |x − x0 | ≤ Cs (voir Figure 2.1). Ils correspondent aux points tels que le support
des fonctions analysantes ψx,s (t) = √1s ψ( t−xs
) contient le point x0 . Si (x, s) est dans
le cone d’influence de f au point x0 alors les valeurs de Wf (x, s) sont influencées par
le comportement de f au voisinage de x0 . De plus, si (x, s) est tel que |x − x0 | ≤ Cs
alors les conditions (2.3) et (2.4) peuvent s’écrire
Wf (x, s)| ≤ A′ sα+1/2 .
Le comportement de la TCO dans le cone d’influence de x0 est donc caractéristique
du comportement de f au voisinage de ce point. Dans la Figure 2.2, on peut remar-
quer que les coefficients d’ondelettes de grande amplitude sont inclus dans le cone
d’influence de chacune des 3 singularités.
1

0.9

0.8

|x-x0| < Cs
0.7

0.6

|x-x0| > Cs |x-x0| > Cs


0.5
s

0.4

0.3

0.2

0.1

0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
x

Fig. 2.1 – Zone grise : cone d’influence de l’ondelette ψ au point x0 = 0.5.

2.1.4 Maxima d’ondelettes


Le théorème 2.2 montre que la régularité d’une fonction peut être mesurée à
partir de la décroissance de ses coefficients d’ondelettes quand s → 0. Toutefois, il
n’est pas nécessaire de considérer l’ensemble des coefficients Wf (x, s). La régularité
d’une fonction peut en effet contrôlée par la décroissance le long des échelles des
maxima en module de la TOC.
29

10 11

10
6

4 9

2
8
0

−2 7

−4
6

−6

−8 5
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

(a) (b)

Fig. 2.2 – (a) Signal présentant 3 singularités (b) Module de sa TOC pour la dérivée
seconde d’une Gaussienne : l’axe des abscisses représente la position x, et l’axe des
ordonnées − log2 (s)

Définition 2.3 Le terme maxima d’ondelette est utilisé pour décrire tout point
(m0 , s0 ) dans le plan temps-échelle tels que x 7→ |Wf (x, s0 )| est locallement maximum
au point x = m0 . Ce maximum local doit être strict à droite ou à gauche de m0 . On
appelle ligne de maxima d’ondelette toute courbe continue m(s) dans le plan
temps-échelle telle que les points (m(s), s) soient des maxima d’ondelette.

Le théorème suivant prouve que la propagation des maxima d’ondelettes dans le


plan temps-échelle est reliée à la régularité Lipschitzienne d’une fonction.

Théorème 2.3 Supposons que l’ondelette ψ est à support compact. S’il existe une
échelle s0 > 0 telle que |Wf (x, s)| n’a pas de maximum local pour x ∈ [a, b] et pour
tout s < s0 , alors f est uniformément Lipschitizienne d’ordre r sur ]a, b[.

Ce théorème montre que si la régularité de f au point x0 est d’ordre α < r, alors


il existe nécessairement une séquence de maxima d’ondelette (mp , sp ) telle que

lim mp = x0 et lim sp = 0.
p→+∞ p→+∞

Cette propriété est illustrée dans la Figure 2.3 qui représente les lignes de maxima
d’ondelettes d’une fonction contenant 3 singularités aux points x = 0.1, x = 0.5 et
x = 0.8, où la TOC a été calculée pour la dérivée seconde d’une Gaussienne i.e. pour
r = 2. On peut constater que plusieurs lignes de maxima d’ondelettes convergent
vers les singularités de la fonction. Il existe également d’autres lignes de maxima qui
convergent vers des parties régulières du signal. Ces lignes sont dues à la présence de
zéros dans la dérivée troisième du signal. En effet, si f est C r+2 dans un intervalle
[a, b] et si f (r+1) a zero au point x0 telle que f (r+2) (x0 ) 6= 0, on peut montrer qu’il
existe une ligne de maxima d’ondelettes qui converge vers x0 quand s tend vers zéro.
Pour cela, on peut tout d’abord remarquer que si f est r fois continûment R +∞ dérivale
Wf (x0 ,s) (r)
au voisinage de x0 , alors lims→0 sr+1/2 = Kf (x0 ) où K = −∞ θ(t)dt, et que
30

∂W (m(s),s)
par définition, si m(s) est une ligne de maxima d’ondelettes alors f ∂x = 0. A
l’aide du théorème des fonctions implicites, on montre alors que si f (r+1) (x0 ) = 0 et
∂Wf (m(s),s)
f (r+2) (x0 ) 6= 0, il existe m(s) → x0 quand s → 0 telle que ∂x
= 0.

10 8

8 7

6
6

4
5

2
4

3
−2

2
−4

1
−6

−8 0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

(a) (b)

Fig. 2.3 – (a) Signal présentant 3 singularités (b) Lignes de maxima d’ondelette
pour la dérivée seconde d’une Gaussienne : l’axe des abscisses représente la position
x, et l’axe des ordonnées − log2 (s)

Mesure de la régularité d’un signal : la régularité Lipschitzienne d’une fonction


peut être mesurée à partir de la décroissance du module des maxima d’ondelettes.
Soit f une fonction de régularité Lipschitzienne d’ordre α < r en x0 . Supposons qu’il
existe une échelle s0 à partir de laquelle tous les maxima d’ondelette (m(s), s) qui
convergent vers le point x0 sont inclus dans un cone du type |x − x0 | ≤ Cs. Alors, on
peut utiliser les théorèmes 2.2 et 2.3 pour montrer que f est Lipschitzienne d’ordre
α au point x0 si et seulement s’il existe une constante A > 0 telle que pour tout
s < s0 et pour tous les maxima d’ondelette inclus dans le cone défini précédemment

|Wf (m(s), s)| ≤ Asα+1/2

ce qui est équivalent à

log2 |Wf (m(s), s)| ≤ log2 A + (α + 1/2) log2 (s).

Pour chaque ligne de maxima d’ondelettes m(s), la régularité Lipchitzienne de f au


point x0 peut donc être estimée en calculant aux fines échelles la pente maximale
de la courbe de log2 |Wf (m(s), s)| considérée comme une fonction de log2 (s).

Remarque : les points pour lesquels toutes les lignes de maxima d’ondelettes se
concentrent dans un cone dans le plan temps-échelle sont des singularités dites
isolées. Les lignes de maxima sont bien adaptées pour mesurer l’exposant Lipschitz
de ce type de singularités. Toutefois, nous verrons en TP qu’il existe des fonctions
pour lesquelles il n’est pas possible d’estimer la régularité ponctuelle de certains
points à partir de cette technique.
31

2.2 Analyse de la régularité d’une image


2.2.1 Extension de la transformée en ondelette pour des
images
La TOC peut être étendue au cas bidimensionnel de plusieurs façons. L’extension
naturelle par rapport à ce que nous avons vu en 1D consiste à prendre une ondelette
réelle et isotrope i.e. une fonction ψ ∈ L2 (R2 ) qui s’écrit pour x = (x1 , x2 ) sous la
forme
ψ(x) = h(kxk),
p
où kxk = x21 + x22 et h est une fonction unidimensionnelle à valeurs réelles. Dans
ce cas, l’ondelette est dite isotrope car ses propriétés sont les mêmes dans toutes les
directions du plan 2D. La TOC d’une fonction f ∈ L2 (R) à l’échelle s > 0 est alors
définie par  
1 u−x
Z
Wf (x, s) = f (u) ψ du.
R2 s s
Si l’ondelette ψ vérifie une condition d’admissibilité similaire à celle du cas 1D,
alors on peut montrer que cette transformation est inversible et qu’elle converse
l’énergie du signal. Comme ψ est de moyenne nulle, Wf (x, s) permet de mesurer les
variations de l’image f dans un voisinage du point x dont la taille est proportionnelle
à s.
Un exemple classique pour l’ondelette ψ est le Laplacien d’une Gaussienne i.e.
pour u = (u1 , u2 ) ∈ R2

1 − u21 +u22 ∂2θ ∂2θ


θ(u) = e 2 et ψ = + .
2π ∂u21 ∂u22
Ce filtre est couramment utilisé en vision par ordinateur. Un exemple d’utilisation du
Laplacien de la Gaussienne est donné dans la Figure 2.4. A une échelle s donnée, on
peut constaster que les contours significatifs d’une image correspondent aux points
où x 7→ Wf (x, s) s’annule. Il s’agit des zero-crossing du Laplacien.

2.2.2 Transformée en ondelette dyadique bidimensionnelle


Pour pouvoir étendre la notion de maxima d’ondelettes pour la détection de
contours dans des images, nous allons considérer une transformée en ondelette di-
rectionnelle selon les axes verticaux et horizontaux d’une image. Une version bidi-
mensionnelle de la TOC peut être implémentée à l’aide d’un noyau de convolution
θ ∈ L2 (R2 ) qui doit être une fonction suffisamment lisse. Un exemple classique pour
θ est le noyau Gaussien.
La TOC 2D est ensuite calculée à partir de deux ondelettes qui sont les dérivées
partielles de θ dans les directions verticales et horizontales
∂θ ∂θ
ψ1 = − et ψ 2 = −
∂u1 ∂u2
32

(a) (b)

(c) (d)

Fig. 2.4 – (a) Image d’un caméraman. TOC en 2D pour le Laplacien d’une Gaus-
sienne : (b) s = 1, (c) s = 2, (d) s = 3. Le noir représente les pixels d’intensité
maximale et le blanc ceux d’intensité minimale.

Il s’agit donc d’une tranformée en ondelette avec r = 1 moment nul. Afin de simplifier
les calculs numériques il est possible de d’échantillonner le paramètre de résolution
s selon une échelle dyadique i.e. de prendre s = 2j pour j ∈ Z. Dans les deux
directions indexées par k = 1, 2 et pour s = 2j , on définit alors la transformée en
ondelette dyadique 2D (abrégée TOD 2D) d’une fonction f ∈ L2 (R) comme
 
1 k u−x
Z
k j
Wf (x, 2 ) = f (u) j ψ du.
R2 2 2j

La TOD 2D peut également s’écrire comme la convolution de f par le noyau θ au


niveau de résolution j ∈ Z suivie d’une dérivée partielle dans les directions verticales
et horizontales i.e. pour k = 1, 2


Wfk (x, 2j ) = 2j (f ⋆ θ2∗j )(x),
∂xk
1
où θ2∗j (u) = 2j
θ( −u
2j
). Les composantes horizontales et verticales de la TOD 2D sont
33

donc proportionnelles au gradient de l’image f lissée par le noyau θ à l’échelle 2j :


 1  ∂ ∗
Wf (x, 2j )
 
j (f ⋆ θ j )(x)
=2 ∂x1

2
= 2j ∇(f ⋆ θ2∗j )(x)
Wf2 (x, 2j ) ∂x2
(f ⋆ θ ∗
2j )(x)

2.2.3 Régularité Lipschitzienne


La décroissance des coefficients de la TOD 2D est reliée à la régularité d’une
image. Pour 0 ≤ α < 1, une fonction f ∈ L2 (R2 ) est dite ponctuellement Lip-
schitzienne d’ordre α au point x0 s’il existe une constante C telle que pour tout
u ∈ R2
|f (u) − f (x0 )| ≤ Cku − x0 kα .
Une fonction est dite uniformément Lipchitizienne d’ordre α sur un domaine Ω de
R2 , si f est ponctuellement Lipschitzienne d’ordre α pour tout x ∈ Ω avec une
constante C qui est indépendante de x0 . Comme dans le cas 1D, on peut montrer
que la décroissance des coefficients d’ondelettes est caractéristique de la régularité
Lipschitzienne d’une image. En particulier si on définit le module de la TOD 2D
comme q
j
Mf (x, 2 ) = |Wf1(x, 2j )|2 + |Wf2 (x, 2j )|2 ,
alors on peut montrer que f est uniformément Lipchitizienne d’ordre α sur Ω si et
seulement s’il existe une constante A telle que pour tout x ∈ Ω et pour tout j ∈ Z

Mf (x, 2j ) ≤ A2j(α+1/2) .

La Figure 2.5 donne un exemple de TOD 2D. On peut constater que les grandes
valeurs de Mf (x, 2j ) se concentrent au niveau des contours de l’image.

2.2.4 Détecteur de Canny


Les contours dans une image peuvent être définis comme les points où l’intensité
de l’image varie brutalement. Le détecteur de Canny est un algorithme adapté à la
détection de ce type de contours. Le gradient d’une image permet de quantifier les
variations d’intensité de ses pixels. La dérivée partielle d’une fonction f ∈ L2 (R)
dans une direction donnée par un vecteur unité − →
n = (cos α, sin α) dans le plan 2D
est égale au produit scalaire du gradient de f et de − →n
∂f ∂f ∂f

→ = ∇f . −

n = cos α + sin α.
∂n ∂x1 ∂x2
La dérivée partielle d’une fonction permet de mesurer le taux de variation de
l’intensité de f dans la direction −

n . Or, le module de ∂∂f→
−n
est maximum si ∇f et − →
n
sont colinéaires. Ceci montre donc que le vecteur ∇f (x) est parallèle à la direction de
changement maximum de l’intensité de f au point x. Nous dirons alors qu’un point
y ∈ R2 fait partie d’un contour dans une image, si x 7→ k∇f (x)k est localement
maximum au point x = y pour x = y + λ∇f (y) et |λ| suffisamment petit. Ceci
34

signifie que la dérivée partielle de f au voisinage de y dans une direction donnée


par le gradient ∇f (y) est locallement maximum en y. Cette définition des contours
correspond donc aux points d’inflexion dans une image.

2.2.5 Maxima d’ondelette pour des images


Rappelons que le module de la TOD 2D à l’échelle s = 2j est défini par
q
Mf (x, 2j ) = |Wf1(x, 2j )|2 + |Wf2 (x, 2j )|2 .

Nous avons montré précédemment que cette quantité est proportionnelle au module
du gradient de l’image f lissée par le noyau θ à l’échelle 2j i.e.

Mf (x, 2j ) = 2j k∇(f ⋆ θ2∗j )(x)k.

Définissons Af (x, 2j ) comme l’angle entre la composante horizontale Wf1 (x, 2j ) et la


composante verticale Wf2 (x, 2j ) de la TOD 2D par

si Wf1 (x, 2j ) ≥ 0,

j α(x)
Af (x, 2 ) =
π − α(x) si Wf1 (x, 2j ) < 0,

où !
Wf2 (x, 2j )
α(x) = tan−1 .
Wf1 (x, 2j )
Le vecteur unitaire − →
n j (x) = (cos Af (x, 2j ), sin Af (x, 2j )) est donc colinéaire au
gradient ∇(f ⋆ θ2∗j )(x). Un point d’un contour à l’échelle 2j est alors défini comme
un point y tel que x 7→ Mf (x, 2j ) est localement maximum au point x = y pour x =
y + λ− →
n j (y) et λ suffisamment petit. Ces points sont également appelés les maxima
d’ondelettes de l’image f à l’échelle 2j . Ainsi, la détection des contours dans une
image via les maxima d’ondelettes est équivalente à un détecteur de Canny multi-
échelles. La Figure 2.5 donne un exemple de détection de contours dans une image à
partir des maxima d’ondelettes pour un noyau θ Gaussien. On peut constater qu’il
est possible de détecter uniquement les contours significatifs en garder les maxima
d’ondelettes tels que le module de la TOD 2D en ces points est suffisamment grand
par rapport à un seuil bien choisi.
35

(a) (b) (c)

Fig. 2.5 – Détection multi-échelles de contours pour l’image du caméraman pour s =


2−j , j = −1, 0, 1, 2 : (a) Mf (x, 2j ) le noir représente les pixels d’intensité maximale et
le blanc ceux d’intensité minimale, (b) Maxima d’ondelette, (c) Maxima d’ondelette
dont l’amplitude est supérieure à un seuil fixé.
36
Chapitre 3

Bases d’ondelettes

Dans les chapitres précédents, nous avons introduit la TOC qui permet une
représentation temps-fréquence d’un signal. Nous avons montré que cette transfor-
mation est inversible et qu’elle conserve l’énergie du signal. Toutefois, il s’agit d’une
représentation très redondante qui nécessite de connaı̂tre l’ensemble des coefficients
d’ondelettes pour pouvoir reconstruire un signal. Dans ce chapitre, nous allons nous
intéresser à des représentations discrètes d’une fonction qui permettent de résumer
l’information contenue dans un signal avec peu de coefficients. En particulier, nous
allons montrer qu’il est possible de construire des ondelettes ψ telle que la famille
t − 2j k
  
1
ψj,k (t) = √ ψ
2j 2j (j,k)∈Z2

soit une base orthonormée de L2 (R). Pour une fonction f ∈ L2 (R), les produits
scalaires hf, ψj,k i sont appellés les coefficients d’ondelettes dans la base {ψj,k }(j,k)∈Z2 ,
et tout signal pourra donc s’écrire sous la forme f = +∞
P P+∞
j=−∞ k=−∞ hf, ψj,k iψj,k . Les
coefficients d’ondelettes au niveau de résolution j caractérisent les variations d’un
signal à l’échelle 2j . Nous allons en particulier montrer que la construction de telle
bases permet d’établir un lien entre l’analyse multi-échelle de signaux (largement
utilisée en vision par ordinateur), la théorie du filtrage discret en traitement du
signal et les mathématiques appliquées.

3.1 Bases orthonormées d’ondelettes


3.1.1 Quelques rappels sur les bases hilbertiennes
Définition 3.1 Un espace de Hilbert est un R espace vectoriel muni d’un pproduit
scalaire noté hx, yi (pour x, y ∈ H) qui est complet pour la norme kxk = hx, xi
(norme associée au produit scalaire).

Proposition 3.1 L’ensemble L2 (R), qui est l’espace des fonctions


R de carré intégrable,
est un espace de Hilbert pour le produit scalaire hf, gi = R
f (t)g(t)dt de norme as-
2 2 2
R
sociée kf k = R |f (t)| dt pour f, g ∈ L (R).

37
38

Soit H un espace de Hilbert. Nous rappelons les définitions et propriétés suivantes


– deux vecteurs x et y de H sont orthogonaux si hx, yi = 0
– soit A une partie non vide de H. On note A⊤ l’orthogonal de A dans H défini
par
A⊤ = {x ∈ H, ∀y ∈ A, hx, yi = 0},
– A⊤ est un sous-espace vectoriel fermé de H
– si A est un sous-espace vectoriel de H, alors Ā = (A⊤ )⊤ .

Proposition 3.2 Soit H un espace de Hilbert et F un sous-espace vectoriel fermé


de H. Pour tout x ∈ H, on note PF x la projection orthogonale de x sur F qui est
caractérisée comme l’unique point de F tel que kx − PF xk = inf y∈F kx − yk. De plus,
– pour tout y ∈ F , hx − PF x, yi = 0
– PF : H L → F est une application linéaire et continue,
– H=F F ⊤.

Définition 3.2 Soit H un espace de Hilbert et soit (Hn )n≥0 une suite de sous-
espaces vectoriels fermés de H. On dit que H est une somme hilbertienne des Hn
si
– ∀m 6= n, ∀(x, y) ∈ Hm × Hn , hx, yi = 0
– l’espace vectoriel
L engendré par les Hn est dense dans H.
On note alors, H = n≥0 Hn .
L
Proposition 3.3 Soit H = n≥0 Hn . Si x ∈ H, on pose pour tout n ∈ N, xn =
PHn x. On Pa alors PN
– x = n≥0 x n , i.e. lim N →∞ n=0 xn = x
– kxk2 = n≥0 kxn k2 (égalité de Bessel-Parseval)
P
Réciproquement, soit (xn )Pune suite dans H telle que pour tout n, xn ∈ Hn et
P 2 N
n≥0 kxn k < +∞, alors n=0 xn converge vers un point x ∈ H tel que pour tout
n ∈ N, xn = PHn x.

Définition 3.3 On appelle base hilbertienne (ou base orthonormée) une suite (en )n≥0
d’éléments de H telle que
– hen , em i = δn,m
– l’espace vectoriel engendré par les (en )n≥0 est dense dans H.

D’après ce qui précède, si (en )n≥0 est une base orthonormée


P d’un espace de
Hilbert P
H, alors tout x ∈ H s’écrit de manière unique x = n≥0 hx, en ien avec
kxk2 = n≥0 |hx, en i|2.

3.1.2 Analyse multirésolution de L2(R)


La décomposition d’un signal à différents niveaux de résolution est largement uti-
lisée en vision par ordinateur. Une analyse multirésolution correspond au calcul d’un
ensemble de coefficients qui constituent une représentation plus ou moins précise
39

d’un signal. Par exemple, l’approximation d’une fonction f au niveau de résolution


j peut être définie par la donnée d’une suite de coefficients qui correspondent à une
moyenne locale de f sur des intervalles disjoints de longueur 2j . Lorsque que l’on
passe de la résolution j à la résolution j + 1 le niveau d’approximation est plus
grossier, alors que lorsque l’on passe du niveau j au niveau j − 1 on affine la qua-
lité de l’approximation (voir Figure 3.1). De façon plus formelle, l’approximation
d’une fonction f à la résolution j correspond à la projection orthogonale de f sur
un sous-espace Vj ⊂ L2 (R) ce qui conduit à la définition suivante :

Définition 3.4 Une analyse multirésolution (AMR) de L2 (R) est une succession
de sous-espaces fermés (Vj )j∈Z qui satisfait les 6 propriétes suivantes

∀j ∈ Z, Vj+1 ⊂ Vj ⊂ . . . ⊂ L2 (R), (3.1)


t
∀j ∈ Z, f (t) ∈ Vj ⇐⇒ f ( ) ∈ Vj+1 , (3.2)
\ 2
Vj = {0}, (3.3)
j∈Z
[
Vj = L2 (R), (3.4)
j∈Z

∀(j, k) ∈ Z2 , f (t) ∈ Vj =⇒ f (t − 2j k) ∈ Vj (3.5)

il existe φ ∈ V0 telle que {φ(t − k), k ∈ Z} soit une base orthonormée de V0 .

Au niveau de résolution j, l’approximation d’une fonction f ∈ L2 (R) correspond


à la projection orthogonale PVj f de f sur Vj . Intuitivement, on peut interpréter les
6 propriétés d’une AMR de la façon suivante
– l’inclusion (3.1) des espaces Vj signifie qu’une approximation d’un signal au
niveau de résolution j est plus précise que l’approximation au niveau j + 1,
– la multirésolution est définie par la propriété (3.2) : l’espace Vj+1 définit une
approximation deux fois plus grossière que la représentation dans l’espace Vj ,
– lorsque que le niveau de résolution devient de plus en plus grossier i.e. j → +∞,
la propriété (3.3) implique que l’approximation de f se dégrade et que l’on perd
tous les détails sur f i.e limj→+∞ kPVj f k = 0,
– lorsque l’échelle d’analyse 2j tend vers zéro (i.e. j → −∞), la propriété (3.4)
impose que l’approximation du signal converge vers le signal original i.e.
limj→−∞ kf − PVj f k = 0,
– la propriété (3.5) signifie que l’espace Vj est invariant par des translation pro-
portionnelles à l’échelle d’analyse 2j ,
– φ est la fonction d’échelle de l’AMR, également appelée fonction génératrice
de l’espace V0 .
Des propriétés d’une AMR, on déduit immédiatement la proposition suivante
 j 
Proposition 3.4 Posons φj,k (t) = √12j φ t−2 2j
k
. Alors pour tout j ∈ Z, {φj,k , k ∈
Z} est une base orthonormée de Vj .
40

Dans ce qui suit, nous allons montrer que l’on peut entièrement spécifier une
AMR à partir de la donnée d’une fonction d’échelle φ. Les deux fonctions suivantes
sont des exemples classiques d’une AMR de L2 (R)

– Approximation constante par morceaux : si φ(t) = 11[0,1] (t) est la fonction


indicatrice de l’intervalle [0, 1], alors Vj est le sous-espace de fonctions f ∈
L2 (R) telles que f (t) est constante sur chaque intervalle {Ij,k = [2j k, 2j (k +
1)[, k ∈ Z}. L’AMR est alors constituée de l’ensemble des fonctions constantes
par morceaux sur les intervalles Ij,k , (j, k) ∈ Z2 i.e. φj,k (t) = 2−j/211Ij,k (t). Au
niveau de résolution j, l’approximation d’un signal f ∈ L2 (R) est une fonction
en escalier qui est la moyenne de f sur chaque intervalle Ij,k (voir Figure 3.1).
– Approximation de Shannon. On peut montrer que si φ(t) = sin(πt) πt
, alors
{φ(t − k), k ∈ Z} est une base orthonormée de l’espace V0 des fonctions de
L2 (R) dont la transformée de Fourier est à support inclus dans [−π, π]. En
définissant les espaces Vj comme l’ensemble des fonctions dont la transformée
de Fourier est à support inclus dans [−2−j π, 2−j π], on peut vérifier que ceci
définit bien une AMR de L2 (R). L’approximation de f ∈ L2 (R) au niveau de
résolution j correspond à un filtre fréquentiel. On peut en effet montrer que
PVˆj f(ω) = fˆ(ω)11[−2−j π,2−j π] (ω).

Généralement, l’approximation au niveau de résolution j correspond à un filtrage


passe-bas dont la largeur de bande est inversement proportionnelle à l’échelle 2j .

25 17 22 24

22
16 20

20
20

15 18
18

15
14 16
16

14
13 14
10

12
12 12

10
5

11 10
8

0 10 8 6
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

(a) (b) (c) (d)


3 5 3
2.5

4
2
2 2
3 1.5

2 1
1 1

1 0.5

0 0 0 0

−1 −0.5

−1 −1
−2 −1

−3 −1.5
−2 −2

−4 −2

−3 −5 −2.5 −3
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

(e) (f) (g) (h)

Fig. 3.1 – (a) Signal présentant 2 singularités. Approximation constante par mor-
ceaux au niveau : (b) j = 1, (c) j = 2 et (d) j = 3. Projection du signal sur les
sous-espaces d’ondelettes (e) W0 , (f) W1 , (g) W2 et (h) W3 .
41

3.1.3 Filtres mirroirs conjugués


Dans cette section, nous étudions les caractéristiques que doit vérifier une fonc-
tion d’échelle φ pour générer une base orthonormée de chaque espace Vj et garantir
toutes les propriétés d’une AMR. Nous montrons en particulier que toute fonction
d’échelle est entièrement spécifiée par un filtre discret appelé filtre mirroir conjugué.

Supposons que l’on ait construit une AMR de L2 (R). La propriété (3.2) impose
que 2−1/2 φ(t/2) ∈ V1 ⊂ V0 et comme {φ(t − k), k ∈ Z} est une base orthonormée
de V0 , on obtient que :
k=+∞
1 t X
√ φ( ) = hk φ(t − k)
2 2 k=−∞

où
hk = h2−1/2 φ(t/2), φ(t − k)i.
La suite hk s’interprète
P+∞comme−ikω
un filtre discret dont la transformée de Fourier est
définie par ĥ(ω) = n=−∞ hk e ce qui permet d’obtenir l’expression suivante :

1
φ̂(2ω) = √ ĥ(ω)φ̂(ω).
2

L’équation précédente implique que l’on peut écrire φ̂ sous la forme :


p
!
−i
Y ĥ(2 ω)
φ̂(ω) = √ φ̂(2−p ω).
i=1
2

Et en prenant la limite quand p → +∞, il est alors tentant d’écrire que :


+∞
!
Y ĥ(2−i ω)
φ̂(ω) = √ φ̂(0).
i=1
2

Le théorème suivant (dû à S. Mallat et Y. Meyer) donne les conditions nécessaires


et suffisantes sur le filtre ĥ(ω) pour que le produit ci-dessus permette de définir une
AMR.

Théorème 3.1 Soit φ ∈ L2 (R) une fonction d’échelle d’une AMR, alors la trans-
formée de Fourier du filtre défini par hk = h2−1/2 φ(t/2), φ(t − k)i vérifie

∀ω ∈ R, |ĥ(ω)|2 + |ĥ(ω + π)|2 = 2, et ĥ(0) = 2. (3.6)

Réciproquement, si ĥ(ω) est une fonction 2π-périodique et continûment dérivable au


voisinage de ω = 0, alors si ĥ vérifie les propriétés (3.6) et si

inf |ĥ(ω)| > 0,


ω∈[−π/2,π/2]
42

alors le produit !
+∞
Y ĥ(2−iω)
φ̂(ω) = √ ,
i=1
2
est la transformée de Fourier d’une fonction d’échelle φ ∈ L2 (R) qui définit une
AMR.

Le théorème précédent montre qu’il est donc équivalent de connaı̂tre le filtre


(hk )k∈Z ou la fonction d’échelle φ, et que la construction d’une AMR de L2 (R) peut
se faire à partir d’un filtre qui vérifie les propriétés énoncées ci-dessus. En effet, si
on connait la fonction φ, on construit une AMR en définissant :

Vj = V ect {2−j/2φ(2−j x − k), k ∈ Z}.

La caractérisation des fonctions d’échelles à partir de la donnée des filtres (hk )k∈Z
permet donc d’établir un lien entre les mathématiques appliquées et la théorie du
filtrage discret en traitement du signal. Ceci va se révéler particulièrement utile pour
le calcul des coefficients d’ondelettes d’un signal discret comme nous le verrons par
la suite. Nous avons vu précédemment que pour l’

– Approximation constante par morceaux, φ(t) = 11[0,1] (t) et que φj,k (t) =
2−j/2 11Ij,k (t), (j, k) ∈ Z2 . On obtient alors que

√1

2
si k = 0, 1
hk =
0 sinon

– Approximation de Shannon, φ̂(ω) = 11[−π,π](ω) ce qui implique que pour



tout ω ∈ [−π, π], ĥ(ω) = 211[−π/2,π/2] (ω). En utilisant le fait que la famille de
fonctions {e−ikω }k∈ZR est une base orthonormée de L2 ([−π, π]) pour le produit
π ˆ
scalaire hfˆ, ĝi = 2π
1
−π
f (ω)ĝ(ω)dω, on obtient alors que
√ Z π/2
2 √ sin( π2 k)
hk = eikω dω = 2 .
2π −π/2 πk

3.1.4 Ondelettes orthogonales


L’approximation d’une fonction f aux échelles 2j et 2j−1 est définie par la pro-
jection orthogonale de f sur les espaces Vj et Vj−1 respectivement. Etant donné que
Vj ⊂ Vj−1, on définit l’espace Wj comme l’espace complémentaire orthogonal de Vj
dans Vj−1 i.e. M
Vj−1 = Vj Wj .
L’approximation de f à l’échelle 2j−1 peut donc se décomposer sous la forme
M
PVj−1 f = PVj f PWj f.
43

L’espace Wj permet de calculer les détails PWj f pour la fonction f qui permettent
de passer de l’approximation à l’échelle 2j à une approximation plus fine à l’échelle
2j−1 . De la définition d’une AMR, on déduit les propriétés suivantes (S. Mallat et
Y. Meyer) qui permettent de construire une base orthornormée de Wj à partir de
contractions et dilatations d’une ondelette ψ :

– ∀(j, j ′ ) ∈ Z2 , j 6= j ′ ⇒ Wj ⊥Wj ′ ,
2
L
– j∈Z Wj = L (R),
– f (t) ∈ Wj ⇐⇒ f ( 2t ) ∈ Wj+1
– ∀(j, k) ∈ Z2 , f (t) ∈ Wj =⇒ f (t − 2j k) ∈ Wj
– soit
1 ω ω
ψ̂(ω) = √ ĝ( )φ̂( ), avec ĝ(ω) = e−iω ĥ(ω + π),
2 2 2
 j 
et posons ψj,k (t) = √12j ψ t−2 2j
k
. Alors pour tout j ∈ Z, {ψj,k , k ∈ Z} est une
base orthonormée de Wj , et donc {ψj,k , (j, k) ∈ L2 (R)} est une base ortho-
normée de L2 (R). La fonction ψ est appelée ondelette mère ou plus simplement
ondelette de l’AMR.

Les espaces Wj sont appelés les sous-espaces de détail ou sous-espaces d’onde-


lettes. Ils caractérisent la différence d’information entre les projections sur les espaces
Vj et Vj−1 . De ce qui précède, on obtient que si l’on dispose d’une AMR de L2 (R)
alors toute fonction f ∈ L2 (R) peut s’écrire sous la forme d’une décomposition en
ondelettes
+∞
X +∞ X
X +∞
f= PW j f = hf, ψj,k iψj,k ,
j=−∞ j=−∞ k=−∞

et pour tout j0 ∈ Z,
j0 +∞ j0 +∞
X X X X
f = PVj0 f + PW j f = hf, φj0 ,k iφj0 ,k + hf, ψj,k iψj,k .
j=−∞ k=−∞ j=−∞ k=−∞

Comme ψ ∈ V0 , l’ondelette vérifie l’équation


+∞
1 t X
√ ψ( ) = gk φ(t − k)
2 2 k=−∞

et on peut alors montrer que la fonction ĝ introduite précédemment est la trans-


formée de Fourier du filtre discret (gk )k∈Z qui est donné par

gk = h2−1/2 ψ(t/2), φ(t − k)i.

On peut également montrer que (gk )k∈Z est un filtre mirroir de (hk )k∈Z i.e.

gk = (−1)1−k h1−k .
44

Cette propriété de filtre en mirroir joue un rôle important dans la mise au point d’al-
gorithmes rapides de transformée en ondelettes. En reprenant les exemples précédents
d’AMR, on obtient que

– Approximation constante par morceaux. Le ondelettes de Haar corres-


pondent au cas d’une AMR constituée des fonctions constates par morceaux
et sont telles que : 
 −1 si 0 ≤ t < 1/2
ψ(t) = 1 si 1/2 ≤ t < 1
0 sinon

et
1
 − √2 si k = 0

gk = √1 si k = 1
2
0 sinon


– Approximation de Shannon, φ̂(ω) = 11[−π,π] (ω) et ĥ(ω) = 211[−π/2,π/2] (ω)
ce qui implique que
 −iω/2 S
e si ω ∈ [−2π, −π] [π, 2π]
ψ̂ =
0 sinon,

et
sin 2π(t − 1/2) sin π(t − 1/2)
ψ(t) = − .
2π(t − 1/2) π(t − 1/2)
Généralement, pour les ondelettes orthogonales,
S l’énergie de ψ̂ est essentiellement
concentrée sur les intervalles [−2π, −π] [π, 2π]. La projection de f sur l’espace Wj
correspond donc à un filtrage passe-bande dont la largeur dépend du niveau de
résolution j. La Figure 3.1 donne un exemple de projection d’une fonction dans
différents espaces de détails Wj , j = 0, 1, 2, 3 pour la base de Haar.

3.2 Construction de bases d’ondelettes


3.2.1 Liens entre filtres, nombre de moments nuls et régularité
de l’ondelette
Les ondelettes de Shanon sont des fonctions C ∞ qui décroissent lentement quand
t tend vers +∞ et −∞, et qui ont un nombre infini de moments nuls. Toutefois,
elles ne sont pas à support compact. L’un des buts d’une décomposition en onde-
lettes dans une base orthonormée, est de représenter une fonction f avec peu de
coefficients significatifs. Nous allons voir par la suite que les ondelettes à support
compact sont bien adaptées pour obtenir des représentations parcimonieuses (ou
creuses) d’un signal. L’amplitude des coefficients d’ondelettes et le nombre de coef-
ficients significatifs dépend à la fois de
45

– la régularité de f
– du nombre de moments nuls r
– de la taille du support de ψ

Les deux dernières propriétés ainsi que la régularité de l’ondelette ψ peuvent être
reliées aux caractéristiques du filtre (hk )k∈Z .

• Nombre de moments nuls : rappelons que si une ondelette a r moments nuls,


alors elle est orthogonale à tous les polynômes de degré inférieur ou égal r−1. Dans le
chapitre précédent, nous avons montré que si f est suffisamment régulière alors l’am-
plitude coefficients d’ondelettes |hf, ψj,k i| est d’autant plus petite aux fines échelles
(j → −∞) que r est grand car |hf, ψj,k i| est borné par 2j(r+1/2) . Soient ψ et φ les
fonctions ondelette et d’échelle d’une AMR telles que |ψ(t) = O((1 + t2 )−r/2−1 )|
et |ψ(t) = O((1 + t2 )−r/2−1 )|, alors les trois assertions suivantes suivantes sont
équivalents et montrent que le nombre de moments nuls dépend du nombre de zéros
de ψ̂ et ĥ aux points ω = 0 et ω = π :

– l’ondelette ψ a r moments nuls


– ψ̂(ω) et ses r − 1 dérivées sont nulles au point ω = 0
– ĥ(ω) et ses r − 1 dérivées sont nulles au point ω = π

• Taille du support de l’ondelette : si f a une singularité isolée en point x0 et si le


support de ψj,k contient le point x0 alors l’amplitude de |hf, ψj,k i| peut être élevée. Si
ψ est à support compact de taille K, alors à l’échelle j, il y a K coefficients |hf, ψj,k i|
qui sont influencés par le comportement de f au voisinage de x0 . Pour réduire le
nombre de coefficients de grande amplitude, il est donc nécessaire de minimiser la
taille du support de ψ. La proposition suivante montre que la taille du support de
l’ondelette est relié à la longueur du filtre (hk )k∈Z (nombre de coefficients hk non
nuls) :

Proposition 3.5 Le filtre h et la fonction d’échelle ψ sont à support compact si et


seulement si leurs supports sont égaux. Si le support de h et de la fonction d’échelle
ψ est [N1 , N2 ], alors le support de ψ est [(N1 − N2 + 1)/2, (N2 − N1 + 1)/2].

• Taille du support et nombre de moments nuls : pour de ondelettes orthogo-


nales, la taille du support et le nombre de moments nuls ne sont pas indépendants.
En effet, il est possible de montrer (théorème dû à I. Daubechies) que si ψ a r
moments nuls, alors son support est au moins de taille 2r − 1. Nous verrons par
la suite que les ondelettes de Daubechies sont optimales dans le sens où elles ont
une taille de support minimale pour un nombre de moments nuls donné. Lors d’une
décomposition en ondelettes, il est donc nécessaire de trouver un compromis entre
taille du support et nombre de moments nuls. Si le signal f a quelques singula-
rités isolées et est très régulier entre ces points, on peut choisir une ondelette avec
un nombre de moments nuls élevés de sorte à produire peu de coefficients d’onde-
lettes |hf, ψj,k i| significiatifs. Si le nombre de singularités augmente, le nombre de
46

fonctions analysantes ψj,k dont le support contient une singularité augmente et il


peut donc être judicieux de réduire la taille du support de ψ même si cela diminue r.

• Régularité de l’ondelette : on peut montrer que la régularité de ψ est reliée au


nombre de zéros de ĥ en ω = π. La régularité de l’ondelette influence laP
qualité de re-
construction ou de débruitage d’un signal. En effet, si on a f = +∞ +∞
P
j=−∞ k=−∞ hf, ψj,k iψj,k ,
alors une perturbation de ǫ d’un coefficent hf, ψj,k i ajoute la composante ǫψj,k . Plus
l’ondelette est régulière et moins cette perturbation sera visible.

Enfin, il est important d’insister sur le fait que l’amplitude des coefficients d’on-
delettes dépend du nombre de moments nuls et non de la régularité de l’ondelette
ψ.

3.2.2 Quelques exemples classiques d’ondelettes


• Ondelettes de Haar : la base de Haar est obtenue à partir d’une AMR constituée
de fonctions constantes par morceaux. Le filtre (hk )k∈Z a deux coefficients non nuls
aux points k = 0 et k = 1, et l’ondelette de Haar a le plus petit support parmi
toutes les ondelettes orthogonales. Toutefois, il s’agit d’une fonction discontinue qui
n’est pas bien adaptée pour représenter les signaux lisses.

• Ondelettes de Daubechies : une ondelette de Daubechies a un support de taille


minimale égal à [−r + 1, r] pour un nombre de moments nuls r donné. De plus, la
régularité de ces ondelettes augmente avec r. Le support de la fonction d’échelle φ
est [0, 2r − 1].

• Symmlets : les ondelettes de Daubechies sont très assymétriques. Daubechies a


montré que l’ondelette de Haar est la seule ondelette symmétrique. Les ondelettes
Symmlets sont construites de sorte à avoir des fonctions analysantes les moins as-
symétriques possibles. Il s’agit à nouveau d’ondelettes qui ont un support minimal
égal à [−r + 1, r] avec r moments nuls.

• Coiflets : il s’agit d’une ondelette qui a r moments nuls et une taille de support
minimale, dont la fonction d’échelle φ vérifie
Z +∞ Z +∞
φ(t)dt = 1, et tk φ(t)dt = 0 pour 1 ≤ k < r.
−∞ −∞

Ces fonctions d’échelles sont très utiles pour établir des formules précises entre l’ap-
proximation d’une fonction dans un espace VJ etRl’échantillonnage d’une fonction. En
+∞
effet, pour une ondelette donnée on a toujours −∞ φ(t)dt = 1 et si on suppose que
f est C 1 alors, en utilisant un développement de Taylor, on obtient l’approximation
suivante entre les échantillons de f et sa projection dans le sous-espace VJ :

2−J/2 hf, φJ,k i ≈ f (2J k) + O(2J ).


47

Si on utilise des Coiflets, on augmente la qualité de l’approximation car dans ce cas


on montre que si f est C k avec k < r alors

2−J/2 hf, φJ,k i ≈ f (2J k) + O(2J(k+1) ).

La taille du support des Coiflets est 3r − 1.

La Figure 3.2 donne les graphes des ondelettes de Daubechies et Symmlets pour
différentes valeurs de r. On peut constater que pour ces ondelettes la régularité de
ψ augmente avec r.
2 2 1.5

1.5 1.5

1 1

0.5
0.5 0.5

0 0
0

−0.5 −0.5

−0.5

−1 −1

−1.5 −1.5 −1
−1 −0.5 0 0.5 1 1.5 2 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 2.5 3 −3 −2 −1 0 1 2 3 4

(a) (b) (c)


1.5 1 1.5

1 1
0.5

0.5 0.5

0 0

−0.5

−0.5 −0.5

−1
−1 −1

−1.5 −1.5 −1.5


−4 −3 −2 −1 0 1 2 3 4 5 −5 −4 −3 −2 −1 0 1 2 3 4 5 6 −6 −4 −2 0 2 4 6

(d) (e) (f)

Fig. 3.2 – Ondelettes de Daubechies (a) r = 2, (b) r = 3, (c) r = 4, et Symmlets


(d) r = 5, (e) r = 6, (f) r = 7.

La Figure 3.3 donne un exemple de décomposition dans différentes bases d’onde-


lettes du signal tracé dans la Figure 3.1(a). On peut remarquer que les coefficients
d’ondelettes de grande amplitude se concentrent au niveau des singularités du si-
gnal à mesure que l’échelle diminue (j → −∞) et que le nombre de coefficients
significatifs dépend du nombre de moments nuls r.

3.2.3 Ondelettes sur un intervalle borné


Dans les sections précédentes, nous avons étudié la construction de bases d’on-
delettes pour des fonctions de L2 (R). En pratique, les signaux rencontrés sont soit
périodiques, soit définis sur un intervalle bornée, par exemple [0, 1]. Afin de pouvoir
analyser des signaux réels, il est donc nécessaire de pouvoir construire des bases
d’ondelettes pour l’espace L2 ([0, 1]). En effet, il n’est pas judicieux d’utiliser une
AMR de L2 (R) pour une fonction f de L2 ([0, 1]) en imposant f = 0 en dehors de
48
10
−2

8 −2.5

6 −3

−3.5
4

−4
2

−4.5
0
−5

−2
−5.5

−4
−6

−6 −6.5

−8 −7
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

(a) (b)
−2 −2

−2.5 −2.5

−3 −3

−3.5 −3.5

−4 −4

−4.5 −4.5

−5 −5

−5.5 −5.5

−6 −6

−6.5 −6.5

−7 −7
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

(c) (d)

Fig. 3.3 – (a) Signal présentant 3 singularités. Coefficients d’ondelettes au niveau


j = −3, −4, −5, −6 dans la base de (b) Haar, (c) Daubechies r = 2 et (d) Symmlets
r = 4. Les barres verticales représentent l’amplitude de 2−j coefficients d’ondelettes
au niveau de résolution j.

[0, 1], car cette extension crée généralement deux discontinuités en t = 0 et t = 1 qui
génèrent de grands coefficients près des bords. Des bases d’ondelettes de L2 ([0, 1])
sont obtenues en modifiant les ondelettes (ψj,k )(j,k)∈Z2 d’une base de L2 (R). Les on-
delettes intérieures (dont le support est inclus dans [0, 1]) ne sont pas modifiées,
alors que les ondelettes aux bords, dont le support contient les points t = 0 ou t = 1,
sont transformée en des fonctions à support dans [0, 1] de sorte à générer une base
orthonormée de L2 ([0, 1]). La principale difficulté de cette construction est d’obtenir
des ondelettes qui conservent leur nombre de moments nuls. Nous citerons deux ap-
proches pour construire des ondelettes sur un intervalle bornée et nous détaillerons
uniquement la construction pour des ondelettes périodiques. Les fonctions d’échelle
φj,k sont également modifiées pour avoir un support inclus dans [0, 1]. Si ψ est à
support compact, il existe un nombre constant d’ondelettes incluses dans un inter-
valle borné à chaque échelle. Une base orthonormée d’ondelettes de L2 ([0, 1]) est
alors constituée de 2−J fonctions d’échelle à une échelle 2J < 1 et de 2−j ondelettes
à chaque échelle 2j ≤ 2J :

n o
(φ̃J,k )0≤k<2−J , (ψ̃j,k )−∞<j≤J,0≤k<2−j ,
49

et une fonction f ∈ L2 ([0, 1]) se décompose alors sous la forme

2−J
X −1 J
X 2X−1 −j

f= hf, φ̃J,k iφ̃J,k + hf, ψ̃j,k iψ̃j,k .


k=0 j=−∞ k=0

Sur un intervalle [a, b], une base orthonormée d’ondelettes de L2 ([a, b]) peut alors
se construire par translation de a et dilatation par b − a d’ondelettes sur l’intervalle
[0, 1].

• Ondelettes périodiques : une base d’ondelettes de L2 ([0, 1]) peut être obtenue
en périodisant une AMR de L2 (R) i.e. en posant

+∞
X +∞
X
−J/2 −j/2
φ̃J,k (t) = 2 φJ,k (t + l) et ψ̃j,k (t) = 2 ψj,k (t + l) .
l=−∞ l=−∞

Pour j ≤ 0, il y a 2−j ondelettes différentes ψ̃j,k indexée par 0 ≤ k < 2−j . Si le


support de ψj,k est inclus dans [0, 1] alors ψ̃j,k = ψj,k . Sinon l’ondelette ψj,k est
transformée en une fonction qui a deux composantes disjointes au voisinage de t = 0
et t = 1 (voir Figure 3.4).

1.5 1

1
0.5

0.5

−0.5

−0.5

−1
−1

−1.5 −1.5
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

(a) (b)

Fig. 3.4 – Ondelettes périodiques sur [0, 1] pour j = −3, k = 0 (a) Daubechies , (b)
Symmlets (r = 6).

n o
−j
En notant Ṽj et W̃j les sous-espaces vectoriels engendrés par φ̃j,k , 0 ≤ k < 2
n o
et ψ̃j,k , 0 ≤ k < 2−j respectivement, on montre que les ondelettes périodiques
50

générent une AMR de L2 ([0, 1]) dans le sens où

∀j ≤ 0, Ṽj ⊂ Ṽj−1
[
Ṽj = L2 ([0, 1])
j≤0

f (t) ∈ Ṽj ⇒ f (t/2) ∈ Ṽj+1


φ̃0,0 (t) = 1 et Ṽ0 = {f ∈ L2 ([0, 1]), f = cste}
dimṼj = 2−j et φ̃j,k (t) = φ̃j,0(t − 2j k) est une base orthonormée de Ṽj ,
dimW̃j = 2−j et ψ̃j,k (t) = ψ̃j,0 (t − 2j k) est une base orthonormée de W̃j
M
Ṽj−1 = Ṽj W̃j

Pour f ∈ L2 ([0, 1]), on note f˜ la périodisation de f sur R (i.e. f(t)


˜ = f (t mod 1)
pour t ∈ R). On peut alors facilement vérifier que

hf, φ̃j,k i = hf˜, φj,k i et hf, ψ̃j,k i = hf,


˜ ψj,k i.

Les coefficients d’ondelettes périodiques peuvent donc s’interpréter comme la décomposition


de f˜ (périodisation de f sur R) dans une base d’ondelettes de L2 (R). Les ondelettes
périodiques composées de deux segments disjoints au voisinage t = 0 et t = 1 n’ont
pas de moments nuls ce qui génére de grands coefficients d’ondelttes au bord de [0, 1]
(voir Figure 3.5). En effet, si f (0) 6= f (1) alors ces ondelettes se comportent comme
si le signal était discontinu en t = 0 et t = 1. Malgré le mauvais comportement des
ondelettes périodiques aux bords de [0, 1], celles-ci sont souvent employées pour la
simplicité de leur implémentation numérique.

2 −2

1.8 −3

1.6 −4

1.4 −5

1.2 −6

1 −7

0.8 −8
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

(a) (b)

Fig. 3.5 – (a) Signal régulier f avec une singularité en x = 0.5, (b) Coefficients
d’ondelettes pour une Symmlet avec r = 8 moments nuls. On peut remarquer que
f (0) et f (1) sont très différents, ce qui génére de grands coefficients aux bords de
[0, 1].
51

• Ondelettes sur l’intervalle : comme nous l’avons vu précédedemment, les co-


efficients d’ondelettes sont de faible amplitude dans les régions où le signal est
régulier si les ondelettes analysantes ont suffisamment de moments nuls. Les on-
delettes périodiques localisées au voisinage de t = 0 et t = 1 n’ont pas de moment
nul, et ne peuvent donc pas prendre en compte la régularité d’un signal aux bornes
de [0, 1]. Ce comportement génère des coefficients de grande amplitude qui ne cor-
respondent pas à la présence de singularités. Cohen, Daubechies et Vial ont proposé
une technique pour obtenir des ondelettes sur l’intervalle [0, 1] qui ont autant de mo-
ments nuls que l’ondelette orginale ψ. Toutefois, cette construction est plus longue
et plus compliquée à décrire que celle des des ondelettes périodiques, et nous ren-
voyons à Mallat [7] pour une présentation détaillée. Nous verrons en TP l’intérêt
d’utiliser des ondelettes sur l’intervalle par rapport aux ondelettes périodiques.

3.2.4 Ondelettes et bancs de filtres


Soit f ∈ L2 (R) et φ, ψ les fonctions d’échelle et d’ondelette d’une AMR de
L2 (R). Nous avons vu que la projection orthogonale PVj f de f dans l’espace Vj peut
s’exprimer comme la somme des projections orthogonales de f dans les sous-espaces
Vj+1 et Wj+1 où
X
PVj f = aj,k φj,k et aj,k = hf, φj,k i
k∈Z
X
PVj+1 f = aj+1,k φj+1,k et aj+1,k = hf, φj+1,k i
k∈Z
X
PWj+1 f = dj+1,k ψj+1,k et dj+1,k = hf, ψj+1,k i
k∈Z

Soient (hk )k∈ZZ et (gk )k∈ZZ les filtres conjugués en miroir associés aux fonctions
φ et ψ. On montre alors que

• Formule de décomposition : le cadre de l’AMR conduit naturellement à un


algorithme rapide de calcul des coefficients
LL−1d’ondelettes à partir de l’approximation
d’une fonction
L dans un espace V L = V J j=J Wj qui est basée sur la décomposition
Vj = Vj+1 Wj+1 et la définition des filtres conjugués en miroir :
X X
aj+1,k = hn−2k aj,n et dj+1,k = gn−2k aj,n
n∈Z n∈Z

Pour une suite (xk )k∈Z , on note (x̄k )k∈Z la suite obtenue en inversant les éléments
de la suite x i.e. x̄k = x−k . Les formules de décomposition ci-dessus peuvent alors
s’exprimer à l’aide de convolutions discrètes suivies par un sous-échantillonnage d’un
facteur 2 :

aj+1,k = aj ⋆ h̄[2k] et dj+1,k = aj ⋆ ḡ[2k].


52

La décomposition d’un signal dans une base d’ondelettes fait donc intervenir une
succession de convolutions discrètes avec le filtre passe-bas h̄ et le filtre passe-haut ḡ.
La décomposition d’une suite aL = hf, φL,k i, k ∈ Z dans une base orthonormée d’on-
delette est donc composée des coefficients d’ondelettes de f aux échelles 2L < 2j ≤ 2J
plus les coefficients d’échelles à l’échelle la plus grossière 2J i.e. l’ensemble de co-
efficients {(dj )L<j≤J , aJ } qui est calculé à l’aide des formules de décomposition
ci-dessus.

• Formule de reconstruction : la reconstruction ou synthèse des coefficients


d’ondelettes consiste à retrouver la suite aL à partir de l’ensemble de coefficients
{(dj )L<j≤J , aJ }. On utilise alors la récurrence ascendante suivante
X X
aj,k = hk−2n aj+1,n + gk−2n dj+1,n
n∈Z n∈Z

Pour une suite (xk )k∈Z , on note (x̃k )k∈Z la suite obtenue en insérant un zéro entre
chaque élément de la suite x i.e. x̃k = xp si k = 2p et x̃k = 0 si k = 2p + 1. Les
formules de décomposition ci-dessus peuvent alors s’exprimer à l’aide de convolutions
discrètes

aj,k = ãj+1 ⋆ h[k] + d˜j+1 ⋆ g[k].


• Initialisation de l’algorithme : en pratique, on doit déterminer les coefficients
d’échelle aL à partir de la discrétisation d’un signal f ( Nk ) k∈Z où 1/N est le pas


d’échantillonnage. On doit donc pouvoir associer à la suite f ( Nk ) k∈Z un ensemble




de coefficients qui soit une bonne approximation de la projection de f dans VL . Nous


avons vu précédemment que si f est C 1 alors 2−L/2 aL,k = f (2L k) + O(2L) et si f
est C k , en utilisant des Coiflets, on obtient que 2−L/2 aL,k = f (2Lk) + O(2L(k+1)).
Donc, si N = 2−L , on pourra considérer que aL,k ≈ N −1/2 f ( Nk ) constitue une bonne
approximation de PVL f pour initialiser l’algorithme de décomposition dans une base
d’ondelettes.

• Complexité de l’algorithme : supposons que les filtres h et g sont de longueur


finie K (cas des ondelettes à support compact). Si aL est une suite de longueur
N = 2−L , alors les suites aj et dj sont de longueur 2−j pour L < j ≤ J. Les formules
de décomposition ci-dessus impliquent donc que aj+1 et dj+1 sont calculées avec au
plus 2−j K additions et multiplications, et les formules de reconstruction montrent
que aj est obtenue à partir de aj+1 et dj+1 avec au plus 2−j K opérations. Le coût de
la décomposition ou de la reconstruction de la suite aL dans une base d’ondelettes
orthogonales est donc en O(n).

• Signaux finis et ondelettes périodiques : supposons que le signal f est observé


sur [0, 1] et que l’on dispose d’un échantillon f ( Nk ), k = 0, . . . , N −1. Notons aL,k , k =
0, . . . , N −1 l’approximation de f dans l’espace VL obtenue à partir de cet échantillon.
Les formules de décomposition impliquent de connaı̂tre les valeurs de aL au delà des
53

bornes k = 0 et k = N − 1. Nous avons vu précédemment que la décomposition


dans une base d’ondelettes périodiques d’une fonction f ∈ L2 ([0, 1]) est équivalente
à la décomposition dans une base d’ondelettes de L2 (R) de la périodisation de f sur
R. Ainsi pour calculer les coefficients d’ondelettes de f dans une base d’ondelettes
périodiques de L2 ([0, 1]), il suffit de périodiser la suite aL,k , k = 0, . . . , N − 1 en
posant ãL,k = aL,k mod N .

3.3 Bases d’ondelettes pour des images


3.3.1 Bases d’ondelettes séparables et multirésolution en 2D
Une base d’ondelettes de L2 (R2 ) peut être construite à partir d’une base d’on-
delettes de L2 (R). Soient φ la fonction d’échelle et ψ la fonction d’ondelette d’une
AMR de L2 (R), et notons Vj et Wj les sous-espaces d’approximation et de détails
associés. Une analyse multirésolution séparable de L2 (R2 ) est définie à l’aide du
produit tensoriel des espaces d’approximation 1D
Vj2 = Vj ⊗ Vj
Les espaces Vj2 vérifient les propriétés de l’extension de la définition d’une AMR
de L2 (R) au cas des images (relation d’échelle, suite emboı̂tée, approximation...).
L’espace Vj2 est l’ensemble des fonctions f ∈ L2 (R2 ) qui s’écrivent comme des com-
binaisons linéaires de fonctions séparables 1D
X
f (x1 , x2 ) = ak hk (x1 )gk (x2 ) avec hk ∈ Vj , gk ∈ Vj .
k∈Z

L’ensemble de fonctions φ2j,k (x1 , x2 ) = φj,k1 (x1 )φj,k2 (x2 ) k=(k ,k )∈Z2 constitue

1 2
une base orthonormée de Vj2 obtenue en dilatant la fonction d’échelle φ2 (x1 , x2 ) =
φ(x1 )φ(x2 ) d’un facteur 2j et en la translatant sur une grille 2D de côté 2j .

• Approximation constante par morceaux : soient Vj l’espace des fonctions


de L2 (R) qui sont constantes sur les intervalles [2j k, 2j (k + 1)[, k ∈ Z. Une AMR
constituée de fonctions constantes par morceaux en 2D est alors construite à l’aide
des sous-espaces d’approximation Vj2 constitués des images constantes sur les carrés
[2j k1 , 2j (k1 + 1)[×[2j k2 , 2j (k2 + 1)[, (k1 , k2 ) ∈ Z2 .

2 2
Soit Wj+1 le complément orthogonal de Vj+1 dans Vj2 i.e.
M
Vj2 = Vj+1
2 2
Wj+1 .
Une base d’ondelettes orthogonales de Wj2 peut être construite en définissant trois
ondelettes
ψ 1 (x1 , x2 ) = φ(x1 )ψ(x2 )
ψ 2 (x1 , x2 ) = ψ(x1 )φ(x2 )
ψ 3 (x1 , x2 ) = ψ(x1 )ψ(x2 ).
54
 
p 1 p x1 −2j k1 x2 −2j k2
En posant pour 1 ≤ p ≤ 3 et k = (k1 , k2 ) ∈ Z2 , ψj,k (x) = 2j
ψ 2j
, 2j , on
1 2 3
montre que la famille d’ondelettes {ψj,k , ψj,k , ψj,k }k∈Z2 est une base orthogonale de
2 1 2 3
Wj et que {ψj,k , ψj,k , ψj,k }j∈Z,k∈Z2 est une base d’ondelettes orthogonales de L2 (R2 ).
Nous verrons par la suite que les coefficients d’ondelettes calculés avec
– ψ 1 sont larges le long des contours horizontaux,
– ψ 2 sont larges le long des contours verticaux,
– ψ 3 sont larges le long des contours diagonaux dans une image.

3.3.2 Algorithme rapide de transformée en ondelettes 2D


Les algorithmes de décomposition et de reconstruction pour une base d’ondelettes
de L2 (R) peuvent être étendus au cas des images pour construire des algorithmes
rapides de calculs des coefficients d’ondelettes en 2D. Pour j ∈ Z et k ∈ Z2 , on
définit les coefficients d’approximation et de détails en 2D pour f ∈ L2 (R2 ) par

aj,k = hf, φ2j,k i et dpj,k = hf, ψj,k


p
i, 1 ≤ p ≤ 3.

Soient (hk )k∈Z et (gk )k∈Z les filtres associés à l’ondelette ψ. On a alors les rela-
tions suivantes :

• Formule de décomposition : les coefficients d’approximation et de détails à


l’échelle 2j+1 sont obtenus à partir des coefficients d’approximation à l’échelle 2j à
l’aide de six groupes de convolutions discrètes uni-dimensionnelles combinées avec
des sous-echantillonnages d’un facteur 2 le long des colonnes et des lignes de l’image
aj

→colonnes ⋆h̄ ↓ 2 → aj+1
aj →lignes ⋆h̄ ↓ 2
→colonnes ⋆ḡ ↓ 2 → d1j+1

→colonnes ⋆h̄ ↓ 2 → d2j+1



aj →lignes ⋆ḡ ↓ 2
→colonnes ⋆ḡ ↓ 2 → d3j+1
• Formule de reconstruction : de même la reconstruction des coefficients d’on-
delettes à l’échelle 2j peut se faire à partir des coefficients d’échelles aj+1 et d’on-
delettes d1j+1 , d2j+1, d3j+1 à l’échelle 2j+1 . Cette reconstruction peut également s’ex-
primer à partir de six groupes de convolutions discrètes uni-dimensionnelles com-
binées avec des insertions de zéros le long des lignes et des colonnes des images
aj+1 , d1j+1, d2j+1, d3j+1
 
aj+1 →colonnes↑ 2 ⋆ h
⊕ →lignes↑ 2 ⋆ h 

d1j+1 →colonnes ↑ 2 ⋆ g



⊕ → aj
d2j+1

→colonnes ↑ 2 ⋆ h


⊕ →lignes ↑ 2 ⋆ g 

d3j+1 →colonnes↑ 2 ⋆ g

55

Soit f ∈ L2 (R) une image dont on connaı̂t une discrétisation de pas N −1 = 2L . La


projection de f dans l’espace VL peut être approximée par aL,k = N −1 f ( kN1 , kN2 ) pour
k = (k1 , k2 ) ∈ Z2 . La représentation de f dans une base d’ondelettes est calculée
en itérant la formule de décomposition ci-dessus pour obtenir pour L < j ≤ J
l’ensemble d’images :
{aJ , (d1j , d2j , d3j )L<j≤J }
• Cas des images de taille finie : supposons que l’on dispose d’une image carrée
aL de taille finie contenant N 2 = 2−2L pixels. Comme dans le cas uni-dimensionnels
la décomposition en ondelettes de aL peut être obtenue en utilisant des ondelettes
périodiques 1D ce qui revient à calculer à périodiser l’image aL dans R2 puis à utiliser
les formules de décomposition et reconstruction 2D ci-dessus. Pour L < j ≤ J, les
images aj , d1j , d2j et d3j sont constituées de 2−2j coefficients. Si les filtres h et g sont
de longueur finie, on peut vérifier que le coût des l’algorithmes de décomposition et
de reconstruction en ondelettes 2D est en 0(N 2 ).

3.3.3 Quelques exemples de décomposition en ondelettes


pour des images
• Approximation dans les espaces Vj : la Figure 3.6 donne un exemple de
projection d’une image de taille 256 × 256 dans plusieurs espaces d’approximation
Vj , j = −6, −5, −4 pour des ondelettes de Haar et des Symmlets avec r = 8 mo-
ments nuls. On peut constater que la qualité de l’approximation se dégrade plus
rapidement avec les ondelettes de Haar à mesure que l’échelle d’analyse augmente.
Dans les Figures 3.6(b-c-d) l’approximation est constituée d’images constantes par
morceaux sur des carrés de côté 2j , j = −6, −5, −4, alors que les approximations
obtenues avec des Symmlets représentées dans les Figures 3.6(e-f-g) sont nettement
plus lisses.

• Représentation des coefficients d’ondelettes en 2D : l’ensemble des coef-


ficients d’échelle et de détails en 2D est de même taille que le nombre de pixels
de l’image originale et peut se représenter sous la forme d’une image organisée de
façon hiérarchique (voir Figure 3.7) dont les pixels les plus noirs représentent les
coefficients de grande amplitude alors que les pixels blancs représentent les coeff-
ciients d’ondelettes les moins significatifs. La Figures 3.8 donne des exemples de
décomposition en ondelettes de trois images de taille 256 × 256 pixels. On peut
constater qu’aux petites échelles, les coefficients d’ondelettes de grande amplitude
se concentrent au voisinage des points où l’intensité des pixels des images change
rapidement. Ils correspondent soit aux contours horizontaux (d1j ), soit aux contours
verticaux (d2j ) ou soit aux contours diagonaux d’une image (d3j ).
56

(a)

(b) (c) (d)

(e) (f) (g)

Fig. 3.6 – (a) Image de Lenna, 256 × 256 pixels. Approximation avec des ondelettes
de Haar dans les espaces Vj : (b) j = −6, (c) j = −5, (d) j = −4. Approximation
avec des ondelettes Symmlets avec r = 8 moments nuls dans les espaces Vj : (e)
j = −6, (f) j = −5, (g) j = −4.

Insérer Figure

Fig. 3.7 – Représentation des coefficients de détails et d’échelle en 2D.


57

50 50

100 100

150 150

200 200

250 250
50 100 150 200 250 50 100 150 200 250

(a) (b)

50 50

100 100

150 150

200 200

250 250
50 100 150 200 250 50 100 150 200 250

(c) (d)

50 50

100 100

150 150

200 200

250 250
50 100 150 200 250 50 100 150 200 250

(e) (f)

Fig. 3.8 – Exemples de décomposition en ondelettes 2D pour des images de taille


256×256 pixels et j = −7, −6, −5. (a) Boite avec une croix, (b) Coefficients d’échelle
et de détails, ondelette Symmlet r = 4. (d) Lenna, (d) Coefficients d’échelle et de
détails, ondelette Coiflet r = 8. (e) Scan MRI, (f) Coefficients d’échelle et de détails,
ondelette Daubechies r = 2
58
Chapitre 4

Approximation, estimation et
compression dans des bases
d’ondelettes

Nous avons vu précédemment que la décroissance de l’amplitude de la TOC aux


fines échelles permet de caractériser la régularité globale ou locale d’un signal. De la
même façon, il est possible sous certaines hypothèses, de relier la décroissance des
coefficients dans une base d’ondelettes à la régularité d’un signal. Dans ce chapitre,
nous allons voir que cette propriété permet d’approximer un signal en gardant uni-
quement les coefficients d’ondelettes qui sont les plus significatifs. Cette propriété
d’approximation permet de représenter efficacement des signaux qui ne sont pas ho-
mogènes c’est à dire qui ne sont pas uniformément réguliers. Nous verrons également
que cette propriété a des conséquences importantes sur les qualités d’estimation et
de compression des bases d’ondelettes.

4.1 Propriétés d’approximation des bases d’onde-


lettes
4.1.1 Décroissance des coefficients d’ondelettes
Définition 4.1 Les espaces de Hölder C α (R) sont définis par :
– si 0 < α < 1, C α (R) = {f ∈ L∞ (R); supx∈R,h>0 |f (x+h)−f
|h|α
(x)|
< +∞}
n
– si α = n + α′ , avec 0 < α′ < 1, C α (R) = {f ∈ C n (R); ddxnf ∈ C α (R)

Définition 4.2 Les espaces de Hölder ponctuels C α ({x0 }) sont définis par :
– si 0 < α < 1, C α ({x0 }) = {f ∈ L∞ (R); suph>0 |f (x0 +h)−f
|h|α
(x0 )|
< +∞}
n
– si α = n + α , avec 0 < α < 1, C ({x0 }) = {f ∈ C ({x0 }); ddxnf ∈ C α ({x0 })
′ ′ α n ′

Théorème 4.1 Soit f ∈ C α (R) et ψ une ondelette r fois continûment différentiable


avec r moments nuls, associée à une AMR de L2 (R). Si r > α, on a alors l’équivalence

59
60

suivante

f ∈ C α (R) ⇔ |hf, ψj,k i| ≤ K2−j(α+1/2) pour tout (j, k) ∈ Z2 ,

et localement nous avons l’équivalence suivante

f ∈ C α ({x0 }) ⇔ |hf, ψj,k i| ≤ K2−j(α+1/2) (1 + |2j x0 − k|)α pour tout (j, k) ∈ Z2 ,

où K > 0 est une constante indépendante de j et k.

En pratique, de nombreux signaux analysés sont des fonctions régulières qui


présentent des singularités isolées (par exemple des fonctions C ∞ par morceaux).
Le théorème 4.1 montre alors que pour ce type de signaux de nombreux coefficients
d’ondelettes seront négligeables. Nous allons voir par la suite que les coefficients qui
sont les plus significatifs permettent une bonne reconstruction d’un signal.

4.1.2 Approximation linéaire de fonctions régulières


Il existe de nombreux espaces fonctionnels pour caractériser la régularité d’une
fonction. Le nombre de dérivées d’un signal permet en particulier de mesurer sa
régularité. Afin de caractériser la régularité des fonctions qui sont n − 1 fois contin-
ment dérivables mais par n fois, il est possible d’utiliser des espaces de Sobolev
d’ordre s > 0 notés W s (R) et qui sont tels que
Z +∞
s
f ∈ W (R) ⇔ |ω|2s|fˆ(ω)|2dω < +∞.
−∞

Si s > n + 1/2 alors on peut vérifier que si f ∈ W s (R) alors f est nécessairement
n fois continûment dérivable. Dans ce qui suit, nous allons étudier des fonctions
définies sur l’intervalle [0, 1]. L’espace de Sobolev W s ([0, 1]) est alors défini comme
l’ensemble des fonctions de L2 ([0, 1]) qu’on peut étendre en dehors de [0, 1] en des
fonctions de W s (R).

Nous avons vu précédemment qu’il est possible de construire des bases d’onde-
lettes orthogonales de L2 ([0, 1]). Afin de présenter les propriétés d’approximation des
ondelettes, nous supposerons que l’on dispose d’une AMR de L2 ([0, 1]) constituée de
2−j0 fonctions d’échelles {φj0 ,k }0≤k<2−j0 (avec 2−j0 > 1 et d’un ensemble de fonctions
ondelettes {ψj,k }−∞<j≤j0,0≤k<2−j . Nous supposerons de plus que les ondelettes ψj,k
possèdent r moments nuls (rappelons que la construction de telles ondelettes a été
proposée par Cohen et al). Notons que cette hypothèse exclue l’utilisation des onde-
lettes périodiques car dans ce cas les ondelettes aux bords de l’intervalle [0, 1] n’ont
pas de moments nuls. Les résultats indiqués dans la suite restent toutefois valable
avec des ondelettes périodiques si on impose que le support du signal analysé est
strictement inclus dans [0, 1] afin d’éviter la création de grands coefficients d’onde-
lettes aux bords dus à la périodisation du signal.
61

L’approximation de f sur les M = 2−J premières fonctions d’échelles et d’onde-


lettes (avec J < j0 ) est donnée par la projection orthogonale de f sur VJ :

2−j0 −1 j0 2 −1
−j
X X X
fM = PVJ f = hf, φj0,k iφj0 ,k + hf, ψj,k iψj,k .
k=0 j=J+1 k=0

L’erreur d’approximation linéaire correspond alors à l’énergie des coefficients


d’ondelettes aux échelles plus petites que 2−J :

J 2X−1 −j
X
2
ǫ(M) = kf − fM k = |hf, ψj,k i|2
j=−∞ k=0

Si 2−J < M < 2−J+1 n’est pas une puissance de deux, on choisit d’inclure
uniquement à l’échelle 2J les coefficients correspondant aux M − 2−J ondelettes
{ψJ,k }0≤k<M −2−J . Une mesure de l’erreur d’approximation linéaire en fonction de la
régularité du signal est alors donnée par le théorème suivant :

Théorème 4.2 Soit 0 < s < r un exposant de Sobolev où r est le nombre de
moments nuls de l’ondelette ψ. Alors, si f ∈ W s ([0, 1])

ǫ(M) = o(M −2s ).

Il s’agit d’un résultat classique pour l’erreur d’approximation linéaire de fonctions


régulières. Les mêmes taux d’erreur peuvent être obtenus à l’aide de séries de Fourier
ou bien avec des Splines.

4.1.3 Approximation linéaire de fonctions non-régulières


Supposons qu’une fonction de L2 ([0, 1]) possède une discontinuité en un point
x0 ∈]0, 1[. Alors, d’après les proprités des espaces de Sobolev, f ne peut pas appar-
tenir à W s ([0, 1]) pour s > 1/2, ce qui implique :

Théorème 4.3 Supposons qu’une fonction f ∈ L2 ([0, 1]) soit discontinue en un


point x0 ∈]0, 1[, alors pour α > 1 on ne peut pas avoir

ǫ(M) = O(M −α ).

Ce résultat nous montre que même si la fonction en très régulière à gauche et à


droite de x0 (par exemple C s ), l’erreur d’approximation se comporte au mieux en
O(M −1 ). Il s’agit d’un des inconvénients majeurs des techniques d’approximation
linéaire.
62

4.1.4 Approximation non-linéaire


Afin de simplifier les notations nous noterons φj0 ,k = ψj0 +1,k pour 0 ≤ k < 2−j0 .
L’approximation non-linéaire d’une fonction f ∈ L2 ([0, 1]) est obtenue à partir des
M plus grands coefficients d’ondelettes i.e.
X

fM = hf, ψj,k iψj,k ,
(j,k)∈IM

où IM représentent les indices des M coefficients d’ondelettes de plus grande am-
plitude |hf, ψj,k i|. Une approximation non-linéaire peut également être calculée à
partir d’une procédure de seuillage. Soit λ ≥ 0 et Tλ la fonction telle que :

x si |x| ≥ λ
Tλ (x) =
0 si |x| < λ

Si l’on choisi le seuil λ de sorte que pour tout (j, k) ∈ IM , |hf, ψj,k i| ≥ λ et pour
tout (j, k) ∈
/ IM , |hf, ψj,k i| < λ alors l’approximation non-linéaire de f peut s’écrire
comme
j0 +1 2−j −1
X X

fM = Tλ (hf, ψj,k i)ψj,k .
j=−∞ k=0

L’erreur d’approximation non-linéaire est définie par


X
ǫ∗ (M) = kf − fM∗ 2
k = |hf, ψj,k i|2
(j,k)∈I
/ M

Une mesure de l’erreur d’approximation non-linéaire pour certaines fonctions


non-régulières est alors donnée par le théorème suivant :
Théorème 4.4 Soit f ∈ L2 ([0, 1]) une fonction qui possède un nombre fini de dis-
continuités et qui est C s (ou uniformément Lipchitizienne d’ordre s) entre ces dis-
continuités. Si s < r où r est le nombre de moments nuls de l’ondelette ψ, alors

ǫ∗ (M) = o(M −2s )

Le théorème 4.4 montre que l’erreur d’approximation non-linéaire dépend de la


régularité uniforme de la fonction entre les discontinuités. Ainsi si s > 1/2, alors
l’erreur d’approximation non-linéaire ǫ∗ (M) décroit plus vite que l’erreur d’approxi-
mation linéaire ǫ(M) et ceci d’autant plus rapidement que s est grand. En effet,
en présence de discontuités ǫ(M) décroit au mieux en O(M −1 ). Une approximation
non-linéaire correspond à une approximation adaptative. Aux fines échelles, l’ap-
proximation se concentre sur les coefficients d’ondelettes de grande amplitude qui
sont localisés au voisinage des discontinuités du signal. Ceci permet une bonne re-
construction des parties irrégulières d’une fonction tout en conservant une bonne
qualité d’approximation des parties régulières du signal.
63

4.1.5 Quelques exemples d’approximation de fonctions


La figure 4.1 donne un exemple d’approximation linéaire et non-linéaire d’un
signal régulier par morceaux qui présentent deux discontinuités. On peut constater
que la qualité de la reconstruction des deux discontinuités du signal est bien meilleure
avec l’approximation non-linéaire. Le taux d’erreur relatif est également bien plus
petit pour une approximation non-linéaire.
4

−1

−2

−3

−4

−5

−6
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

(a)
6 4

4
2

1
2

0 −1

−2

−2
−3

−4
−4

−5

−6 −6
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

(b) (c)

Fig. 4.1 – (a) Signal f de taille n = 1024 régulier par morceaux présentant 2 dis-
continuités. Pour une ondelette Coiflet avec r = 6 : (b) approximation linéaire dans
l’espace Vj0 pour j0 = −5 i.e. M = 32, kf − fM k/kf k = 0.0537, (c) approximation

non-linéaire pour M = 32, kf − fM k/kf k = 0.0135

4.1.6 Approximation d’images


Dans le cas bi-dimensionnel, il est plus difficile de trouver des espaces fonction-
nels qui permettent de bien caractériser le comportement d’une image. Une image se
compose généralement de parties homogènes où l’intensité des pixels est pratique-
ment constante, de contours qui correspondent à des changement brusques d’inten-
sité entre deux zones homogènes, ainsi que de parties dites texturées dans lesquelles
l’intensité peut varier fortement et rapidement d’un pixel à un autre.

Nous ne présenterons pas les espaces fonctionnels utilisés pour modéliser les
images. Il est par contre important de noter que les bons résultats de l’approximation
64

non-linéaire obtenus dans le cas 1D ne peuvent pas s’étendre au cas 2D en utilisant


des produits tensoriels de bases d’ondelettes uni-dimensionnelles. En effet, supposons
que l’on ait construit une base d’ondelettes orthogonales adaptées à l’espace L2 (R2 ).
Si f est une image régulière sur deux morceaux qui sont séparés par un contour
Ω de longueur finie L > 0 (e.g. f = C 11Ω ) alors l’erreur d’approximation non-
linéaire ǫ∗ (M) d’ordre M (calculée comme dans le cas 1D à l’aide des M plus grands
coefficients d’ondelettes) est telle que

ǫ∗ (M) ∼ KM −1 ,

où K est une constante qui dépend du contour Ω.

Ainsi, contrairement au cas 1D, une approximation non-linéaire d’une image


dans une base d’ondelettes ne décroit pas en fonction de la régularité uniforme de
l’image sur chacun des morceaux. Il s’agit d’un des désavantages des bases d’on-
delettes en deux dimensions. Pour des images, il est nécessaire d’utiliser de nom-
breuses ondelettes pour représenter un contour ce qui explique la limitation de la
vitesse de convergence de ǫ∗ (M). La recherche de nouvelles réprésentations multi-
échelles qui sont adaptées à la géométrie des images fait actuellement l’objet de
nombreux travaux (Donoho [], Candes et Donoho [], Donoho et Huo [], Willet et
Nowak [], Le Pennec et Mallat [], Cohen et Matei [].) . Ceci permetterait d’améliorer
considérablement la qualité de l’approximation de fonctions en 2D ce qui aurait de
nombreux avantages en débruitage et compression d’images.

4.1.7 Quelques exemples d’approximation d’images


La figure 4.2 donne un exemple d’approximation linéaire et non-linéaire de l’image
du caméraman. On peut constater que la qualité de la reconstruction des contours
de l’image est bien meilleure avec l’approximation non-linéaire. Le taux d’erreur
relatif est également plus petit pour une approximation non-linéaire.

4.2 Débruitage de fonctions 1D


Le problème du débruitage de fonctions 1D peut se formuler comme un problème
de régression nonparamétrique en statistique. On suppose que l’on dispose de n = 2J
observations bruitées d’une fonction inconnue f ∈ L2 ([0, 1]) à des instants régulièrement
espacés ti = ni de l’intervalle [0, 1] :

yi = f (ti ) + σǫi , i = 1, . . . , n, (4.1)

où les ǫi sont des réalisations indépendantes et identiquement distribuées (i.i.d.)


de la loi normale de moyenne 0 et de variance 1 (N(0, 1)), et σ est un paramètre
qui représente le niveau de bruit (σ 2 correspond donc à la variance du bruit dans
ce modèle). L’équation (4.1) correspond au modèle standard de régression non-
paramétrique avec un bruit Gaussien. Il s’agit d’un modèle nonparamétrique car,
65

(a)

(b) (c)

Fig. 4.2 – (a) Image f du caméraman de taille n × n avec n = 256. Pour une
ondelette Symmlet avec r = 8 : (b) approximation linéaire dans l’espace Vj0 pour
j0 = −6 i.e. M = 4096, kf − fM k/kf k = 0.1354, (c) approximation non-linéaire

pour M = 4096, kf − fM k/kf k = 0.0620

comme nous allons le voir par la suite, aucune hypothèse restrictive n’est faite sur la
forme de la fonction f . Le but du débruitage de fonctions est de trouver un estima-
teur fˆ qui approche au mieux la fonction f . La qualité du débruitage est mesurée à
partir de l’erreur quadratique empirique :

n
1X ˆ
E= (f(ti ) − f (ti ))2 ,
n i=1

pour f appartenant à une certaine classe de fonctions (par exemple f ∈ W s ([0, 1])(M) =
{f ∈ L2 ([0, 1]), kf kW s ≤ M}, ou bien pour f appartenant à une classe de fonctions
plus irrégulières).

Rappelons que la décomposition en ondelettes d’une fonction f ∈ L2 ([0, 1]) dans


66

une base d’ondelettes périodiques s’écrit sous la forme


2−j0 −1 j0 2 −1
−j
X X X
f= hf, φ̃j0,k iφ̃j0,k + hf, ψ̃j,k iψ̃j,k .
k=0 j=−∞ k=0

Le calcul des coefficients d’échelle et des coefficients d’ondelette empiriques peut


s’exprimer à l’aide d’une matrice W de taille n × n dont les lignes correspondent à la
discrétisation des fonctions d’échelle et d’ondelette à différents niveaux de résolution.
Ainsi, si on note f = [f (t1 ), . . . , f (tn )] le vecteur des valeurs de f aux points du
design, les coefficients d’échelle et d’ondelette empiriques au niveau j0 sont donnés
par
d = W f,
où d = [(αj0 ,k )k=0,...,2−j0 −1 , (βj,k )j=−J+1,...,j0 ,k=0,...,2−j −1 ]. Rappelons toutefois qu’il
s’agit seulement d’une façon formelle d’écrire la transformée en ondelette empirique
car en pratique on utilise l’algorithme pyramidal en O(n) et non pas un produit
matriciel (coût en O(n2 )). De plus, nous avons vu précédemment que :
√ √
αj0 ,k ≈ nhf, φ̃j0,k i et βj,k ≈ nhf, ψ̃j,k i.
On peut montrer que W est une matrice orthogonale i.e. W t W = In ce qui implique
que la transformée en ondelette inverse peut s’exprimer comme
f = W t d.
La matrice W étant une matrice orthogonale, on peut montrer que la transformée
en ondelette d’un vecteur Gaussien est à nouveau un vecteur Gaussien de même
moyenne et de même matrice de covariance. Ainsi, les coefficients d’échelle et d’on-
delette bruités peuvent s’écrire comme (avec y = [y1 , . . . , yn ]) :
d̃ = W y,
avec
α̃j0 ,k = αj0 ,k + σzj0 ,k , k = 0, . . . , 2−j0 − 1
β̃j,k = βj,k + σzj,k , j = −J + 1, . . . , j0 , k = 0, . . . , 2j − 1,
où les zj,k sont des variables aléatoires i.i.d. N(0, 1).

Nous avons vu précédemment que pour des fonctions qui sont régulières par
morceaux, la plupart des coefficients d’ondelette sont nuls aux fines échelles, et que
les coefficients d’ondelette de grande amplitude se concentrent aux voisinages des
éventuelles singularités du signal. Aux fines échelles, les coefficients d’ondelette d’une
fonction bruitée correspondent donc principalement au bruit et seuls quelques co-
efficients correspondent effectivement au signal. Le débruitage par ondelette d’une
fonction est donc obtenu par une procédure de seuillage des coefficients d’ondelettes
bruités pour un seuil λ ≥ 0 bien choisi. On distingue en particulier
67

– le seuillage dur (Hard Thresholding) :



H 0 si |β̃j,k | ≤ λ
δλ (β̃j,k ) =
β̃j,k si |β̃j,k | > λ

– le seuillage doux (Soft Thresholding) :



 0 si |β̃j,k | ≤ λ
δλS (β̃j,k ) = β̃j,k − λ si β̃j,k > λ
β̃j,k + λ si β̃j,k < −λ

En général, on choisit de ne pas modifier les coefficients d’échelles α̃j0 ,k car ceux-
ci sont très peu influencés par le bruit et correspondent au comportement du signal
aux basses fréquences. Prendre j0 = −2 ou j0 = −3 donne généralement de bons
résultats. L’estimation de f est alors donnée par
2−j0 −1 j0 2X −1 −j
α̃j0 ,k δλ (β̃j,k )
fˆλ =
X X
√ φ̃j0,k + √ ψ̃j,k .
k=0
n j=−J+1 k=0
n

Au point du design, on calcule l’estimation de f selon le schéma suivant :

y F
−−W
−→T {α̃j0 ,k , β̃j,k } Seuillage {α̃j0 ,k , δλ (β̃j,k )} IW T
−−−→ f̂λ
−−−−−−→
Il a été développé de nombreuses techniques pour déterminer un seuil λ optimal.
L’un des méthodes les plus utilisées, car très simple à implémenter, consiste à choisir
le seuillage universel : p
λ = σ̂ 2 log n,
où σ̂ est une estimation du niveau du bruit à partir des coefficients d’ondelettes à
l’échelle la plus fine :

median({|β̃−J+1,k |, k = 0, . . . , 2−J+1 − 1})


σ̂ = .
0.6745
La Figure 4.3 donne un exemple de débruitage par ondelettes avec un seuillage
dur universel. On peut constater que la procédure de seuillage conserve uniquement
les coefficients significatifs du signal bruité.

4.3 Compression d’images


Nous présentons ici quelques principes de la compression d’images. Une présentation
détaillée du problème de la compression de signaux dépasse très largement le cadre
de ce cours. Les méthodes de compression des images par ondelettes sont basées sur
le fait que les décompositions en ondelettes permettent des représentations creuses
des images (c’est à dire avec peu de coefficients). C’est l’une des raisons qui explique
le succès du nouveau standard de compression d’images JPEG2000 qui est basé sur
68
4 −2

−3
2

1
−4

−1 −5

−2

−6
−3

−4
−7

−5

−6 −8
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

(a) (b)
6 −2

4
−3

2
−4

−5

−2

−6
−4

−7
−6

−8 −8
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

(c) (d)
4 −2

2 −3

0 −4

−2 −5

−4 −6

−6 −7

−8 −8
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

(e) (f)

Fig. 4.3 – (a), (b) Signal HeaviSine et ses coefficients d’ondelette (Symmlet, r = 8,
n = 256, j0 = −3), (c), (d) Signal bruité et coefficients d’ondelette bruités, (e), (f)
estimation du signal par seuillage dur et coefficients d’ondelette seuillés

des décompositions dans des bases d’ondelettes.

Supposons que l’on dispose d’une image f de taille N × N. Le principice de la


compression de signaux est de décomposer cette image dans une base orthonormée de
fonctions gm (x), m = 0, . . . , N 2 −1 (qui ne sont pas nécessairement des ondelettes) :
N 2 −1
X
f (x) = fm gm (x), avec fm = hf, gm i
m=0

Afin de pouvoir stocker la valeur des coefficients fm , il est nécessaire d’introduire


une fontion de quantification notée Q qui a tout x ∈ R associe un élement Q(x)
69

dans un ensemble de cardinal fini X = {x1 , . . . , xK }. La reconstruction de l’image


est alors définie par
N 2 −1

f˜(x) =
X
Q(fm )gm (x)
m=0

et l’erreur (ou taux de distorsion) qui est introduite par cette quantification est
mesurée par
N 2 −1
X
d(f ) = (fm − Q(fm ))2 .
m=0
Afin de déterminer une fonction Q qui soit bien adaptée aux données, on peut
2
utiliser la méthode suivante : soit
R p(x) l’histogramme des N coefficients fm . Il s’agit
d’une densité de probabilité ( p(x)dx = 1) qui permet de connaı̂tre la répartition
des coeffcients fm . En particulier,
R y on peut définir la proportion de coefficients dans
l’intervalle [yk , yk+1[ par pk = ykk+1 p(x)dx, où [yk , yk+1[, k = 1, . . . , K correspond à
une partition du support [a, b] de p(x). On définit alors le codage par
1
Q(x) = xk = (yk + yk+1) si x ∈ [yk , yk+1[.
2
Chaque quantité xk est ensuité codée par lk bits, et le nombre total R de bits
nécessaires pour coder l’image est donné par
K
X
R = N2 pk lk .
k=1

Un codage de taille constante correspond à : lk = log2 (K) et dans ce cas R =


N 2 log2 (K). Le nombre minimal de bits est minoré par l’entropie de Shanon qui
correspond au choix lk = − log2 (pk ) :
K
X
2
R ≥ −N pk log2 (pk ).
k=1

Le problème de la compression d’image est de déterminer une quantification op-


timale Q qui minimise l’erreur d(f ) lorque l’on se fixe un nombre de bits par pixels
R̄ = R/N 2 . Le choix de Q dépend de la forme de l’histogramme p(x). Si p(x) est
approximativement constant sur les intervalles [yk , yk+1 [, alors on peut montrer que
le quantificateur optimal est donné par [yk , yk+1[= ∆ = b−aK
, k = 1, . . . , K : il s’agit
du quantificateur uniforme.

Par contre si l’on choisit une base de fonctions gm (x) de sorte que de nombreux
coefficients fm sont nuls (par exemple une base d’ondelettes), alors on ne peut plus
considérer que p(x) est constant au voisinage de zéro, et le quantificateur uniforme
n’est plus optimal, en particulier si R̄ est petit. Il faut donc distinguer les coefficients
significatifs de ceux que l’on peut considérer comme négligeagles pour pouvoir obte-
nir une bonne compression. Soit λ un seuil bien choisi et M le nombre de coefficients
70

tels que |fm | > λ. Soit R0 le nombre de bits nécessaires pour coder la position de
ces coefficients significatifs et R1 le nombre de bits nécessaires pour coder la valeur
de ces coefficients. Le nombre total de bits pour coder l’image est alors donné par
R = R0 + R1 . Le taux de distorsion est égal à
X X
d(f ) = |fm |2 + (fm − Q(fm ))2
|fm |<λ |fm |≥λ

Il est alors possible de déterminer une quantification optimale en fonction de la


décroissance en module des plus grands coefficients fm (voir [7] pour plus de détails).

4.4 Problèmes inverses


Lorsqu’un signal ou une image n’est pas directement mesurable, il est courant
de procéder à l’observation d’autres quantités qui sont reliées à la fonction que l’on
voudrait estimer. Le principe d’un problème inverse est la recherche d’une méthode
pour inverser le processus que l’on observe afin de retrouver le signal ou l’image
d’intérêt. Il existe de nombreuses applications qui peuvent se modéliser comme un
problème inverse : tomographie, déconvolution d’image, estimation de la dérivée
d’une fonction...

Formellement, un problème inverse peut se formuler à l’aide d’un opérateur K


qui représente le processus que l’on voudrait inverser et où les données qu’on observe
sont de la forme
g = Kf + ǫ,
où f est le signal ou l’image que l’on voudrait estimer et ǫ représente un bruit de me-
sure. Par exemple si l’on suppose que l’on se place dans un modèle de régression non-
paramétrique, le problème de l’estimation de la dérivée d’une fonctionR peut s’écrire
t
sous la forme (dans ce cas, K est l’opérateur d’intégration : Kf (t) = 0 f (u)du) :
Z ti
gi = f (u)du + ǫi , i = 1, . . . , n.
0

Dans la plupart des applications, le problème est mal-posé dans le sens où il n’est
pas possible d’estimer f en inversant directement l’opérateur K. En effet, l’opérateur
inverse K −1 n’est en général pas borné ce qui entraı̂ne une amplification du bruit et
implique que l’estimateur fˆ = K −1 ĝ n’est pas une bonne estimation de f .

Lorque les fonctions que l’on souhaite estimer sont irrégulières (ce qui est le cas
des images par exemple), les ondelettes sont un outil bien adapté pour estimer la
fonction f . L’estimation est basée sur une décomposition temps-échelle des observa-
tions g, puis sur un seuillage bien adapté des coefficients et une méthode d’inversion
à base d’ondelettes (qui prend en compte l’amplification du bruit par le processus
d’inversion). Le lecteur intéressé pourra consulter [7], pour de plus amples détails.
Bibliographie

[1] Antoniadis, A. et Oppenheim, G. (Eds.) (1995) Wavelets and Statistics, Lect.


Notes Statist., New York : Springer-Verlag.
[2] Aldroudi, A. et Unser, M. (1996) Wavelets in Medecine and Biologoy, CRC
Press.
[3] Abry, P. (1997) Ondelettes et turbulences, Nouveaux essais, arts et sciences,
Diderot.
[4] Cohen, A. (2003) Numerical Analysis of Wavelet Methods, Studies in Mathe-
matics and Its Applications, V. 32, Elsevier.
[5] Daubechies, I. (1992) Ten lectures on Wavelets, SIAM, Philadelphia.
[6] Gasquet, C. et Witomski, P. (2000) Analyse de Fourier et applications. Filtrage,
calcul numérique et ondelettes, Dunod.
[7] Mallat, S. (1998). A Wavelet Tour of Signal Processing, Academic Press.
[8] Mallat, S. (2000). Une exploration des signaux en ondelettes, Les Editions de
l’Ecole Polytechnique.
[9] Torrésani, B. (1995). Analyse continue par ondelettes , Savoir actuels - In-
teréditions/CNRS éditions.

71

Vous aimerez peut-être aussi