Soulard RFIA 2010 Revu Soumis

Ondelettes quaternioniques pour la classication de textures
Raphal Soulard Philippe Carr

Laboratoire Xlim-SIC - CNRS UMR 6172, Universit de Poitiers
Bt. SP2MI, Tlport 2, Bvd. Marie et Pierre Curie BP 30179,
86962 Futuroscope Chasseneuil Cedex
e-mail : {soulard,carre}@sic.univ-poitiers.fr
Rsum
Cet article propose un nouveau classieur de textures bas
sur la transforme en ondelettes quaternionique (QWT).
Cette rcente transforme spare les informations conte-
nues dans une image plus efcacement quune transfor-
me en ondelettes classique (DWT), et fournit une analyse
multi-chelles dont les coefcients sont 2D analytiques,
avec une amplitude presque invariante par translation et
une phase, compose de trois angles. Linterprtation et
lutilisation des coefcients QWT, en particulier la phase,
sont traites, et nous prsentons un classieur de textures
qui utilise la fois lamplitude et la phase. Grce la QWT,
nous obtenons de meilleures performances de classication
quavec la DWT.
Mots Clef
Transforme en ondelettes quaternionique, Phase 2D, Ana-
lyse de texture, Classication.
Abstract
This paper proposes a new texture classier based on the
Quaternionic Wavelet Transform (QWT). This recent trans-
form separates the informations contained in the image
better than a classical wavelet transform (DWT), and pro-
vides a multiscale image analysis which coefcients are
2D analytic, with one near-shift invariant magnitude and
a phase, that is made of three angles. The interpretation
and use of the QWT coefcients, especially the phase, are
discussed, and we present a texture classier using both the
QWT magnitude and the QWT phase of images. Our clas-
sier performs a better recognition rate than a standard
wavelet based classier.
Keywords
Quaternionic Wavelet Transform, 2D Phase, Texture ana-
lysis, Image classication.
Travail ralis dans le cadre du projet ANR RESEAUX DU FUTUR

ET SERVICES - CAIMAN / Codage Avanc dIMAges et Nouveaux ser-
vices.
1 Introduction
La classication de textures consiste associer automati-
quement une image texturale donne la classe de textures
laquelle elle appartient, le plus vraisemblablement. Pour
cel, on dispose dun ensemble de classes prdnies par
des exemples dimages, classes par lutilisateur. La texture
na pas vraiment de dnition universelle, mais on peut
prsenter ce type dimage avec des exemples classiques
comme des photos de goudron, surface deau, sable, cano-
pe dune fort, vue arienne dune ville . . . On saccorde
souvent qualier les textures duniformes, et les voir
comme une rptition dun motif.
Une classe est un type de texture, selon une classication
arbitraire que nous faisons instinctivement.
En traitement dimages, la reconnaissance de textures a
beaucoup t traite [1], nous dveloppons ici une ap-
proche base sur les ondelettes quaternioniques.
Ce travail ne vise pas directement la dnition dun classi-
eur performant, mais plutt un premier pas innovant dans
la mise en pratique dune nouvelle transforme. Dune part,
la transforme en ondelettes quaternionique (QWT), qui
est le centre de notre tude, a dencourageantes proprits
thoriques ; dautre part, lanalyse de textures est une des
applications reconnues de la reprsentation par ondelettes.
Cest pourquoi nous proposons dtudier le positionnement
de la QWT par rapport la transforme en ondelettes clas-
sique, dans un contexte de classication de texture. De ce
fait, dans le cadre de cet article, nous nous concentrons uni-
quement sur les classieurs bass ondelettes.
Outre la proposition dun nouveau classieur de textures,
ce travail est une application de la QWT qui notre
connaissance na pas encore t faite. Cela permet de
concrtiser la faon dutiliser les coefcients quaternio-
niques dune telle reprsentation.
2 Ondelettes Quaternioniques
2.1 DWT
La transforme en ondelettes classique (DWT) fournit une
analyse espace-chelle dune image, dans une matrice dont
chaque coefcient correspond une sous-bande (zone du
h
a
l
-
0
0
4
6
2
9
6
1
,

v
e
r
s
i
o
n

1

-

1
1

M
a
r

2
0
1
0
Manuscrit auteur, publi dans "17me Congrs Francophone de Reconnaissance des Formes et Intelligence Artificielle
(RFIA'10), Caen : France (2010)"
domaine de Fourier) et une position dans limage.
Une sous-bande traduit une chelle doscillation (i.e. une
bande de frquence 1D) ainsi quune orientation spatiale
(i.e. plutt vertical, horizontal ou diagonal). Elle est co-
de par une fonction atomique 2D appele ondelette, qui
est une sorte dimpulsion oscillante localise et oriente.
Chaque coefcient est calcul par un produit scalaire entre
une ondelette translate et limage, et donc reprsente la
prsence dune composante locale dans limage, une po-
sition, pour une sous-bande.
Par la transforme en ondelettes, limage est exprime dans
une base orthogonale datomes 2D, forme par des dilata-
tions et translations dune fonction dchelle et de trois
ondelettes (
D
,
V
,
H
) exprimes en fonction dune fonc-
tion dchelle 1D
1
et dune ondelette
1
comme suit :
D
=
1
(x)
1
(y)
V
=
1
(x)
1
(y)
H
=
1
(x)
1
(y)
=
1
(x)
1
(y)
En pratique, les produits scalaires sont raliss par ltrages
(convolutions) de limage par les 4 atomes de base, com-
bins avec des r-chantillonnages, qui traduisent la dilata-
tion de ces atomes.
2.2 QWT
La transforme en ondelettes quaternionique (QWT) [3] est
une amlioration de la DWT, qui fournit une analyse plus
riche pour les signaux 2D. Contrairement la DWT, elle est
presque invariante par translation, et ses coefcients sont
exprims en termes damplitude et de phase, la manire
des coefcients dune transforme de Fourier.
Elle se base sur la transforme de Fourier quaternionique
(QFT), et sur la phase locale quaternionique de T. B-
low[4], qui tendent la dimension 2 les outils bien connus
de traitement du signal, par une gnralisation dans lal-
gbre des quaternions H. Selon Blow, cette algbre plus
gnrale est plus adapte que C pour manipuler des si-
gnaux 2D.
Un quaternion est la gnralisation dun nombre complexe,
possdant trois parties imaginaires codes sur les nombres
imaginaires i, j, k. On lcrit en reprsentation cartsienne
q = a+bi +cj +dk, et son criture polaire est, de manire
analogue lexponentiele complexe, q = |q|e
i
e
j
e
k
. Il
est donc dni par un module, et un argument qui contient
trois angles. Largument quaternionique nous donne accs
la phase des signaux 2D.
Phase locale du signal. La phase locale dun signal 1D
est connue pour tre extraite par la transforme de Hilbert
(HT) et largument des nombres complexes (voir signal
analytique). Blow remarque quelle permet de dcrire ef-
cacement la forme des signaux 1D, cest pourquoi il cre
la phase quaternionique [4], associ une fonction 2D, d-
nie laide des transformes de Hilbert (HT) partielles
(H
1
, H
2
) et totale (H
T
) qui forment le signal quaternio-
nique analytique [3] :
f
A
(x,y) = f(x,y) +iH
1
f(x,y) +jH
2
f(x,y) +kH
T
f(x,y)
Largument quaternionique de ce genre de signal repr-
sente la phase quaternionique de f, qui dcrit ses structures
locales en tout point.
Intgration dans les ondelettes. La QWT intgre la no-
tion de phase dans une dcomposition en ondelettes. D-
nie partir dune ondelette mre quaternionique analy-
tique, la QWT fournit en sortie des coefcients quaternio-
niques dont la phase dcrit prcisment les structures co-
des. La puissance de description de limage dj appor-
te par la dcomposition en sous-bandes, est alors compl-
te par une description encore plus ne grce la phase.
Chaque sous-bande de la QWT peut tre vue comme le
signal analytique associ une partie bande-troite
1
de
limage.
On gardera les termes amplitude locale (module) et phase
locale (argument), du signal analytique 1D. Lamplitude
dun coefcient quantie la prsence dune composante lo-
cale 2D, et sa phase, reprsente par trois angles, en consti-
tue une description complte.
Lamplitude dun coefcient QWT |q|, invariante par trans-
lation de limage, quantie la prsence dune composante,
toute position spatiale, dans chaque sous-bande frquen-
tielle. La phase, reprsente par trois angles (, , ),
constitue une description complte de la structure de ces
composantes. Nous traitons plus bas linterprtation de
cette phase.
Implantation. Dun point de vue pratique, si londelette
mre est sparable i.e. (x,y) =
h
(x)
h
(y) (cest notre
cas), alors les HT 2D sont quivalentes des HT 1D le long
des lignes et des colonnes de limage. Donc, en considrant
les paires de Hilbert
(
h
,
g
= H
h
) (dondelettes) et (
h
,
g
= H
h
) (de
fonctions dchelles), londelette 2D analytique scrit en
termes de produits sparables.
D
=
h
(x)
h
(y)+i
g
(x)
h
(y)+j
h
(x)
g
(y)+k
g
(x)
g
(y)
V
=
h
(x)
h
(y)+i
g
(x)
h
(y)+j
h
(x)
g
(y)+k
g
(x)
g
(y)
H
=
h
(x)
h
(y)+i
g
(x)
h
(y)+j
h
(x)
g
(y)+k
g
(x)
g
(y)
=
h
(x)
h
(y)+i
g
(x)
h
(y)+j
h
(x)
g
(y)+k
g
(x)
g
(y)
Cela signie quune telle dcomposition est trs dpen-
dante de lorientation de limage dans le repre (x, y) (va-
riance par rotation), et que londelette nest pas isotropique.
Lavantage de la QWT est dans sa facilit dimplantation
par des bancs de ltres sparables, et dans sa notion de
phase.
La QWT utilise lalgorithme du Dual-Tree [5], un banc
de ltres qui utilise une paire de Hilbert comme ondelette
mre complexe 1D. Il fournit des coefcients analytiques,
1. Le signal analytique 1D offre une analyse instantane en consid-
rant toute la bande du spectre frquentiel. En pratique, les caractristiques
locales (instantanes) sont donc interprtables seulement si le signal
analyser est bande troite.
h
a
l
-
0
0
4
6
2
9
6
1
,

v
e
r
s
i
o
n

1

-

1
1

M
a
r

2
0
1
0
1 8 10 14 15 16 17
FIGURE 1 Exemples dimages de la base Outex [2] (srie TC-00012).
dont le module est invariant par translation, pour une re-
dondance de seulement 4 :1.
Deux bancs de ltres complmentaires, lun utilisant un
ltre pair, lautre un ltre impair, mnent quatre bancs
de ltres 2D sparables, lgrement dcals les uns par
rapport aux autres. Ces dcalages correspondent thorique-
ment aux dphasages des transformes de Hilbert 2D vo-
ques plus haut. On obtient une prcision sous-pixellique,
traduite indirectement dans la notion de phase.
Au dpart combines par Kingsbury [5] pour implanter
deux dcompositions complexes (6 sous-bandes orientes),
les quatre sorties du Dual-Tree constituent ici les compo-
santes cartsiennes dune sortie quaternionique. Lalgbre
des quaternions H donne alors accs la reprsentation
module/argument qui nous permet de reprsenter spar-
ment la prsence des composantes locales dans limage
(amplitude), et leurs structures (phase).
Notons que le Dual-Tree ralise une approximation, qui
rend les coefcients de la QWT approximativement analy-
tiques, et donc lextraction des amplitudes et phases 2D lo-
cales, ainsi que leur interprtation, sont en ralit approxi-
matives.
3 Classication de textures
3.1 Utilisation des ondelettes
Lextraction de caractristiques par la reprsentation en
ondelettes standard (DWT) a souvent t utilise en tant
quapproche Traitement du Signal vers lanalyse de tex-
tures. Il semble que lanalyse multi-chelle de la DWT
soit bien adapte aux images texturales. A partir de chaque
sous-bande, on calcule une moyenne, un ecart-type, lner-
gie totale, la puissance moyenne . . . En combinant correc-
tement ces caractristiques, on constitue un vecteur des-
cripteur exprimentalement propice bien caractriser la
texture.
Rcemment, Celik et Tjahjadi [6] ont utilis le Dual-Tree
CWT, pour son module (presque) invariant par transla-
tion et son aspect orient. Le descripteur extrait a per-
mis dobtenir de meilleurs rsultats quavec les ondelettes
classiques.
Linvariance par translation du module assure que les ca-
ractristiques extraites sont indpendantes de la position
prcise des motifs texturaux, et donc permet une meilleure
caractrisation.
Nous proposons dutiliser la QWT, qui a aussi un module
invariant par translation, et nous tendons lanalyse en uti-
lisant la phase QWT.
Pour calculer la QWT, nous reprenons lalgorithme dcrit
dans [3], et pour les comparaisons, une transforme en on-
delettes classique avec les clbres ltres CDF 9/7
2
.
En dcomposant sur 3 niveaux de profondeur, on obtient
9 sous-bandes danalyse, ainsi quune sous-bande basses-
frquences (BF). Notons que la sous-bande BF ne sera pas
utilise car elle nest pas intressante, a priori, pour lana-
lyse de textures. En effet, on saccorde considrer que des
structures presque constantes comme des composantes BF,
ne sont pas constituantes de ce quon appelle des textures.
3.2 Le classieur k-ppv
Nous proposons un simple classieur dit k plus proches
voisins (k-ppv). A partir de chaque image dun ensemble
dapprentissage, on extrait un descripteur qui caractrise
la texture, et on ltiquette avec le numro rel de sa classe.
Quand une image test est donne, son descripteur est cal-
cul et compar avec ceux de lensemble dapprentissage,
en terme de distance euclidienne. Selon un paramtre k, les
k vecteurs les plus proches sont conservs pour trouver la
classe la plus reprsentative, cest--dire celle qui a le plus
grand effectif parmi les k voisins.
Nous avons choisi cette mthode de classication pour
sa simplicit. Nanmoins, nous devons utiliser une base
dimages consquente pour les exprimentations, et nous
avons choisi la base Outex [2].
3.3 Les textures de la base Outex [2]
Pour tous nos tests, nous utilisons la srie TC-00012 de
la base Outex, cre par luniversit de Oulu, Finlande,
et disponible sur Internet [2]. Elle contient 24 classes de
textures, chacune contenant 380 individus. Dans chaque
classe de cette base, on retrouve diffrentes images dun
mme type de texture, sous diffrentes orientations et diff-
rentes luminosits. Des exemples de textures de cette base
sont montrs gure 1, et illustrent bien sa diversit.
Pour nos tests, nous sparons les textures de chaque classe
en deux groupes suivant un protocole de validation croise :
Lensemble de test : 350 exemples que le programme ne
connait pas,
Lensemble dapprentissage : 30 exemples tiquets que
le programme peut consulter.
2. On considre souvent quune bonne sparation des composantes
frquentielles est bien adapte lanalyse de textures, et les ltres CDF
9/7 sont connus pour offrir particulirement cette proprit. A noter que
les ltres danalyse utiliss sont de mme taille (9 coefcients) pour les
deux dcompositions : DWT et QWT.
h
a
l
-
0
0
4
6
2
9
6
1
,

v
e
r
s
i
o
n

1

-

1
1

M
a
r

2
0
1
0
3.4 Performance de la classication
Le programme k-ppv a en entre une image inconnue, et
en sortie un indice de classe, qui correspond vraisembla-
blement la classe de limage inconnue.
On donne au programme chaque image de lensemble de
test, et on compte le nombre de fois o il dcide la bonne
classe, ce qui permet de calculer un taux de reconnaissance
pour chaque classe.
Pour quantier la qualit de notre classication, nous tu-
dions son taux de reconnaissance par classe, par une tech-
nique de validation croise. Plus prcisment, pour cha-
cune des 24 classes de la base, on slectionne alatoire-
ment 30 individus pour constituer lensemble dapprentis-
sage, les 350 autres restant inconnus. Lalgorithme des k-
ppv est lanc sur les inconnus, et on calcule le pourcentage
dimages bien classes sur les 350. On obtient 24 taux de
reconnaissance.
Cette simulation est itre 100 fois, en prenant toujours un
ensemble dapprentissage alatoire, de manire tudier la
variabilit des taux de reconnaissance estims. On obtient
pour chaque classe, un taux de reconnaissance moyen, et
un ecart-type de ce taux, qui reprsentera lincertitude sur
son estimation.
Cette valuation de la classication doit se faire pour
chaque descripteur envisag, et tmoigne directement de
la qualit du descripteur.
Dans la suite, nous allons dabord prsenter une extraction
classique du descripteur, base sur le module des coef-
cients dondelette, pour comparer les deux transformes
DWT et QWT. Puis une approche phase est dveloppe,
et la combinaison du module et de la phase est traite, pour
prsenter le classieur nal.
4 Utilisation du module QWT
Dans la plupart des applications de la littrature, les classi-
cations de textures bases ondelettes utilisent une mesure
globale dnergie ou des mesures statistiques sur le mo-
dule. Dans un premier temps, nous avons donc compar
les performances de la DWT et de la QWT en faisant des
mesures sur leur module.
4.1 Extraction du descripteur
Aprs avoir calcul le module M
ij
= |q
ij
| de la transfor-
me en ondelettes dune image donne (i et j sont les coor-
donnes discrtes dun pixel), on considre deux mesures
pour chaque sous-bande.
Lnergie :
m =
1
E
i,j
M
2
ij
o E est lnergie totale de limage moins celle de la sous-
bande basses-frquences. Cette normalisation fait de m la
quantit relative dnergie dans une sous-bande par rapport
aux autres.
Lcart-type :
m =
1
N
i,j
(M
ij
)
2
o N est le nombre de pixels dans la sous-bande, et la
moyenne.
4.2 Rsultats
Nous avons obtenu diffrents rsultats, en fonction du ni-
veau de profondeur de dcomposition considr (1, 2 ou/et
3), du type de mesure, et de la valeur de k. Exprimentale-
ment, les meilleurs rsultats sont donns en utilisant les 3
niveaux et k = 3.
Une grande valeur de k est pnalisante en terme de cot
algoritmique. En revanche, un k trs petit comme 1 ou 2
donne une estimation statistique trs pauvre de la classe
reprsente en un point de lensemble, et on ne peut pas
vraiment parler deffectif de chaque classe parmi 1 ou 2
voisins.
Exprimentalement, les courbes de taux de reconnaissance
en fonction de k sont quasiment monotones pour k > 3,
et les meilleurs rsultats sont obtenus pour k = 3. Pour
la suite, nous garderons ce paramtre xe, en considrant
que lanalyse des rsultats nen ptit pas. En effet, le choix
de k na pas vraiment de consquence sur les rsultats, car
une valeur un peu diffrente donnerait des rsultats sem-
blables, dus la monotonie observe des courbes de recon-
naissance.
Les rsultats de validation croise sont presque identiques
pour lnergie et lcart-type. Nous choisissons arbitraire-
ment, pour la suite, de garder la mesure dcart-type. Nous
prsentons gure 4 les rsultats avec les trois niveaux de
profondeur (vecteur de taille 9) et k = 3. Notons que ces
rsultats sont corrects, et conrment que lanalyse des tex-
tures par ondelettes est une bonne mthode. De plus, ils
valident la QWT comme tant au moins aussi efcace que
la DWT, lorsquon se restreint utiliser seulement son mo-
dule.
4.3 Analyse des rsultats
Observons la gure 2 qui montre quelques images repr-
sentatives, ainsi que leurs spectres QFT
3
.
Avec les taux de reconnaissance par classe, on peut compa-
rer la qualit danalyse de certaines textures particulires.
Nous illustrons les classes pour lesquelles la diffrence de
taux de reconnaissance est la plus grande entre la DWT et
la QWT. On espre donc mettre en valeur certains types de
textures plus ou moins propices tre analyses par lune
ou lautre. Aprs observation, on constate que des conclu-
sions ventuelles par rapport au type de texture, ne sont pas
immdiates.
On remarque que les textures 14 et 15 sont beaucoup mieux
reconnues par la QWT (environ +20% de russite). En re-
vanche, la DWT reconnait mieux la texture 13.
3. Un spectre QFT peut se lire de la mme manire quun spectre de
Fourier classique.
h
a
l
-
0
0
4
6
2
9
6
1
,

v
e
r
s
i
o
n

1

-

1
1

M
a
r

2
0
1
0
Le module DWT est meilleur pour : Le module QWT est meilleur pour :
Texture 13 : 87% vs 62% Texture 14 : 78% vs 93% Texture 15 : 46% vs 65%
FIGURE 2 Textures particulires mieux reconnues, soit par la DWT, soit par la QWT, avec la mesure dcart-type sur le
module. Les taux de reconnaissance moyens sont indiqus en pourcentage. On afche ct de chaque texture, le module de
sa QFT dont le contraste a t renforc pour une meilleure lisiblit.
Pour conclure sur lanalyse base module, la QWT et la
DWT ont des performances similaires, et la QWT permet
damliorer la reconnaissance de la texture 15 qui posait
problme avec la DWT. Les rsultats suprieurs de la QWT
sur certaines textures, sont certainement ds, en partie,
linvariance par translation du module. Mais le travail de
Blow [4] et Chan et al. [3] montre que la phase QWT
peut fournir une puissante analyse des images, donc la
QWT nest pas compltement exploite ici. Nous propo-
sons maintenant une extraction du descripteur utilisant des
mesures sur la phase QWT.
5 Utilisation de la phase QWT
5.1 La phase QWT
Dans sa thse [4], Blow dmontre limportance de la
phase en analyse dimage, dnit une transforme de Fou-
rier quaternionique (QFT), une phase 2D quaternionique,
et des ltres de Gabor 2D quaternioniques analytiques.
Dans une segmentation de textures base sur la transfor-
me de Gabor, les images ltres sont 2D analytiques, et
forment une analyse espace-chelle de limage, partir de
laquelle Blow extrait des amplitudes et phases locales en
chaque point, pour caractriser la texture.
Premirement, grce au thorme du dcalage (QFT shift
theorem [4]), on obtient que les deux premiers termes de
phase and indiquent un petit dcalage de la structure
code, autour de la position du coefcient quaternionique.
Cette information est analogue une phase instantane 1D
classique, qui encode un dcalage dune impulsion.
Notons quen 1D, ce dcalage est sufsant pour caractri-
ser compltement la structure de la composante locale. En
fait, il sagit de la mme information (Voir [4]), puisquune
phase denviron 0 ou signie simplement une impul-
sion (positive ou negative), et une phase autour de
2
dcrit une pente (monte ou descente), tant en fait le
bord dune impulsion dcale. En 2D, ce dcalage nest
pas sufsant pour caractriser toute structure, en particu-
lier les structures i2D (e.g. coins, jonctions T), qui sont
plus complexes que des lignes ou des bords.
Le troisime terme de la phase complte lanalyse de
la structure, et est considr comme une caractristique de
texture. Blow a trouv que est presque linaire avec une
variable , dans une superposition de deux ondes planes
dnie comme ceci :
f
(x,y) = (1) cos(

1
x +
2
y) +cos(
1
x
2
y)
Dans son application de segmentation de textures, il obtient
de trs bons rsultats en utilisant seulement |q| et .
Avec la QWT, Chan et al. [3] utilisent et dans une
procdure destimation de ot optique. Ils considrent que
puisque la QWT ralise des QFT locales, le thorme du
dcalage est toujours valable, approximativement.
Dans une autre application (reprsentation en wedgelets),
et sont utiliss pour calculer la position des segments,
et sert pour le calcul de leur orientation.
5.2 Extraction du descripteur
Comment utiliser la phase QWT pour dcrire les textures ?
Dabord, il semble que les deux premiers termes et
soient inappropris, car ils informent seulement sur la
position prcise des composantes locales, alors que nous
sommes intresss principalement par leur structure. Il est
vrai que le dcalage cod devrait servir caractriser une
structure 1D comme un bord ou une ligne oriente, de ma-
nire analogue la phase 1D. Mais cette information ne
nous semble pas assez claire. De plus, les exprimentations
que nous avons menes avec des mesures sur et ont
donn des taux de reconnaissance infrieurs 3%, ce qui a
conrm notre intuition. On se focalisera donc sur le troi-
sime terme , utilis notamment par Blow (transforme
de Gabor) dans une segmentation de textures.
Dans cette application, on suppose que les textures sont
uniformes, il ne sagira donc pas ici de dcrire en dtail
les motifs texturaux, mais plutt dextraire des mesures
globales sur la phase de limage. A loppos, on se rend
compte que des mesures trop globales sur lensemble des
phases, comme une moyenne, ne dcrivent daucune faon
la nature des motifs. En effet, les taux de reconnaissance
que nous avons obtenus pour une mesure de moyenne sont
infrieurs 1%.
Le but nest pas de faire une procdure volue de descrip-
tion spatiale (recherche dextrema, tude de connexit . . .),
puisquil sagit pour linstant de mettre lpreuve la QWT
dans une application simple, et notre travail est centr sur
h
a
l
-
0
0
4
6
2
9
6
1
,

v
e
r
s
i
o
n

1

-

1
1

M
a
r

2
0
1
0
La mesure du module est meilleure pour :
La mesure de la phase est meilleure pour :
FIGURE 3 Textures particulires mieux reconnues, soit par le module QWT (cart-type), soit par la la phase QWT (cart-
type pondr). Les taux de reconnaissance moyens sont indiqus en pourcentage. On afche ct de chaque texture, le
module de sa QFT dont le contraste a t renforc pour une meilleure lisiblit.
linterprtation de la phase QWT. Aussi, on sattachera
extraire une mesure globale de chaque sous-bande, assez
simple pour notre tude, et capable de tmoigner de lvo-
lution spatiale de la phase.
Il existe notre connaissance peu de choses sur la me-
sure globale de phase. On retient une mesure prsente par
Blanchet et al.(2008), appele Global Phase Coherence,
qui utilise la notion locale de congruence de phase, et qui
donne un indicateur de la nettet de limage. Mais cette
mesure ne nous semble pas approprie dans ce contexte.
Il vient que le simple calcul de lcart-type de est un
bon candidat, en dcrivant simplement une part du com-
portement de . De plus, comme [
4
,

4
], on na pas
les problmes habituels de calcul avec les donnes circu-
laires (discontinuit autour de ), donc pas dambigut
dans le calcul de diffrences entre deux angles. La variable
peut tre considre dans une procdure standard de calcul
dcart-type.
Une autre ide est de pondrer la phase par le module. En
effet, un module fort tmoigne de limportante prsence
dune composante, alors que les nombreux points de la d-
composition o le module est trs faible ne correspondent
aucune structure locale, donc il est aberrant de dcrire la
structure ces endroits. En pondrant les phases, on cal-
cule lcart-type des structures des seules composantes as-
sez prsentes, ce qui est plus reprsentatif.
La fonction de pondration W est le module de la QWT
normalise pour que la somme dans chaque sous-bande soit
gale 1. On lintgre dans le calcul de lcart-type comme
ci-dessous.
Voici les deux mesures de phases utilises dans nos tests.
Lcart-type :
m =
1
N
i,j
(
ij
)
2
o =
1
N
i,j

ij
, N est le nombre de pixels dans la
sous-bande, et (i, j) parcoure une sous-bande.
Lcart-type pondr :
m =
i,j
W
ij
(
ij

)
2
=
1
N
i,j
W
ij
ij
5.3 Rsultats
Nous avons utilis la mme procdure que pour la me-
sure du module. Les rsultats sont sensiblement quiva-
lents ceux du module. De plus, la pondration de lcart-
type donne effectivement des rsultats bien suprieurs aux
carts-type classiques. Les rsultats avec lcart-type pon-
dr sont illustrs gure 4.
En observant les taux de reconnaissance par classe, on re-
marque que certaines textures sont beaucoup mieux recon-
nues soit par le module, soit par la phase. Cela signie que
les deux classications sont complmentaires. Le module
informe, linstar de la DWT classique, sur le contenu fr-
quentiel de la texture, tandis que la phase apporte une in-
formation supplmentaire sur les structures locales de la
texture. La gure 3 illustre les diffrences de reconnais-
sance les plus signicatives, entre la mesure du module et
celle de la phase .
Mme si cette complmentarit semble exister, il est dif-
cile de cerner des types de textures, qui seraient plus pro-
pices tre analyss par le module ou par la phase. Lintui-
tion voudrait que des images contenant des contours nets
h
a
l
-
0
0
4
6
2
9
6
1
,

v
e
r
s
i
o
n

1

-

1
1

M
a
r

2
0
1
0
Ecart-type sur le module DWT Ecart-type sur le module QWT
Ecart-type pondr sur la -phase QWT Combinaison Module/-phase QWT
FIGURE 4 Rsultats de validation croise pour diffrents descripteurs (k = 3, 3 niveaux de dcomposition). En abscisses,
les indices des 24 classes de texture, et en ordonnes les statistiques sur le taux de reconnaissance du classieur. Le trait noir
vertical reprsente les taux minimum et maximum observs pour une classe. Le rectangle blanc est centr autour du taux
moyen, sa hauteur est deux fois lcart-type du taux.
aligns avec les diagonales soient mieux dcrites par ,
mais on ne le constate pas ici.
En effet, rappelons nous que les valeurs les plus signi-
catives de la phase (
4
) correspondent des lignes ou
des bords orients selon une diagonale. Finalement, dans
une image quelconque, on trouve une grande majorit de
phases locales proches de 0, car les diffrentes structures
locales possibles dans une image sont bien plus varies que
ce cas particulier de lignes ou de bords. Alors, si une image
contient de nombreux bords et lignes, il y a des chances
pour que sa phase locale soit plus varie, et donc plus
descriptive dans un contexte de classication.
Cependant, notre base dimages ne contient pas vraiment
de texture prsentant des contours nets, et il serait intres-
sant dexprimenter dautres bases.
Nanmoins, les taux derreurs nous indiquent clairement
une complmentarit de description, entre le module et la
phase. Il serait donc intressant de combiner les deux me-
sures pour construire un meilleur vecteur descripteur des
textures.
5.4 Combinaison du module et de la phase
Lcart-type est utilis pour le module et lcart-type pon-
dr pour la phase, en utilisant les trois niveaux de dcom-
position, donc nous avons 18 mesures pour chaque texture.
Tout dabord, en faisant une simple concatnation des deux
vecteurs de mesure, on obtient les rsultats de la gure 4
(dernier graphe), qui sont meilleurs que toutes nos simula-
tions prcdentes. Le taux de reconnaissance moyen toutes
classes confondues est de 91% contre 84% pour la DWT.
Notons que dans ce cas, le taux de reconnaissance est en-
core meilleur pour k = 1 : 92%. On pourra prfrer cette
valeur qui acclre considrablement lalgorithme, rduit
une recherche de distance minimum.
Ici se pose une problmatique classique en classication,
savoir que les deux mesures ne sont pas du mme type,
lune est homogne une amplitude ( R
+
), lautre un
angle( [0,

2
]). Cela provoque un manque de cohrence du
descripteur car tous ses termes sont vus de la mme faon
par la distance euclidienne.
Une mtrique permet souvent de pallier ce problme dh-
trogent des mesures, mais les diffrentes mtriques que
nous avons essayes namliorent pas signicativement
notre classieur. En effet, en pratique, les descripteurs de
module et de phase sont du mme ordre de grandeur, et
en utilisant une mtrique optimale par rapport notre en-
semble dimages (normalisation des mesures par leur cart-
type), on ne modie que peu les donnes, et on augmente
trs faiblement les taux de reconnaissance.
Une autre ide est de reprsenter les mesures en coordon-
nes cartsiennes. Puisque le vecteur contient pour chaque
sous-bande une amplitude et un angle, on peut considrer
que cest une reprsentation polaire dune mesure 2D, et
reprsenter ces deux valeurs en coordonnes cartsiennes.
Ainsi, le type de mesure est le mme pour tout le vecteur.
Mais l encore, le rsultat exprimental nest pas satisfai-
h
a
l
-
0
0
4
6
2
9
6
1
,

v
e
r
s
i
o
n

1

-

1
1

M
a
r

2
0
1
0
sant, et les taux de reconnaissance chutent.
Finalement, nous retenons pour la suite la simple concat-
nation des deux mesures.
6 Analyse critique des rsultats
Par une simple concatnation des deux types de mesure
QWT, on obtient 91% de reconnaissance moyenne, contre
84% avec la DWT, sur la base Outex TC-00012. De plus, le
meilleur rsultat avec la QWT est pour k = 1, ce qui rduit
lalgorithme k-ppv une procdure de recherche de dis-
tance minimum, qui a une complexit linaire. Les textures
les mieux reconnues par la QWT par rapport la DWT sont
les classes 10, 15 et 16 (voir gure 1), ou le taux derreur
moyen est denviron 20% meilleur pour la QWT, en consi-
drant les classieurs naux.
Selon nous, au regard des rsultats de validations croises,
le module le la QWT peut tout--fait remplacer la DWT
dans un contexte de classication de textures, puisquil
donne des performances similaires. Lorsquon utilise la
phase de la QWT pour complter lanalyse, certaines tex-
tures sont nettement mieux reconnues par la QWT, mais il
est encore difcile de caractriser prcisment les concer-
nes. Dune manire gnrale, linterprtation de la phase
de cette rcente transforme quaternionique mrite encore
dtre approfondie.
Aucune texture dans la base Outex TC-00012 ne montre
la DWT vraiment suprieure la QWT, donc non seule-
ment la QWT donne un meilleur rsultat global, mais cette
nouvelle transforme en ondelettes conserve galement les
qualits de la DWT, ce qui en fait une vraie amlioration
dans un contexte danalyse de texture. De plus, la valida-
tion croise nous permet de remarquer que la variabilit
des taux derreur est plus faible avec cette nouvelle m-
thode, cest--dire que la QWT amliore la robustesse de
la classication. Ainsi, les performances ne dpendent pas
fortement de lensemble dapprentissage choisi.
Nos rsultats sont trs satisfaisant en considrant que les
images utilises ont des orientations diffrentes, et des lu-
minosits diffrentes.
Enn, nous devons garder lesprit que la phase locale
fournie par la QWT est une analyse ponctuelle de limage,
et les composantes locales dcrites sont des structures l-
mentaires (impulsions, bords, lignes, impulsions selon une
direction, selon plusieurs directions . . .), quon peut quali-
er dimpulsions labores. En consquence, on ne tra-
vaille pas la mme chelle que les motifs texturaux, qui
eux sont beaucoup plus complexes, et forms dun en-
semble de composantes locales. La QWT nest donc peut-
tre pas loutil le plus adapt pour une analyse rapide
des textures. Il nous semble quune mesure spatiale sur le
module des coefcients QWT (comme cel a t fait par
exemple dans [7], sur la DWT) conjointe une tude de la
phase QWT, serait bien plus efcace pour la caractrisation
des textures. Ce travail, avec un simple cart-type, ouvre la
voie de nombreuses possibilits dtude dans le domaine
spatial.
7 Conclusion
Cet article prsente un travail dapplication dune nouvelle
transforme, la QWT de Chan et al. [3], travers une clas-
sication de textures base ondelettes. Le but est de mon-
trer exprimentalement que la QWT est une amlioration
de la transforme en ondelettes classique, plus complte,
grce son invariance par translation et sa phase, qui d-
crit nement le contenu des images.
A travers une technique de validation croise, nous avons
montr que la QWT rend une classication de textures ba-
se ondelettes plus performante et plus robuste, grce
lutilisation conjointe du module et de la phase des coef-
cients QWT, qui permet danalyser efcacement les struc-
tures locales des textures.
Les fondements de la QWT [4], depuis 1999, ont t am-
liors avec le signal et la phase monognique (Felsberg et
Sommer). Cet outil dni dans lalgbre gomtrique est
invariant par rotation, et semble fournir une meilleure des-
cription locale, plus claire, des signaux 2D, laide dune
phase deux composantes beaucoup plus facile interpr-
ter que la phase quaternionique. Une implantation de type
banc de ltres monognique, et une mesure de phase adap-
te, pourraient certainement amliorer encore la classica-
tion. Le banc de ltres monognique fait actuellement par-
tie de nos travaux.
Rfrences
[1] M. Tuceyran and A. K. Jain, Texture analysis, in
Handbook of pattern recognition and computer vi-
sion, River Edge, NJ, USA, 1993, pp. 235276, World
Scientic Publishing Co., Inc.
[2] Finland University of Oulu, Outex texture database,
http ://www.outex.oulu.fi/.
[3] W.L. Chan, H.H. Choi, and R.G. Baraniuk, Coherent
multiscale image processing using dual-tree quater-
nion wavelets, IEEE Transactions on Image Proces-
sing, vol. 17, no. 7, pp. 10691082, July 2008.
[4] T. Blow, Hypercomplex Spectral Signal Representa-
tions for Image Processing and Analysis, Ph.D. the-
sis, Inst. f. Informatik u. Prakt. Math. der Christian-
Albrechts-Universitt zu Kiel, 1999.
[5] Nick Kingsbury, Complex wavelets for shift invariant
analysis and ltering of signals, Applied and Compu-
tational Harmonic Analysis, vol. 10, no. 3, pp. 234
253, 2001.
[6] Turgay Celik and Tardi Tjahjadi, Multiscale texture
classication using dual-tree complex wavelet trans-
form, Pattern Recogn. Lett., vol. 30, no. 3, pp. 331
339, 2009.
[7] F. Mourougaya, P. Carr, and C. Fernandez-Maloigne,
A new wavelet sub-band characterization for texture
recognition., in Wavelet Applications in Industrial
Processing III. Octobre 2005, SPIE Optics East Sym-
posium.
h
a
l
-
0
0
4
6
2
9
6
1
,

v
e
r
s
i
o
n

1

-

1
1

M
a
r

2
0
1
0

Soulard RFIA 2010 Revu Soumis

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Soulard RFIA 2010 Revu Soumis

Transféré par

Droits d'auteur :

Formats disponibles

Ondelettes quaternioniques pour la classication de textures

Raphal Soulard Philippe Carr

Travail ralis dans le cadre du projet ANR RESEAUX DU FUTUR

(x,y) = (1) cos(

Vous aimerez peut-être aussi