Académique Documents
Professionnel Documents
Culture Documents
mg
Résumé : Abstract:
Cet article représente une des applications de This paper has applied theory of linear algebra
l’algèbre linéaire appelé : « Décomposition en called “Singular Value Decomposition”, to digital
valeurs singulières» au traitement d’images image processing, especially to the one area of that
numériques, spécialement un thème a été investi et is investigated and tested, this is the indexing and
testé : c’est la partie indexation et recherche retrieval image ; SVD method can transform one
d’image par le contenu. matrix into product which allows us to
La SVD transforme une matrice en un produit de refactoring a digital image in three matrices: the
matrices qui nous permettrait de re- using of singular values of such refactoring allows
factoriser l’image en trois matrices. L’utilisation us to represent the image with smaller values;
des valeurs singulières pour chaque décomposition witch can preserve useful features of the original
accéderait à représenter l’image avec de petits image. To perform indexing image with SVD, we
valeurs, pourtant, la reconstruction de l’image treated the image by ranging the maximum of their
originale. Nous avons traité l’image en rangeant le components in R, G, B into the singular values
maximum d’informations en couleurs R, G, B de after the decomposition. All test and experiments
l’image dans les valeurs singulières issues de la are carried out by using Matlab as computing
décomposition SVD. Tous les tests et environment and programming language.
programmation ont été effectués sous Matlab.
Mots clés: RVB, indexation, SRIC, SVD. Keywords: RGB, indexing, CBIR, SVD.
30
MADA-ETI, ISSN 2220-0673, Vol.1, 2011 www.madarevues.gov.mg
1. Introduction Swason et Twefik, utilisent les coefficients de
On décrit ici, une nouvelle méthode d’indexation DWT combinée avec une représentation en B-
d’image couleur dans le domaine des valeurs spline des contours des objets. [2]
singulières (DVS)., nous nous intéresserons Hu identifie sept moments caractérisant l’image.
uniquement à l’attribut couleur du fait de son haut Milanese et Cherbuliez, utilise la norme de
pouvoir discriminant par rapport aux autres Transformée de Fourrier Discrète (TFD) comme
attributs. attribut ; cette valeur a l’avantage d’être robuste
Dans les dix dernières années, la reconnaissance de aux transformations géométriques de l’image
d’image par le contenu a tiré de larges intentions Pour l’indexation utilisant le critère forme, on s’est
des chercheurs après la vision par ordinateur, les servi des théorèmes de Hough, de Fourrier, de
réseaux de neurones. L’application de l’indexation Laplace ; le filtre de Gabor et les domaines de
comprend : reconnaissance des faces, contrôle transformés pour la texture. [3] [4].
d’accès, sécurité d’information, l’interaction
Haralick a disposé l’utilisation de matrices de co-
homme-machine…
occurrences. Aussi, plusieurs méthodes
Le domaine de l’indexation d’image a connu un d’indexation dans le domaine des transformés en
essor très rapide ces dernières années sans que l’on ondelettes discrètes (DWT) ont étés déjà présentés.
ait pu réellement voir émerger des services Il y a aussi une représentation d’image basée sur la
opérationnels. Après une phase très largement notion de chaînes de symboles, et de nombreux
exploratrice ; Swain et Ballard a utilisé travaux en indexation d’images ont fait référence à
l’algorithme d’histogramme, les histogrammes la notion de points d’intérêt comme base d’une
peuvent être construits dans plusieurs plages de représentation [5].
couleurs RVB. Un histogramme de couleur est un
Accéder à une information pertinente dans un
produit découpant les couleurs de l’image dans
contexte distribué et fortement dynamique, par
certains nombres de cases puis en comptant le
exemple le web, est un véritable chalenge. Définir
nombre de pixels dans chaque case : cela fournit
la pertinence selon les critères de l’utilisateur
une vue d’ensemble plus compacte des données
nécessite la création automatique de profils
dans une image. C’est un outil intéressant pour la
dynamiques représentant les centres d’intérêts de
reconnaissance d’objets ayant une position et une
l’utilisateur. Au début, on a indexé les documents
rotation inconnue par rapport à la scène. [1].
par la SVD, qui a pour but de classifier ces
Smith et Chang, utilisent des données statistiques: derniers chacun étant caractérisé par un certain
moyenne, variance, extraites des sous bandes des nombre de concepts ; de mesurer l’apport d’une
ondelettes afin de présenter les textures. [2] décomposition en valeurs singulières par rapport à
31
MADA-ETI, ISSN 2220-0673, Vol.1, 2011 www.madarevues.gov.mg
une analyse robuste en prenant pour cas pratique d’une nouvelle image dans tous les « espace de
une analyse de contenu. [6]. visage » [9].
Par Will en 1999, la SVD permet de dégager des Il est donc indispensable de posséder des outils
concepts à partir d’éléments primitifs : les mots. permettant de rechercher les images les plus
Cette observation est à la base de l’utilisation de la pertinentes par leur contenu, comme c'est déjà le
décomposition SVD dans l’indexation sémantique cas pour les systèmes de recherche de texte par
des documents [7] dans le but d’identifier les mots clés [2]. Quel modèle mathématique pourrait-
tendances dans les relations entre les termes et on utiliser afin de rendre efficace le système
concepts contenus dans une collection non d’indexation et aussi pour la phase d’appariement ?
structurées du texte. Où : Représente une matrice Dans ce travail, on a utilisé l’indexation d’image
« document- mots » . On suppose cette matrice de par une méthode de la décomposition en valeurs
dimension ∗ . Cette matrice est décomposée singulières.
par une SVD en un produit de trois matrices dont C’est une technique qui est utile pour le traitement
la matrice centrale est diagonale. d’image (compression, indexation, classification de
M d∗m =R d∗d ∗D d∗m données). Le problème consiste à réduire le
∗U m∗m
(01)
dimensionnement d’un ensemble des données
Dès lors, la SVD représente une des méthodes de (échantillon), en trouvant un nouvel ensemble de
quantification de l’image couleur, c'est-à-dire variables plus petit que l’ensemble original des
quantifier la couleur par une modélisation/ variables, qui néanmoins contient la plupart de
quantification a pour but de réduire le nombre de variables, appelées Valeurs Singulières (VS)
32
et ≤ ≤
MADA-ETI, ISSN 2220-0673, Vol.1, 2011 www.madarevues.gov.mg
lignes et colonnes avec un rang par ordre décroissant et dans un minimum de
peut être factorisé en trois matrices : valeurs singulières car chaque image est en
Pour = 1, 2, … , ; sont appelés valeurs couleur Rouge, Vert, Bleu. Chaque pixel,
singulières de la matrice . chaque site +, , contient une information
couleur sur l’intensité du rouge, l’intensité du
! ≥ # ≥ ⋯ ≥ % ≥ 0 '( %)! = %)# = ⋯ = * =0 vert, l’intensité du bleu.
Les '( sont appelés : droite et gauche Image originale
vecteurs singulières de . [10]
R V B
A
A
2.2 Propriétés de la SVD d’une image
Figure 01 : Division des composantes couleurs de
Les valeurs singulières sont les plus importants car
l’image
ils sont uniques, ce sont des plus importants
attributs de la matrice image et peut être utilisée • Décomposition en SVD de chacune des
pour la reconnaissance des formes. composantes couleurs de l’image :
!, #, … , * sont uniques, mais '( ne les sont = ∗ ∗ (02)
pas.
=
A
- Le rang de la matrice est égale au nombre de
leur valeurs singulières non nuls. ∗ ∗ ∗ ( ∗
- Les V.S représentent l’énergie de l’image, c'est-à- = - .! , .# , … , .% , .%)! , … , ./ 0
dire que la SVD range le maximum d’énergie de . , = 1, 2, … , (03)
1 =4
. .1 = 2 1 = 3 6
l’image dans un minimum de V.S [11]
0 ≠4
(04)
- Les valeurs singulières d’une image ont une très
bonne stabilité, c’est-à-dire, quand une petite = - !, # , … , % , %)! , … , * 0 (05)
perturbation est ajoutée à une image, les valeurs 7! , = 1, 2, … , (06)
1 =4
= 2 1 = 3 6
1 0 ≠4
singulières ne change pas significativement. (07)
! ⋯ 0
2.3 Méthode de la nouvelle approche avec SVD 8=9⋮ ⋱ ⋮<
0 ⋯
(08)
Premièrement, la méthode d’indexation, c'est-à- *
dire la phase de l’extraction des informations sont appelés EF'.G8 H.F èG'8 de A Pour
essentielles de l’image à présenter est divisée en = 1, 2, … ,
≥ ≥⋯≥ >0
deux parties :
! # %
• Dissociation de la taille de l’image originale par
• Une fois qu’on ait pu extraire les informations
trois : Rouge, Vert, Bleu en ne conservant
maximales de l’image, et les avoir stockées dans
qu’un seul canal qui range le maximum
les minimums de VS ; on peut, à partir d’un
certain rang de la matrice , reconstituer
d’énergie de l’image dans les valeurs singulières
33
MADA-ETI, ISSN 2220-0673, Vol.1, 2011 www.madarevues.gov.mg
l’image originale, ici, ce rang nommé est l’analyse d’une caractéristique, les valeurs
égale à la valeur 50. C'est-à-dire abandonner les singulières stockent l’énergie de l’image.
plus basses VS de la matrice .
On capture maintenant un exemple d’image L’indexation a pour but de substituer à une image
requête et on recherche la similarité entre l’image qui occupe une place non négligeable en
requête et celles se trouvant dans la base. représentant moins encombrant qui la caractérise le
mieux possible et de ne travailler que sur ce
Les résultats seront affichés sur une figure
modèle, lors de la recherche. La difficulté réside et
illustrant l’image requête avec la liste des images
provient de la définition même du représentant,
trouvées suivant un ordre décroissant selon la
c'est-à-dire quelles caractéristiques choisir pour
distance entre l’image requête et chacune des
quel résultat ?
images trouvées. Le nombre souhaité des images à
On applique la SVD, ici, comme une technique
trouver a été préalablement signalé dans le
d’extraction des informations de l’image, aussi
programme.
pour construire les signatures de l’image couleur;
Afin de calculer la similarité entre l’image requête on utilise les informations issues du processus de la
et les images cibles dans la base d’images (indexée décomposition, c’est ce qu’on appelle l’indexation
aussi), plus précisément, on calcule d’abord par la signature. [11]
l’histogramme des valeurs singulières, une fois ces La décomposition en valeurs singulières peut donc
dernières trouvées, notons ℎ 8(M N O , ℎ 8(M O
, être vue comme une technique de réduction de
ℎ 8(M P O ces histogrammes ; ℎ 8(Q N O ℎ 8(Q N O , dimensionnalité.
ℎ 8(Q N O ceux des images dans la base d’image. La
Afin d’évaluer la méthode choisie, on a essayé
similarité ici retourne la distance euclidienne
plusieurs types d’image requête suivant différentes
calculée entre les histogrammes de toutes les
catégories dans la base d’images.
valeurs singulières concernés, formule (02).
Pendant la phase de la recherche de similarité, on 2.4 Architecture du système
calcule la distance euclidienne des histogrammes et Un utilisateur choisit une image requête. On
les trier par ordre de pertinence suivant le critère calcule l’index c'est-à-dire SVD pour l’image
couleur de l’image. inconnue. Le système mesure la similarité de
8( , P = l’index inconnu avec les indices de la base. Le
ℎ 8(Q N O − ℎ 8(M N O # + ℎ 8(Q O− ℎ 8(M O # + ℎ 8(Q PO − ℎ 8(M PO #
=R
système adresse les meilleures images au sens de la
1.09
mesure de similarité, c’est à dire par la distance
euclidienne [12]. Le principe de fonctionnement
La signature d’une image par la SVD conserve
est illustré par la figure 02.
un « résumé » de l’information extraite par
34
MADA-ETI, ISSN 2220-0673, Vol.1, 2011 www.madarevues.gov.mg
Calcul des Indexation
valeurs système
Base
Base singulières
appariement
d’images
d’image indexées
s
2.5 Calcul de la similarité images utilisées pour les tests en indexation sont
Au sens d’une métrique donnée, on propose ici, par très diverses et sont, souvent, choisies en fonction
la distance euclidienne des histogrammes des du critère utilisé pour la recherche (par la couleur,
vecteurs singulières de l’image requête et les images forme, par la texture, etc…). La base utilisée pour
de la base, la phase de la recherche d’image. Ce cette étude est une base générique, formée de 1250
calcul fournit : les images réponses. C'est-à-dire images, composée de onze catégories d’images,
classer les images. chacune composée de 100 images différentes. On
La question qui se pose c’est : Quelle est l’image de peut y trouver toutes sortes d’images : des images
la base la plus similaire à la requête ? Le système très colorées et des images texturées. Par exemple :
adresse les meilleures images au sens de la mesure des imageries en télécommunication, des paysages
de similarité ; enneigés, des images de bâtiments, des animaux,
Une distance nulle signifie que les images sont des voitures, des fleurs, ….
similaires. Comme cette base est hétérogène, elle est
généralement destinées au grand public, donc est
2.6 Choix de la base d’images accessible via internet ; donc pour une
Une base de données multimédia est un type de interprétation subjective. Elle a été élaborée pour
base de données consacré au stockage et à mettre en œuvre une recherche d’image par la
l'organisation de données multimédia : documents couleur qui va répondre à l’exemple de l’image
sonores, images, vidéos [13]. Les bases de données requête et dont l’évaluation est qualitative [7].
35
MADA-ETI, ISSN 2220-0673, Vol.1, 2011 www.madarevues.gov.mg
3. Résultats Avec :
Etant donné que l’objectif est de sensibiliser au ∝ nombre de réponses pertinentes retrouvées
1
documents en réponse, mais le rappel souffrira. Il
0.9 faut donc utiliser les deux métriques ensemble.
0.8 Dans notre cas, on a obtenu un taux de 31% pour
0.7 le rappel et 45% pour la précision.
précision
0.6
0.5
Pour une image requête nommée ‘fruit jpg’ par
0.4 exemple, les trois premières figures de la figure 1-
0.3 a et celles de la figure 1-b ci-dessous représentent
0.2
0.2 0.25 0.3 0.35 0.4 0.45 0.5
l’histogramme des valeurs singulières de l’image
rappel
requête dont les trois premières courbes
Figure 04 : Courbe de rappel/précision
représentent chacune respectivement les
En effet, il est facile d'avoir 100% de rappel: il informations couleur en rouge, vert et bleu. Les
suffirait de donner toute la base comme la réponse trois dernières figures de la Figure 1-a et celles de
à chaque requête. Cependant, la précision dans ce la Figure 1- b, celles de des images candidates.
cas-ci serait très basse. De même, on peut
augmenter la précision en donnant très peu de
20 40 60 20 40 60 20 40 60 20 40 60 20 40 60 20 40 60
20 40 60 20 40 60 20 40 60 20 40 60 20 40 60 20 40 60
(a) (b)
Figure 05 : Exemple d’une image requête : ‘fruit.jpg’
Pour toutes ces courbes, l’axe des ordonnées donné que les informations utiles de l’image sont
correspond aux échantillons d’histogrammes toutes presque stockées dans les premières
effectués au cours des calculs des VS et leurs valeurs singulières.
histogrammes.
En second lieu, on obtient les images recherchées,
Il n’est pas nécessaire pour l’axe des abscisses de affichées par ordre décroissante.
prendre des valeurs supérieures à 100 car, étant
37
MADA-ETI, ISSN 2220-0673, Vol.1, 2011 www.madarevues.gov.mg
Une fois que le système ait fini de comparer les critère bas niveau de l’image et que si on place
histogrammes des VS (Valeurs Singulières) de plusieurs images à peu près similaires à l’image
l’image requête avec tous les histogrammes de la requête dans la base d’image.
base de données d’images en calculant leur
Nous avons proposé une méthode d’indexation
distance euclidienne.
qui extrait les informations couleurs dans les
En effet, pour deux images similaires, cette
matrices des valeurs singulières. En extrayant les
− è ' des rangs dans la matrice , nous avons
dernière est égale à zéro.
Le système va alors effectuer la recherche et
pu rechercher les images les plus similaires de
retourner les résultats par ordre de similarité
l’image requête dans la base.
décroissante.
Image requête
Résultats de la recherche
On a pu constater que la perte d’information est Une image contient beaucoup d’informations, et
41