Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
Valérie Gouet-Brunet
valerie.gouet@cnam.fr
7 Juin 2006
Plan de la séance
| Descripteurs génériques
• Points d’intérêt
| Descripteurs spécifiques
z Visages
z Empreintes digitales
Définitions
Définitions
| Descripteur d’image
z Méthode d’extraction du contenu visuel de l’image (pertinent pour
l’application)
• Exple : histogramme couleur
z Mesure de similarité associée
• Exple : intersection d’histogrammes
| Signature d’image
z Vecteur numérique représentant le contenu visuel de l’image
• Exple : 1 vecteur de dimension 216 pour l’histogramme couleur
Définitions
Propriétés
Propriétés
Définitions
Définitions
| Traitement « off-line »
| Construction de l’index
z Stockage efficace des descripteurs en machine
z Structurer le nuage de points dans l’espace de description,
pour réduire ultérieurement le coût de la requête
z Compromis entre :
• Stockage (mémoires principale et secondaire)
• Recherche (temps de réponse)
¾ Index multidimensionnels
z B-tree, Kd-tree, R-tree, X-tree, VA-files, tables de hachage…
| 3 classes de descripteurs
z Description globale de l’image
• Description approximative de toute l’image (recherche d’une ambiance)
• Solutions :
• Couleur, Texture , Forme
• 1 point dans un espace de description de grande dimension
| Espaces colorimétriques
• RVB, CMY, HSV, Lab, Luv, …
Cube de Maxwel
Bases de données multimédia / Les descripteurs d'images (1) 15
| Espace Lab
z Transformation non linéaire de XYZ
• Espace plus uniforme
• Deux couleurs proches en distance le sont aussi pour l’œil
Y 1
L * = 116 ( ) 3 − 16
Yn
⎡ X 1 Y 1 ⎤
a *
= 500 ⎢( ) 3 − ( ) 3
⎥
⎣ X n Yn ⎦
⎡ Y 1 Z 1 ⎤
b *
= 200 ⎢( ) 3 − ( ) 3
⎥
⎣ Yn Z n ⎦
h(c)
M −1 N −1
∑∑ δ ( f (i, j ) − c)
~ 1
∀c ∈ C h (c ) =
MN
i =0 j =0
c
d (i, j) = q (| x − x | + | x − x | +...+ | x − x | )
q q q
i1 j1 i2 j 2 id jd
• q=1 : distance de Manhattan (L1)
• q=2 : distance euclidienne (L2)
• q=∞ : distance max (L∞) d(x,y) = max i=1,d |xi-yi|
. . .
. .. . euclidienne pondérée
euclidienne . ... . max . .
. . . . . .... . . . . .
.
manhattan . . ... . .
. . . . quadratique
.
Bases de données multimédia / Les descripteurs d'images (1) 20
∑mi
ci
z Distances
• L1
• L2 généralisée d L2 ( H , M ) = ( H − M ) A( H − M )T
• L∞
Bases de donnéeshttp://www-rocq.inria.fr/imedia
multimédia / Les descripteurs d'images (1) 22
| Limitations
Histogrammes similaires
w(i, j ) = (k + ∇(i, j ) )α
• α < 0 et k > 0 (régions uniformes)
• α > 0 et k > 0 (contours)
• Probabilités
• …
Bases de données multimédia / Les descripteurs d'images (1) 24
Signature
couleur
classique
Requête
Signature
intégrant la
répartition
spatiale de
la couleur
http://www-rocq.inria.fr/imedia
Signature
histogramme
couleur
Signature
histogramme
accumulatif
http://www-rocq.inria.fr/imedia
Bases de données multimédia / Les descripteurs d'images (1) 26
∫∫ I ( x, y)e
−i (ux + vy )
F (u , v) = dxdy
• Invariance
• Phase invariante à la luminosité, stable jusqu’à un changement d’échelle de 20%
• Amplitude invariante à la translation
• Variantes
• Transformée de Fourier circulaire (amplitude invariante à la rotation)
• Transformée de Mellin (amplitude invariante au changement d’échelle)
z Ondelettes
Orientation
Contours du gradient
http://www-rocq.inria.fr/imedia
Bases de données multimédia / Les descripteurs d'images (1) 32
| Objectif
z Recherche de zones ou d’objets similaires
z Requêtes dites partielles
Je cherche des images contenant des tournesols comme celui-ci
| Solutions
z Description par le contenu de zones de l’image
z Ajout de relations spatiales
• Ex : Je cherche des images avec du ciel en haut et de l’herbe en bas
Bases de données multimédia / Les descripteurs d'images (1) 33
z Subdivision adaptative
| Subdivision systématique
http://www-rocq.inria.fr/imedia
| Subdivision adaptative
Extraction de
Segmentation en régions points d’intérêt
⎛ −⎞
⎜ ⎟
⎜ −⎟ ⎛ −⎞
R=⎜ ⎟ ⎜ ⎟
M ⎜ −⎟
⎜ ⎟ p=⎜ ⎟
⎜ −⎟ M
⎝ ⎠ ⎜ ⎟
⎜ −⎟
⎝ ⎠
z Principe
• Segmenter grossièrement l’image en régions
• Caractériser finement chaque région
z Objectif
• Extraction de zones saillantes exhibant les structures dominantes de
l’image
z Usage
• Les zones obtenues sont proposées comme requêtes à l’utilisateur
C5 C4
Images originales
Images segmentées
Couleurs dominantes
Zone
sélectionnée
(cliquée)
comme
requête
Zone
sélectionnée
(cliquée)
comme
requête
http://www-rocq.inria.fr/imedia
Bases de données multimédia / Les descripteurs d'images (1) 41
Formulation de la requête
http://www-rocq.inria.fr/imedia
Bases de données multimédia / Les descripteurs d'images (1) 42
http://www-rocq.inria.fr/imedia
Résultat de la requête
Exemples d’images
rejetées
Bases de données multimédia / Les descripteurs d'images (1) http://www-rocq.inria.fr/imedia 43