Académique Documents
Professionnel Documents
Culture Documents
Valérie Gouet-Brunet
valerie.gouet@cnam.fr
14 octobre 2009
Plan de la séance
• Segmentation en régions
• Points d’intérêt
Signatures de couleur
h(c)
M −1 N −1
∑∑ δ ( f (i, j ) − c)
~ 1
∀c ∈ C h (c ) =
MN
i =0 j =0
c
d (i, j) = q (| x − x | + | x − x | +...+ | x − x | )
q q q
i1 j1 i2 j 2 id jd
• q=1 : distance de Manhattan (L1)
• q=2 : distance euclidienne (L2)
• q=∞ : distance max (L∞) d(x,y) = max i=1,d |xi-yi|
. . .
. .. . euclidienne pondérée
euclidienne . ... . max . .
. . . . . .... . . . . .
.
manhattan . . ... . .
. . . . quadratique
.
Bases de données multimédia / Descripteurs d'images et applications 6
∑m i
ci
z Distances
• L1
• L2 généralisée d L2 ( H , M ) = ( H − M ) A( H − M )T
• L∞
Bases de donnéeshttp://www-rocq.inria.fr/imedia
multimédia / Descripteurs d'images et applications 8
| Limitations
Histogrammes similaires
w(i, j ) = (k + ∇(i, j ) )α
• α < 0 et k > 0 (régions uniformes)
• α > 0 et k > 0 (contours)
• Probabilités
• …
Bases de données multimédia / Descripteurs d'images et applications 10
Signature
couleur
classique
Requête
Signature
intégrant la
répartition
spatiale de
la couleur
http://www-rocq.inria.fr/imedia
Signature
histogramme
couleur
Signature
histogramme
accumulatif
http://www-rocq.inria.fr/imedia
Bases de données multimédia / Descripteurs d'images et applications 12
z Méthodes statistiques
• Matrice de coocurrence
• Longueurs de plage
• …
| Matrices de cooccurrence
n −1 n −1
Énergie ∑∑ MC (i, j )
i =0 j =0
2
n −1 n −1
| Matrices de cooccurrence
http://www.crm.umontreal.ca/~physnum/Ard/Program/Texture/texture.html
∫∫ I ( x, y)e
−i (ux + vy )
F (u , v) = dxdy
• Invariance
• Phase invariante à la luminosité, stable jusqu’à un changement d’échelle de 20%
• Amplitude invariante à la translation
• Variantes
• Transformée de Fourier circulaire (amplitude invariante à la rotation)
• Transformée de Mellin (amplitude invariante au changement d’échelle)
x '2 + y ' 2
| Filtres de Gabor − x'
G( x, y, λ ,θ , ϕ ) = exp 2σ 2
cos(2π + ϕ)
z Filtre passe bande λ
x' = x cosθ + y sinθ
avec
y' = − x sin θ + y cosθ
2
z Énergie de convolution ⎡ ⎤
S 2 ( λ , θ ) = ∑ ⎢ ∑ G ( x, y , λ , θ , ϕ ) I ( x, y ) ⎥
de l’image avec le filtre ϕ ⎣ x, y ⎦
• Méthodes globales
• Périmètre, compacité, excentricité, descripteurs de Fourier, etc
• Méthodes globales
• Surface, compacité, moments géométriques, etc
Orientation
Contours du gradient
http://www-rocq.inria.fr/imedia
Bases de données multimédia / Descripteurs d'images et applications 26
Une application
© Like.com
| Objectif
z Recherche de zones ou d’objets similaires
z Requêtes dites partielles
Je cherche des images contenant des tournesols comme celui-ci
| Solutions
z Description par le contenu de zones de l’image
z Ajout de relations spatiales
• Ex : Je cherche des images avec du ciel en haut et de l’herbe en bas
Bases de données multimédia / Descripteurs d'images et applications 28
z Subdivision adaptative
| Subdivision systématique
http://www-rocq.inria.fr/imedia
| Subdivision adaptative
Extraction de
Segmentation en régions points d intérêt
⎛ −⎞
⎜ ⎟
⎜ −⎟ ⎛ −⎞
R=⎜ ⎟ ⎜ ⎟
M ⎜ −⎟
⎜ ⎟ p=⎜ ⎟
⎜ −⎟ M
⎝ ⎠ ⎜ ⎟
⎜ −⎟
⎝ ⎠
z Principe
• Segmenter grossièrement l’image en régions
• Caractériser finement chaque région
z Objectif
• Extraction de zones saillantes exhibant les structures dominantes de
l’image
z Usage
• Les zones obtenues sont proposées comme requêtes à l’utilisateur
C5 C4
Images originales
Images segmentées
Couleurs dominantes
http://www-rocq.inria.fr/imedia
Bases de données multimédia / Descripteurs d'images et applications 34
Zone
sélectionnée
(cliquée)
comme
requête
Zone
sélectionnée
(cliquée)
comme
requête
http://www-rocq.inria.fr/imedia
Bases de données multimédia / Descripteurs d'images et applications 36
Formulation de la requête
http://www-rocq.inria.fr/imedia
Bases de données multimédia / Descripteurs d'images et applications 37
http://www-rocq.inria.fr/imedia
Résultat de la requête
Exemples d’images
rejetées
Bases de données multimédia / Descripteurs d'images et applications http://www-rocq.inria.fr/imedia 38
| Subdivision adaptative
Extraction de
Segmentation en régions points d intérêt
⎛ −⎞
⎜ ⎟
⎜ −⎟ ⎛ −⎞
R=⎜ ⎟ ⎜ ⎟
M ⎜ −⎟
⎜ ⎟ p=⎜ ⎟
⎜ −⎟ M
⎝ ⎠ ⎜ ⎟
⎜ −⎟
⎝ ⎠
p − pi ≤ ε
• Chaque point n’a qu’un seul ε
correspondant par image p
• Problème de la détermination du seuil
¾ Algorithme de vote
• Combinaison des réponses pour
les n points de la requête
| Algorithme de vote
Image requête Base d’images
Distance faible ≤ ε
Distance plus élevée ≤ ε
Distance > ε
Image impliquant le
plus grand nombre
de points les plus
Points de la
proches de ceux de
requête
la requête
sélectionnés
dynamiquement
par l’utilisateur
| Avantages
z Recherche de parties d’images ou d’objets (élimination de
l’arrière-plan)
z Sélection dynamique de la requête (dite partielle)
z Robuste aux transformations image
z Robuste aux occultations
| Inconvénients
z Coûteux en temps de recherche
• Exple : 500 000 images décrites par 300 points d’intérêt décrits par un
vecteur de dimension 17 => recherche dans un espace de dimension 17
contenant 150 millions de points (500 000×300).
¾ Nécessité de structurer l’espace de recherche avec un index
multidimensionnel
Bases de données multimédia / Descripteurs d'images et applications 44
z Principe
• Un coin est détecté sur un contour aux endroits de plus forte courbure
¾ Courbure et gradient élevés
z Algorithme de détection
1. Détection des contours
I xx I y2 − 2 I xy I x I y + I yy I x2
2. Calcul de la courbure des isophotes K = 3
3. Maximisation de K sur les contours ( I x2 + I y2 ) 2
(voisinage local)
| Exemple de détection
z Domaine fréquentiel
• Transformée de Fourier
• Transformée de Gabor
• …
Points à mettre
| La corrélation Fenêtres de corrélation
en correspondance
z Peut être appliquée sur
• L’image
• Ses dérivées
m1
m2
Image 1 Image 2
ZNSSD scr(F1,F2) = || (F1 – MF1) - (F2 – MF2) ||2 / (||F1 – MF1|| . ||F2 – MF2||)
scr(F1,F2) = scr(aF1+b1,aF2+b2)
ZNCC scr(F1,F2) = (F1 – MF1) . (F2 – MF2) / (||F1 – MF1|| . ||F2 – MF2||)
scr(F1,F2) = scr(a1F1+b1,a2F2+b2)
| La corrélation (suite)
| Le jet local
z Approximation par une série de Taylor à l’ordre n
n
∂ ∂ ∂n
∂x ∂y
p=1
∑
f (x0 + x, y0 + y) = f (x0, y0 ) + x f (x0, y0 ) + y f (x0 , y0 ) +...+ x p yn− p
p n− p
∂x ∂y
f (x0, y0 ) + O(xn , yn )
J n ( x , y , σ ) = {L i1 ... ik ( x , y , σ ) / k = 0 ,..., n }
y Coordonnées de Gauge
η
ξ
⎧ ∇I
⎪η = ∇ I
⎨
⎪ξ ⊥ η
⎩
x
I I
Iηη + Iξξ I xx + I yy
Iη ∇I
Iξξ − I x2 I yy + 2 I x I y I xy − I y2 I xx
3
Iη ( I x2 + I y2 ) 2
Iξη I x I y ( I yy − I xx ) + I xy ( I x2 − I y2 )
3
Iη ( I x2 + I y2 ) 2
⎪
⎪ I xxx I 3y + 3 I xyy I x2 I y − 3 I xxy I x I y2 − I yyy I x3
⎪
⎪ I xxx I x I y2 + I xxy ( I 3y − 2 I x2 I y ) + I xyy ( I x3 − 2 I x I y2 ) + I yyy I x2 I y
⎪
⎪ I xxy ( 2 I x I y2 − I x3 ) + I xyy ( I 3y − 2 I x2 I y ) − I yyy I x I y2 + I xxx I x2 I y
⎪
⎪ I xxx I x3 + 3 I xxy I x2 I y + 3 I xyy I x I y2 + I yyy I 3y
⎩
⎛ R ⎞
⎜ ⎟
⎜ || ∇R || ⎟
2
⎜ G ⎟
⎜ ⎟
r ⎜ || ∇G ||2 ⎟
vcol ( x, y ) = ⎜ ⎟
⎜ B ⎟
⎜ || ∇B || ⎟
2
⎜ ⎟
⎜ ∇R.∇G ⎟
⎜ ∇R.∇B ⎟
⎝ ⎠
Invariants inter-plans
Invariance à la rotation
Bases de données multimédia / Descripteurs d'images et applications 56
⎛−⎞ ⎛−⎞
⎜ ⎟
⎜−⎟
p1 = ⎜ ⎟
M
⎜ ⎟
? ⎜ ⎟
⎜−⎟
p2 = ⎜ ⎟
M
⎜ ⎟
⎜−⎟
⎝ ⎠ = ⎜−⎟
⎝ ⎠
z Distance pondérée :
• Ne tient pas compte des corrélations
dist ( p, q ) = ∑w (p − q )
i
i i i
2
z Distance de Mahalanobis
Λ = {Λ lm ( X l, X m )}p× p
n
∑
1
Λ lm ( X l , X m) = ( x li − X l ). ( x m
i
− X m ) Obs1 Obs2 L Obsn
n
i =1
X1 ⎡ x11 ⎤ ⎡ x12 ⎤ ⎡ x1n ⎤
• Seuillage X2 ⎢ 1⎥ ⎢ 2⎥ ⎢ n⎥
• δ2 suit la loi du Khi 2 ⎢ x2 ⎥ ⎢ x2 ⎥ ⎢ x2 ⎥
M ⎢M ⎥ ⎢M ⎥ L ⎢M ⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
X p ⎢ x1 ⎥
⎣⎢ x p ⎦⎥ ⎣⎢ x p ⎦⎥
2 n
⎣ p⎦
z Difficultés
• Complexité du calcul
• Solution : changement de base
r r r r 2
δ (v1, v2 ) 2 = D Pv2 − D Pv1 avec Λ−1 = PT DP
• Estimation de Λ:
• A partir de quels échantillons ?
• Sur l’ensemble des points ? Λ non discriminante.
• Sur plusieurs séries de points ? Comment sélectionner les échantillons ?
• Solutions :
• Suivi manuel des points
• Classification automatique de l’espace de représentation
| Procédure d’appariement
z Si aucune information sur les positions des caméras :
m× n
comparaisons
de points
m points n points
z Si faible déplacement d’une caméra à l’autre :
z Seuillage
z Algorithme « Winner takes all »
z Appariements croisés
0.4
0.6
p1 p2
p2’
p1’ p’’2
0.8
m’1 c'
m’2
Contraintes de m1 m2
voisinage
M’’1
m’’2
c''
Contraintes de
rigidité locale :
Angle α entre
2 gradients couleur
Requête
Requête
Recherche de
motifs
particuliers
dans une
collection
d’œuvres d’art
Recherche
d’objets
particuliers
dans une
collection
d’œuvres d’art
(bases d’objets
volés)
Saab (85%)
L’Equipe (91%)
TF1 (84%)
- -
Saab (85%)
Saab (76%)
Saab (68%)
Saab (54%)
http://www-rocq.inria.fr/imedia
Bases de données multimédia / Descripteurs d'images et applications 72
4. Appariement d’empreintes
z Recherche des plus proches
voisins
z Ajout de contraintes spatiales
(transformée de Hough, etc)
Bases de données multimédia / Descripteurs d'images et applications 74
Base d’empreintes
Recherche
par similarité
⎡ I x2 IxI y IxIt ⎤
⎢ ⎥
M = S sσ ,sτ ∗ ⎢I xI y I y2 I yIt ⎥
⎢⎣ I x I t I yIt I t ⎥⎦
2
Det(M) - k.Trace3(M)
http://www.nada.kth.se/~laptev/ http://www.nada.kth.se/~laptev/
4. Compression de l’information
• Remplacer les points d’intérêt par les prototypes des clusters
http://www-rocq.inria.fr/imedia / http://www.ina.fr
Bases de données multimédia / Descripteurs d'images et applications 84
Point rare
http://www-rocq.inria.fr/imedia / http://www.ina.fr
Bases de données multimédia / Descripteurs d'images et applications 85