Académique Documents
Professionnel Documents
Culture Documents
de Recherche
en Informatique
Indexation des images et de la vidéo
Jenny Benois-Pineau
LABRI UMR 5800 Université Bordeaux
1/Bordeaux2/IPB-ENSEIRB-Matmeca
06/04/2012
Laboratoire Bordelais
de Recherche
en Informatique
Indexation des images et de la vidéo
1. Description du contenu des images
Descripteurs globaux
Descripteurs locaux
Quantification : Notion de BOF et BOVW
Mesures de similarité et distances
Prise en compte du contexte spatial : SPMK, GraphWords
2. Extensions spatio-temporelles
Comparaisons des séquences vidéo
Mouvement : descripteur particulier
Estimation
Segmentation en plages du mouvement homogène.
06/04/2012
Laboratoire Bordelais
de Recherche
1. Description du contenu des images
en Informatique
Objectifs :
-recherche des images par similarité dans des bases
de données
- reconnaissance des scènes, des objets
- classification non supérivisée /groupement des
images similaires dans une BD ou des images une
une vidéo
- classification supervisée
Formulation générale du problème de recherche par
similarité :
06/04/2012
Laboratoire Bordelais
de Recherche
en Informatique
06/04/2012
Laboratoire Bordelais
de Recherche
Evaluation des performances
en Informatique
MAP= ∑ ( )
06/04/2012
Laboratoire Bordelais
de Recherche
Descripteurs globaux
en Informatique
06/04/2012
Laboratoire Bordelais
de Recherche
Descripteurs globaux : couleur
en Informatique
06/04/2012
Mesures de similarité et distances sur les
Laboratoire Bordelais
de Recherche
histogrammes(2)
en Informatique
Distance :
( ! " # $ " )%
, = ∑ Tapez une équation ici.
! " & $ "
Cette distance permet de réduire l’effet des classes de forte population.
Encore S&B montrent que leur mesure de similarité
des histogrammes peut être exprimée via la norme L1:
1-5 , = ∑9
" 7 − 7 , T=Card(I)
6
06/04/2012
Laboratoire Bordelais
de Recherche
Descripteurs de la couleur en MPEG7 (2)
en Informatique
06/04/2012
Calcul du DCD – Split-LBG
{( )}
Laboratoire Bordelais
(n ) T ∞
de Recherche
en Informatique
A = a ,..., a
(1)
i i =1
Nombre de classes final fixé à priori K=2n
Méthode :
1. Initialisation : tirage aléatoire des centres
de M<K classes (M=2) D = {c1 ,..., cM }∈ A
2) « Split » de D : ci a (ci + ε , ci − ε )
3) LBG
a - affectation C ( a j ) = Arg min d ( a j , ck ), ck ∈ Di
k
1
b - calcul du nouveau centroïde de chaque classe : g k = ∑ al
N k al ∈Ck
m = 6, n = 3 par exemple
06/04/2012
Laboratoire Bordelais
de Recherche
Calcul du descripteur
en Informatique
64(8x8) blocs
image Partitionement
Calcul des
couleurs
représentatives
Cr
Cb DCT
Coefficients Y
Zigzag Scan
CLD
06/04/2012
Laboratoire Bordelais
de Recherche
Exemples de CLD
en Informatique
06/04/2012
Laboratoire Bordelais
de Recherche
Descripteurs de texture/contours
en Informatique
06/04/2012
Laboratoire Bordelais
de Recherche
EDH(1)
en Informatique
Principe de calcul :
diviser l’image en 16 blocs;
détecter les contours dans chaque bloc;
et déterminer leur orientation parmi les 5 :
H,V,45°,135°,ND (non-directionnal);
pour chaque bloc calculer l’histogramme normalisé des
orientations des contours;
concaténer les histogrammes dans un vecteur à 16x5=80
dimensions.
06/04/2012
Laboratoire Bordelais
de Recherche
en Informatique
06/04/2012
de Recherche
en Informatique
EDH(2)
Laboratoire Bordelais
06/04/2012
Laboratoire Bordelais
de Recherche
Descripteurs locaux
en Informatique
Principe :
-a)Détecter des points, des régions « singuliers »
dans l’image et décrire la texture autour
-b) Décrire la texture en utilisant les descripteurs
de (a) en effectuant le découpage régulier
« description dense » ou irrégulier « description
par régions ».
06/04/2012
Laboratoire Bordelais
de Recherche
Descripteurs SIFT (D. Lowe 2004) -1
en Informatique
DOG ( x, y, σ ) = D( x, y, σ ) = L( x, y, kσ ) − L( x, y, σ )
06/04/2012
Descripteurs SIFT (D. Lowe 2004) -2
Laboratoire Bordelais
de Recherche
en Informatique
Considérons k σ = σ + ∆ σ ⇒ ∆ σ = (k − 1 )σ
∂G
G ( x, y, kσ ) − G ( x, y, σ ) ≈ (k − 1)σ
Alors ∂σ (3)
∂G x2 + y 2
=
1
∂σ 2πσ 5
(
x + y − 2σ exp(−
2 2 2
2σ 2
) ) (4)
Par ailleurs
∂2G ∂2G 1 2 2 x2 + y2
(
∇ G= 2 + 2 = 6 x + y −2σ exp− 2
2
∂x ∂y 2πσ
2
) (5)
2σ
06/04/2012
Laboratoire Bordelais
de Recherche
Descripteurs SIFT (D. Lowe 2004) -3
en Informatique
De (4) et (5) :
∂G
σ ∇ 2G =
∂σ
(6)
∂G ( x, y, σ )
G ( x, y, kσ ) − G ( x, y, σ ) ≈ (k − 1)σ = (k − 1)σ 2∇ 2G ( x, y, σ )
∂σ2
DOG déjà comporte la σ normalisation requise pour Laplacien
06/04/2012
Laboratoire Bordelais
de Recherche
Calcul de la DOG
en Informatique
Convoluer I avec G
progressivement pour
produire L séparées par k σ ,2σ
DOG:
D ( x, y, σ i ) = L( x, y, kσ i ) − L( x, y, σ i )
Sous-échantillonnage de
facteur 2
06/04/2012
Laboratoire Bordelais
de Recherche
Détection des extremums locaux
en Informatique
valeur σ = 1,6
(Lowe[2004])
06/04/2012
Laboratoire Bordelais
de Recherche
Filtrage le long des contours (1)
en Informatique
D xx D xy Matrice Hessienne
H =
D yx D yy
Finalement
Tr (H ) (α + β )2 (r + 1)
2 2
= =
Det (H ) αβ r
Exclusion du point si
Tr (H ) (Thr + 1 )
2 2
<
Det (H ) Thr
06/04/2012
Laboratoire Bordelais
de Recherche Résultats de la détection
en Informatique
Image1
06/04/2012
Laboratoire Bordelais
de Recherche
Résultats de la détection
en Informatique
Image10
06/04/2012
Laboratoire Bordelais
de Recherche
Affectation de l’orientation
en Informatique
06/04/2012
Laboratoire Bordelais
de Recherche
Affectation de l’orientation(2)
en Informatique
06/04/2012
Laboratoire Bordelais
de Recherche
Descripteur local autour du point caractéristique (1)
en Informatique
06/04/2012
Descripteur local autour du point caractéristique (2)
Laboratoire Bordelais
de Recherche
en Informatique
Normaliser : X ← X / X
- invariance par rapport aux transformations affines de la
luminance
06/04/2012
Laboratoire Bordelais
de Recherche
SURF (speed-up robust features)(1)
en Informatique
06/04/2012
SURF (speed-up robust features)(2) H.
Laboratoire Bordelais
de Recherche
Bay et al.
en Informatique
Image intégrale
C-B-D+A
06/04/2012
Laboratoire Bordelais
de Recherche
SURF (speed-up robust features)(3)
en Informatique
06/04/2012
Laboratoire Bordelais
de Recherche
Régions de calcul du descripteur.
en Informatique
06/04/2012
Laboratoire Bordelais
de Recherche
Descripteur
en Informatique
06/04/2012
Laboratoire Bordelais
de Recherche
Quantification: BOF et BOVW
en Informatique
06/04/2012
Laboratoire Bordelais
de Recherche
Approche BagofFeatures (BoF)
en Informatique
Score(i,j) d(Fk,i,Fl,j)
Laboratoire Bordelais
de Recherche
Recherche des images similaires
en Informatique
« Dictionnaires visuels »
J. Sivic and A. Zisserman, “Video google: a text retrieval approach to
object matching in videos,” ICCV’2003, vol. 2, pp. 1470-1477, 2003.
Laboratoire Bordelais
de Recherche
BoW(1)
en Informatique
+ +
…
Laboratoire Bordelais
de Recherche
BoW(3)
en Informatique
Laboratoire Bordelais
de Recherche
BoW(4)
en Informatique
Laboratoire Bordelais
de Recherche
BoW(5)
en Informatique
Choix des éléments de l’image
Laboratoire Bordelais
de Recherche
et des descripteurs(1)
en Informatique
Sivic &
Zisserman
2005
Laboratoire Bordelais
de Recherche
BORW – Bag of Region-Words
en Informatique
06/04/2012
Laboratoire Bordelais
de Recherche
TF-IDF(1)
en Informatique
Laboratoire Bordelais
de Recherche
TF-IDF(2)
en Informatique
Laboratoire Bordelais
de Recherche
Méthodes de construction de dictionnaire
en Informatique
J. MacQueen, “Some methods for classification and analysis of multivariate observations”, Proc. Of the Fifth Berkley Symposium
on Math. Stat. And Prob., pp. 281 – 296, 1967
06/04/2012
Laboratoire Bordelais
de Recherche
Clustering incrémental
en Informatique
Principes :
(1) A l’initialisation chaque vecteur descripteur dans l’échantillon de données
forme une classe.
(2) Tant que le nombre de classes est supérieur à k ( à la limite k=1)
Regrouper les classes les plus proches au sens d’une distance d
∑ ∑ d (x , y )
1
d moy (Ci , C j ) =
ni × n j
l p
l =1 p =1
06/04/2012
d’après S. Benini, ICIP’2006
Prise en compte du contexte spatial:
Laboratoire Bordelais
de Recherche
SPMK
en Informatique
7 A BC , DC = EI F
BC , F
DC +∑A EG>H I BC , DC
I A B, D =∑JC 7 A BC , DC
Ceci revient à concatener les histogrammes pour tous les niveaux et
pour toutes les cellules avec la pondération.
Inconvénient : non-invariance par rapport aux transformations affines
du plan –image.
06/04/2012
Laboratoire Bordelais
de Recherche
GraphWords
en Informatique
69
Laboratoire Bordelais
de Recherche
Problème de clustering des graphes
en Informatique
(1) Distance:
d(P,Q) = s(P, P)+s(Q, Q) - 2 s(P, Q) ∈ [0,1]
Nécessité de définir la similarité s
(2) Méthode de quantification/classification
HAG car impossible d’interpoler les graphes –
espace non-vectoriel
Modèle de classe : graphe médian
06/04/2012
Laboratoire Bordelais
de Recherche
Exemples
en Informatique
06/04/2012
Laboratoire Bordelais
de Recherche
Évaluation de la méthode
en Informatique
72
Laboratoire Bordelais
de Recherche
Évaluation de la méthode
en Informatique
73
2. Extensions spatio-temporelles
Laboratoire Bordelais
de Recherche
Comparaisons des séquences vidéo(1)
en Informatique
(1) Key–framing
«Chancre » - CERIMES
KLM N , NO = P
Q! ,QR
Laboratoire Bordelais
de Recherche
Comparaisons des séquences vidéo(2)
en Informatique
Laboratoire Bordelais
de Recherche
en Informatique
Mouvement : descripteur particulier
Représentation du mouvement dans le plan - image
Modèles du mouvement
Méthodes d’estimation
Méthodes directes / Estimation par bloc
Méthodes paramétriques/Estimation robuste
Méthodes de la segmentation basées mouvement
Méthodes par comparaison du mouvement
06/04/2012
Représentation du mouvement dans le
Laboratoire Bordelais
plan - image
de Recherche
en Informatique
X X
àt à t+1
Mouvement apparent _ “flot optique” est observé dans
le plan image 2D grâce au changements de la luminance
06/04/2012
Mouvement réel 2D vs mouvement
Laboratoire Bordelais
apparent (2)
de Recherche
en Informatique
b)Changements
d’illumination extérieure
MR - non
MA - oui
Néanmoins!
Hypothèse: Mouvement Apparent=Mouvement reel 2D
06/04/2012
Caractérisation locale du mouvement
Laboratoire Bordelais
de Recherche
en Informatique
v
P’ d = (dx, dy )T
v Vecteur de déplacement
P d élémentaire
r
w = (dx / dt , dy / dt )T
t t+1 vecteur vitesse
Premier niveau de caractérisation du mouvement
consiste à calculer le flot optique W = {w}Ω ou D = {d }Ω
r r
“champ de déplacement”
06/04/2012
Modèles de mouvement
Laboratoire Bordelais
de Recherche
v
En développant d = (dx, dy )T en série de Taylor
en Informatique
r dx a0 a1 a2 x − x g
d = = + (9)
dy b0 b1 b2 y − y g
Ici M
∂dx ∂dx ∂dy ∂dy
a1 = a2 = b1 = b2 =
∂x ∂y ∂x ∂y
1 1 1
M = (traceM )I + M − M + M + M T − (traceM )I
en Informatique
T
2 2 2 r
∂dx ∂dy
traceM = a1 + b2 = + = div(d )
∂x ∂y
1 1 ∂dy ∂dx 0 − 1
(M − M ) =
T
−
2 2 ∂x ∂y 1 0
rot z (d )
r
− b2 + a1 b1 + a2
1
2
[
M + M − (traceM )I =
T
] b1 + a2 b2 − a1
dx = t x + k ( x − xg )
y (
dy = t + k y − y
g )
dx = x2 − x1 = t x + k (x1 − xg1 ) − θ (y1 − y g1 )
dy = y − y = t + θ
2 1 y (x1 − xg1 ) + k (y1 − yg1 )
dx a0 a1 a2 x − x g
= +
dy b0 b1 b2 y − y g
dx a0 a1 a2 x − xg a3
+
( )
a4 x − xg 2 a5
( )( )
= + + x − xg y − y g
dy b0 b1 b2 y − y
g b3 (
b4 y − y g
2)
5
b
Méthodes d’estimation
Laboratoire Bordelais
de Recherche
en Informatique
06/04/2012
Laboratoire Bordelais
de Recherche
Estimation du mouvement(1)
en Informatique
(x, y)
(dx, dy)
r
n’est jamais nulle à cause du bruit et de
DFD( x, y, d )
changement d’éclairage
06/04/2012
Estimation du mouvement(2)
Laboratoire Bordelais
de Recherche
en Informatique
1 2
EQM = ∑ DFD ( x, y, d ( x, y )) min
Ω ( x, y )∈Ω
1
MAD = ∑ DFD ( x, y, d ( x, y )) min
Ω ( x, y )∈Ω
{ }
r
D ( x, y ) = d ( x, y ) = Arg min EQM ( D )
*
Estimation directe
Ω
r
d ( x, y, Θ )− > Θ* = Arg min EQM (Θ) Estimation paramétrique
Ω
06/04/2012
Estimation du mouvement(3)
Laboratoire Bordelais
de Recherche
en Informatique
∂I ∂I ∂I
dx + dy + dt = 0
∂x ∂y ∂t
Le critère à rminimiser :
min ∑
r r
I(p,t)−I(p+d,t−dt)
ou
min
r r
∑ I ( (
r
p , t ) − I (
r r
p + d , t − dt )
)
2
r
p∈B d ∈F p∈B
It
06/04/2012 t-dt
I
Laboratoire Bordelais
de Recherche
Méthode de recherche exhaustive
en Informatique
B
F
It-dt It
rˆ r r r
r min ∑
d = Arg r
I(p,t)−I(p+d,t−dt)
d∈F p∈B
L’inconvénient majeur : coût opératoire
Les estimateurs basés-blocs sont utilisés pour tous les standards du codage vidéo
cf. UE « Codage Vidéo »
06/04/2012
Laboratoire Bordelais
de Recherche
en Informatique
06/04/2012
Laboratoire Bordelais
de Recherche
Méthodes de Flot Optique
en Informatique
⋅ DFD p , d ⋅ ∇I p + d , t )
( ) (
r (i +1) r (i ) ε r (i ) r (i ) r (i ) r ( i )
=d −
( )
d
r (i ) r (i ) 2
∇I p + d , t + α 2
06/04/2012
Approches multi-résolution-multi-
Laboratoire Bordelais
de Recherche
en Informatique
échelle
1)Construction des pyramides Gaussiennes pour I t , I t +1
I t0 = I t Itl = ( g ∗ I tl −1) ↓
k 2+l2
g(k,l)= 1 exp− 2
2πσ 2 2 σ
On considère
- les mesures observées Yi
- les mesures conformes au modèle (
M Θ, ( x, y )i )
- les résidus ri = Yi − M (Θ, (x, y )i )
dépendant du paramètre . θ
La vraisemblance du paramètre est définie
θ
( )
L θ Pσ = ∏ Pσ (r ) Pour toutes les valeurs disponibles de r
r
06/04/2012
Estimation robuste (3)
Laboratoire Bordelais
de Recherche
en Informatique
r2
ρ L (r , σ ) = log(1 + 2 )
Estimateur de Lorentz 2σ
r2 /σ 2
Estimateur de Geman-McClur ρ GM (r , σ ) =
1+ r 2 /σ 2
D. Hasler, L. Sbaiaz, S. Susstrunk, M. Vetterli, « Outlier Modeling in Image Matching »,
IEEE TRans on PAMI, v. 25, n3, march 2003
06/04/2012
Laboratoire Bordelais
de Recherche
Estimation robuste (5)
en Informatique
1
∑ ρ (r ) = ∑ w r 2, r = Z − Z (Θ, ( x, y)) min
i i i i i i
i i2
∂r ∂r
∑ψ(ri )∂θi =∑wi ri ∂θi =0 ici
i j i j
ψ (ri ) = ρ& (ri )
ψ ( ri )
wi =
ri
06/04/2012
Laboratoire Bordelais
Estimation robuste (3)
de Recherche
en Informatique
Estimateur de Tuckey
r 6 2C 2 r 4 C 4 r 2
− + , if r < C
6 4 2
ρ (r , C ) = 6
C , othervise
6
La dérivée
r (r 2 − C 2 )2 , if r < C
ψ (r , C ) =
0, othervise
06/04/2012
Laboratoire Bordelais
de Recherche
en Informatique
06/04/2012
Laboratoire Bordelais
de Recherche
Segmentation en plages homogènes
en Informatique
(
Θ = a1 , a4 , div, rot , hyp1 , hyp2 )
T
( )
div=1 a2+a6 rot =1 a5 −a3
2 2
( ) (
hyp1 =1 a2−a6
2
) (
hyp2=1 a3 +a5
2
)
06/04/2012
Tests des hypothèses statistiques sur la
Laboratoire Bordelais
de Recherche
signification des paramètres du mouvement
en Informatique
06/04/2012
Laboratoire Bordelais
de Recherche
en Informatique
06/04/2012
Laboratoire Bordelais
de Recherche
La mise en œuvre sur FO MPEG2
en Informatique
Caméra
statique
06/04/2012
Laboratoire Bordelais
de Recherche
en Informatique
Questions?
06/04/2012