Académique Documents
Professionnel Documents
Culture Documents
• Représentation, descripteurs :
Couleur,
–
– Texture, -
– Points d’intérêts,
– Forme,
– Structure …
L valeurs possibles
M Noir = 0 ≤ l < L = Blanc
avec L=256, 1 pixel = 1 octet
è 1 pixel = 3 octets
Quelques espaces de couleur
• Linéaires :
– RGB : Rouge, vert, bleu.
l Système de couleur additif
– YCbCr : Luminance, Chrominances (L-rouge, L-bleu)
• Non linéaires :
– HSV : Hue, Saturation, Value,
– LAB : Luminance, Chrominances
⇒ Les distances euclidiennes entre couleurs
sont plus proches des différences perçues
par les humains
Histogrammes de couleur
l Opérateur de convolution
Filtrage : convolution
l Opérateur de convolution
- Parcourt de l’image par une fenêtre glissante : le noyau de
convolution
l Exemple en 1D
[1 2 3 4 5 6 7]
[2 3 1] à 2 + 6 + 3 = 11
[1 2 3 4 5 6 7]
[2 3 1] à 4 + 9 + 4 = 14
[1 2 3 4 5 6 7]
[2 3 1] à 6 + 12 + 5 = 23
Opérateurs de Sobel
(apprentissage de dictionnaires)
Sparse Coding
l Codage du signal avec contrainte de sparsité [Olshausen and
Field, 1997]
- Apprentissage de dictionnaire (codebook) pour la représentation
parcimonieuse du signal
⇒ [Olshausen and Field, 1997], [Engan et al., 1999], [Lewicki and Sejnowski,
2000], [Aharon et al., 2006] , [Roth and Black, 2005], [Lee et al., 2007]
Sparse Coding
l Nombreuses applications
- Image denoising [Elad and Aharon, 2006]
Sparse Coding
l Nombreuses applications
- Image restoration [Mairal, Sapiro, and Elad, 2008]
Sparse Coding
l Nombreuses applications
- Inpainting [Mairal, Elad, and Sapiro, 2008b]
Sparse Coding
l Un patch de 14x14 pixels est représenté par 196
valeurs (souvent redondantes)
100
150
200 50
250
100
300
150
350
200
400
250 50
450
300 100
500
50 100 150 200 250 300 350 400 450
150 500
350
200
400
250
450
300
500
50 100 150 200
350 250 300 350 400 450 500
400
450
500
50 100 150 200 250 300 350 400 450 500
Exemple test
f5 f18 f29
- Avec non-linéarité
Apprentissage de représentation
"profondes"
Vers les réseaux convolutionnels
l Plusieurs idées, déjà vu dans les NN, sparse coding,
et bag-of-words
- Banque de filtres + non linéarité → espace non linéaire de grande
dimension
- Feature pooling → Réduction de dimension, contraintes spatiales
- Connexions locales
Apprentissage de représentations
Convolution 2D
• Paramètres :
1. Taille des filtres, ex : K x K
2. Nombre de filtres, ex : C
3. Stride : pas de la convolution
4. Padding : méthode de complétion sur les bords
5. + non-linéarité, biais, régularization, etc