Académique Documents
Professionnel Documents
Culture Documents
EXTRACTION DE
CARACTERISTIQUES ET
REPRESENTATION
5.1 Introduction
5.2 Vecteur de Caractéristiques & Hyper-Espace
5.3 Les descripteurs de formes
5.4 Les descripteurs de contours
5.5 Les descripteurs basés sur l’histogramme
5.6 Les descripteurs de texture
Support de cours - Vision Artificielle (Master ESE – Semestre 3 – 2018/2019) Pr. Abdelhamid LOUKIL
Chapitre 5 : Extraction de caractéristiques et représentation Page 47
5.1 INTRODUCTION
L'objectif commun des techniques d'extraction et de représentation de caractéristiques est de
convertir les objets segmentés en représentations qui décrivent le mieux leurs principales
caractéristiques. Le type et la complexité de la représentation résultante dépendent de
nombreux facteurs, tels que le type d'image (binaire, en niveaux de gris ou couleur) et du
contexte de l'application finale.
( )
Le vecteur de caractéristiques est une représentation compacte d'une image (ou d'un objet
dans l’image) qui peut être associé à la notion d’espace de caractéristiques appelé aussi Hyper-
espace permettant la visualisation et l'interprétation des caractéristiques contenues dans ce
vecteur.
EXEMPLE PRATIQUE :
Etant donnés les objets de la figure 5.1 (a) et leurs représentation par les deux caractéristiques :
« Area » et « Perimeter » qui ont été calculées comme suit:
Support de cours - Vision Artificielle (Master ESE – Semestre 3 – 2018/2019) Pr. Abdelhamid LOUKIL
Chapitre 5 : Extraction de caractéristiques et représentation Page 48
Figure 5.1 : (a) Image résultante de la segmentation et (b) Hyper-espace et vecteurs de caractéristiques 2D
La figure 5.1(b) montre les 3 vecteurs de caractéristiques sur un plan 2D ayant comme axes les
deux caractéristiques ‘Perimeter’ et ‘Area’.
I(x,y) = {
Dans MATLAB, la fonction ’bwlabel’ implémente l'opération d’étiquetage des régions (pixels
connectés).
∑∑
Support de cours - Vision Artificielle (Master ESE – Semestre 3 – 2018/2019) Pr. Abdelhamid LOUKIL
Chapitre 5 : Extraction de caractéristiques et représentation Page 49
∑∑
∑∑
C (𝑋𝑐 𝑌𝑐
Support de cours - Vision Artificielle (Master ESE – Semestre 3 – 2018/2019) Pr. Abdelhamid LOUKIL
Chapitre 5 : Extraction de caractéristiques et représentation Page 50
hi(x) =(0,0,2,4,4,3,6,1,0,0)
vi(y) =(0,1,2,4,5,3,1,3,1,0)
5.3.6 LA COMPACITE
La compacité ‘Cp’ d’un objet binaire définit le degré de compacité d’un objet (voir figure 5.4)
et est exprimé par :
Support de cours - Vision Artificielle (Master ESE – Semestre 3 – 2018/2019) Pr. Abdelhamid LOUKIL
Chapitre 5 : Extraction de caractéristiques et représentation Page 51
Figure 5.4 : Exemples d’objet compact (a) et d’objet non compact (b)
(a) (b)
Figure 5.5 : Exemples de deux régions avec un nombre d’Euler E égal à ‘0’ (a) et ‘-1’ (b)
Où (xmin, ymin) et (xmax, ymax) sont les coordonnées des coins supérieur gauche et inférieur droit
du cadre entourant un objet (boite englobante – Bounding box).
Support de cours - Vision Artificielle (Master ESE – Semestre 3 – 2018/2019) Pr. Abdelhamid LOUKIL
Chapitre 5 : Extraction de caractéristiques et représentation Page 52
∑∑
Où :
M: nombre de lignes ;
N: nombre de colonnes :
p et q : des entiers non nuls.
Image entière ou l’objet d’intérêt.
∑∑
Les moments centrés sont utilisés pour le calcul des moments centrés normalisés par
l’expression suivante:
A partir des moments centrés normalisés, nous obtenons un ensemble de sept paramètres
invariants, appelés moment de Hu, qui sont :
Support de cours - Vision Artificielle (Master ESE – Semestre 3 – 2018/2019) Pr. Abdelhamid LOUKIL
Chapitre 5 : Extraction de caractéristiques et représentation Page 53
[
[ ]]
[ ]
[ ]
[ ]
Les six premiers paramètres invariants caractérisent la forme avec l’invariance aux translations,
rotations et changements d’échelle. Le septième paramètre invariant permet de distinguer des
formes symétriques (Mirrored image).
Nous montrons ci-dessous (figures 5.7 et 5.8) deux images (niveau de gris et binaire) avec leurs
moments de Hu respectifs.
Support de cours - Vision Artificielle (Master ESE – Semestre 3 – 2018/2019) Pr. Abdelhamid LOUKIL
Chapitre 5 : Extraction de caractéristiques et représentation Page 54
Dans MATLAB, la fonction « bwboundaries » trace les contours des objets dans une image binaire.
Les coordonnées du point de départ et de la direction de recherche initiale (N, NE, E, SE, S, SW,
W, ou NW) doit être passé en tant que paramètres. En option, le type de connectivité (4 ou 8) et
la direction du tracé (dans le sens des aiguilles d'une montre ou dans le sens inverse des aiguilles
d'une montre) peut également être des arguments. La fonction « bwboundaries » renvoie un
tableau contenant les coordonnées des pixels formant le contour.
Support de cours - Vision Artificielle (Master ESE – Semestre 3 – 2018/2019) Pr. Abdelhamid LOUKIL
Chapitre 5 : Extraction de caractéristiques et représentation Page 55
Exemple :
Dans ce qui suit, nous faisant la trace du contour des 4 objets présents dans l’image ‘ TP7-1 ’ à
l’aide de la commande Matlab « bwboundaries» :
I= imread('TP7-1.png');
imshow(I);
[B,L] = bwboundaries(J);
figure; imshow(I); hold on;
for k=1:length(B),
bord = B{k};
plot(bord(:,2),bord(:,1),'g','LineWidth',2);
end
Cette commande renvoie un tableau pour chacun des 4 objets présents dans l’image. Le premier
tableau est de la forme :
B1 = [ 38 , 150 ; 38 , 160 ; 38 , 161 ; … ; 40 , 159 ; 39 , 159 ; 38 , 159]
Support de cours - Vision Artificielle (Master ESE – Semestre 3 – 2018/2019) Pr. Abdelhamid LOUKIL
Chapitre 5 : Extraction de caractéristiques et représentation Page 56
5.4.3 SIGNATURES
Une signature est une représentation 1D d'un contour, généralement obtenue en
représentant la frontière dans un système de coordonnées polaires. La distance r est calculée
entre chaque pixel du contour et le centroïde pour un angle θ allant de 0 à 2π.
Support de cours - Vision Artificielle (Master ESE – Semestre 3 – 2018/2019) Pr. Abdelhamid LOUKIL
Chapitre 5 : Extraction de caractéristiques et représentation Page 57
Exemple :
La figure 15.12 montre un exemple d’un contour contenant 1467 points (partie (a)) et les
résultats de la reconstruction (application de la TFD suivie par IDFT) en utilisant un nombre
variable de termes. La partie (b) montre les résultats de la reconstruction avec le même nombre
de points pour des raisons de vérification. Les parties (c) - (f) montrent les résultats pour la
reconstruction avec progressivement moins de points: 734, 366, 36 et 15, respectivement. Les
valeurs choisies pour les parties (c) - (f) correspondent respectivement à environ 50%, 25%,
2,5% et 1% du nombre total de points.
Une inspection minutieuse des résultats montre que l'image reconstruite en utilisant 25% des
points est pratiquement identique à celle obtenue avec 50% ou 100% des points.
Le contour reconstruit en utilisant 2,5% des points conserve encore une grande partie de sa
forme globale, et les résultats utilisant seulement 1% du nombre total de points peuvent être
jugés inacceptables.
Support de cours - Vision Artificielle (Master ESE – Semestre 3 – 2018/2019) Pr. Abdelhamid LOUKIL
Chapitre 5 : Extraction de caractéristiques et représentation Page 58
Le descripteur basé sur l'histogramme le plus simple est la « luminance », représentant son
intensité moyenne µ:
∑ ∑∑
Où :
I(x,y) : Le pixel de coordonnées (x,y) de l’image I ;
MN : représente les dimensions de l’image;
d: la dynamique de l’image en bits
k: le niveau de gris
H(k) : la valeur de l’histogramme relatif au niveau de gris k.
La luminance µ est un descripteur très compact (une valeur à virgule flottante par image ou
objet) qui fournit une mesure de la luminosité globale de l'image ou de l'objet correspondant.
√ ∑∑
Le carré de l'écart type est la variance, également appelée moment de second ordre
normalisé de l'image. L'écart type fournit une représentation concise du contraste global.
L'asymétrie (the skew) d'un histogramme est une mesure de son asymétrie par rapport au
niveau moyen. Il est défini par :
∑ ∑
L’énergie fournit une autre mesure de la distribution des valeurs de pixel le long de la plage
de niveaux de gris: des images avec une seule valeur constante d'énergie a un maximum
(c'est-à-dire, énergie = 1); Les images avec peu de niveaux de gris auront une énergie plus
élevée que celles avec beaucoup de niveaux de gris. Le descripteur d'énergie peut être calculé
comme suit :
∑[ ]
Support de cours - Vision Artificielle (Master ESE – Semestre 3 – 2018/2019) Pr. Abdelhamid LOUKIL
Chapitre 5 : Extraction de caractéristiques et représentation Page 59
Les histogrammes fournissent également des informations sur la complexité de l'image, sous
la forme d'un descripteur d'entropie. Plus l'entropie est élevée, plus l'image est complexe.
L'entropie et l'énergie ont tendance à varier inversement les unes par rapport aux autres.
La formulation mathématique pour l'entropie est déjà vue en chapitre 1 et est donnée par:
Figure 5.13 : Exemples d’images avec une texture lisse (a), rugueuse (b) et régulière (c)
Il existe trois approches principales pour décrire les propriétés de texture dans le traitement
d'image: structurelle, spectrale et statistique. Dans cette section, nous nous concentrerons sur les
approches statistiques, en raison de leur popularité, leur utilité et leur facilité de calcul.
Un des ensembles statistiques les plus simples pour la description de texture consiste en des
descripteurs basés sur l'histogramme de l'image (ou région): moyenne (luminance), variance (ou
sa racine carrée, l'écart-type), l’asymétrie, l’énergie (utilisée comme mesure de l'uniformité) et
l’entropie.
Support de cours - Vision Artificielle (Master ESE – Semestre 3 – 2018/2019) Pr. Abdelhamid LOUKIL
Chapitre 5 : Extraction de caractéristiques et représentation Page 60
La variance est parfois utilisée comme un descripteur normalisé de rugosité (R), défini par :
Où :
σ2 : est la variance normalisée (à un intervalle [0, 1]).
La valeur de R = 0 pour les zones d'intensité constante, c'est-à-dire de texture lisse.
Exemple :
Le tableau 5.1 montre les valeurs des descripteurs de texture statistiques représentatifs pour
les trois images de la figure 5.13.
Tableau 5.1 : Les descripteurs de texture relatifs aux 3 images de la figure 5.13
Comme prévu, la texture régulière a l'entropie la plus faible des trois. De plus, la texture
grossière montre une valeur plus élevée pour la rugosité normalisée que la texture lisse, ce qui
est également conforme à nos attentes.
Les descripteurs de texture basés sur l'histogramme sont limités par le fait que l'histogramme ne
porte aucune information sur les relations spatiales entre les pixels. Un moyen de contourner
cette limitation consiste à utiliser une représentation alternative pour les valeurs de pixel qui
encode leur position relative les unes par rapport aux autres. Une telle représentation est la
matrice de cooccurrence de niveau de gris G, définie comme une matrice dont l'élément g (i, j)
représente le nombre de fois que des paires de pixels d'intensités zi et zj apparaissent dans
l'image I(x, y) par un opérateur d. Le vecteur d est connu comme vecteur de déplacement:
Où :
dx et dy sont les déplacements, en pixels, le long des lignes et des colonnes, de l'image,
respectivement.
Exemple :
La figure 5.15 montre un exemple de matrice de cooccurrence de niveau de gris pour d = (0, 1).
- Le tableau de gauche est une image de taille (6 × 6) et k = 8 (k est le nombre total de
niveaux de gris - dynamique).
- Le tableau de droite est la matrice de cooccurrence de niveau de gris G, en utilisant une
convention 0 ≤ i , j <k.
Chaque élément dans G correspond au nombre d'occurrences d'un pixel de niveau de gris x
se trouve à gauche d'un pixel de niveau de gris j. Par exemple, puisque la valeur 6 apparaît
quatre fois à gauche de la valeur 3 dans l'image originale, la valeur de g (6, 3) est égale à 4.
Support de cours - Vision Artificielle (Master ESE – Semestre 3 – 2018/2019) Pr. Abdelhamid LOUKIL
Chapitre 5 : Extraction de caractéristiques et représentation Page 61
Figure 5.15 : Une image (a) et sa matrice de cooccurrence pour d =(0,1) (b)
Le contenu de G dépend clairement du choix de d. Si nous avions choisi d = (1, 0) (qui peut
être interprétée comme "un pixel plus bas"), la matrice de cooccurrence de niveau de gris
résultante pour la même image de la Figure 5.15 (a) serait celle de la Figure 5.16.
Figure 5.16 : Une image (a) et sa matrice de cooccurrence pour d =(1,0) (b)
∑ ∑
Où : est la matrice de cooccurrence de niveau de gris normalisée.
Puisque toutes les valeurs de sont comprises entre 0 et 1, on peut les considérer
comme la probabilité qu'une paire de points satisfaisant d ayant des valeurs (z i, zj).
Les matrices de cooccurrence peuvent être utilisées pour représenter les propriétés de texture
d'une image. Au lieu d'utiliser toute la matrice, des descripteurs plus compacts sont préférés.
Ce sont les caractéristiques basées sur la texture les plus populaires qui peuvent être calculées à
partir d'une matrice de cooccurrence de niveau de gris normalisée :
∑∑
Support de cours - Vision Artificielle (Master ESE – Semestre 3 – 2018/2019) Pr. Abdelhamid LOUKIL
Chapitre 5 : Extraction de caractéristiques et représentation Page 62
∑∑
∑∑
∑∑
| |
∑ ∑
Où :
sont les moyennes ;
sont les écarts-types de la ligne
Exemple :
Le tableau 5.2 montre les valeurs des descripteurs de texture statistiques représentatifs pour
les trois images de la figure 5.13. Ces descripteurs ont été obtenus en calculant les matrices
normalisées de cooccurrence de niveau de gris avec d = (0, 1).
Comme prévu, la texture régulière a l'uniformité la plus élevée, la plus grande homogénéité et la
plus faible entropie des trois. Bien que la distinction entre les textures grossière et lisse utilisant
ces descripteurs soit possible (par exemple, l'image avec une texture grossière montre une
corrélation, une uniformité et une homogénéité significativement supérieures à l'image avec une
texture lisse), elle n'est pas aussi intuitive.
Tableau 5.2 : Descripteurs statistiques de texture pour les 3 images de la figure 5.13
Probabilité Energie
Texture Corrélation Contraste Homogénéité Entropie
maximale (Uniformité)
Lisse 0.0013 0.5859 33.4779 0.0005 0.0982 7.9731
Rugueuse 0.0645 0.9420 14.5181 0.0088 0.3279 6.8345
Régulière 0.1136 0.9267 13.1013 0.0380 0.5226 4.7150
Support de cours - Vision Artificielle (Master ESE – Semestre 3 – 2018/2019) Pr. Abdelhamid LOUKIL