Vous êtes sur la page 1sur 3

RdF : reconnaissance de formes Master 1

2h — documents autorisés — calculatrice interdite Informatique

Pour faciliter la correction, changez de page ou utilisez un nouvel intercalaire pour traiter chacune des 3 parties.

1 Analyse de texture par filtrage linéaire


En utilisant une approche similaire à celle proposée par Laws, on va utiliser les trois filtres linéaires de la figure 1
pour mettre en évidence des textures spécifiques dans une image.
Comme dans l’exercice traité en TD, les images initiales sont binaires, mais le résultat des opérations de
convolution est un nombre entier relatif. On considérera que les deux états binaires sont codés par −1 pour le
noir (au lieu de 0) et +1 pour le blanc.

1 2 1 -2 0 2 -1 2 -1

(a) M3 (b) E3 (c) L3

Figure 1 – masques des filtres d’analyse de texture

La première étape de traitement est une opération de convolution réalisée entre l’un des trois masques et l’image.

Questions :
1. calculer les 3 images ligne résultant du filtrage d’une image ligne ne contenant que des pixels noirs.
2. calculer les 3 images ligne résultant du filtrage d’une image ligne contenant une alternance de pixels noirs
et blancs (série [−1, +1, −1, +1, −1, etc.]).
3. pour le filtre E3, trouver la texture pour laquelle la valeur absolue de la réponse est toujours maximale.

La deuxième étape consiste à sommer sur 4 pixels successifs les valeurs absolues des réponses des filtres puis à
pondérer le résultat afin de constituer un indice de texture compris entre 0 et 1.

Questions :
4. pour chaque filtre, calculer le coefficient de pondération qui permet de garantir que l’indice de texture
prend toujours une valeur comprise entre 0 et 1.
5. calculer les indices de texture obtenus pour la ligne de pixels de la figure 2 pour le filtre L3 normalisé.

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29

Figure 2 – ligne d’une image binaire

2 Analyse en composantes principales


Nous allons exécuter une analyse en composantes principales sur les 6 données 2D suivantes :

{(3, 3), (4, 6), (4, 2), (5, 5), (6, 4), (2, 4)}

Questions :
1. calculer la moyenne m des données.
2. calculer S la matrice de co-variance des données.
3. donner les 2 vecteurs et valeurs propres associées de S.

1
4. quel est le vecteur propre à retenir pour la projection sur la droite optimale ?
5. tracer sur votre copie de manière graphique la droite optimale et projeter les points sur la droite. Quelle
est votre conclusion sur la discrimination des points ainsi projetés ?
6. peut-on discriminer ainsi les 2 classes composées chacune de 3 données :

C1 = {(3, 3), (2, 4), (4, 2)} et C2 = {(5, 5), (4, 6), (6, 4)}

7. obtient-on un résultat similaire en projetant sur la droite dont le vecteur directeur est l’autre vecteur
propre ? Donnez en la raison.

3 Reconnaissance syntaxique

3.1 Arbres de décision


On considère les données d’apprentissage fournies dans le Tableau 1. Les données sont représentées par trois
attributs binaires A1, A2, A3 ∈ {V, F} et appartiennent à l’une des deux classes C1 et C2. À partir de ces données,
on construit l’arbre de classification T fourni dans la Figure 3, en se basant sur le critère de maximisation du
gain d’information.

A1 A2 A3 Classe
1 V V F C1
2 F F V C1
3 F F V C1
4 V F F C1
5 V V V C1
6 F F V C1
7 F F V C1
8 F F V C1
9 F V F C2
10 F V V C2
11 F V F C2
12 F F F C2
13 F F F C2
14 F V F C2
15 F V V C2

Table 1 – Données d’apprentissage pour la construction de l’arbre de décision T .

A1 A2 A3 Classe
1 V F V C1
2 V V F C1
3 F F V C1
4 F F F C1
5 F F F C1
6 F V V C2
7 F V F C2
8 F F V C2

Table 2 – Données de test.

Questions :
1. En vous basant sur l’arbre de décision T , donnez une interprétation des différentes classes sous forme de
propositions logiques.
2. Justifiez numériquement le choix de l’attribut A1 comme premier nœud de l’arbre de décision T . Donnez
le détail des calculs menant à ce choix.

2
Figure 3 – Arbre de décision T .

3. Pour chaque échantillon de test du Tableau 2, indiquez la classe prédite par l’arbre de décision T .
4. Quel est le taux de classification de l’arbre T sur les données de test ?
5. Le taux de classification sur les données d’apprentissage est de 100%.
(a) Quel phénomène observe-t-on ici ?
(b) Que pourrait-on faire pour améliorer le taux de classification de T sur les données de test ?
(c) Donnez une nouvelle version T 0 de l’arbre T qui maximise le taux de classification sur les données de
test. Il n’est pas demandé de justifier numériquement votre solution.
(d) Quel est le taux de classification de T 0 sur les données de test ?

3.2 Distances entre séquences


On souhaite calculer la distance de Levenshtein (ou distance d’édition) entre les séquences de caractères article
et désarticulé. L’algorithme de programmation dynamique vu en cours fournit le Tableau 3 pour le calcul de
cette distance.

d é s a r t i c u l é
0 1 2 3 4 5 6 7 8 9 10 11
a 1 1 2 3 3 4 5 6 7 8 9 10
r 2 2 2 3 4 3 4 5 6 7 8 9
t 3 3 3 3 4 4 3 4 4 6 7 8
i 4 4 4 4 4 5 4 3 4 5 6 7
c 5 5 5 5 5 5 5 4 3 4 5 6
l 6 6 6 6 6 6 6 5 4 4 4 5
e 7 7 7 7 7 7 7 6 5 5 4 5

Table 3 – Tableau de calcul de la distance de Levenshtein entre article et désarticulé.

Questions :
1. Quelle est la distance entre article et désarticulé ?
2. Indiquez le nombre d’insertions, de suppressions et de substitutions nécessaires pour passer de article
à désarticulé.

Vous aimerez peut-être aussi