Académique Documents
Professionnel Documents
Culture Documents
(Pattern Recognition)
II.1. Le prétraitement :
Extraction de caractéristiques
1) Transformée de Fourier
Une image numérique est définie par une matrice rectangulaire dont
les éléments correspondent à la valeur de la couleur de chaque pixel.
Cette valeur représente l’intensité lumineuse des pixels des images
noir et blanc.
D'après l'expression de la TF que F(u,v) est en général un nombre
complexe, même si f(m,n) est un nombre réel. F(u,v) possède donc
une amplitude et une phase. On peut choisir de représenter l'une ou
l'autre. Nous ne nous intéresserons qu'à l'amplitude.
2. Plus une droite est longue, plus elle porte des fréquences élevées.
Spectre d’une texture orientée sur les diagonales
2) La transformée de radon
La transformée de radon (1917) est un mappage des coordonnées
rectangulaires cartésiennes (x, y) à une distance et à un angle, également
appelés coordonnées polaires. L'application de la transformée de Radon sur
une image f (x, y) pour un ensemble donné d'angles peut être considérée
comme le calcul de la projection de l'image le long des angles donnés. La
projection résultante est la somme des intensités des pixels dans chaque
direction. Cette transformation peut capturer efficacement les
caractéristiques directionnelles dans l'image du motif en projetant le motif sur
différentes tranches d'orientation. De plus, la transformée du radon peut être
effectuée dans le domaine de Fourier.
Définition 1 :
Soit f(x, y) une fonction continue et à support compact dans R2.
La transformation de Radon de f(x, y) est définie par les intégrales de curvilignes au
long d’une droite L :
∫
Rf = L f(x, y) d l
II.3. La classification
Par exemple, pour trouver si une image donnée contient un visage ou non, le
problème sera un problème de classification face/non-face.
Les classes, ou catégories, sont des groupes de modèles ayant des valeurs de
caractéristiques similaires selon une métrique donnée.
Le clustering est utilisé vise à trouver des aspects communs entre objets.
La classification est une technique d'apprentissage supervisé. C'est-à-dire nous
connaissons les données d'entrée au préalable (étiquetées dans ce cas) et que nous
connaissons la sortie possible de l'algorithme. Il y a deux types de classifications :
classification binaire et classification multiclasses.
La classification binaire répond aux problèmes avec des réponses comme «oui» et
«non», par exemple, tandis que la multiclassification est appliquée pour les
problèmes où l'on trouve plus de deux classes, répondant à des réponses plus
ouvertes telles que " excellent "," bon ", " moyen " ou " médiocre ".
Le clustering (regroupement) est utilisé pour identifier les groupes d’objets qui
ont des aspects communs spécifiques.
La classification est utilisée lorsque vous avez besoin de connaître les objets
(formes, motifs, etc…) pour décider quelle classes à laquelle il peut
appartenir.
Les réseaux de neurones ART flou peuvent être utilisés comme classifieur
vectoriel non supervisé. La théorie de la résonance adaptative (ART) est
compatible avec le cerveau humain dans le traitement de l'information, elle a
la capacité d'apprendre et de mémoriser un grand nombre de nouveaux
concepts d'une manière qui n'entraîne pas nécessairement l'oubli des
concepts existants. ART est capable de classer les vecteurs d'entrée qui se
ressemblent en fonction des modèles stockés. En outre, il peut créer de
manière adaptative un nouveau correspondant à un modèle d'entrée, s'il n'est
similaire à aucune catégorie existante. ART1 était le premier modèle d'ART; il
peut apprendre de manière stable à catégoriser les modèles d'entrée binaire
présentés dans un ordre arbitraire. De plus, la théorie des ensembles flous
peut imiter largement et profondément le processus de pensée de l'être
humain. Ainsi, le modèle Fuzzy ART, qui incorpore des calculs de la théorie des
fuzzy sets au réseau neuronal ART1, est capable d'un apprentissage rapide et
stable des catégories de reconnaissance en réponse à des séquences
arbitraires de modèles d'entrée analogiques ou binaires. La vigilance est un
paramètre qui affecte la performance de Fuzzy ART qui est évaluée par le taux
de reconnaissance. Le paramètre de vigilance maximale permet à Fuzzy ART
de classer les modèles d'entrée dans le taux de reconnaissance le plus élevé.
Les effets combinés de Fuzzy ART et Fuzzy Invariant Vector (FIV) décrits
ci-dessus, donnent de la robustesse.
2) Réseaux de neurones
Un algorithme génétique est une méthode hybride qui peut être utilisée pour
combiner des classifieurs de réseaux. Cela nous donne un véhicule efficace
pour déterminer les paramètres de poids optimaux qui sont multipliés par la
sortie du réseau en tant que coefficients. Il considère la différence de
performance de chaque réseau lors de la combinaison des réseaux. Le
neurone ayant la valeur maximale est sélectionné comme classe
correspondante. Deux approches générales pour combiner les multiples
réseaux de neurones, la technique de fusion où la classification d'une entrée
est en fait basée sur un ensemble de mesures en valeur réelle, ou la technique
de vote qui considère le résultat de chaque réseau comme un jugement
d'expert.
3) Les Champs Aléatoires de Markov (MRF : Markov Random Fields)
Les MRFs sont des modèles stochastiques inspirés des chaines de Markov.
Les MRFs sont de nature multidimensionnelle sont utilisés pour la
reconnaissance de formes ; en combinant des informations statistiques et
structurelles.
Les états sont utilisés pour modéliser les informations statistiques et les
relations entre les états sont utilisées pour représenter les informations
structurelles. Seul le meilleur ensemble d'états doit être considéré. La fonction
d'énergie de vraisemblance globale peut être réécrite avec deux parties, l'une
utilisée pour modéliser les informations structurelles décrites par les relations
entre les états et la seconde modélise les informations statistiques car il s'agit
d'une probabilité de sortie pour l'observation et l'état donnés. Le processus de
reconnaissance consiste à minimiser la fonction d'énergie de vraisemblance
qui est la somme des fonctions de clique. La conception des systèmes de
voisinage et des cliques est basée sur la connectivité et la distance, bien que
les systèmes de voisinage puissent être de toutes formes et tailles en théorie
où la connectivité consiste à représenter certains modèles par des points
caractéristiques, et de nombreux points caractéristiques ne sont pas
connectés directement avec d'autres. Par conséquent, le système de voisinage
constitué des sites situés à une certaine distance est adopté. Les systèmes de
voisinage de ce type conviennent particulièrement à la reconnaissance de
modèles ou à la récupération d'images par correspondance de points critiques
ou de points caractéristiques, car les points critiques ne sont pas connectés.