Vous êtes sur la page 1sur 37

Apprentissage

& Raisonnement dans l’incertain


Master Informatique, spé. AVR
Organisation du cours
Apprentissage connexionniste
Les perceptron multicouches, réseaux récurrents, réseaux
convolutifs, …) permettent de catégoriser et d’estimer une
classe d’appartenance ou la valeur d’une variable réelle au fur
et à mesure de l’acquisition de nouvelles données.
Prise en compte des incertitudes
les modèles de probabilité discrets permettant de
représenter un système dynamique (chaîne de Markov et
HMM)
la manière d’utiliser ces modèles pour prédire des futurs
possibles (réseau bayésien), pour prendre des décisions
(Processus de décision markovien, apprentissage par
renforcement) et pour mettre à jour ses connaissances sur le
monde à partir d’observations (problème de filtrage).

Laurent.Bougrain@univ-lorraine.fr 2
Organisation du cours

Volume 24h (16h CM, 8h TD)

Evaluation
Terminale 60%
Continue 40%
Note plancher : 6/20

Laurent.Bougrain@univ-lorraine.fr 3
Reconnaissance de formes
Généralités

Laurent.Bougrain@univ-lorraine.fr
Bibliographie

Disponible en ligne

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 5


Qu’est-ce qu’une forme ?
Un élément décrit par un ensemble de
caractéristiques/variables.
e.g.:
Une empreinte,
Une mot manuscrit,
Un visage,
Un signal de parole,
Une séquence ADN,
Un geste.

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 6


et la reconnaissance de formes ?
Un domaine
qui utilise théories et méthodes
pour réaliser des systèmes
qui peuvent reconnaître des formes
à partir de données brutes généralement
bruitées
et réaliser une action
basée sur la catégorie/classe de cette forme.

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 7


et la reconnaissance de formes ?
La reconnaissance de formes est partie prenante
de la plupart des systèmes intelligents
qui prennent des décisions.

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 8


et la reconnaissance de formes ?
...étudie comment des systèmes peuvent
Observer l’environnement,
Apprendre à distinguer des formes intéressantes,
Prendre des décisions en fonction de la catégories
de la forme.

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 13


Applications
Reconnaissance d’écriture manuscrite

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 14


Applications
Reconnaissance un empreinte

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 16


Applications
Détection ou graduation d’un cancer

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 17


Applications
Segmenter des terrains

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 18


Applications
Classification de données de puce

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 19


Exemple de classement
Supposons que :
Une usine de conditionnement de poissons veut
automatiser le processus de tri de poissons entrant
sur un tapis roulant selon l’espèce,
Il y a deux espèces :
• Bar,
• Saumon.

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 20


Exemple de classement
Comment distinguer une espèce de l'autre ?
longueur, largeur, poids, nombre et forme des
nageoires, forme de la queue, etc.

Bar Saumon

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 21


Exemple de classement
Supposons qu’un employé de l'usine de poissons
nous dise que :
• Le bar est généralement plus long que le
saumon
Alors notre modèle de reconnaissance
considèrera que :
• Le bar a une longueur typique qui est plus
grande que celle du saumon.

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 22


Exemple de classement
La longueur est une caractéristique (feature),
Nous pouvons tenter de classer les poissons en
regardant si oui ou non la longueur d'un
poisson est supérieure à une certaine valeur
critique (valeur de seuil).

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 23


Exemple de classement
Comment définir la valeur critique (valeur de
seuil) ?
Nous pourrions :
1) obtenir quelques exemples/spécimens
(échantillon d’apprentissage) des différents
types de poissons,
2) Effectuer des mesures de longueur,

3) Inspectez les résultats.

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 24


Exemple de classement
Résultats des mesures de longueur sur
l'échantillon d’apprentissage contenant des
poissons des deux espèces.

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 25


Exemple de classement
Peut-on séparer de manière fiable les bars des
saumons en utilisant la longueur comme
caractéristique ?
Rappelez-vous notre
modèle :
le bar a une longueur
typique qui est plus
grande que celle du
saumon.

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 26


Exemple de classement
A partir de l’histogramme, nous pouvons voir
que cette caractéristique est assez pauvre.

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 27


Exemple de classement
Il est évident que la longueur n’est pas un bon
choix.
Que pouvons-nous faire pour séparer le bar du
saumon ?
Essayez une autre caractéristique :
la brillance moyenne des écailles de poisson.

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 28


Exemple de classement
Peut-on séparer de manière fiable les bars des
saumons en utilisant la brillance comme
caractéristique ?

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 29


Exemple de classement
La brillance est meilleure que la longueur
comme caractéristique mais il y a toujours des
erreurs de classement.

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 30


Exemple de classement
Supposons que nous savons aussi que :
Le bar est généralement plus large que le saumon.
Nous pouvons utiliser plus d'une
caractéristique pour prendre notre décision :
La brillance (x1) et la largeur (x2)

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 31


Exemple de classement
Chaque poisson est maintenant un point dans
un espace à deux dimensions :
La brillance (x1) et la largeur (x2)

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 32


Fonction de coût des erreurs
Le coût des différentes erreurs de classement
et donc des actions qui en découleront doit
être considérée lors de la prise de décision,
Nous essayons d’avoir une règle de décision qui
minimise un coût ou risque en fonction des
coûts des erreurs,
Telle est la tâche centrale de la théorie de la
décision.

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 33


Fonction de coût des erreurs
Par exemple, si l'entreprise d'emballage du poisson
sait que :
• Les clients qui achètent du saumon se plaindront
s’ils trouvent du bar dans leurs boîtes.
• Les clients qui achètent du bar ne seront pas
mécontents s’ils trouvent de temps en temps du
saumon (pas cher) dans leurs boîtes.
Alors le coût d’une erreur de classement
f(saumon)->bar sera moins forte que dans l’autre
sens.
Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 34
Frontières de décision
Nous pouvons réduire les erreurs si nous
utilisons des frontières de décision plus
complexes.

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 35


Frontières de décision
Il y a un compromis entre la complexité des
règles de décision et leurs performances sur des
échantillons inconnus.
La généralisation est la capacité du classifieur à
produire des résultats corrects sur de nouvelles
formes.
Pour cela, il faut souvent simplifier la frontière de
décision !

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 36


Frontières de décision
La frontière de décision ci-dessous peut
représenter un compromis optimal entre la
performance obtenue sur l'ensemble
d’apprentissage et la simplicité du classifieur.

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 37


Cycle de modélisation : préparation
1. Acquisition des données brutes
• Capture d’une image du poisson
2. Pré-traitement pour diminuer le bruit
• Amélioration du contraste
3. Segmentation
• Extraction du contour
4. Extraction des caractéristiques (x1, x2,…)
• Brillance et largeur
5. Enregistrement d’un échantillon
• 50 bars et 50 saumons
Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 38
Cycle de modélisation : Apprentissage
6. Choix de la famille de modèles
• Modèle linéaire a1x1 + a2x2 > θ
• Types de modèles : de décisions théoriques ou
statistiques, syntaxiques ou structurelles, de
neurones artificiels, hybride…
7. Choix de la fonction de coût
8. Apprentissage des paramètres (a1, a2) du
modèle à partir de l’échantillon
d’apprentissage à l’aide d’une méthode
d’apprentissage statistique
Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 39
Cycle de modélisation : Evaluation
6. Evaluation des performances
Sur l’ensemble d’apprentissage
Sur l’ensemble de test
Étudier les problèmes de sur-apprentissage et de
généralisation.

Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 40


Formes d’apprentissage
Apprentissage supervisé
Estimer la valeur d’une variable à partir d’un
ensemble de variables (quantitatives ou
qualitatives) sur la base d’un ensemble de cas où
cette valeur est connu
• Si la variable à prédire est quantitative, on parle de
régression
• Si la variable à prédire est qualitative, on parle de
discrimination
Apprentissage par renforcement
Apprentissage supervisé pour lequel on sait
uniquement si la décision est correcte ou non.
Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 41
Formes d’apprentissage
Apprentissage non supervisé
Seules les variables descriptives sont utilisées. Par
exemple pour faire de la classification.
Apprentissage semi-supervisé
Tous les éléments de l’échantillon ne sont pas étiquetés. On
peut utiliser la distribution des variables sur l’ensemble de
l’échantillon mais n’apprendre les paramètres du modèle
que sur une partie.
Apprentissage par transfert
Recherche des similitudes entre les données de
deux problèmes et extrapolation de la solution.
Laurent.Bougrain@univ-lorraine.fr Reconnaissance de formes 42

Vous aimerez peut-être aussi