Chapitre 2 : Apprentissage
supervisé
Classes
Identification de groupes avec des profils particulier
Possibilité de décider l’appartenance d’une entité à une
classe
Caractéristiques
Apprentissage supervisé: classes connues à l’avance
Pb : qualité de la classification (taux d’erreur)
Ex : établir un diagnostic (si erreur !!!)
Classification - Applications
3
Accord de crédit
Marketing ciblé
Diagnostic médical
Analyse de l’effet d’un traitement
Détection de fraudes fiscales
etc
Classification - Applications
4
Classification - Applications
5
Classification - Applications
6
En image
Classification - Applications
7
Classification - Applications
8
Classification - Applications
9
En audio
Systemes de recommendation
Processus à deux étapes
11
Etape 1 :
Constructiondu modèle à partir de l’ensemble
d’apprentissage (training set)
Etape 2 :
Utilisation du modèle : tester la précision du modèle et
l’utiliser dans la classification de nouvelles données
Etape 1 : Construction du modèle
12
Extensibilité
Interprétabilité
Simplicité
Méthodes de Classification
20
Caractéristiques
Apprentissage supervisé (classes connues)
21 La méthode des plus proches voisins
(KNN : K-nearest neighbors))
Méthode des plus proches voisins
22
Entrée : un enregistrement y
1. Déterminer les k plus proches enregistrements de y
2. combiner les classes de ces k exemples en une classe c
(faire voter les voisins de y)
K=3
Distance
27
Propriétés de la distance:
d(A,A)=0
d(A,B)= d(B,A)
d(A,B)<= d(A,C) + d(B,C)
Distance entre numériques
28
d(x,y) = |x-y|
ou
Autres distances
31
Sommation:
Pourquoi pondérer les attributs?
32
Exemple:
Choix de la classe
33
Calculs d’erreur
Illustration
34
Effet de la valeur de K
35
K=20 K=200
Algorithme KNN : critique
36
Construction de l’arbre
Au départ, toutes les instances d’apprentissage sont à la
racine de l’arbre
3 oui et 5 non
G-statistic
Gain d’information
61
Hypothèses
Classe P : jouer_tennis = “oui”
Classe N : jouer_tennis = “non”
Information nécessaire pour classer
un exemple donné est :
Matrice de confusion
VP
précision pour les positifs
VP FP
VN
précision pour les négatifs
VN FN
Autrement dit :
nb d' exemples correctement attribués à la classe i
précisioni
nb d' exemples attribués à la classe i
Mesures de qualité d’un classeur
82
VP
rappel pour les positifs
VP FN
VN
rappel pour les négatifs
VN FP
Autrement dit :
nb d' exemples correctement attribués à la classe i
rappeli
nb d' exemples appartenant à la classe i
Mesures de qualité d’un classeur
83
Mesure F :