Académique Documents
Professionnel Documents
Culture Documents
1. Introduction
L’analyse factorielle discriminante (AFD) est une méthode descriptive et explicative apparentée de
l’analyse en composantes principales (ACP), s’appliquant à des données quantitatives sur lesquelles,
on a déjà défini une topologie ou une partition. Par exemple, les indicateurs associés à des clients
d’une banque classés comme : bon payeur, mauvais payeur, ayant fait faillite.
Donc, elle vise à décrire, expliquer et prédire l’appartenance à des groupes prédéfinis (des classes),
d’un ensemble d’observations à partir d’une série de variables prédictives.
2. Domaine d’application
2.1. Médecine
Pour détecter les groupes à haute risque cardiaque. A partir de caractéristiques telles que
l’alimentation, le fait de fumer autant, les antécédents familiaux…etc.
Lorsqu’on veut évaluer la fiabilité d’un demandeur de crédit à partir de ses revenus, le nombre de
personnes à charge…etc.
2.3. En biologie
Le but d’une méthode comme l’ACP, est de définir le nombre de dimension de données en
recherchant celles suivant lesquelles les classes séparent le mieux. Divers indicateurs et tests sont
également calculés qui permettent de juger l’intérêt de la pertinence des résultats obtenus.
4. Exemple
Considérons le suivi de N malades, pour chacun, on mesure P paramètres, selon ces mesures, on
constate qu’il y’a trois états possibles (Amélioration, stationnaire, détérioration).
état =f l ( X 1 , X 2 , … , X p ) fct linéaire
¿ a1 . X 1 +a2 . X 2+ …+a p . X p
5. Les méthodes
L’analyse discriminante étudie les liaisons entre les caractères à expliquer et les caractères
explicatives.
5.1. L’AFD :
C’est le calcul de probabilités d’appartenance aux différentes d’une observation aux différents
groupes.
Prévoir les modalités des caractères à expliquer à partir des valeurs prises par les caractères
explicatives.
6. Présentation
Etude d’un tableau ind*var :
o Var
o p variables X1,…, Xp quantitatives.
o Reparties en k classes selon les modalités d’une variable qualitatives Y
Recherche de variables discriminants se séparant les k classes (AFD).
Affectation d’une nouvelle observation à une des classes en fonction de ses valeurs de X
observées (ADB).
7. La méthode AFD
Pour déterminer un ou des facteurs de combinaison(s) linéaire(s). Les variables descriptives qui
prennent des valeurs les plus proches possibles pour des éléments de la même classe et les plus
éloignés possibles des éléments de classe différentes.
Ayant n individus repartis en k groupes sur lesquels on a relevé p variables quantitatives. On note :
X1 X2 X3 X4 X5 X6 X7 XP
X1
classe
X2
1
X3
X4
classe
X5
2
X6
X7
classe k
Xp
On centre les variables pour déplacer l’origine vers le centre de gravité, on note :
❑
De groupe w i=∑ ( y ih − y i . ) ' . ( y ih − y i . ) / N
h
❑
ni . . w i
Intra classes w=∑
i N
❑
Inter classe B=∑ ni . . ( y i. − y .. ) ' . ( y i .− y .. ) /N
h
On a l’égalité matricielle : T =w +B
Supposons qu’on a deux variable X et Y et trois classes, le schéma au dessus, donnez l’axe
discriminant qui représente au mieux les trois classes.
La variable X seule ne représente pas les trois classes, la variable Y seule ne représente pas les trois
classes non plus. Or Z=a.Xi+b.Yi+c sépare les trois classes (combinaison linéaire).
Dans l’ACP, on cherche des composantes principales Cj qui doivent
représenter au mieux les distances qui existent entre ces
individus.
Dans l’AFD, on recherche les composantes principales qui
représentent au mieux la séparation entre les classes.