Vous êtes sur la page 1sur 6

Analyse factorielle discriminante (AFD)

1. Introduction

L’analyse factorielle discriminante (AFD) est une méthode descriptive et explicative apparentée de
l’analyse en composantes principales (ACP), s’appliquant à des données quantitatives sur lesquelles,
on a déjà défini une topologie ou une partition. Par exemple, les indicateurs associés à des clients
d’une banque classés comme : bon payeur, mauvais payeur, ayant fait faillite.

Donc, elle vise à décrire, expliquer et prédire l’appartenance à des groupes prédéfinis (des classes),
d’un ensemble d’observations à partir d’une série de variables prédictives.

2. Domaine d’application

L’analyse discriminante est utilisée dans plusieurs propres domaines :

2.1. Médecine

Pour détecter les groupes à haute risque cardiaque. A partir de caractéristiques telles que
l’alimentation, le fait de fumer autant, les antécédents familiaux…etc.

2.2. Dans le domaine bancaire

Lorsqu’on veut évaluer la fiabilité d’un demandeur de crédit à partir de ses revenus, le nombre de
personnes à charge…etc.

2.3. En biologie

Lorsqu’on veut affecter un objet à sa famille d’appartenance à partir de ses caractéristiques


physiques.

3. Que ce que c’est que l’analyse discriminante ?


 Elle permet d’étudier la différence entre deux ou plusieurs groupes en tenant de multiples
variables simultanément.
 Elle permet aussi d’étudier les relations entre une variable qualitative et des variables
explicatives quantitatives.
 Elle permet d’analyser les différences entre les groupes et/ou les moyens pour assigner
(classifier) les cas du groupe qui les ressemble le plus.
 Elle sert à valider une classification ou faire un choix entre plusieurs classifications pour
savoir laquelle est la plus pertinente (l’analyse discriminante intervient donc à postériori une
classification).

Le but d’une méthode comme l’ACP, est de définir le nombre de dimension de données en
recherchant celles suivant lesquelles les classes séparent le mieux. Divers indicateurs et tests sont
également calculés qui permettent de juger l’intérêt de la pertinence des résultats obtenus.

4. Exemple

Considérons le suivi de N malades, pour chacun, on mesure P paramètres, selon ces mesures, on
constate qu’il y’a trois états possibles (Amélioration, stationnaire, détérioration).
état =f l ( X 1 , X 2 , … , X p ) fct linéaire

¿ a1 . X 1 +a2 . X 2+ …+a p . X p

Les a i représentent les poids associés aux variables

5. Les méthodes

L’analyse discriminante étudie les liaisons entre les caractères à expliquer et les caractères
explicatives.

L’analyse discriminante comporte trois analyses :

5.1. L’AFD :

C’est mettre en évidence des différences entre les classes

5.2. L’analyse discriminante bayésienne

C’est le calcul de probabilités d’appartenance aux différentes d’une observation aux différents
groupes.

5.3. L’analyse discriminante décisionnelle

Prévoir les modalités des caractères à expliquer à partir des valeurs prises par les caractères
explicatives.

6. Présentation
 Etude d’un tableau ind*var :
o Var
o p variables X1,…, Xp quantitatives.
o Reparties en k classes selon les modalités d’une variable qualitatives Y
 Recherche de variables discriminants se séparant les k classes (AFD).
 Affectation d’une nouvelle observation à une des classes en fonction de ses valeurs de X
observées (ADB).
7. La méthode AFD

Pour déterminer un ou des facteurs de combinaison(s) linéaire(s). Les variables descriptives qui
prennent des valeurs les plus proches possibles pour des éléments de la même classe et les plus
éloignés possibles des éléments de classe différentes.
Ayant n individus repartis en k groupes sur lesquels on a relevé p variables quantitatives. On note :

  X1 X2 X3 X4 X5 X6 X7   XP
X1                  
classe
X2                  
1
X3                  
X4                  
classe
X5                  
2
X6                  
X7                  
                   
classe k
Xp                  

On centre les variables pour déplacer l’origine vers le centre de gravité, on note :

y ih : element de R p , c ' estle hième individu du groupe i

ni :l ' effectif du groupe i

y i . centre de gravité du groupei

y .. centre de gravité de l' ensemble

On définit les matrices de variance-covariance



Totale T =∑ ( y ih − y .. ) ' . ( y ih − y .. ) / N
ih


De groupe w i=∑ ( y ih − y i . ) ' . ( y ih − y i . ) / N
h


ni . . w i
Intra classes w=∑
i N

Inter classe B=∑ ni . . ( y i. − y .. ) ' . ( y i .− y .. ) /N
h

On a l’égalité matricielle : T =w +B

Pour le calcul des valeurs propres, on a T −1 . B .u=λ . u

L’analyse discriminante a deux objectifs :

 Déterminer la combinaison linéaire de p variables qui exprime le mieux la séparation des n


individus en k classes. De plus présenter une représentation graphique comme l’ACP.
 Ayant un nouvel individu sur lequel on a mesuré les p variables. On cherche à déterminer à
quelle classe il a plus de chances d’appartenir.

Supposons qu’on a deux variable X et Y et trois classes, le schéma au dessus, donnez l’axe
discriminant qui représente au mieux les trois classes.
La variable X seule ne représente pas les trois classes, la variable Y seule ne représente pas les trois
classes non plus. Or Z=a.Xi+b.Yi+c sépare les trois classes (combinaison linéaire).
 Dans l’ACP, on cherche des composantes principales Cj qui doivent
représenter au mieux les distances qui existent entre ces
individus.
 Dans l’AFD, on recherche les composantes principales qui
représentent au mieux la séparation entre les classes.

Vous aimerez peut-être aussi