Académique Documents
Professionnel Documents
Culture Documents
(ACP)
1. Introduction
L’Analyse en Composantes Principales (ACP) est sans doute la méthode d’analyse de
données la plus connue et la plus utilisée. Proposée dès les années 30 par HOTELLING (1933),
mais nécessitant d’importants calculs numériques, L’ACP n’est devenue une technique
opérationnelle qu’à partir des années 60, avec le développement des moyens de calculs
informatique.
Elle est la méthode de base en statistique exploratoire multidimensionnelle (ou analyse des
données)
- Multidimensionnelle : l’analyse porte sur plusieurs variables
- Exploratoire : descriptive (par opposition à inférentielle) Il s’agit de résumer
l’information portant sur plusieurs variables en :
- faisant émerger des liaisons entre variables
- formant des groupes d’individus se ressemblant.
L’analyse en composantes principales présente de nombreuses variantes selon les
transformations apportées au tableau de données : le nuage de points des individus peut être
centré ou non, parmi ces variantes, l’analyse en composantes principales normée (nuage centré-
réduit) certainement la plus utilisée.
Le ième individu :
La jème variable :
3. Principe de l’ACP
Le principe de l’ACP est d’obtenir une représentation approchée du nuage des individus
N(I) dans un sous espace de faible dimension k inférieur ou égale à p et pour cela on projette
les individus sur un sous espace de dimension faible, le choix de sous espace de projection
s’effectue suivant le critère : « les distances en projection doivent être déformées le plus
possible ».ce qui veut dire l’inertie du nuage projetée sur le sous espace (F) doit être maximale.
chaque individu poids Pi. Les valeurs sont rangées dans un tableau à n lignes et p colonnes ;
Où est la valeur prise par la variable j sur l’individu i. (on peut écrire aussi )
Vecteur .
Est en fait la moyenne pondérée des valeurs de la variable j prises par l’ensemble des
individus.
C) Le Tableau De Données Centrées Réduites
On note :
Par :
La Matrice de Corrélation : R
l’espace à p dimensions.
Décomposition de l’inertie
p
• Direction de R qui maximise l’inertie projetée : On cherche telle que
maximum.
du nuage de points est maximale ; cet axe F1 passe au plus près du nuage de points,
c'est-à-dire est tel que la moyenne des carrées des distances entre les n points et l’axe F1
est minimale.
Soit le vecteur directeur normé de F1 ; est alors le vecteur propre normé associé à la
2
3
dispersion du nuage de points est maximales ; cet axe Fp passe au plus près du nuage
de points, c'est-à-dire est tel que la moyenne des carrées des distances entre les n points
possible les variables de départ, et non corrélée aux (p-1) premières composantes
Si les écarts types sont égaux alors les variables sont homogènes, et on utilise une
Calcul des valeurs propres de la matrice R, i = 1…p rangés par ordre décroissant
Présentation des variables : donne les coordonnées des p variables, est aussi le
corrélation.
4. Interprétation
Pour interpréter les résultats fournis par une ACP, on procédera dans un premier
temps à l’examen de l’inertie de chaque facteur puis on s’intéresse aux éléments contribuant à
la construction et à la définition des facteurs.
Parmi les règles pratiques les plus courantes on s’intéresse en générale aux axes ayant
une inertie supérieure à la moyenne, qui vaut 1 dans le cas d’une ACP normée.
On procède axe par axe pour définir les composantes, l’examen du plan factoriel
permet de visualiser les corrélations entre les variables et identifier des groupes d’individus
ayant pris les mêmes valeurs pour les mêmes variables.
Les variables fortement corrélées avec un axe vont contribuer à la définition de cet
axe , on s’intéresse par conséquent aux variables présentant les fortes coordonnées (ce qui
situent proche du cercle de corrélation) et l’on interprétera les composantes principales en
fonction des groupements de certaines de ces variables et de l’opposition avec les autres,
rappelons que le cosinus de l’angle sous lequel on voit deux variables actives dans le cercle
n’est que le coefficient de corrélation de ces deux variables selon la qualité d’ajustement .
Où :
On s’intéressera surtout aux individus qui ont les plus fortes contributions relatives aux
axes. La représentation des individus sur le plan factoriel permet d’apprécier leur répétition et
de réparer des zones de densités plus ou moins fortes.
1°) Interprétation des axes : On retient que les axes que l’on peut attribuer une forme
d’interprétation économique, par exemple, soit directement, soit en terme des variables avec
lesquelles ils sont très corrélés.
2°) Critère de Kaiser (variables centrées et réduites) : On ne retient que les axes associés
aux valeurs propres supérieurs à 1, c'est-à-dire dont la variance est supérieure à celle des
variables d’origine.
• Une autre interprétation est que la moyenne des valeurs propres étant 1, on ne garde
que celles qui sont supérieures à cette moyenne.
C'est donc une quantité qui tient compte à la fois de la norme des vecteurs ainsi que de l'angle
qu'ils forment. Deux vecteurs formant un angle aigu donneront un produit scalaire positif alors
que pour deux vecteurs formant un angle obtu, le produit scalaire sera négatif. Entre ces deux
cas, notons que deux vecteurs orthogonaux auront un produit scalaire nul.
On a une autre définition du produit scalaire de deux vecteurs en lien avec leurs coordonnées.
Si l'on considère deux vecteurs , de R3 repérés par leurs coordonnées
et , le produit scalaire peut s'écrire :
Exemple : Pour des vecteurs de norme 1, le produit scalaire donne une mesure de l’angle (via
le cosinus) :
Normé : =1
Si nous considérons deux variables j et j’ associées aux données que nous étudions, leur
coefficient de corrélation linéaire s'écrit donc :
C’est le produit scalaire des deux colonnes centrées-réduites associées (à 1/n près) :
Notons qu'un coefficient de corrélation est toujours compris entre -1 et 1. On voit par
ailleurs, qu'au efficient 1/n prés, rj j’ correspond au produit scalaire entre deux vecteurs
colonnes de la matrice X des données centrées réduites. Comme nous avons dit que les vecteurs
colonnes j et j’ avaient tous les deux la même norme, ce coefficient donne en fait une mesure
du cosinus de l'angle formé par ces vecteurs. Plus précisément, correspond exactement au
Donc:
Qualité de représentation d'un élément (individu ou variable) par un axe :
La qualité de représentation d'un élément i par l'axe α est donnée par le rapport de
l'inertie de la projection de l'élément i sur l'axe α et de l'inertie totale de l'élément i :
Afin d’interpréter les points i de N(I), on utilise les mêmes règles d’interprétations que