Académique Documents
Professionnel Documents
Culture Documents
1 Introduction
3 Problèmes et Objectifs
Introduction
La matrice X est d’ordre (n,p). Son terme générique est xij (ième
observation de la jème variable.). Chaque ligne de X représente les
valeurs prises par l’individu i sur les p variables ; de même chaque
colonne de X représente les valeurs de la variable p pour les n indi-
vidus. Par simplicité de langage, l’individu i est une ligne du tableau
X identifié au vecteur xi de Rp et la variable j est une colonne du
tableau X identifiée au vecteur xj de Rn.
Lorsque toutes les variables sont exprimées dans la même unité et que
les variances ne sont pas trop différentes (de sorte que chaque variable
ait la même importance dans le calcul des distances entre points), la
distance euclidienne convient. Dans le cas contraire, la métrique la
plus couramment utilisée est la métrique des inverses des variances.
Cette métrique permet à la fois de s’affranchir de l’unité de mesure
et de donner à chaque variable la même importance dans le calcul
de la distance. Cette démarche est appelée centrage-réduction.
Dr Nvuh Njoya Y. Analyse en Composantes Principales
Introduction
Données, Notations, Exemples Distance entre points individus
Problèmes et Objectifs Principe d’ajustement
Analyse du nuage des individus dans Rp Matrice à diagonaliser
Analyse du nuage des variables dans Rn Axes factoriels
Interprétation d’une ACP normée
xij − xj
rij = √ (3)
σj n
s/c u 0 u = 1
Soit u1 le vecteur qui réalise ce maximum. Le sous-espace à deux
dimensions s’ajustant au mieux au nuage contient nécessairement le
sous-espace engendré par u1 . On cherche ensuite u2 , le second vec-
teur de base de ce sous-espace, orthogonal à u1 et rendant maximal
u’2 X’Xu2 . On recherche de façon analogue le meilleur sous-espace
au sens des moindres carrés à q dimensions (pour q6p ).
Dr Nvuh Njoya Y. Analyse en Composantes Principales
Introduction
Données, Notations, Exemples Distance entre points individus
Problèmes et Objectifs Principe d’ajustement
Analyse du nuage des individus dans Rp Matrice à diagonaliser
Analyse du nuage des variables dans Rn Axes factoriels
Interprétation d’une ACP normée
ψα = Xuα
D’où :
d 2 (j, j 0 ) = 2(1 − cjj 0 ) (6)
Dr Nvuh Njoya Y. Analyse en Composantes Principales
Introduction
Distance entre points variables
Données, Notations, Exemples
Distance à l’origine
Problèmes et Objectifs
Principe d’ajustement
Analyse du nuage des individus dans Rp
Matrice à diagonaliser
Analyse du nuage des variables dans Rn
Axes factoriels
Interprétation d’une ACP normée
avec
p avec ∑pα=1 ϕαj
2 =1 et |ϕ |61
αj
∑ cos2α (i) =1
α=1 p
∑ cos2α (j) = 1
α=1
Éléments supplémentaires
Représentation simultanée
L’analyse du nuage des variables est déduite de celle du nuage
des individus : la représentation des variables sur les axes facto-
riels dans Rn aide l’interprétation des axes factoriels dans Rp et
réciproquement.
Cependant les deux nuages ne sont pas dans le même repère, ce
qui rend impossible la représentation simultanée des individus et
des variables. La superposition de ces deux plans factoriels n’a
pas de sens.
Toutefois, si l’on considère non plus des points-variables mais
des directions de variables dans Rp , on peut alors envisager de
représenter simultanément, dans cet espace, à la fois les points-
individus et des vecteurs représentant les variables.