Chap. VI - Analyse en Composantes Principales

Chap.
VI – Analyse en Composantes Principales 11
Chapitre VI - ANALYSE EN COMPOSANTES PRINCIPALES
1. GENERALITES.
L’analyse en composantes principales (ACP) s’utilise quand il s’agit de décrire un tableau X de

valeurs numériques continues du type “ individus - caractères ”.
Par exemple, évolution des dépenses des ménages Européens dans différents secteurs, comme
l'alimentation, les loisirs, l'automobile etc... en fonction des années. Dans notre cas, les secteurs
sont considérés comme caractères et les années individus.
On est ainsi en présence d’un tableau initial individus-caractères, X (n,p) de n individus et p

caractères.
Comme on l’a vu précédemment les individus forment un nuage de n points dans l’E.V Rp
(espace des individus) et les caractères, un nuage de p points dans l’E.V Rn (espace des
caractères).
Si l’on veut représenter les individus (ou caractères) sur un graphique plan on aura une figure
déformée de la représentation exacte.
La projection raccourcit les distances, on cherche donc un plan (π) dit plan principal tel que la
somme des carrés des projections des distances soit maximale.
Si on appelle d(Mi ; Mj) la distance entre les points Mi et Mj alors, on cherche (π) le plan
principal tel que :
∑d 2
( H i ; H j ) maximum (Hi, Hj projections orthogonales, respectivement de Mi, Mj sur (π)
On aura : d(Hi, Hj) ≤ d(Mi, Mj)
Soient deux droites F1 et F2 (F1 ⊥ F2 ) telles que:
d2(Hi; Hj) = d2(αi; αj) + d2(βi; βj)
Mi
F2
Mj
βi Hi
βj Hj
F1
αi αj
π
Michel RAYNAUD Statistiques Appliquées

Chap. VI – Analyse en Composantes Principales 12
La méthode consiste à chercher:
F1 telle que ∑d 2
(α i ; α j ) soit maximal
puis F2 telle que ∑d 2

(βi ; β j ) soit maximal
N.B. Comme on l’a vu précédemment, on peut étendre le procédé en dehors du plan. Sera
alors trouvé les droites F3, ... Fα, ... Fp orthogonales, qui seront les axes principaux du nuage
r r r
(support des vecteurs u 1 , ... u α , ... u p )
r
Les nouvelles composantes des vecteurs OM i sur ces axes sont alors les composantes
principales.
p
C (α , i ) = X i uα = ∑ X ik u kα Xi : ième ligne de la matrice X
k =1
r
C(α , i ) étant la composante principale du point Mi (ou vecteur OM i ) sur le αième axe principal.
II. CHOIX D’UNE METRIQUE EN ACP
Plaçons-nous par exemple dans l’espace des individus Rp.
Chaque individu est défini par p

coordonnées et est un vecteur de Rp
Axe j M1
r r
e i = OM i ayant pour composantes: x1j
(x1i, ....., xip).
x2j M2
Comment calculer la distance entre 2
individus
- En physique: Pythagore
x1k x2k Axe k
d 2 (M 1 ; M 2 ) = ( x 1k − x 2 k ) 2 + ( x 1 j − x 2 j ) 2
- Différent en statistique où les dimensions sur chaque axe ne sont pas les mêmes.
On part du principe que:
d 2 (M1 ; M 2 ) = a1 ( x11 − x 21 )2 + a 2 (x12 − x 22 )2 + ... + a p (x1p − x 2p ) 2

Ce qui revient à multiplier chaque caractère par a j , aj>0
Pythagore n’est valable que si les axes sont orthogonaux.
Si on prend des axes obliques faisant entre eux un angle θ alors:

Axe j
d2(M1 ;M2) se calcule avec x1j M1

la différence des 2 vecteurs:
x2j ∆ M2
θ
O x1k x2k Axe k
r r r r r r r
∆M 2 − ∆M 1 = M 1M 2 ⇒ d 2 (M 1 ; M 2 ) = (∆M 2 ) 2 + (∆M 1 ) 2 − 2.∆M 2 ∆M 1
soit:
d 2 (M1; M 2 ) = (x1k − x 2 k )2 + ( x1 j − x 2 j )2 − 2( x1k − x 2 k )(x1 j − x 2 j ) cos θ ou
p p
d 2 (M1; M 2 ) = ∑∑ mij ( x1k − x 2k )( x1 j − x 2 j )
k =1 j =1
matriciellement:
d 2 (M1; M 2 ) = (M1 - M2)' M (M1 - M2)
N.B. Pythagore revient à choisir M = I.
L’espace des individus étant muni d’une structure euclidienne, M= [mkj]: matrice de l’espace
euclidien peut être n’importe quelle matrice symétrique définie positive.
On définit ensuite le produit scalaire de 2 vecteurs de l’espace des individus:

r r
e1 = OM1 ,
r r
e2 = OM 2
Le produit scalaire des 2 vecteurs dans l’espace muni de la norme M s'exprime par :
r r
< e1; e2 > M = e1' Me 2
2 r
N.B. Le produit scalaire de e1 par lui même est noté e1 M
et e1 M
analogue au module de e1
s’appelle la M norme de e1
La métrique généralement utilisée en ACP normée est la métrique diagonale qui revient à
pondérer les caractères en 1/s2 s représentant l'écart-type du caractère, ainsi :

1 / s12 0 
 
 1 / s 22 
M = D1/s 2 = 
 . 
 0 1 / s 2p 

Ce qui revient à diviser chaque variable par son écart-type.
Ainsi cette métrique donne à chaque caractère la même importance (un caractère dispersé
“ n’absorbe ” pas ainsi toute la variance) et d’autre part les distances entre individus sont
adimensionnelles ce qui permet de traiter des caractères d'unités différentes.
r r
En posant M=T’T, alors le produit scalaire < e1; e2 > M = e1' Me 2 peut s’écrire:
e1' T' Te 2 = (T' e1 )' (T' e 2 ) =< Te1; Te 2 > I
Tout se passe comme si on avait transformé les données initiales du tableau X par la matrice T
et utilisé ensuite le produit scalaire ordinaire.
En conclusion, il revient à remplacer le tableau X par Y=XT’ et à prendre comme métrique M

la matrice unité I avec T= D1/s
Y est appelée la matrice des coordonnées centrées réduites.
La métrique ayant été définie, on analyse les comportements des données dans chaque espace
Rp et Rn.
III. ANALYSE DANS L'ESPACE DES INDIVIDUS Rp
III-1. Coordonnées centrées
Les n points de l’espace Rp sont des

individus. Il est nécessaire de prendre
comme nouvelle origine le centre de
gravité du nuage car il importe de (F1)
connaître sa forme et non sa position. x x x
Il est pris ainsi comme nouvelle origine le x x
x x
centre de gravité G du nuage.
Rp x x
Par mesure de notation, appelons X0 la
G
matrice des coordonnées initiales x x
(anciennement X) x
X0=[Xij] x x
Si Xij sont les coordonnées brutes des n O
points Mi dans Rp alors:

xij = ( X ij − X j ) xij : Coordonnées centrées

n
X j = ∑ X ij x j : Moyennes arithmétiques ou coordonnées de G
i =1
G ( X 1 , X 2 ,.... X j , ..., X p )
Exemple_1: Tableau individus-caractères. On distingue 3 caractères, indice géographique,

revenu, âge
géographie revenu âge

Individu_1 8 30 55
Individu_2 2 6 40
Individu_3 5 15 30
Individu_4 7 22 40
8+2+5+7
La moyenne, par exemple, de l’indice géographique est : = 5.5 et le premier terme
4
de la matrice des coordonnées centrées réduites est 8-5.5=2.5
On obtient la matrice XC , des coordonnées centrées X=X0-XG où XG est la matrice des

moyennes ou des coordonnées du centre de gravité du nuage :
 2.5 11.75 13.75   5.50 18.25 41.25 
 −3.5 −12.25 −1.25   
   5.50 18.25 41.25 
X= avec XG =
 −0.5 −3.25 −11.25   5.50 18.25 41.25 
 1.5 

−1.25   5.50 18.25 41.25 
 3.75  
III-2. Coordonnées centrées réduites
Comme on l’a vu précédemment, la matrice des coordonnées centrées réduites est:

Y = XT’ avec T’T = M = D1/s 2
Il est nécessaire de calculer D1/s 2 la variance d'un caractère s'exprimant par :

1 n 2 1 n
s 2j = ∑ xij
n i =1
ou s 2j = ∑
n i =1
( X ij −X j ) 2 dans le cas où il y a équi-pondération
Si on appelle D la matrice diagonale des poids statistique, d’ordre n:
 p1 0 1 0 
   n
 .   . 
D=  ici D= 
.  . 
 
0 p n   0 1 
  n

On peut déterminer la matrice V de variance covariance:
V = X’DX
x x12 
Par exemple si X =  11  on obtient
 x 21 x 22 
 x11 x12 1 2 0  x11 x12  1  x112 + x 221 x11x12 + x 21x 22 
X' DX =     =  
 x 21 x 22  0 1 2  x 21 x 22  2  x12 x11 + x 22 x 21
2
x12 + x 222 
où les éléments diagonaux (termes carrés), représentent la variance et les autres éléments
(termes rectangles), la covariance
D’une manière générale si X est la matrice (n,p) des coordonnées centrées, alors V est une
matrice (p,p) symétrique de terme général :
1 n
sij = ∑ x ki x kj
n k =1
1 n 2
Pour i = j ∑ x kj on définit ainsi la variance d'un caractère ce qui permet de
sii = s jj = s 2j =
n k =1
déterminer la matrice de la métrique utilisée D1/s 2
Il faut donc prendre la diagonale de la matrice V:
D1/s 2 = diag(V)−1 = M
On détermine ainsi la matrice T telle que:
T’T = M avec T = D1/s et
 1 / s1 0 
 
T= . 
 0 1 / s p 

N.B. La diagonale de T est ainsi formée de l’inverse de la racine carré des termes diagonaux de
V
Ainsi, la matrice Y des coordonnées centrées réduites s'exprime par :

Y = XT’
N.B. Pour calculer la matrice V de variance-covariance de terme général sij on aurait pu diviser
1
chaque terme xij de la matrice des coordonnées centrées par : , ce qui donne la nouvelle
n
~ x
x ij ] de terme général x%ij = ij
matrice X = [~
n

La matrice de variance-covariance s'exprime alors :

~ ~
V = X' X
~ x ij
Egalement pour la matrice Y on définit la matrice Y de terme général ~
y ij = qui servira
sj n
par la suite à calculer la matrice des coefficients de corrélation entre caractères.
Exemple_1 : La matrice de variance-covariance s’exprime par :

1 
4 0 0 0
  2.5 11.75 13.75
 
 2.5 −3.5 −0.5 1.5   0 1 0 0  
  4   −3.5 −12.25 −1.25 
V = X’DX=  11.75 −12.25 −3.25 3.75   
 13.75 −1.25 −11.25 −1.25   0 0 1 0   −0.5 −3.25 −11.25 
  4   1.5 3.75 −1.25 
 1
 0 0 0 
 4
 5.25 19.88 10.63 
 
Soit V =  19.88 78.19 52.19 
 10.63 52.19 79.69 
 
On vérifie bien que V, est une matrice carrée (3,3) et on en déduit la matrice M de la
 1 
 5.25 0 0 
   0.1905 0 0 
 
métrique en 1/s, soit M = D1/ s 2 =  0 0 = 0
1
0.0128 0  en
 78.19 
   0 0 0.0125 
 0 1 
 0 
 79 .69 
prenant l’inverse des termes diagonaux de V . La racine carrée des termes diagonaux de M
donne la matrice T telle que M=T’T :
 0.4364 0 0 
  la matrice Y des coordonnées centrées réduites est :
T= 0 0.1131 0 
 0 0.1120 
 0
 1.0911 1.3288 1.5403 

 -1.5275 -1.3854 -0.1400 
Y = XT ' =  
 -0.2182 -0.3675 -1.2603 
 
 0.6547 0.4241 -0.1400 

III.3. Axes principaux d’inertie
On a vu précédemment que les directions principales sont données par les vecteurs propres de
la matrice X’X.
En ACP elles sont données maintenant par les vecteurs propres de la matrice :
~ ~
R= Y' Y ou bien R=Y'DY
1 n
∑ x ki x kj
n k =1
dont le terme général est rij = qui n’est autre que le coefficient de corrélation
sis j
s ij
rij = entre les variables i et j.
sis j
D'après le théorème2, les directions principales, sont données par les vecteurs propres du
~ ~
produit matriciel R = Y' Y , matrice des coefficients de corrélation.
N.B. Il est possible de déterminer R d’une autre manière :

V étant la matrice de variance-covariance
X = [ x ij ] (coordonnées centrées)

 1 / n 0 
V= X’DX avec:   
D =  .  (matrice diagonale des poids )
  1 / n 
  0
On remplace Y par sa valeur Y=XT’ dans R:
R=Y'DY=(TX’)D(XT’) ⇒ R=D1/sVD1/s
% Y
Exemple_1 : On peut déterminer la matrice des coefficients de corrélation par : R=Y' % où
 0.5455 0.6644 0.7702 
 
% 1 Y soit Y
Y= % = 1 Y =  -0.7638 -0.6927 -0.0700  et
n 2  -0.1091 -0.1838 -0.6301 
 
 0.3273 0.2120 -0.0700 
 1.0000 0.9810 0.5195 

 
R =  0.9810 1.0000 0.6612 
 0.5195 0.6612 1.0000 
 
On détermine ensuite les matrices des vecteurs propres et valeur propres, respectivement u et
vap de R.

 -0.5988 -0.6515 -0.4658   2.4598 0 0 

On obtient : u =  -0.6277   
0.7430 -0.2322  et vap =  0 0.0034 0 
 -0.4974 -0.1534 0.8539   0 0.5368 
  0
Les deux plus grandes valeurs propres λ1=2.4598 et λ2=0.5368, donnent la valeur de la
variance expliquée par les 2 axes factoriels choisis pour le plan principal.
Ces axes factoriels sont générés par les 2 vecteurs propres correspondant à ces valeurs
propres.
Le taux de variance expliquée par les q premiers axes factoriels (ou inertie sur ces axes), relatif
aux q plus grandes valeurs propres est égal à :
q
∑λ α
2.4598 + 0.5368
τq = α=1
p
dans notre cas q=2 et τq = = 0.9989 ce qui veut dire que
∑λ
3
α
α=1
99.99% de la variance est expliquée par les deux axes factoriels choisis. Le nuage de points est
très voisin d’un plan, l’échantillon, dans ce cas, se prête avec une grande précision à une ACP.
N.B. Lorsque le taux de variance expliquée par 2 axes factoriels choisis est faible, l’échantillon
ne se prête pas à priori à une analyse factorielle, les résultats seront donnés avec une précision
médiocre.
Il est toutefois possible de déterminer la distance entre points Mi et Mi’ du nuage, donnée par
1 p
d 2 (i, i' ) = ∑ (x ik − x i ' k )2 / s 2k
n k =1
Lorsque les valeurs propres sont voisines ou égales, il est nécessaire, dans certains cas, de
s’intéresser aux axes factoriels correspondants et donc d’effectuer l’analyse pour un nombre
plus grand de vecteurs propres.
 -2.2536 0.0403 0.4984 
 1.8540 -0.0128 0.9137 
La matrice des composantes principales est : C=Yu =  
 0.9882 0.0624 -0.8891 
 
 -0.5886 -0.0899 -0.5230 
N.B. On aurait pu prendre pour C l’expression Yu % donnant des valeurs homothétiques, sans
influence sur la nature de la représentation graphique.
On ne retient que les deux composantes principales correspondants aux 2 plus grandes valeurs
propres ou aux 2 vecteurs propres u1 et u3
C1 C3
Indivvidu_1 -2.2536 0.4984
Indivvidu_2 1.8540 0.9137
Indivvidu_3 0.9882 -0.8891
Indivvidu_4 -0.5886 -0.5230

Représentation des individus dans le plan principal :
Les points * sont les points individus (au nombre de 4 ) et les points ° sont les directions des
axes initiaux ou tendeances (au nombre de 3).
n
Les directions des axes initiaux ou axes caractères (voir plus loin, analyse dans R ) du plan
principal sont les droites tracées de l’origine aux points °
Pour obtenir dans l’espace des individus, ces ∆α (axe principal)

axes initiaux, il faut connaître les composantes
r
des vecteurs propres u α
uα
r r
Il est égal au produit scalaire u α ik qui est
commutatif.
Ce dernier représente la composante de l’axe ik δκ (axe initial)
initial (δk) sur le αième axe principal (∆α)
En appelant i la matrice des vecteurs de la base canonique de l’espace des caractères, les
directions des tendances ou axes-caractères sont données par le produit i u’ qui, comme on l’a
dit précédemment, est commutatif ou bien par la matrice u -1 qui dans ce cas est égale à u’ , car
les vecteurs sont unitaires :
Dans notre exemple, la matrice des vecteurs propres est :

r r r
u1 u2 u3
r
i1 -0.5988 -0.6515 -0.4658
u= r
i2 -0.6277 0.7430 -0.2322
r
i3 -0.4974 -0.1534 0.8539
En appelant c la matrice des vecteurs directions initiales ou axes caractères :

r r r
i1 i2 i3
r
u1 -0.5988 -0.6277 -0.4974
c =u’ = u = -1
r
u2 -0.6515 0.7430 -0.1534
r
u3 -0.4658 -0.2322 0.8539
r r
On ne retiendra que les composantes sur u1 et u3 , soit :
r r r
i1 i2 i3
r
u1 -0.5988 -0.6277 -0.4974
c= r
u3 -0.4658 -0.2322 0.8539
N.B. Dans les cas de notre figure, les coordonnées ont été multipliées par un coefficient
d’homothétie de 2 pour une représentation plus facile.

En conclusion: Dans l’espace Rp des individus on déterminera :
X : matrice des coordonnées centrées

x ij = (X ij − X j )
V: matrice de variance-covariance
V=X’DX
D : Matrice des poids statistiques
D1/s Matrice de la métrique en 1/s.

D1/s =T=T' Matrice diagonale composée de l'inverse de la racine carrée des éléments diagonaux de V
R Matrice des coefficients de corrélation

~ ~
R = Y' Y =Y'DY= D1/sVD1/s
u : Directions principales ou axes principaux : Vecteurs propres de R

vap : Variance absorbée par les axes principaux : Valeurs propres de R
∑λ α
Qualité de la représentation τq = α=1
p
∑λ
α=1
α
(variance absorbée par les 2 premiers axes principaux)

C=Yu : Tracé des points individus,
u’ : Tracé des directions initiales (tendances ou axes-caractères)
N.B. La distance entre 2 points Mi et Mj dans Rp est :

1 p
d 2 (i, i' ) = ∑ (x ik − x i ' k )2 / s 2k
n k =1

IV- ANALYSE DANS L 'ESPACE DES CARACTERES.
Pour l’espace des caractères, l’analyse devient alors celle de p points Qj (j=1, ..., p) dans Rn
L'analyse dans Rp et l'analyse dans Rn sont différentes car i et j ne jouent pas des rôles
similaires.
Ainsi dans Rp la transformation x ij = X ij -X j qui était une translation de l’origine au centre de

gravité du nuage, est maintenant dans Rn une projection parallèle à la 1ère bissectrice .
- le changement d’échelle des axes, c'est-à-dire, la division de chaque coordonnées de Rp par

s j n devient ici une déformation du nuage qui ramène chacun des points Qj à la distance 1
du centre de gravité pris comme origine.
En effet :
1 n n
d 2 ( j ,0) = ∑
n i =1
( X ij − X j )2 / s2j ou bien d 2 ( j ,0) = ∑ y%ij2
i =1
et
1 n
n
∑ (Xij − x j ) 2
d 2 ( j,0) = i =1 2 =1
sj
Les points Qj sont donc une hyper-sphère de rayon 1 centrée à l’origine qui est le point
moyen du nuage.
Calcul de la distance entre 2 point Qj et Qj’ de Rn
La distance entre 2 point Qj et Qj’ s’écrit:

1 n x x
d 2 ( j, j' ) = ∑ ( ij − ij' )2 soit
n i =1 s j s j'
2 2
1 n x ij 1 n x ij' 2 n x ij x ij'
d 2 ( j, j' ) = ∑ (
n i =1 s 2j
) + ∑ (
n i =1 s 2j'
) − ∑( )
n i =1 s js j'
s 2j' s 2j
= + − 2r jj' et
s 2j' s 2j
d 2 ( j, j' ) = 2(1 − rjj' )
rij’ : coefficient de corrélation entre les variables liées à j et j’ (caractères)

Les points sont très proches si leur

corrélation rjj’ est positive, voisine de 1 Rn …n (∆α)
ou très éloignés si elle est voisine de -1. x Qj'
x Qj
Les coordonnées des p point-variables
sur l’axe (∆α) axe principal sont les θ
composantes du vecteur: vα
Y' v = λ u G 2
N.B. Remarque sur les coefficients de corrélation
Par définition la corrélation entre 2 caractères Qj et Qj’ est

1 n x x
rjj ' = ∑ ij ij ' (xij variables centrées)
n i =1 s j s j '
Si on considère les vecteurs :
x1 j x1 j '
. .
r r
GQ j x ij GQ j' x ij'
. .
x nj x nj'
r n r n
= ∑x = ∑ x ij2'
2 2
2
GQ j ij et GQ j' soit :
i =1 i =1
 GQr 2
 1 n 2
∑ x ij = s 2j et
j
=
 n n i =1
 r 2
 GQ j' 1 n 2

 n
= ∑ x ij' = s 2j'
n i =1
Les modules (au carré) sont égaux à la variance du caractère j à 1/n près
Si l’on fait le produit scalaire :
r r n r r
GQ j .GQ j' = ∑ x ij x ij' = GQ j GQ j' cos θ
i =1

r r 1 n
∑ xij xij '
r r GQ j .GQ j ' n 1
θ = (GQ j , GQ j' ) ⇒ cos θ = r r = 1/ 2
GQ j . GQ j ' 1 2 
∑ xij ∑i xij ' 
n  i
2
cosθ est égal au coefficient de corrélation entre les deux caractères j et j’
- Représentation dans l’espace des caractères Rn

r
C’est la projection de GQ j sur l’axe (∆α) qui donne sa composante sur cet axe ou bien en
termes statistiques, représente la corrélation entre le α-ième axe principal et le caractère j
Y' v α = uα λα
Interprétation :
La projection de l' hyper-sphère dans R2
est appelée le cercle des corrélations.
Pour que 2 caractères soient Qj Qj'

effectivement corrélés, il faut d’une part
qu’ils soient proches du cercle des
corrélation et d’autres part proches entre
eux (ou diamétralement opposés lorsque
rjj’ → -1)
Exemple_1 : La matrice des coordonnées dans l’espace des caractères es donnée par :
RC = u λ (λ = vap matrice des valeurs propres)
 2.4598 0 0   1.5684 0 0 
   
vap =  0 0.0034 0  vap =  0 0.0586 0  et
 0 0.5368   0 0.7327 
 0  0

 -0.5988 -0.6515 -0.4658  1.5684 0   -0.9392

0 -0.0382 -0.3413
 
RC=  -0.6277  
0.7430 -0.2322  0 0.0586 0  =  -0.9845 0.0436 -0.1701
 -0.4974


-0.1534 0.8539  0 0 0.7327   -0.7801 -0.0090 0.6256 
r r
Dont on ne retiendra que la première et 3ième colonne : composantes sur v1 et composantes sur v3
Représentation dans l’espace des individus :
En résumé :
Pour l'analyse dans Rn on calculera :
RC = Y' v = λ u
RC : Matrice des points-caractères ( Y' v α = uα λα )
Tracé du cercle des corrélations
En conclusion
Rp → classification entre individus, tendances caractérielles.
Rn → corrélation entre caractères

P
ANALYSE DANS R
X : matrice des coordonnées centrées

x ij = (X ij − x j )
V: matrice de variance-covariance
V=X’DX
D : Matrice des poids statistiques
D1/s Matrice de la métrique en 1/s.

D1/s =T=T' Matrice diagonale composée de l'inverse de la racine carrée des éléments diagonaux de V
R Matrice des coefficients de corrélation

~ ~
R = Y' Y =Y'DY= D1/sVD1/s
u : Directions principales ou axes principaux : Vecteurs propres de R

vap : Variance absorbée par les axes principaux : Valeurs propres de R
Qualité de la représentation
(variance absorbée par les 2 premiers axes principaux)
C=Yu : Tracé des points individus,
u’ : Tracé des directions initiales (tendances ou axes-caractères)
1 p
∑ (x ik − x i'k )2 / s 2k
p
Distance entre 2 points Mi et Mi’ dans R : d 2 (i, i' ) =
n k =1
ANALYSE DANS RN
RC = Y' v = λ u
RC : Matrice des points-caractères ( Y' v α = uα λα )
Tracé du cercle des corrélations

n
Distance entre 2 caractères Qj et Qj’ dans R : d 2 ( j, j') = 2(1 − rjj' )

Chap. VI - Analyse en Composantes Principales

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Chap. VI - Analyse en Composantes Principales

Transféré par

Droits d'auteur :

Formats disponibles

Chap.

VI – Analyse en Composantes Principales 11

Chapitre VI - ANALYSE EN COMPOSANTES PRINCIPALES

L’analyse en composantes principales (ACP) s’utilise quand il s’agit de décrire un tableau X de

On est ainsi en présence d’un tableau initial individus-caractères, X (n,p) de n individus et p

On aura : d(Hi, Hj) ≤ d(Mi, Mj)

Soient deux droites F1 et F2 (F1 ⊥ F2 ) telles que:

d2(Hi; Hj) = d2(αi; αj) + d2(βi; βj)

Michel RAYNAUD Statistiques Appliquées

La méthode consiste à chercher:

puis F2 telle que ∑d 2

II. CHOIX D’UNE METRIQUE EN ACP

Plaçons-nous par exemple dans l’espace des individus Rp.

Chaque individu est défini par p

d 2 (M1 ; M 2 ) = a1 ( x11 − x 21 )2 + a 2 (x12 − x 22 )2 + ... + a p (x1p − x 2p ) 2

Si on prend des axes obliques faisant entre eux un angle θ alors:

Michel RAYNAUD Statistiques Appliquées

d2(M1 ;M2) se calcule avec x1j M1

O x1k x2k Axe k

d 2 (M1; M 2 ) = (x1k − x 2 k )2 + ( x1 j − x 2 j )2 − 2( x1k − x 2 k )(x1 j − x 2 j ) cos θ ou

N.B. Pythagore revient à choisir M = I.

On définit ensuite le produit scalaire de 2 vecteurs de l’espace des individus:

Michel RAYNAUD Statistiques Appliquées

Ce qui revient à diviser chaque variable par son écart-type.

e1' T' Te 2 = (T' e1 )' (T' e 2 ) =< Te1; Te 2 > I

En conclusion, il revient à remplacer le tableau X par Y=XT’ et à prendre comme métrique M

III. ANALYSE DANS L'ESPACE DES INDIVIDUS Rp

III-1. Coordonnées centrées

Les n points de l’espace Rp sont des

Michel RAYNAUD Statistiques Appliquées

xij = ( X ij − X j ) xij : Coordonnées centrées

Exemple_1: Tableau individus-caractères. On distingue 3 caractères, indice géographique,

géographie revenu âge

On obtient la matrice XC , des coordonnées centrées X=X0-XG où XG est la matrice des

III-2. Coordonnées centrées réduites

Comme on l’a vu précédemment, la matrice des coordonnées centrées réduites est:

Il est nécessaire de calculer D1/s 2 la variance d'un caractère s'exprimant par :

Si on appelle D la matrice diagonale des poids statistique, d’ordre n:

Michel RAYNAUD Statistiques Appliquées

On peut déterminer la matrice V de variance covariance:

Il faut donc prendre la diagonale de la matrice V:

On détermine ainsi la matrice T telle que:

T’T = M avec T = D1/s et

Ainsi, la matrice Y des coordonnées centrées réduites s'exprime par :

Michel RAYNAUD Statistiques Appliquées

La matrice de variance-covariance s'exprime alors :

Exemple_1 : La matrice de variance-covariance s’exprime par :

 1.0911 1.3288 1.5403 

Michel RAYNAUD Statistiques Appliquées

III.3. Axes principaux d’inertie

N.B. Il est possible de déterminer R d’une autre manière :

On remplace Y par sa valeur Y=XT’ dans R:

 1.0000 0.9810 0.5195 

Michel RAYNAUD Statistiques Appliquées

 -0.5988 -0.6515 -0.4658   2.4598 0 0 

Michel RAYNAUD Statistiques Appliquées

Représentation des individus dans le plan principal :

Pour obtenir dans l’espace des individus, ces ∆α (axe principal)

Dans notre exemple, la matrice des vecteurs propres est :

Michel RAYNAUD Statistiques Appliquées

En appelant c la matrice des vecteurs directions initiales ou axes caractères :

Michel RAYNAUD Statistiques Appliquées

En conclusion: Dans l’espace Rp des individus on déterminera :