Vous êtes sur la page 1sur 25

3- Analyse en composantes principales 1

3. ANALYSE EN COMPOSANTES PRINCIPALES............................................................................. 2


3.1 Mthodologie de l'ACP ............................................................................................................... 2
3.1.1 Recherche de sous-espaces optimaux..................................................................................... 3
3.1.2 Interprtation gomtrique de l'ACP. ..................................................................................... 5
3.1.3 Analyse dans l'espace des chantillons................................................................................... 5
3.1.4 Reconstruction complte et partielle de la matrice X.............................................................. 6
3.1.5 Coordonnes des observations et des variables sur les vecteurs propres (composantes
principales) .................................................................................................................................. 6
3.1.6 Qualit de la reprsentation des observations et des variables .................................................. 7
3.1.7 Contributions des observations et des variables ...................................................................... 7
3.1.8 Rgles d'interprtation des vecteurs propres ........................................................................... 7
3.2 Exemple numrique .................................................................................................................... 9
3.3 Observations et variables supplmentaires .................................................................................. 10
3.4 ACP de la matrice des covariances ............................................................................................. 11
3.5 ACP de la matrice des corrlations ............................................................................................. 11
3.5.1 Cas particulier de l'ACP avec 2 variables ............................................................................. 12
3.6 Exemples d'application.............................................................................................................. 14
3.6.1 ACP des donnes des montrgiennes ................................................................................. 14
3.6.2 Utilisation en tldtection.................................................................................................. 15
3.6.3 Dtermination de l'orientation d'une veine partir de donnes de forages............................... 15
3.6.4 Dtermination des contraintes principales et de leur orientation en un point d'un massif rocheux
.................................................................................................................................................. 16
3.6.5 tude des joints et fractures................................................................................................. 17
Exemple: On a observ les 15 joints suivants:.............................................................................. 18
3.6.6 Filtrage de donnes gochimiques ....................................................................................... 19
3.6.7 Analyse de donnes TBF (Marroquin, 1997) ........................................................................ 20
3.7 Tableau rcapitulatif.................................................................................................................. 21
3.8 Exemple numrique complet...................................................................................................... 22
Rponses aux questions et exercices ................................................................................................ 24
RFRENCES .............................................................................................................................. 25
3- Analyse en composantes principales 2

3. ANALYSE EN COMPOSANTES PRINCIPALES

L'analyse des donnes consiste essentiellement tablir quelles sont les relations existant entre les observations,
entre les variables, et entre les observations et les variables. Il s'agit donc de mettre un peu d'ordre dans le
fichier de donnes, souvent de taille considrable (quelques centaines ou milliers d'analyses et quelques
dizaines de variables. Ceci peut tre fait l'aide de diagrammes binaires, l'aide des corrlations et corrlations
partielles, l'aide de diagrammes spcifiques propres au domaine tudi (ex. diagramme AFM et diagrammes
de Harker en ptrologie). L'analyse en composantes principales est un autre outil permettant une meilleure
visualisation de nos donnes.


3.1 Mthodologie de l'ACP

Le tableau de donnes n x p forme un nuage de n points dans un espace p dimensions, ou un nuage de p
points dans un espace n dimensions. Un diagramme binaire consiste projeter ces points sur deux des
dimensions choisies plus ou moins arbitrairement. L'ACP consiste projeter les points sur une droite, un plan...
un sous-espace s dimensions (avec s p) choisi de faon optimiser un certain critre. Intuitivement, on
cherchera le sous-espace donnant la meilleure visualisation possible de notre nuage de points. Un bon choix
consiste rechercher la plus grande dispersion (le plus grand talement) possible des projections dans le sous-
espace choisi. On est amen ainsi chercher une rotation de notre systme d'axes initial (les variables)
permettant de mieux voir notre nuage. Dfinissons u
1
le vecteur unitaire (i.e. de norme 1; u
1
'u
1
=1) recherch;
c'est le vecteur prsentant la plus grande dispersion des projections.

Soit la matrice X
nxp
; chaque ligne reprsente une observation. Chaque colonne reprsente une variable. On
supposera chaque variable centre, i.e. on a soustrait la moyenne de chaque variable au pralable. Ceci est fait
de faon faire concider le centre de gravit du nuage de points avec l'origine.

Les projections des n observations sur le vecteur u
1
sont donnes par:

C=Xu
1
(produit scalaire)

La somme des carrs de ces projections (inertie) est:

C'C=u
1
'X'Xu
1


On choisira u
1
de faon maximiser cette dernire quantit. Le problme est donc:

Maximiser u
1
'X'Xu
1
sujet u
1
'u
1
=1

Il s'agit d'un problme classique d'optimisation sous contrainte que l'on peut solutionner par la mthode de
Lagrange.

On forme le Lagrangien:

L = u
1
'X'Xu
1
- (u
1
'u
1
-1)

On drive par rapport chacune des p composantes du vecteur u
1
ainsi que par rapport au
multiplicateur de Lagrange () et on pose les drives partielles gales zro.

3- Analyse en composantes principales 3


[ ]
2 X Xu u = 0
u u
= 1
1 1

1 1


Simplifiant, on trouve:

X'X u
1
= u
1

u
1
'u
1
= 1

On reconnat l l'quation de vecteurs propres et de valeurs propres de la matrice X'X. On note que cette
matrice est, un facteur 1/n ou 1/(n-1) prs, la matrice de variances (sur la diagonale) et de covariances (hors-
diagonale) des p variables. Le vecteur donnant les projections ayant la plus grande dispersion est donc le 1
er

vecteur propre de la matrice de variances-covariances de X (c.f. remarque ii. ci-bas).

Remarques:

i. La matrice des produits scalaires (X'X) est, par construction, symtrique et au moins positive semi-
dfinie. Ceci implique que les valeurs propres et les vecteurs propres seront rels. De plus les valeurs
propres seront toutes positives ou nulles. Finalement, rappelons que les vecteurs propres d'une matrice
symtrique sont toujours orthogonaux entre eux, i.e. u
1
'u
2
=0. Ce n'est gnralement pas le cas lorsque
la matrice n'est pas symtrique.

ii. Les projections sur le vecteur u
1
dfinissent une nouvelle variable qui est combinaison linaire des
variables originales. La variance de cette nouvelle variable est donne par:

1/n (u
1
'X'Xu
1
) = 1/n (u
1
'
1
u
1
) = 1/n
1


La variance des projections est donc gale (au facteur 1/n) la valeur propre. Le maximum est donc
atteint avec la 1
re
valeur propre. C'est pourquoi on retient le 1
er
vecteur propre.

iii. On sait que la somme des valeurs propres d'une matrice est gale la trace de la matrice originale. La
quantit totale de variation n'est donc pas modifie. De plus, le rapport
1
/(
i
) indique la proportion de
la variance totale prise en charge par le 1
er
vecteur propre.

Question 1: Quelle relation y a-t-il entre les vecteurs propres et les valeurs propres de X'X et ceux de
X'X/n?

3.1.1 Recherche de sous-espaces optimaux

A la section prcdente, on a tabli que le vecteur pour lequel la variance des projections est maximale
est le 1
er
vecteur propre de la matrice des variances-covariances. Qu'en est-il maintenant si on recherche le plan
pour lequel la variabilit (l'talement) des projections est maximale?


Thorme: Le plan expliquant le mieux le nuage de points (au sens des moindres carrs) contient
ncessairement le vecteur u
1


Dmonstration:
On suppose que u
1
n'est pas inclus dans le meilleur plan et on montre que l'on arrive alors une
contradiction.
3- Analyse en composantes principales 4


i. Il existe au moins une droite (disons u
2
) contenue dans le meilleur plan et qui est orthogonale
u
1
.
Soit u
1
*
la projection de u
1
dans le meilleur plan. On peut crire u
1
= u*
1
+ (u
1
- u*
1
)
Soit u
2
la droite du meilleur plan orthogonale u*
1
. Par construction, u
2
est aussi orthogonale
(u
1
- u*
1
) donc u
2
est orthogonale u
1
.

ii. L'inertie (i.e. la somme des carrs des projections) sur tout plan est gale la somme des
inerties expliques par deux droites orthogonales du plan (trivial par le thorme de Pythagore
et la dfinition d'inertie).

iii. Le "meilleur" plan est dfini par u
2
et u
1
*
. Ce plan explique moins d'inertie que le plan dfini
par u
2
et u
1
car u
1
est la droite expliquant le plus d'inertie. On arrive donc une contradiction et
on conclut que le meilleur plan contient ncessairement u
1
.

Le rsultat est important puisqu'il nous permet de chercher le vecteur expliquant le maximum d'inertie puis le
second vecteur, orthogonal au premier, expliquant le maximum d'inertie, etc.....


Recherche du 2e vecteur expliquant le maximum d'inertie.

On cherche u
2
tel que:

u
2
'X'Xu
2
soit maximum
sujet u
2
'u
1
= 0
et u
2
'u
2
= 1

Le Lagrangien est:

L = u
2
'X'Xu
2
- w(u
2
'u
1
) -
2
(u
2
'u
2
- 1)

Drivant le Lagrangien par rapport chacune des composantes du vecteur u
2
et par rapport
2
et w
2
puis
simplifiant, on trouve:

X'X u
2
=
2
u
2

u
2
'u
2
= 1
u
1
'u
2
= 0

Le vecteur recherch est le vecteur propre associ la 2e plus grande valeur propre de la matrice de variances-
covariances. Ces rsultats se gnralisent aisment plusieurs dimensions et on trouve que:

Thorme: L'espace s dimensions s p donnant la meilleure explication (en termes d'inertie) du nuage
original est dfini par les s vecteurs propres de X'X associs aux s plus grandes valeurs
propres.


3- Analyse en composantes principales 5

3.1.2 Interprtation gomtrique de l'ACP.

L'ACP revient effectuer une rotation du sytme d'axes initial puisque les vecteurs propres sont orthogonaux
entre eux et constituent donc un nouveau repre de coordonnes. Les cosinus entre les nouveaux axes et les
anciens sont les composantes des vecteurs propres.

Une autre interprtation procde par analogie avec la rgression. Le 1er vecteur propre est le vecteur qui
explique le mieux, simultanment toutes les variables de la matrice X. Ce vecteur minimise la somme des
carrs entre les projections sur le vecteur et la position des points dans l'espace original. Le deuxime vecteur
propre est celui qui explique le mieux, simultanment, l'ensemble des rsidus obtenus, et ainsi de suite...

3.1.3 Analyse dans l'espace des chantillons

On s'est intress, jusqu' maintenant, au nuage des n observations dans l'espace des p variables. On pourrait
galement considrer le nuage de p variables dans l'espace des n observations. On cherche le sous-espace de
dimension s (s p) pour lequel la somme des carrs des projections est maximale.

On applique la mme technique que prcdemment et on trouve que la solution, pour le premier vecteur est
donne par le systme suivant:

XX'v
1
=
1
v
1

v
1
'v
1
= 1

Le premier vecteur propre de XX' est celui qui maximise la variance des projections. Comme tantt, le plan
maximisant la variance des projections sera form des deux premiers vecteurs propres, et ainsi de suite.

Thorme: Les valeurs propres
i
et
i
sont identiques.

Prmultiplions par X':

X'XX'v
i
=
i
X'v
i


Cette quation nous indique que X'v
i
est vecteur propre de X'X associ la valeur propre
i
.
Or, les valeurs propres de X'X sont donnes par
i
. Donc, on conclut que
i
=
i


Remarque: Le thorme prcdent nous indique qu'il n'est pas ncessaire de rechercher explicitement les
valeurs propres et les vecteurs propres de XX'. Les valeurs propres sont les mmes, et les
vecteurs propres u
i
sont donns par X'v
i
une constante de normalisation prs. En effet, la
norme de X'v
i
est:

v
i
'XX'v
i
=
i


donc

1
X
v
i
i


est de norme 1. Par consquent, on a ncessairement:
3- Analyse en composantes principales 6


1
X
v
=
u
i
i


i

et, de faon similaire

1

Xu
=
v
i
i

i

Ces formules sont appeles formules de transition.

Sous forme matricielle, on peut les crire comme:

V = XU
-1/2
U = X'V
-1/2


o U et V contiennent les vecteurs propres u
i
et v
i
placs en colonne.

3.1.4 Reconstruction complte et partielle de la matrice X

Soit la matrice V ayant les p vecteurs propres de XX' placs en colonne, et U ayant les p vecteurs propres de la
matrice X'X placs en colonne. Soit la matrice , une matrice diagonale pxp ayant les p valeurs propres sur la
diagonale. Des formules de transition on a:

XU=V
1/2


Postmultipliant cette expression par U' et notant que UU'=I, on obtient:

XUU'= X = V
1/2
U'

Cette dernire expression nous indique que l'on peut reconstruire la matrice X si on connat les valeurs propres
et les vecteurs propres de XX' et X'X. Cette dcomposition de la matrice X est connue sous le nom de
dcomposition en valeurs singulires (Singular Value Decomposition (SVD) en anglais).

Remarque: Dans l'quation prcdente, on peut slectionner le nombre dsir de vecteurs propres de faon
limiter la reconstruction de X aux seuls vecteurs qui nous semblent vraiment signifiants. On
peut ainsi filtrer de la matrice X toute information qui nous semble non-pertinente.

3.1.5 Coordonnes des observations et des variables sur les vecteurs propres (composantes
principales)

Les coordonnes (en anglais "scores") des observations et des variables sont simplement les projections sur les
vecteurs propres:

observations: C
o
= XU = V
1/2

variables: C
v
= X'V = U
1/2


3- Analyse en composantes principales 7


3.1.6 Qualit de la reprsentation des observations et des variables

En comparant la projection d'une observation (au carr) avec la distance (au carr) par rapport l'origine de
cette observation, on obtient une mesure permettant de juger jusqu' quel point une observation est prs du
vecteur, du plan,..., considr.

observation i sur vecteur j: Qlt
o
(i,j) = (C
o
(i,j)
2
)/l
i
2

variable i sur vecteur j: Qlt
v
(i,j) = (C
v
(i,j)
2
)/l
i
2


Remarque: On peut, avec Matlab excuter ce calcul sous forme matricielle (voir acp.m). l
i
2
se lit sur la
diagonale de XX' pour les observations et sur la diagonale de X'X pour les variables.

Question 2: Si on effectue la somme des qualits de rprsentation d'une observation ou d'une variable sur
les diffrents vecteurs propres, qu'obtiendra-t-on?

Remarque: La qualit de la reprsentation des variables est aussi gale au carr de la corrlation entre la
variable et la composante principale. Dans le cas d'une acp de matrice des corrlations, la
qualit de la reprsentation est le carr de la coordonne (puisque l
i
=1 pour toutes les
variables); la coordonne de la variable i sur le vecteur j est donc gale la corrlation entre la
variable i et le vecteur propre j (j
e
composante principale).

3.1.7 Contributions des observations et des variables

Cette mesure vise quantifier l'importance de chaque variable et de chaque observation dans la dfinition d'un
vecteur propre. C'est une mesure de premire importance quand vient le temps d'interprter chaque vecteur
propre.

observations: Ctr
o
= (C
o
(.)
2
)
-1

variables: Ctr
v
= (C
v
(.)
2
)
-1
= U(.)
2



Remarque: La contribution est donne par la coordonne (au carr) d'une observation ou d'une variable sur
un vecteur propre divise par la valeur propre associe ce vecteur propre. Pour les variables,
il suffit de prendre les lments, au carr, des vecteurs propres.

Question 3: Si on effectue la somme des contributions des observations ou des variables sur un vecteur
propre, quel rsultat obtiendra-t-on?


3.1.8 Rgles d'interprtation des vecteurs propres

Etapes d'une interprtation.

i. Considrer l'analyse dans son ensemble. Rpondre aux questions suivantes:
A-t-on pu rduire la dimension du problme?
Combien a-t-on de vecteurs importants?
3- Analyse en composantes principales 8

Ces vecteurs expliquent quel pourcentage de l'inertie totale?

Remarque: -Sous hypothse multinormale pour X, on peut effectuer des tests de signification sur les
valeurs propres. Ceci n'est pas prsent ici car l'hypothse multinormale est rarement vrifie
en pratique.

-Il arrive parfois que des vecteurs propres associs des valeurs propres faibles soient plus
intressants en termes gologiques que des vecteurs associs des valeurs propres plus fortes.
Souvent, avec des analyses gochimiques de roches volcaniques par exemple, le premier
facteur reprsentera les variations relies la diffrenciation magmatique. Les facteurs de
variation vraiment intressants apparatront alors sur d'autres vecteurs propres.

-La proportion d'inertie exige avant de considrer un vecteur propre comme important
dcrot lorsque le nombre de variables et d'observations augmente. Pour plus de dtails, voir
Lebart et al. (1984, 162-190); Legendre et Legendre (1984, 123-124); Cooley et Lohnes (1971,
103-105).
-Interprter, si possible, chaque vecteur retenu en se servant des contributions et des qualits de
reprsentation. Rpondre aux questions suivantes:

- Quelles sont les variables qui contribuent le plus dfinir un vecteur?

- Quelles sont les observations qui contribuent le plus dfinir un vecteur?

- Parmi les variables (ou observations) qui contribuent beaucoup, attacher plus
d'importance celles qui sont bien reprsentes.

- Parmi les variables (ou observations) qui ne contribuent pas (ou peu), considrer tout
de mme celles qui sont trs bien reprsentes sur ce vecteur.

- Quelles sont les signes affectant les coordonnes des variables (observations);
interprter les vecteurs en tenant compte de ces associations et de ces oppositions.

- A-t-on de l'information extrieure (non incluse dans l'analyse) que l'on peut utiliser
(ex. type de roche, altration connue, provenance, proximit d'un gisement,....) pour
aider l'interprtation? Si oui examiner la disposition de ces facteurs externes sur les
diffrentes composantes principales.

- Y a-t-il des regroupements, tendances, volutions au niveau des observations? Si oui,
comment les expliquer?

Il n'y a pas de recette magique pour interprter les rsultats de l'analyse. Il s'agit d'un travail de synthse qui
demande habituellement de considrer simultanment plusieurs des pistes donnes prcdemment.

Disons simplement qu'habituellement, l'interprtation des facteurs se fait partir des variables, en considrant
les variables qui contribuent fortement ou qui sont trs bien reprsentes et en tenant compte videmment de
leur position (coordonnes) sur les diffrents vecteurs propres (ou sur les diffrents plans factoriaux).

Les observations servent surtout soit corroborer l'interprtation faite sur les variables, soit donner des pistes
d'interprtation en termes des variables, soit relier les variables des informations extrieures non incluses
dans l'analyse.

3- Analyse en composantes principales 9

On pourra dceler des valeurs "bizarres" par leur contribution (pour les observations) la dfinition des
diffrents vecteurs. Une trop forte contribution peut indiquer par exemple une erreur de mesure ou un mauvais
chantillonnage, etc... En effet une trs forte contribution d'une observation n'est possible que si l'observation
s'carte considrablement du nuage de points. Si on dcle de tels problmes, on doit vrifier et, s'il y a lieu,
reprendre ou liminer l'analyse.

Une technique qui peut tre utile l'interprtation consiste choisir des observations qui sont trs bien
reprsentes diffrents emplacements sur le vecteur propre, puis de cheminer d'une extrmit l'autre du
vecteur propre en notant ce qui change au niveau des observations retenues.

Mis part les dtails techniques prsents en justification, une interprtation ne dpasse que rarement une page
de texte. C'est une formidable synthse si l'on considre que le tableau initial de donnes comprend parfois
plusieurs milliers de valeurs.


3.2 Exemple numrique

Voici un petit exemle numrique tir de Davis (1973, 479-483). Les donnes sont :
x= 3 4 6 6 6 7 7 8 9 9 9 10 11 12 12 13 13 13 13 14 15 17 17 18 20
y= 2 10 5 8 10 2 13 9 5 8 14 7 12 10 11 6 14 15 17 7 13 13 17 19 20

On effectue lACP de la matrice des covariances :
(

=
24.06 15.59
15.59 20.28

Les deux valeurs propres sont gales 37.9 et 6.5. Les vecteurs propres sont :
u
1
u
2
x 0.66314 0.7485
y 0.7485 -0.66314

Les vecteurs u
1

1
et u
2

2
, dfinissent les axes majeurs dune ellipse passant par les points
(Var(x),Cov(x,y)) et (Cov(x,y),Var(y)). Les vecteurs 2
1
u
1
et 2
2
u
2
sont les axes majeurs dune
ellipse qui trace dans le plan des coordonnes des observations devraient renfermer approximativement
86% des observations lorsque la distribution est (bi) normale.

3- Analyse en composantes principales 10

0 5 10 15 20
0
2
4
6
8
10
12
14
16
18
20
22
x
y
Ellipse dfinie par l'ACP

Question 4: Quelle est la proportion de la variance explique par chaque vecteur propre? La somme des
valeurs propres est gale quelle quantit? Les vecteurs propres ont-ils t calculs avec X
centr ou non?

Exercice 1: Vrifiez l'orthogonalit des vecteurs propres.

Question 5: Vous voulez utiliser le premier vecteur propre de l'ACP comme une quation de prdiction.
Vous observez (nouvelle observation) X
2
=19. Quel estim donnerez-vous pour X
1
?

3.3 Observations et variables supplmentaires

Il peut arriver que l'on veuille reprsenter sur les diffrents plans factoriels (i.e. plans dfinis par deux vecteurs
propres) des observations ou des variables qui n'taient pas incluses dans l'analyse initiale. Par exemple, on
pourrait disposer d'observations de contrle ou de nouvelles observations pourraient s'ajouter dans des
contextes lgrement diffrents ou provenant de localisations diffrentes,... Les variables supplmentaires
pourraient tre des variables de nature trs diffrentes des variables originales. On pourrait effectuer l'ACP
partir d'analyses gochimiques d'lments majeurs et vouloir projeter sur les plans factoriels d'autres variables
telles les lments mineurs, des variables indicatrices du type ou de la texture de la roche, une variable donnant
la distance du gisement le plus prs,...

Observations:

On transforme chaque observation supplmentaire de la mme faon que les donnes originales (sil y
a lieu). Pour cela on utilise les moyennes et carts-types calculs avec les donnes originales
seulement. On calcule X
+
U o X
+
dsigne la matice mxp contenant les m observations
supplmentaires.

Variables:

On effectue la mme transformation sur la variable supplmentaire que celle effectue sur les variables
originales (sil y a lieu). On calcule X
+
V o X
+
dsigne la matrice kxn des k nouvelles variables
projeter. En utilisant les formules de transition, on a que les coordonnes des variables supplmentaires
sont:

X
+
XU
-1/2

3- Analyse en composantes principales 11


Remarque: La notion de projections supplmentaires peut tre utilise pour tudier la stabilit des plans
factoriels obtenus. Pour ce faire, on effectue l'ACP et on dtermine U. On chantillonne, avec
remise, n ranges de notre matrice initiale X. on obtient ainsi une nouvelle matrice de donnes
X
2
(de mme taille). On calcule la matrice de variances-covariances de cette nouvelle matrice
et on projette chaque ligne de la matrice de variances-covariances sur les vecteurs U
-1/2
. En
effet, la projection d'une variable est donne par XV=X'XU
-1/2
. Or X'X est, au facteur 1/n
prs la matrice de variances-covariances des variables. On rpte l'chantillonnage un grand
nombre de fois et on observe la dispersion des coordonnes des variables sur les diffrents
vecteurs propres. Cette procdure est connue sous le nom de "bootstrapping". Pour plus de
dtails, voir Greenacre (1984) et Lebart et al. (1984).


3.4 ACP de la matrice des covariances

Dans cette forme dACP, on cherche les vecteurs propres et valeurs propres de la matrice XX/n au lieu de XX
(X est centre). Habituellement, on projette ensuite X sur les vecteurs propres. Les valeurs propres de cette
matrice reprsentent des variances plutt que des sommes de carr. Toutefois rien dimportant ne change par
rapport lanalyse de XX. Les vecteurs propres demeurent les mmes, les projections galement.

3.5 ACP de la matrice des corrlations

Si, en plus de centrer la matrice X, on avait divis chaque valeur par l'cart-type de la variable correspondante,
alors le produit X'X/n serait la matrice des corrlations. Il s'agit de l'ACP la plus courante. L'avantage de cette
approche est que les variables ne possdant plus d'units, les rsultats sont indpendants des units originales
choisies pour mesurer les variables. On peut ainsi considrer des variables dont l'ordre de grandeur des
variations est trs diffrent. Auparavant, une variable prsentant une variation trs grande aurait contribu
beaucoup plus la dfinition des vecteurs propres qu'une variable montrant peu de variations. Ainsi, le TiO
2

exprimer en pourcentage, aura une importance beaucoup moins grande dans l'ACP de la matrice des variances-
covariances que s'il est exprim en ppm. Ce n'est pas le cas avec l'ACP de la matrice des corrlations et c'est ce
qui fait que cette mthode est habituellement prfre.

Particularits de l'ACP de la matrice des corrlations

i. La trace de la matrice des corrlations (donc la somme des valeurs propres) est gale au
nombre de variables. Comme pour l'ACP de la matrice des covariances, les valeurs propres
reprsentent la variance des projections sur chaque vecteur. Dans les calculs des contributions
des observations, il faudra en tenir compte (cf. ACP matrice des covariances).

ii. Les coordonnes des variables sur les vecteurs propres sont gales aux corrlations entre ces
variables et les composantes principales correspondantes. Par consquent les coordonnes des
variables sont toutes infrieures 1 et suprieures -1. galement, si on trace un cercle unit
sur un plan factoriel quelconque, on est assur que les projections des variables tomberont
toutes l'intrieur de ce cercle.

En effet, les coordonnes des variables sont donnes par:

3- Analyse en composantes principales 12

X'V=U
1/2


La variance d'une composante principale est donne par
i
(note: ici
i
est valeur propre de la
matrice des corrlations).
La variance d'une variable originale est 1.
Les covariances entre composantes principales et variables originales sont donnes par:

1/n X'C= 1/n X'XU = U

La corrlation est donc : U
-1/2
= U
1/2
, i.e. la corrlation est gale la coordonne des
variables sur les vecteurs propres.

Finalement, puisque la qualit de la reprsentation est ici gale la coordonne, au carr, de la
variable et que la somme des qualits de reprsentation donne ncessairement 1, il suit que les
coordonnes des variables sont sur la surface dune hypersphre de rayon unit. Plusieurs
programmes impriment automatiquement le cercle unit sur les divers plans factoriels.

Question 6: Deux variables trs corrles apparatront comment sur les diffrents plans factoriels?
Comment peut-on valuer visuellement si une variable est bien reprsente sur un plan
factoriel donn?

Question 7: Lorsqu'on a que deux variables, quelle forme trs particulire prennent les vecteurs propres?


3.5.1 Cas particulier de l'ACP avec 2 variables

Lorsqu'il n'y a que deux variables, des relations trs simples existent pour les valeurs propres et vecteurs
propres de l'ACP de la matrice des corrlations. Les composantes des vecteurs propres sont toutes gales
(1/2)
0.5
. Les valeurs propres sont gales 1 r
xy
. Dans une figure mettant en relation X/s
x
et Y/s
y
, la pente du
1er vecteur propre est donc 1 ou -1 selon que la corrlation entre x et y est positive ou ngative. Si on construit
la figure Y vs X, alors on aura une droite dont la pente est s
y
/s
x
que l'on peut utiliser pour effectuer des
prdictions lorsque X et Y ont des rles similaires (ex. longueur et largeur d'un fossile). Cette droite de
prdiction est connue sous le nom de "reduced major axis". On peut dmontrer que c'est la droite qui minimise
la somme des produits croiss des erreurs sur X et des erreurs sur Y.

(

)
Y
-
Y
)(
X
-
X
( Min
i
i
i
i
n
1 = i

avec les valeurs prdites donnes par le modle unique:

$
$
Y =
b
+
b
X

X =
Y -
b
b
0 1
0
1



3- Analyse en composantes principales 13

Gomtriquement, ceci revient minimiser la somme des surfaces des triangles rectangles forms par la droite
et les points exprimentaux.

Pour l'ACP de la matrice des covariances, on parle d'axe majeur, mais il n'y a pas les mmes relations simples
pour dterminer les valeurs propres et vecteurs propres.

On peut aussi gnraliser la notion d'axe majeur ou d'axe majeur rduit plus de deux dimensions. On obtient
ainsi, en gnral, un hyperplan de dimension p-1 orient dans un espace p dimensions et qui permet de prdire
n'importe quelle variable tant donn que l'on connat les p-1 autres variables. Cette quation s'obtient partir
du vecteur propre associ la plus petite valeur propre. En effet, la projection sur le plus petit vecteur propre
est Xu
i
. Si cette projection est 0, alors l'observation se trouve dans l'espace complmentaire (i.e. hyperplan de
dimension p-1). Donc, on doit avoir, dans le cas de l'ACP de la matrice des corrlations:

u
s
)
x
-
x
(
+ .... +
u
s
)
x
-
x
(
+
u
s
)
x
-
x
(
= 0
pp
p
p
p
2 p
2
2
2
1 p
1
1
1

qui permet d'exprimer une variable en fonction des p-1 autres.

0 2 4 6 8 10 12 14 16 18 20
-10
-5
0
5
10
15
20
25
x
y
Rgressions et ACP
Reg y sur x
Reg x sur y
ACP
ACP R

3- Analyse en composantes principales 14


3.6 Exemples d'application

3.6.1 ACP des donnes des montrgiennes

Les donnes sont des analyses gochimiques d'lments majeurs (10 lments) de roches prleves dans les
diffrentes montrgiennes de la rgion. On a 68 analyses de roches rparties en 4 groupes principaux de 17
observations et plusieurs sous-groupes.

On remarque que les deux premiers vecteurs propres expliquent eux seuls 77% de la variance totale. Le
premier vecteur propre oppose SiO
2
, Al
2
O
3
, Na
2
O et K
2
O FeO, MgO, TiO
2
, CaO et P
2
O
5
. Les divers lments
contribuent peu prs galement la dfinition du vecteur (sauf MnO). Ce premier vecteur oppose donc les
lments felsiques aux lments mafiques. A ce titre, on peut l'interprter comme un axe de maturit
magmatique. La disposition des observations le long de cet axe confirme d'ailleurs cette interprtation puisqu'on
retrouve les roches mafiques droite sur le graphe, les felsiques gauche, et les intermdiaires au centre.

Groupe Sous-groupe Observations #
Ultramafiques Jacupirangite 1, 2
Alnote 3 13
Mlilite biotite 14
Yamaskite 15 17
Mafiques Essexite 18 21
Montralite 22
Gabbro 23 32
Diabase 33, 34
Roches intermdiaires Dykes msocratiques 35 51
Roches felsiques Synites 52 68




-1 -0.5 0 0.5 1
-1
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
Si
Al
Fe
Mg
Ca
Na
K
Ti
Mn
P
1er vecteur propre,
1
=65.3%
2
e

v
e
c
t
e
u
r

p
r
o
p
r
e
,

2
=
1
2
%
ACP des donnes des montrgiennes (variables)
1 2 3 4 5 6 7 8 9 10
0
10
20
30
40
50
60
70
Graphe des valeurs propres (en %)
# valeur propre
%

v
a
r
i
a
n
c
e

e
x
p
l
i
q
u

e
3- Analyse en composantes principales 15




-4 -3 -2 -1 0 1 2 3 4
-2.5
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55 56
57
58
59
60
61
62
63
64
65
66
67
68
1er vecteur propre,
1
=65.3%
2
e

v
e
c
t
e
u
r

p
r
o
p
r
e
,

2
=
1
2
%
ACP des donnes des montrgiennes (observations)



Le 2
e
vecteur propre oppose TiO
2
et MnO MgO. Sa signification est moins claire, toutefois, on note que la
dispersion au niveau des observations s'effectue surtout au niveau des roches mafiques, les autres roches
prsentant gnralement des coordonnes plus homognes sur ce facteur. Il semble opposer les Jacupirangites
(1-2) et Yamaskites (15 17) aux Alnotes (3 13). On notera galement que l'observation 9 des Alnotes se
dmarque nettement des autres Alnotes. Ceci suggre soit une erreur d'analyse, soit une erreur d'identification
de cette roche, soit une particularit qui la distingue des autres Alnotes (ex. altration, minralogie particulire,
etc.). Si on compare les valeurs de l'analyse celles des autres Alnotes, on note une teneur en MnO, P
2
O
5
et
CaO plus leve et en MgO plus faible. L'augmentation des trois premiers lments suggre la prsence
importante d'apatite dans cette roche.

3.6.2 Utilisation en tldtection

Une application trs courante de l'ACP consiste produire une carte synthse partir d'une information
multivariable. Ce genre de situation se prsente en tldtection et analyse d'images ou l'on dispose de
l'intensit d'un signal mesure pour diffrentes plages de longueurs d'ondes. Les systmes sophistiqus de SIG
(systme d'information gographique) permettent habituellement d'effectuer l'ACP du signal mesur et de
produire des images composites correspondant aux diverses composantes principales. Ceci permet, entre autres,
de filtrer du bruit et de rehausser l'information contenue dans l'image originale.

3.6.3 Dtermination de l'orientation d'une veine partir de donnes de forages

Souvent on a des intersections d'une veine obtenues dans quelques forages et l'on dsire dterminer
l'orientation de la veine. On cherche donc dterminer 1- si les donnes sont rellement dans un plan, 2- si
oui, quelle est l'orientation de ce plan. L'ACP fournit une mthode trs simple pour solutionner ce
3- Analyse en composantes principales 16

problme. On effectue l'ACP avec, comme variables, les coordonnes x,y, et z des intersections
(habituellement le centre de l'intersection). Les deux premiers vecteur propres vont s'orienter dans le plan de
la veine et fourniront le meilleur plan d'ajustement possible (les distances au carr mesures
perpendiculairement au plan sont minimises). Le 3e vecteur propre (vecteur unitaire) sera la normale au
plan et peut tre utilis pour calculer la direction et le pendage du plan.

ex. La compagnie Cambiex-Miramar a obtenu 112 intersections d'une veine d'or dans un dpt des TNO. La
variable x est oriente vers l'est, y vers le nord et z vers le haut. L'ACP de la matrice des covariances de ces
donnes a indiqu que 99.7% de la variation tait exprime par les 2 premiers vecteurs-propres. On est donc
effectivement sur un plan. Les composantes du 3e v.p. sont u
3
=[0.9937 -0.1116 .0104]. On voit donc
immdiatement que ce vecteur est essentiellement parallle l'axe des x et donc que la veine est
subverticale et oriente suivant la direction y (nord).

Plus prcisment, la direction du ple est donne par:

atan(u
x
/u
y
)=atan(-0.9937/0.1116)=-83.59
0


L'inclinaison du ple est: asin(0.0104)=0.59
o


Passant du ple au plan et respectant la convention de la main droite, on trouve que la direction du plan est:
90-83.59=6.4
o
et le pendage: 90-0.59=89.41
o
.

3.6.4 Dtermination des contraintes principales et de leur orientation en un point d'un massif rocheux

Cette application n'est pas proprement parler de l'ACP, toutefois, elle utilise les mmes outils. En effet, l'ACP
consiste, en dfinitive, extraire les valeurs propres et les vecteurs propres d'une matrice symtrique. Les
vecteurs de cette matrice symtrique sont situs sur un hyper-ellipsode (ellipse si p=2, ellipsode si p=3); Les
vecteurs propres donnent les directions des axes principaux et les valeurs propres les longueurs de ces axes.

En mcanique des roches, lorsqu'on mesure un tenseur de dformations, on calcule par inversion un tenseur de
contraintes, lequel est symtrique (toutefois, il n'est pas ncessairement positif dfini ou positif semi-dfini). On
y retrouve les contraintes normales sur la diagonale et les contraintes tangentielles hors diagonale. Les vecteurs
propres de cette matrice donnent les directions des forces principales et les valeurs propres en donnent
l'amplitude. Il est possible d'observer des valeurs propres ngatives, ce qui correspond alors des forces de
tension plutt que la situation plus courante de forces de compression.

Exemple: On a calcul les contraintes selon 3 axes orthogonaux (x,y et z) dans un massif rocheux et on a
obtenu la matrice des contraintes suivantes:

1200 150 200
150 800 320
200 320 1800

(
(
(
(
Les valeurs sont en KPa. Calculant les valeurs propres et vecteurs propres de cette matrice, on
trouve:
3- Analyse en composantes principales 17


1 2
u u u
.29 -.94 .19
.29 -.1 .95
.91 .33 .24

(
(
(
(
(
(
3
Les valeurs propres valent
1
=1966,
2
=1145 et
3
=690. Ces valeurs propres sont les
contraintes principales et la direction de ces contraintes est donne par les vecteurs propres.
Ainsi, l'angle de la contrainte
1
avec l'axe z est cos
-1
(0.91)=24.5
o

l'angle de la contrainte
3
avec l'axe y est cos
-1
(0.95)=18
o
.

3.6.5 tude des joints et fractures

(Consultez aussi Fisher, Lewis et Embleton, 1987, Statistical analysis of spherical data; . G.S. Watson, 1983,
Statistics on spheres)

Soit un systme de coordonne main droite (i.e. main droite tendue, paume vers le haut, le pouce pointe vers x,
l'index vers y et le majeur vers z). On peut reprsenter une fracture par sa normale sous la forme d'un vecteur
unitaire dans ce repre. Il existe plusieurs conventions possibles pour orienter une fracture (ex. direction-
pendage; pendage et direction du pendage; etc.)

Ainsi, une fracture dont le vecteur pendage est orient 35
o
et montre une inclinaison de 63
o
(pendage positif
vers le bas) prsente un ple dont le pendage est 63-90= -27
o
orient 35
o
. Les cosinus directeurs de ce vecteur
sont:
x=cos(27)*sin(35)=0.5111
y=cos(27)*cos(35)=0.7299
z=sin(27)=0.4540

On a bien: x
2
+y
2
+z
2
=1, i.e. le vecteur est unitaire. Note, on aurait pu tout aussi bien utiliser comme cosinus
directeurs
-(x,y,z), i.e. les vecteurs ne sont pas orients.

Si on considre "n" fractures, on peut former une matrice X
nx3
de tels vecteurs. On dfinit la matrice
d'orientation comme X'X (sans centrage). L'ide est d'effectuer l'ACP directement sur cette matrice. On cherche
donc les valeurs propres et vecteurs propres de 1/n X'X. les rsultats de l'ACP s'interprtent de la faon
suivante:

# Apparence sur le stronet Valeurs
propres
Interprtation des vecteur propres
1 Points regroups (mode unique)
1
>>
2,

3
Le 1er vecteur propre donne l'orientation moyenne
des fractures.
2 Points sur un grand cercle
1

2
>
3
Les fractures s'orientent autour d'un cylindre ex. pli
cylindrique). Le 3e vecteur propre donne l'axe du
cylindre.
3 Points sur une portion de grand
cercle

1
>
2
>
3
Mme interprtation sauf que l'on a observ qu'une
partie des positions possibles des fractures.
4 Points sur un petit cercle
1
>
2

3
Les fractures sont sur un cne de grande ouverture
(s'approche du cas 1). Le 1er v.p. donne l'orientation
3- Analyse en composantes principales 18

de l'axe du cne.
5 Points sur un petit cercle
1

2
>
3
Les fractures sont sur un cne de petite ouverture
(s'approche du cas 2). Le 3e v.p. donne l'orientation
de l'axe du cne.
6 Points rpartis uniformment
1

3
Pas d'orientation prfrentielle (distrib. alatoire)
7 2 ou plusieurs groupes de points
1
>
2
>
3
Plusieurs familles? Si oui, isoler les familles et
reprendre l'analyse sparment pour chaque famille.
Pas d'interprtation particulire des vecteurs propres
et valeurs propres.

Note: Comme Trace(X'X)=Trace(XX') et que la diagonale de XX' vaut 1 partout (les vecteurs sont unitaires),
il dcoule que les valeurs propres de 1/n X'X somment 1.

Note: Lorsqu'il n'y a qu'une seule famille de joints, le 1er vecteur propre est un excellent estimateur du ple
moyen de la famille. Il possde l'immense avantage de traiter correctement, et de faon automatique,
les ples indpendamment de l'orientation qu'on leur donne. Ex. en 2D: Si on a un ple 0
o
et un autre
180
o
, le ple moyen est 0
o
(ou 180
o
) et non 90
o
. L'ACP fournira ce rsultat alors que les autres
estimateurs ncessitent d'abord de corriger l'orientation du 2e joint de 180
o
0
o
avant de calculer le
ple moyen. Ces corrections ne sont pas toujours videntes faire lorsqu'on a une famille montrant une
grande dispersion et cest encore plus difficile si plusieurs familles se retrouvent sur le stronet.

Note: Lorsqu'il y a plus d'une famille de joints, on devrait au pralable sparer les familles avant de les
soumettre l'ACP. On peut aussi utiliser le principe de maximum de vraisemblance si on a une ide
priori du type de distribution des joints pour chaque famille.

Note: On peut tester l'uniformit de la distribution des joints (i.e. aucune orientation prfrentielle) dans un
espace p dimensions (rf. G.S. Watson, 1983, Statistics on spheres, Wiley, p. 59).

|
|
.
|

\
|

2
1 -
2
1) + p(p
i
2
p
1 i=

p
1
-
2
p
2) + n(p
o n est le nombre d'observations et p la dimension (habituellement 2 ou 3).

Exemple: On a observ les 15 joints suivants:

Ple Vecteur ple (unitaire)
Pendage Direction x y z
9.40 95.91 0.9813 -0.1016 -0.1633
8.12 98.53 0.9790 -0.1468 -0.1413
12.28 102.84 0.9527 -0.2171 -0.2127
32.10 101.66 0.8297 -0.1712 -0.5314
21.34 100.01 0.9172 -0.1619 -0.3640
25.49 109.66 0.8500 -0.3037 -0.4304
4.34 274.45 -0.9941 0.0774 -0.0757
3.33 256.40 -0.9703 -0.2347 -0.0581
24.66 278.28 -0.8994 0.1310 -0.4172
12.46 288.40 -0.9265 0.3082 -0.2158
0.49 293.80 -0.9149 0.4035 -0.0086
3- Analyse en composantes principales 19

8.18 96.94 0.9826 -0.1195 -0.1423
16.68 84.58 0.9536 0.0905 -0.2870
3.88 66.42 0.9144 0.3991 -0.0676
1.77 255.66 -0.9684 -0.2475 -0.0308

Les 3 dernires colonnes contiennent les coordonnes des vecteurs pendages unitaires. On soumets les 3
dernires colonnes une ACP (i.e. on extrait de la matrice d'orientation les vecteurs propres et valeurs
propres). On obtient:

1
=0.89,
2
=0.06 et
3
=0.04. Clairement, on se retrouve dans le cas 1, i.e. des donnes regroupes autour
d'un mode. Le 1
er
v.p. est: u
1
=(0.99, -0.08, -0.11). Ce vecteur indique que le ple moyen des fractures est
essentiellement parallle x. Sa direction est: 94.9
o
, son pendage est 6.4
o
.

Le test prcdent donne: 15*5*1.5*[(0.89-0.33)
2
+(0.06-0.33)
2
+(0.06-0.33)
2
=51.7 alors qu'une chi
2
avec
3*4/2-1=5 degrs de libert montre une valeur critique de 11.07. Clairement, on rejette fortement
l'hypothse d'uniformit et le regroupement de points peut donc tre considr comme significatif. Les
fractures sont sub-verticales d'orientation nord-sud..
Lambert angles gaux
E
N
1er vp ACP

3.6.6 Filtrage de donnes gochimiques

Une application courante de lACP consiste liminer des donnes des facteurs de variation indsirables.
Ceci peut tre fait facilement en effectuant une reconstruction partielle de la matrice X en ne conservant que
les vecteurs propres dintrt.

ex. 1. Dans le cas dune campagne gochimique rgionale (ex. sdiments de lac), des facteurs locaux et
rgionaux viennent influer sur la composition chimique des sdiments. Les facteurs rgionaux peuvent tre
la gologie, la vgtation, le relief, la temprature, etc. Les facteurs locaux peuvent tre, la disponibilit de
3- Analyse en composantes principales 20

matire organique, la position du lac dans le rseau hydrographique, la profondeur du lac, la nature des
sdiments, la minralisation, etc.

Une bonne faon didentifier le caractre rgional ou local dun facteur de variation est de calculer le
variogramme des coordonnes sur chaque vecteur propre. Les vecteurs montrant des variogrammes
indicatifs dune structure spatiale grande chelle (grande porte) identifient les facteurs srement
rgionaux. Les variogrammes prsentant une absence de structure de grande chelle identifient les facteurs
locaux.

ex. 2. PFE de M. Guvremont (1999)

Des diagrammes de classification sont utiliss pour reconnatre le type de roche partir de l'analyse
gochimique. Ces diagrammes ncessitent en gnral l'utilisation de roches fraches et non altres. M.
Guvremont a projet des analyses prises proximit d'un dpt minralis. La plupart des observations
tombaient carrment l'extrieur des diagrammes de De la Roche(1980) servant classer les roches
plutoniques. De plus les observations tombant sur le diagramme fournissait des noms de roches diffrents
de ceux attendus suite aux observations ptrographiques.

M. Guvremont a effectu une ACP (matrice des corrlations) du tableau d'analyses gochimiques. Il en est
ressorti un premier vecteur propre reprsentant 58% de la variation et dont l'interprtation tait clairement la
maturit magmatique de la roche. On a reconstruit les analyses en ne conservant que ce facteur et on a
projet les analyses reconstruites (ou filtres) sur le diagramme de De la Roche. Cette fois, presque toutes
les observations tombent dans le champ de la granodiorite, le type de roche suggr par l'examen
ptrographique et celui rencontr le plus souvent proximit de la zone tudie.

3.6.7 Analyse de donnes TBF (Marroquin, 1997)

Considrons une plaque mince conductrice au-dessus duquel un relev TBF est ralis.
La rponse TBF dpend des facteurs suivants :
frquence du signal mis par lantenne
conductivit du conducteur et du milieu encaissant,
paisseur du conducteur,
profondeur du conducteur,
pendage du conducteur.

Le long dun profil donn traversant un conducteur, on note la variation du champ magntique vertical. Cette
variation est reprsente par linclinaison de lellipse de polarisation par rapport lhorizontal (phase). Cest
habituellement la valeur tudie bien que la quadrature (rapport entre les axes mineurs et majeurs de lellipse de
polarisation) soit aussi parfois utilise.

Marroquin (1997) a gnr synthtiquement des rponses TBF de conducteurs dont les divers paramtres
(conductivit, paisseur, profondeur et pendage) variaient. Chaque conducteur tait chantillonn aux mmes
41 points le long du profil. Ces 41 points constituent les observations alors que chaque conducteur dfinit une
colonne dans la matrice X. En soumettant cette matrice X une ACP (ACP de la matrice des corrlations), il a
t possible didentifier des vecteurs propres pouvant tre relis la profondeur, la conductivit, etc. Un
premier vecteur propre reprsentait la forme commune des diffrents conducteurs et comptait pour 95% de
la variation totale. Les autres vecteurs propres reprsentaient de lgres variations par rapport cette forme
commune et dues aux diffrences existant entre les divers conducteurs tudis.
3- Analyse en composantes principales 21


3.7 Tableau rcapitulatif

Le tableau suivant prsente les diverses relations pour le cas gnrique dune matrice X. On cherche alors les
vecteurs propres de la matrice XX.


Item Observations Variables Remarques
Valeurs propres
) ( trace
j
i
=

:proportion explique par le


v.p. "i"
Vecteurs propres U V U'U=UU'=I U est pxp
V'V=I V est nxp
quation X'XU=U XX'V=V Variances-covariances (au facteur 1/n prs)
Relations de
transition
U=X'V
-1/2
V=XU
-1/2



Coordonnes C
o
=XU
=V
1/2

C
v
=X'V
=U
1/2

Les coordonnes sont les projections des
observations (ou des variables) sur les vecteurs
propres
Qualits (observation
ou variable i sur
vecteur j)
C
o
(i,j)
2
/l
i
2
C
v
(i,j)
2
/l
i
2
Carr des coordonnes/carr de la longueur (l
i
2
);
pour la variable i, c'est aussi le carr de la
corrlation entre la variable i et les coordonnes
des observations sur le vecteur j.
Contributions C
o
(.)
2

-1
C
v
(.)
2

-1

U(.)
2

Notation pointe: l'opration s'applique chaque
lment de la matrice pris sparment.
Reconstruction de X X= V
1/2
U'
=C
o
U

Reconstruction partielle obtenue en utilisant les
colonnes dsires de V et X ainsi que les lments
diagonaux correspondants de

Note : Dans le cas de l'acp de la matrice des corrlations, les coordonnes des variables sont gales aux
corrlations entre les variables et les diffrents vecteurs propres (i.e. corrlation entre les variables
originales et les coordonnes des observations sur les diffrents vecteurs propres).


Note : Si les vecteurs propres sont issus dune matrice de covariance ou de corrlation, alors le tableau
prcdent sapplique intgralement en posant :

Matrice des covariances Matrice des corrlations
( )
n
n / Y ' 11 Y
X

=
( )
1
D
n
n / Y ' 11 Y
X

=
3- Analyse en composantes principales 22


o Y est la matrice des donnes originales, 1 est un vecteur nx1 avec des 1 1/n effectue le centrage de Y.
1
D

est une matrice diagonale avec 1/ (cette multiplication normalise lcart-type de X la valeur 1).

Note importante : Plusieurs programmes effectuant lACP de la matrice des covariances ou des corrlations
prfrent utiliser comme coordonnes des observations n C plutt que C pour rendre les coordonnes
indpendantes du nombre dobservations. Il faut donc diviser les coordonnes fournies par ces programmes
par le facteur n avant dappliquer les formules du tableau.
Si lon prend directement les coordonnes fournies par ces programmes, on aura alors :
Item matrice des covariances matrice des corrlations
Qualit (observation i, vecteur j) C
o
(i,j)
2
/l
i
2
C
o
(i,j)
2
/l
i
2

Qualit (variable i, vecteur j)
C
v
(i,j)
2
/
2
i
C
v
(i,j)
2

Contribution (observation i, vecteur j) (C
o
(.)
2
/n)
-1
(C
o
(.)
2
/n)
-1

Contribution (variable i,, vecteur j) U(i,j)
2
U(i,j)
2


3.8 Exemple numrique complet

ACP de la matrice des covariances.


Matrice des donnes Y
21 38 52
4 51 67
67 83 0
67 3 38
93 5 6

Matrice centre X
-29.4 2 19.4
-46.4 15 34.4
16.6 47 -32.6
16.6 -33 5.4
42.6 -31 -26.6

Matrice des variances et des covariances S=(X'X/n)
1076.6 -368.6 -750.24
-368.6 897.6 -66.2
-750.24 -66.2 671.84

Valeurs propres

1
= 1732.20

2
= 906.65

3
= 7.28

Vecteurs propres U
u
1
u
2
u
3

x
1
0.79 -0.06 0.62
3- Analyse en composantes principales 23

x
2
-0.30 -0.90 0.31
x
3
-0.54 0.43 0.73

Coordonnes des observations (C
o
=XU)
u
1
u
2
u
3

obs 1 -34.15 8.16 -3.40
obs 2 -59.54 3.84 1.03
obs 3 16.25 -57.29 1.07
obs 4 20.21 31.14 3.94
obs 5 57.24 14.14 -2.65

ex. observation 4 sur le 2e vecteur:
16.6*(-.06) - 33*(-0.90) + 5.4*.43 = 31.14 (aux arrondis prs)

Coordonnes des variables U
1/2

u
1
u
2
u
3

x
1
-32.73 -1.66 1.66
x
2
12.68 -27.13 0.83
x
3
22.37 12.95 1.96

ex. variable 2 sur le 1er vecteur:
-.30*(1732.2)
1/2
= -12.68 (aux arrondis prs)

Qualit de reprsentation des observations

u
1
u
2
u
3

obs 1 0.94 0.05 0.01
obs 2 1.00 0.00 0.00
obs 3 0.07 0.93 0.00
obs 4 0.29 0.70 0.01
obs 5 0.94 0.06 0.00

ex. Observation 4 sur le vecteur 2
31.14
2
/(16.6
2
+33
2
+5.4
2
) = 969.7/1393.72 = 0.70

Qualit de reprsentation des variables
u
1
u
2
u
3

x
1
0.99 0.00 0.00
x
2
0.18 0.82 0.00
x
3
0.74 0.25 0.01

ex. Variable 3 sur le vecteur 1:
(-22.37)
2
/671.24= .74

Contribution des observations (C
o
(.)
2
/n)
-1

Note : le facteur n est introduit pour tenir compte que les coordonnes calcules plus haut sont XU et non
XU/n
0.5
.
u
1
u
2
u
3

Obs 1 0.13 0.01 0.32
Obs 2 0.41 0.00 0.03
Obs 3 0.03 0.72 0.03
3- Analyse en composantes principales 24

Obs 4 0.05 0.21 0.43
Obs 5 0.38 0.04 0.19

ex. Observation 4 sur le 3e vecteur
3.94
2
/(5*7.28) = 0.43


Contribution des variables (U(.)
2
)
u
1
u
2
u
3

x
1
0.62 0.00 0.38
x
2
0.09 0.81 0.10
x
3
0.29 0.19 0.53

ex. Variable 1 sur le 3e vecteur
.62
2
= .38



Rponses aux questions et exercices

Question 1:
On a: X'Xu
1
=
1
u
1

1/n X'Xu
1
=1/n
1
u
1

Les vecteurs propres sont les mmes, les valeurs propres sont divises par "n".

Question 2:
C
0
C
0
'=XUU'X'=XX' sur la diagonale, on a les longueurs carrs des observations. Donc la somme
des qualits de reprsentations est 1. La dmonstration est analogue
pour les variables.

Question 3:
C
0
'C
0
=U'X'XU=
1/2
V'V
1/2
=
La somme des contributions des observations sur un vecteur propre est donc 1.

Question 4:
Proportions: 37.9/44.4 6.6/44.4
La somme est gale la trace de la matrice de covariances (acp de la matrice des covariances) donc elle
est gale la somme des variances des variables originales.
Les v.p. ont t calculs avec X centr (matrice des covariances). Toutefois, les projections des X sur le
1
er
v.p. indiquent que X n'a pas t centr avant d'effectuer la projection (toutes les valeurs sont
positives). Ceci ne change rien toutefois aux positions relatives des points (simple translation).

Question 5:
La valeur prdite est sur le 1
er
v.p. et x
2
=19. La projection sur le 2
e
v.p. doit donner 0. donc:
0 = (x
1
, 19)* (.75 ; -.66)
.75 x
1
= 19*.66
x
1
=16.7
3- Analyse en composantes principales 25


Question 6 :
Les points reprsentants les diverses variables seront trs proches lun de lautre sur tous les plans
factoriels. Une variable bien reprsente sur un plan factoriel aura sa projection prs du primtre du
cercle unit centr lorigine.

Question 7 :
Les vecteurs ont toutes leurs composantes gales (1/2)
1/2
un signe prs. Le vecteur u
1
sera orient
45
0
(antihoraire par rapport x ) si la corrlation entre les deux variables est positive, sinon il sera
orient -45
0
.
Exercice 1: (.66, .75) * (.75 ; -.66) =0



RFRENCES


Cooley W.W. et Lohnes P.R., 1971. Multivariate data analysis. Wiley, 364p.

Davis J. C., 1986. Statistics and data analysis in geology (2e ed.). Wiley, 646p.

Greenacre M.G., 1984. Theory and applications of correspondence analysis. Academic Press, 364p.

Lebart L., Morineau A. et Warwick K.M., 1984. Multivariate descriptive statistical analysis. Wiley, 231p.

Legendre L. et Legendre P., 1984. cologie numrique. Masson, 2 tomes.