Académique Documents
Professionnel Documents
Culture Documents
24 mai 2022
1
Table des matières
1 Introduction 3
2 Tableau de données 4
4 Le choix de l'origine 6
5 Moments d'inertie 8
5.1 Inertie totale du nuage des individus . . . . . . . . . . . . . . 8
5.2 Inertie du nuage des individus par rapport à un axe passant
le Centre de Gravité . . . . . . . . . . . . . . . . . . . . . . . 8
5.3 Inertie du nuage des individus par rapport à un sous-espace
vectoriel V passant par G . . . . . . . . . . . . . . . . . . . . 9
5.4 Décomposition de l'inertie totale . . . . . . . . . . . . . . . . . 9
2
1 Introduction
3
2 Tableau de données
x1,1 x1,2 . . . x1,j . . . x1,p
.. .
.
.
.
.
.
. . . .
X = xi,1 xi,2 . . . xi,j . . . xi,p
. . . .
.. .
.
.
.
.
.
xn,1 xn,2 . . . xn,j . . . xn,p
Soit Ui ∈ Rp le vecteur
−→
associé à u (ou ) déni par :
i i
xi,1
xi,2
.
.
.
Ui =
xi,j
.
..
xi,p
x1,j
x2,j
.
.
.
Vj =
xi,j
.
..
xn,j
L'ensemble des points qui représentent les variables est appelé nuage des
variables et celui qui représentent les unités est appelé nuage des individus.
4
3 Choix d'une distance
p
X
2
d (ui , ui′ ) = (xij − xi′ j )2
j=1
Avec cette distance, toutes les variables jouent le même rôle et les axes
dénis par les variables constituent une base orthogonale. A cette distance,
on associe un produit scalaire entre deux vecteurs :
p
⟨−→, − →
X
ou i oui′ ⟩ = (xij xi′ j ) = t Ui Ui′
j=1
p
||−→||2 =
X
ou i (xij )2 = t Ui Ui′
j=1
On peut alors dénir l'angle α entre deux vecteurs par son cosinus :
⟨−→, − → Pp
j=1 (xij xi′ j )
t
ou i oui′ ⟩ Ui Ui′
cos(α) = −→ −→ = qP = p
||oui || ||oui′ || p 2
Pp 2 (t Ui Ui )(t Ui′ Ui′ )
j=1 (xij ) j=1 (xi′ j )
5
4 Le choix de l'origine
1
Pn
n i=1 xi1 x̄1
. ..
.
Pn. .
1
X= i=1 xij = x̄j
n
. .
. ..
Pn.
1
n i=1 xip x̄p
Prendre G comme origine, conformément à la gure suivante, revient alors
à travailler sur le tableau des données centrées :
xi,1 − x̄1
xi,2 − x̄2
.
.
.
Uci =
xi,j − x̄j
.
.
.
xi,p − x̄p
6
celui des coordonnées centrées de la variable vj est :
x1,j − x̄j
.
.
.
Vcj = xi,j − x̄j
.
.
.
xn,j − x̄j
1
Pn
V ar(vj ) = n i=1 (xij − x̄j )2
1
Pn
Cov(vi , vj ) = n k=1 (xki − x̄i )(xkj − x̄j ) ∀i ̸= j
1
Pn
MV = n i=1 Uci t Uci et sa forme matricielle est :
7
V ar(v1 ) Cov(v1 , v2 ) . . . Cov(v1 , vj ) . . . Cov(v1 , vp )
Cov(v2 , v1 ) V ar(v2 ) . . . Cov(v2 , vj ) . . . Cov(v2 , vp )
. . .. . .
. . . . .
MV = . . . .
Cov(vj , v1 ) Cov(vj , v2 ) . . . V ar(vj ) . . . Cov(vj , vp )
. . . .. .
. . . . .
. . . .
Cov(vp , v1 ) Cov(vp , v2 ) . . . Cov(vp , vj ) . . . V ar(vp )
5 Moments d'inertie
n n p n
1X 2 1 XX 1Xt
IG = d (G, ui ) = (xij − x¯j )2 = Uci Uci
n i=1 n i=1 j=1 n i=1
L'inertie totale est encore égale à la somme des éléments diagonaux (Va-
riance des p variables) de notre matrice de variance-covariance : IG = trace(M V ).
8
5.3 Inertie du nuage des individus par rapport à un
n
1X 2
IV = d (hV i , ui )
n i=1
Si on note V⊥ p
le complémentaire orthogonal de V dans R , hV ⊥i la pro-
⊥
jection orthogonale de ui sur V en appliquant le théorème de Pythagore,
on peut écrire :
Démonstration :
(
⟨x − pV (x), z⟩ = 0 ∀z ∈ V
pV (x) ∈ V
SoitV ⊥ = {x ∈ Rp /⟨x, y⟩ = 0 ∀y ∈ V }
−−−−→ −−−−−→
pV ⊥ (x) = x − pV (x) =⇒ pV (x)x = GpV ⊥ (x)
∀z ∈ V ⊥ , ⟨pV (x), z⟩ = ⟨x − pV ⊥ (x), z⟩ = 0
9
D'après le théorème de Huygens, l'inertie totale se décompose comme :
IG = IV + IV ⊥ . Dans le cas particulier où le sous-espace est de dimension 1,
c'est-à-dire est un axe, IV ⊥ est une mesure de l'allongement du nuage selon
cet axe. On emploie pour IV ⊥ les expressions d'inertie portée par l'axe ou
bien d'inertie expliquée par l'axe.
En projetant le nuage des individus sur un sous-espace V , on perd l'inertie
mesurée par IV , on ne conserve que celle mesurée par IV ⊥ .
tie minimum
n
1X
I∆⊥1 = (⟨a1 , ui ⟩)2
n i=1
n
1X −−→
= (⟨a1 , Gui ⟩)2
n i=1
n
1Xt
= a1 Uci t Uci a1
n i=1
X n
t 1 t
= a1 Uci Uci a1
n i=1
= t a1 M V a 1
Et ||a1 ||2 = t a1 a1 .
10
6.2 Recherche du maximum
t
Le problème à résoudre : trouver a1 tel que a1 M V a1 soit maximum avec
t
la contrainte a1 a1 = 1 est le problème de la recherche d'un optimum d'une
fonction de plusieurs variables liées par une contrainte. La méthode des mul-
tiplicateurs de Lagrange peut alors être utilisée.
n
1X 2
I∆⊥1 = d (h∆1 i , G) maximal.
n i=1
D'après le théorème des extréma liés, on tire que λ = λ1 qui est la plus
grande valeur propre de la matrice MV et a1 est un vecteur propre de norme
1 associé. Alors, λ1 = I∆⊥1 .
11
7 Recherche des axes suivants
µ = 2 t a1 M V a = 2 t at1 M V a = 2 t (M V a1 )a = 2 λt1 a1 a = 0.
12
8 Contribution des axes à l'inertie totale
IG = λ1 + λ2 + . . . + λp
La contribution absolue de l'axe ∆k à l'inertie totale du nuage des indi-
vidus est égale à : ca(∆k /IG ) = λk , valeur propre qui lui est associée.
Sa contribution relative est égale à :
λk
cr(∆k /IG ) =
λ1 + λ2 + . . . + λp
Ces pourcentages d'inertie sont des indicateurs qui rendent compte de la
part de variabilité du nuage des individus expliquée par ces sous-espaces. Si
les dernières valeurs propres ont des valeurs faibles, on pourra négliger la
variabilité qu'expliquent les axes correspondants. On se contente souvent de
faire des représentations du nuage des individus dans un sous-espace engendré
par les d premiers axes si ce sous-espace explique un pourcentage d'inertie
proche de 1. On peut ainsi réduire l'analyse à un sous-espace de dimension
d < p.
13
en gros de s'assurer du contenu du tableau de données. En eet, il est pos-
sible qu'en examinant le premier plan principal on observe quelques individus
complètement extérieurs au reste de la population traduisant la présence soit
de données erronées telles que des fautes de frappes ou une erreur de mesure
qu'il faut corriger soit d'individus totalement diérents des autres qu'il faut
retirer de l'analyse pour mieux observer les individus restants ; on pourra les
réintroduire a posteriori comme éléments supplémentaires. À la suite de cette
étude préalable, on peut alors examiner de plus près les résultats de l'ACP ;
on passe à la phase d'interprétation qui comporte plusieurs étapes.
Dans le cas pratique, les seuls critères applicables sont des critères empi-
riques dont le plus connu est celui de Kaiser : en données centrées réduites,
on retient les composantes principales correspondant à des valeurs propres
supérieures à 1 ce qui revient à ne s'intéresser qu'aux composantes qui ap-
portent plus que les variables initiales. On peut aussi regarder le diagramme
des valeurs propres qui désigne le graphe de la fonction j 7→ λj , où (λj )j est
la suite des valeurs propres de MV classées par ordre décroissant. On utilise
alors la règle du coude qui consiste à détecter l'existence d'un coude (cassure)
et on retient les valeurs propres avant la cassure. Mais ceci n'est pas toujours
aisé en pratique.
14
9 Représentation des individus dans les axes
construits
Considérons notre ancienne base qui est Uci ∈ Rp . An de représenter les
individus dans le plan des nouveaux axes, il sut de calculer leurs coordon-
−−→
nées dans les axes construits en projettant orthogonalement le vecteur Gui
sur l'axe ∆k . En utilisant le changement de base, on a :
−−→
yik = ⟨Gui , ak ⟩ = t ak Uci
Désignons par Yi le vecteur des coordonnées de l'unité ui et A est la
matrice du changement de base. C'est une matrice orthogonale de norme 1
par conséquent son inverse est égale à sa transposée. Ainsi,
yi1
..
.
Yi = A−1 Uci = t A Uci = yik
.
..
yip
2
−−→
Gui , ak t
2 ak Uci t Uci ak
cos (θik ) = −−→2 = tU U
Gui ci ci
15
D'après le théorème de Pythagore, on a :
individus
Il est très utile aussi de calculer pour chaque axe la contribution apportée
par les divers individus à cet axe. En calculant l'inertie I∆⊥k , on peut voir la
contribution de cette inertie par rapport à un individu ui particulier.
Soit ca la contribution absolue de ui et cr la contribution relative par
rapport à l'axe ∆k .
D'après la section 6 on a :
1 2 1 −−→ −−→ 1 t
ca(ui /∆k ) n
d (G, h∆ki ) n
⟨Gui , Gak ⟩2 n
ak Uci t Uci ak
cr(ui /∆k ) = = ta M V a
= =
I∆⊥k k k λk λk
Plus la contribution d'un individu est importante, plus sa projection sur cet
Pp
axe sera éloigné du centre de gravité. En remarquant que i=1 cr(ui /∆k ) = 1,
on peut mieux interpréter la contribution de cet individu à la confection d'un
axe. Par exemple, il n'est pas souhaitable qu'un individu ait une contribution
excessive. On pourrait donc éliminer les individus dont la contribution est
trop importante.
16
Figure 3 Cercle de corrélations
changement de base dans cet espace. Les nouveaux axes sont des combinai-
sons linéaires des anciens axes et par conséquent les nouvelles variables Zk
seront des combinaisons linéaires des anciennes variables Vcj calculées comme
suit :
p
X
Zk = akj Vcj = Xc ak
j=1
Il s'agit ensuite d'étudier la liaison des anciennes variables avec les compo-
santes principales et qui se traduit par le calcul des coecients de corrélations
entre elles qui varient entre −1 et 1. On obtient donc le cercle de corrélation
sur lequel chacune des variables est repérée par ses coordonnées sur les axes
∆1 et ∆2 .
L'examen du cercle de corrélation permet de détecter les éventuels groupes
de variables qui se ressemblent ou au contraire qui s'opposent donnant ainsi
un sens aux axes principaux.
On peut calculer les variances, covariances et coecients de corrélations
des composantes principales. On a par dénition :
d'où
1t t
V ar(Zk ) = ak Xc Xc ak = t ak M V ak = λk
n
Par dénition, le coecient de corrélation s'exprime comme suit :
Cov(Zk , Vcj )
Cor(Zk , Vcj ) = p
V ar(Zk )V ar(Vcj )
17
avec
Soit
Donc
0 0 0
.. .. ..
1 . . .
Cov(Zk , Vcj ) = t ak t Xc Xc 1 = t ak M V 1 = λk t ak 1 = λk akj
n . . .
.. .. ..
0 0 0
Car
t
ak M V a k = λ k
t
et en multipliant chaque membre de l'égalité par ak on obtient :
t
ak M V I = λk t ak
Enn,
18
10.1 Interprétation et Qualité de la représentation des
variables
Références
19