Académique Documents
Professionnel Documents
Culture Documents
Principales (ACP)
A- Objectifs
B- construction d’un espace factoriel
C- Les étapes d’une ACP
D- Interprétation
E- Limites
A- Objectifs
ei
xij
Xj
en
Xp
uk = ak1 X 1 + ....akp X p
u1
e1 X1
G
X2
ei G u2
xij cik
Xj
ei uk
en
Xp
uq
ei = ( xi1 ,...xij ,...xip )'
B- construction d’un espace factoriel
ck ci u
• Il faut que l’axe sur lequel on projette permette la dispersion
maximale d(c ,c ) ≃ d(e ,e )
i k i k
B- construction d’un espace factoriel
• Conclusion :
le meilleur axe (premier axe factoriel) sera celui sur
lequel le nuage de points projeté est de dispersion, ie
tel que le nuage projeté est d’inertie maximale.
Le second axe sera celui qui, après le premier est tel
que le nuage projeté est d’inertie maximale, tout
en étant orthogonal au premier
…….
300
250
G
t$Assault
200
150
100
50
5 10 15
t$Murder
B- construction d’un espace factoriel
G
X2
ei G u2
xij cik
Xj
ei uk
en
Xp
up
ei = ( xi1 ,...xij ,...xip )'
cik = ei , u k = xi1u k 1 + .... + xip u kp
C- Les étapes d’une ACP
Choix du tableau X
60 30
25
50 20
40 15
rapt
10
réduit
30
rapt
5
20 G 0
-10 -5 -5 0 5 10
10
-10
0 -15
0 5 10 15 20 -20
Il passe par G
Vecteur directeur : u normé t.q. le nuage de points projeté sur u
1 1
est d’inertie maximale
I est maximale
1
(P) sous la contrainte : u =1
1
Solution de (P):
.
C-2 Analyse directe
b- Recherche du premier axe factoriel
Propriétés du premier axe :
• Les valeurs prises par la projection des individus sur ces axes
sont les coordonnées des composantes principales (les nouvelles
variables créées, CL des variables de départ de variance max)
C-3 Analyse duale
d jk = r ( X j , Ck )
C-4 Résumé de la décomposition factorielle
Analyse directe
ei = (ci1 ,...,cik ,...cip )'
u1
e1
I = ∑ pi d ²(ei , G ) = ∑ λk
X1
G
X2
ei G u2
xij cik
Xj
ei uk
en
Xp
up
ei = ( xi1 ,...xij ,...xip )' Ruk = λk uk , uk = 1, λ1 ≥ .. ≥ λ p
I k = λk = Var (Ck ); Cov(Ck , Cl ) = 0 Ck = Xuk , Ck = (c1k ,.., cik ,..., cnk ) '
C-4 Résumé de la décomposition factorielle
Analyse duale
Xj
G e2 dij
Xj vi
ei
Xuk vp
xij
vk = ,1≤ k ≤ p
en
λk
Xp X ' PCk
Dk = λk uk = , Dk = (d1k ,..d pk ) '
λk
I k = λk = ∑ d jk ²
C-5 Conclusion de la décomposition
factorielle
L’ACP permet donc de construire de nouvelles variables (les
composantes principales), Ck = Xuk combinaison linéaire des
variables d’origine. On montre facilement qu’elles sont
Call:
Call:
princomp(x = crime3, cor = T)
Standard deviations: λk
Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6
1.8670647 1.1924148 0.6875928 0.5425280 0.4676170 0.3262364
Valeurs propres de R
>summary(acp)
Importance of components:
Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 λk
Standard deviation 1.8670647 1.1924148 0.68759281 0.54252803 0.46761698
Proportion of Variance 0.5809884 0.2369755 0.07879731 0.04905611 0.03644427 Ik / I
Cumulative Proportion 0.5809884 0.8179639 0.89676125 0.94581736 0.98226164
Comp.6
Standard deviation 0.32623640
Proportion of Variance 0.01773836
Cumulative Proportion 1.00000000 I = 6 = λk
∑
>plot(acp)
ACP normée avec R
>
ACP normée avec R
c
> acp$scores ik
>biplot(acp, cex=0.7,col=c(1,0))
ACP normée avec R
Coordonnées des
variables sur les axes
factoriels du nuage de
points-variables:
d jk = r( X j , Ck )