2.Ch2 ACP 2022

Chapitre 2
Introduction
•Définition :
:
• L’analyse en composantes principales ACP : Ensemble de

méthodes permettant de procéder à des transformations
linéaires d’un grand nombre de variables intercorrélées de
manière à obtenir un nombre relativement limité de
composantes non corrélées. Cette approche facilite l’analyse
en regroupant les données en des ensembles plus petits et
en permettant d’éliminer les problèmes de multicolinéarité
entre les variables. L’analyse en composantes principales
s’apparente à l’analyse factorielle, mais c’est une technique
indépendante qui est souvent utilisée comme première
étape à une analyse factorielle (« Dictionary of statistics and
methodology »(Vogt, 1993 page 177).
Introduction :
• L’ACP est une méthode descriptive linéaire. C’est
une technique de réduction des données. Son
objectif est de passer d’un grand nombre de
variables, à un nombre restreint de variables
fictives appelés facteurs (ou Composantes principales).
• Elle vise à représenter sous forme graphique
l’essentiel de l’information contenue dans un
tableau de données quantitatif.
• Dans un tableau de données à p variables, les
individus se trouvent dans un espace à p
dimensions.
I- Présentation des
données d’une ACP normée :
• Un tableau (Observation / Variable) à double

entrée est une matrice M (nxp) à n lignes et p
colonnes ; où la ligne i représente la valeur prise par
le ième individu pour les p variables quantitatives
• X1 Xj Xp
• I1
• Ii
• In
I- Présentation des données d’une ACP
normée :
• Dans ce chapitre on se ramène à la matrice centrée

et réduite
1 n
 
n
1
et où x j   X ij ;  2j   X ij  x j
2
n i 1 n i 1
I- Présentation des données d’une ACP
normée :
• Matriciellement, on l’ écrit :
~
Z  I n  1n 1n    M  S 1
  
où I est la matrice identité et où 1  1 1  1
 n n   
  
 n fois 
 1
  étant la matrice des poids (n  n) ; ici :   I n
 n
 1 0 0  0 
 
 0  0 0  
S la matrice diagonale  p  p  des ecarts types S    0 i 0  
 
 0 0 0  0 
 0   0  p 

 1 
 0 0  0 
 1 
 
 0  0 0  
 
1  1 
 S   0 0  
i
 
 0 0 0  0 
 
 
 0   1 
0
  p 

II- Position du problème
• On construit, dans l’ordre, un nombre réduit de
variables « fictives » F1 , F2 , …, Fm , combinaisons
linéaires des variables 𝑍1 , 𝑍2 , … , 𝑍𝑝 , qu’on appelle
composantes principales afin d’en faire une synthèse
du tableau M (où m  p).
A l’étape k, Fk s’écrit matriciellement :
𝑢1𝑘
𝐹 𝑘 = 𝑍𝑢𝑘 𝑜ù 𝑢𝑘 = 𝑢2𝑘 ∈ ℝ𝑝
⋮
𝑢𝑝𝑘
𝑝
• La ième ligne de Fk s’écrit alors : 𝐹𝑖𝑘 = 𝑍𝑖𝑗 𝑢𝑗 𝑘

𝑗 =1
• est appelé le kème facteur.
II- Position du problème
• Remarques :
• i)- On convient de prendre𝑝des facteurs normés :
2 2
𝑢𝑘 = 𝑢𝑗 𝑘 =1
𝑗 =1
• ii)- Les composantes Fk𝑝 sont centrées
𝐹𝑘 = 𝑍𝑗 𝑢𝑗 𝑘 = 0
𝑗 =1 =0
• iii)- 𝑉 𝐹 𝑘
= 𝑘 2
𝐹 𝑃 = 𝑍𝑢 𝑍𝑢 𝑘 𝑘
1 𝑘′
= 𝑢 𝑍 ′ 𝑍 𝑢𝑘
𝑃 𝑛
′
= 𝑢𝑘 𝑅 𝑢𝑘
1 𝑟𝑖𝑗
1 𝑐𝑜𝑣 𝑋𝑖 , 𝑋𝑗
• où 𝑅𝑝×𝑝 = 𝑍′ 𝑍 = ⋱ 𝑒𝑡 𝑜ù 𝑟𝑖𝑗 = ; 𝑖≠𝑗
𝑛 σi σj
𝑟𝑖𝑗 1
III- Détermination des Facteurs
et des composantes principales
• 1)- Espace des individus (Nn )
• Le nuage de points est formé de n individus

représentés, chacun, dans un espace de
dimension p (grâce aux coordonnées relatives
aux p variables).
• Puisque les 𝑍𝑗 sont des variables centrées
réduites, le centre du nuage est l’origine du
repère O ; et on définit le produit scalaire
usuelle (canonique).
III- Détermination des Facteurs et des composantes principales
• 1)- Espace des individus (Nn )

• On montre (voir chapitre 1) qu’à l’étape 1,
on détermine l’axe D1, passant par l’origine,
selon lequel le nuage de points est le plus
dispersé (le plus grand allongement) et que
le vecteur directeur unitaire (||u1||=1) de
cette droite n’est autre que le vecteur
propre associé à la plus grande valeur
propre de la matrice de corrélation :
1 1 1
𝐺𝑚𝑖 = 𝐺𝑀𝑖 𝑢 𝑢 = 𝐺𝑀𝑖 𝑢
Mi D1
d(Mi , D1 )
d(G,Mi)
mi
G
d(G,mi)=||Gmi||
1 𝑛 2 1 1′ 1′
𝑖=1 𝐺𝑚𝑖 = 𝑢 𝑍 ′ 𝑍 𝑢 = 𝑢 𝑅 𝑢1 =
1
𝑛 𝑛
𝐹1
1 1′ 1 𝑛 1 2
𝐹 𝐹 = 1
𝑖=1 𝐹𝑖 = 𝑉(𝐹1 )= 
𝑛 𝑛
• Donc le maximum est atteint lorsque u1 est le vecteur
propre associé à la plus grande valeur propre 1 de la
matrice de corrélation (C’est un problème de
maximisation sous contrainte, on peut le résoudre par
la méthode du multiplicateur de Lagrange (voir CH 1)).
• En conclusion, l’étape1 consiste, grâce à l’ACP, à donner
l’approximation unidimensionnelle du nuage.
• Ensuite, on passe à maximiser la variance dans une
direction orthogonale à D1. Cette droite D2 aura comme
vecteur directeur unitaire u2  u1 et associé à la
deuxième plus grande valeur propre 2 : 1 > 2 …
• ainsi de suite, jusqu’à l’étape k, où on trace la droite Dk
 Dk-1, Dk-2, … D2 et D1 et de vecteur directeur unitaire
uk orthogonal au sous espace engendré par les facteurs
(uk-1 , uk-2 , …, u1 ) et associé à la keme plus grande valeur
propre k et tel que k<…< 2 <1
• 2)- Dans l’espace des variables (Np ) :

• Dans cet espace, on construit une variable « fictive »
qui synthétise le mieux les p variables.
𝑝
• A l’étape 1, on détermine F1 tel que 𝑅2 𝐹1 , 𝑍𝑗 soit maximale.

𝑗 =1
• F est le vecteur propre associé à la plus grande valeur
1
1
propre 1 de la matrice 𝑍 𝑍 ′
𝑛
1 ′ 1 1 1′
• En effet : 𝑐𝑜𝑣 𝐹 , 𝑍𝑗 = 𝑍𝑗 𝐹 ⇒ 𝑐𝑜𝑣 𝐹 , 𝑍𝑗 = 2 𝐹 𝑍𝑗 𝑍𝑗′ 𝐹1
1 2 1
𝑛 𝑛
1
1 1′ 1
𝑜𝑟 𝑉 𝑍𝑗 = 1 𝑒𝑡 𝑉 𝐹 = 𝐹 𝐹
𝑛
1′
𝐹 𝑍𝑗 𝑍𝑗′ 𝐹1
⇒ 𝑅2 𝐹1 , 𝑍𝑗 = 1 ′ 1
𝑛𝐹 𝐹
• 2)- Dans l’espace des variables (Np ) :

𝑝 1′ 𝑝
𝑍𝑗 𝑍′𝑗 𝐹1 1′
𝐹 𝑗 =1 𝐹 𝑍 𝑍 ′ 𝐹1
⇒ 𝑅2 𝐹1 , 𝑍𝑗 = ′ = ′
𝑗 =1
𝑛𝐹1 𝐹1 𝑛𝐹1 𝐹1
• On démontre que F1 est la meilleure synthèse des p

variables, ce n’est autre que le vecteur propre associé à la
1
plus grande valeur propre 1 de la matrice R (n,n)= 𝑍 𝑍 ′ .
𝑛
• Comme précédemment, à l’étape 2, on construit F , le 2
second vecteur propre associé à la deuxième plus grande

valeur propre 2 : 1 > 2 …et de telle sorte qu’il soit non
corrélé à F1 :
cov(F1 ,F2 )=0  R(F1 ,F2 )=0 et ainsi de suite…
• A l’étape k, Fk est associé à la plus grande k tel que
k<…< 2 < 1 et avec R(Fk ,Fk-1 )=0.
• 3)- Conclusion : comparaison des deux approches

• Dans l’espace des variables, à l'étape k, la solution est la
1
composante principale Fk vecteur propre de 𝑍 𝑍′
𝑛
, alors que dans l’espace des individus, la solution est le
1
vecteur propre (le facteur uk) à l’ordre k de 𝑍′ 𝑍
𝑛
• Les deux solutions sont équivalentes, en effet :

1 1
⇒ 𝑍′ 𝑍 𝑢 = 𝜆𝑘 𝑢 ⇒ 𝑍𝑍 ′ 𝑍𝑢𝑘 = 𝜆𝑘 𝑍𝑢𝑘
𝑘 𝑘
𝑛 𝑛 𝑘
𝐹 𝐹𝑘
𝑘 1
⇒ 𝐹 𝑒𝑠𝑡 𝑢𝑛 𝑣𝑒𝑐𝑡𝑒𝑢𝑟 𝑝𝑟𝑜𝑝𝑟𝑒 𝑎𝑠𝑠𝑜𝑐𝑖é à 𝜆𝑘 𝑑𝑒 𝑙𝑎 𝑚𝑎𝑡𝑟𝑖𝑐𝑒 𝑍𝑍 ′
𝑛
Remarque :
𝜆𝑘 = 𝑝
𝑘=1
En effet :
p
1 ′
λk = Tr Z Z = 1+1+⋯+1 = p
n p fois
k=1
• 4)- Part de variance expliquée par un axe factoriel

• Chaque étape, parmi les p étapes de l’ACP,
fournit une synthèse du tableau moins
intéressante que la précédente.
• A l’étape k, on a :
𝑛
• 1 𝑘 2 𝑘 𝑘 2
𝐹𝑖 =𝑉 𝐹 = 𝐹 𝑃 = 𝜆𝑘
𝑛
𝑖=1
• La part de variance (taux d’inertie (information)) expliquée par l’axe k est :
𝜆𝑘 𝜆𝑘
𝑝 =
𝑘=1 𝜆 𝑘 𝑝
• 4)- Part de variance expliquée par un axe factoriel
• De même dans l’espace des variables, on a :

𝑝 𝑘′ 𝑝 𝑡 𝑘
1 𝑘 1 𝐹 𝑍
𝑗 =1 𝑗 𝑍𝑗 𝐹
2 2
𝑅 = 𝑅 𝐹 , 𝑍𝑗 = ′ 𝑘
𝑝 𝑝 𝑘
𝑛𝐹 𝐹
𝑗 =1
𝑘′
1 𝜆𝑘 𝐹 𝐹 𝑘 𝜆𝑘
= ′ =
𝑝 𝐹𝑘 𝐹𝑘 𝑝
𝜆
• D’où 𝑘 est la moyenne des carrés des corrélations entre
𝑝
les p variables et le kème axe.
• Remarque: Puisque les k sont décroissantes, l’information

principale réside dans les premiers axes.
Relations de Transition
• On a vu que les deux analyses du même tableau M
nous ont données respectivement les deux nuages
N n et Np . Ces deux nuages sont liés par ce
qu’on appelle les relations de dualité (où :
𝑘 𝑘
𝐹𝑖 ( 𝑟𝑒𝑠𝑝𝑐𝑡. 𝐺𝑗 ) la kème coordonnée factorielle de
l’individu i (respct. de la variable j)
𝑝
1
𝐹𝑖 =𝑘
𝑧𝑖𝑗 𝐺𝑗 𝑘
𝜆𝑘 𝑗 =1
𝑛
𝑘 1
𝐺𝑗 = 𝑧𝑖𝑗 𝐹𝑖 𝑘
𝑛 𝜆𝑘 𝑖=1
Relations de Transition
• Un individu se trouvant donc du côté d’une

variable prendra des fortes valeurs pour celle-ci
et de faibles valeurs s’il se trouve à l’opposé.
VI- Les aides à l’interprétation
• 1)- la représentation des individus
• L’analyse se fait grâce à la projection des individus
sur les plans principaux formés par 2 axes des
premiers retenus par exemple F1 et F2 ou F1 et F3, …
F2 F3
Mi Fi3 Mi
F i2
Fi1 F1 Fi1 F1
• Remarque : Attention aux erreurs de perspectives
• Pour une meilleur lecture de ces graphiques, on a

souvent recourt aux calculs des aides à
l’interprétation. Les plus utilisées sont :
qualité de représentation (QR) d’un point et la
contribution (C) de chaque individu à la variance.

• a)- La Qualité de représentation d’un point :
• a)- La QR de l’individu i sur l’axe k est
mesurée par 𝑘 2
k 𝐹𝑖
QR i = 𝑝 2
𝑗 =1 𝑍𝑖𝑗
𝑝
2
• 𝑍𝑖𝑗 est le carré de la distance de l’individu i au centre du nuage G.
𝑗 =1 𝑝
2
• De même 𝐹𝑖𝑘 est celui dans la nouvelle base.
𝑘=1
𝑝 𝑝
2 2
• Par suite 𝐹𝑖𝑘 = 𝑍𝑖𝑗
𝑘=1 𝑗 =1

b)- La QR de l’individu i sur le plan principal (k ,k’)

est mesurée par :
2
• 𝑘 2 𝑘′
k,k ′ 𝐹𝑖 𝐹𝑖
QR i = 𝑝 2 + 𝑝 2
𝑗 =1 𝑍𝑖𝑗 𝑗 =1 𝑍𝑖𝑗
• Remarque :
• i)-
2
k 𝐺𝑀𝑖 𝑢𝑘 2 𝑘 k,k ′ ′
QR i = 2 = cos 𝐺𝑀𝑖 ; 𝑢 𝑒𝑡 QR i = cos 2 𝐺𝑀𝑖 ; 𝑢𝑘 + cos2 𝐺𝑀𝑖 ; 𝑢𝑘
𝐺𝑀𝑖

• Un individu est bien expliqué par un axe k si

son QRi(k) est grand ou si son cos2 est proche
de 1.
• Conséquence : lorsque la projection d’un

individu i sur l’axe k est proche de l’origine (Fik
est faible ), alors sa qualité de représentation
par rapport à cet axe est faible .
• b)- Les points individus remarquables :
• On dit qu’ un individu est remarquable

s’il prend des valeurs extrêmes sur
plusieurs variables, autrement s’il est loin
de G dans l’espace Rp.

• c)- la contribution (C) de chaque individu à la
variance 𝑛
1 2
𝑉𝐸 𝑘
= 𝐹𝑖𝑘 = λk = V F k
n
𝑖=1
• Chaque individu a une part de la

1 2
𝑉𝐸 𝑘
qui est égale à 𝐹𝑖𝑘
n
• La contribution de chaque individu i à la

variance de l’axe k est égale à
𝑘 2
𝐹𝑖
𝐶𝑖𝑘 =
𝑛λk

• c)- la contribution (C) de chaque individu à la
variance
• Remarque :
𝑛
• Pour un k donné 𝐶𝑖𝑘 = 100% ;

𝑖=1
• plus Cik est grande plus l’individu i est

important dans la construction de l’axe k.

• d)- Les Individus supplémentaires (illustratifs):
• On dit qu’un individu est supplémentaire
s’il est représenté sur les axes factoriels
sans avoir contribuer à leurs formations.
Leur rôle est d’illustrer ces axes.
• Remarque :
• un individu supplémentaire est choisi
parmi les points extrêmes du nuage.
• 2)- La représentation des variables :

• Il s’agit de représenter les p variables par leurs
projections sur le plan principal choisi.
• La coordonnée de la variable 𝑍𝑗 est donnée
par : 𝑐𝑜𝑣 𝐹 𝑘 , 𝑍𝑗 𝑘
𝑘
= 𝑅 𝐹 , 𝑍𝑗
𝜎 𝐹
• Dans la nouvelle base, les coordonnées de 𝑍𝑗 sont :

1 2 𝑝
𝑅 𝐹 , 𝑍𝑗 , 𝑅 𝐹 , 𝑍𝑗 , … , 𝑅 𝐹 , 𝑍𝑗
𝑝
⇒ 𝑅 2 𝐹 𝑘 , 𝑍𝑗 = 1 𝑐𝑎𝑟 𝑍𝑗 𝑒𝑠𝑡 𝑛𝑜𝑟𝑚é𝑒

𝑘=1
F2
𝑅 𝐹 2 , 𝑍𝑗
𝑍𝑗
F1
𝑅 𝐹1 , 𝑍𝑗
2 1 2 2
𝑅 𝐹 , 𝑍𝑗 + 𝑅 𝐹 , 𝑍𝑗 ≤ 1
• Remarques :
i. Le point représentatif de 𝑍𝑗 est situé à

l’intérieur d’un cercle de rayon 1
ii.Si 𝑍𝑗 est proche du bord du cercle, alors 𝑍𝑗 est
proche du plan principal (Fk,Fk’).
iii.Si 𝑍𝑗 et 𝑍𝑗 ′ sont proches du bord du cercle, alors
l’angle entre ces deux variables est proche de
l’angle qu’elles font entre elles dans l’espace
des variables et son cosinus est
approximativement égal au R( 𝑍𝑗 , 𝑍𝑗 ′ ) :
• Remarques :
cos  ≈ R( 𝑍𝑗 , 𝑍𝑗′ ) ;
𝑍𝑗
𝑍𝑗 ′

si  𝑍𝑗 et 𝑍𝑗 ′ sont très fortement corrélées

par contre si  ≈ /2, 𝑍𝑗 et 𝑍𝑗 ′ ne sont pas corrélées. Si elles
sont opposées alors R( 𝑍𝑗 , 𝑍𝑗 ′ ) ≈ -1.
En fin le cercle de corrélation décrit l’essentiel de la matrice de

corrélation entre les p variables.
• 3)- Calcul des coefficients de corrélation :
• Soit la matrice 𝑍 , alors

𝑘
𝑅 𝐹 ,𝑍 = 𝜆𝑘 𝑢𝑘
• en effet :
𝑘 𝑘 𝑘
𝑐𝑜𝑣 𝐹 , 𝑍 𝑍 ′ 𝐹 𝑍′ 𝑍 𝑢
𝑅 𝐹𝑘 , 𝑍 = 𝑘
= =
𝜎 𝐹 n 𝜆𝑘 n 𝜆𝑘
𝜆𝑘 𝑢𝑘
= = 𝜆𝑘 𝑢𝑘
𝜆𝑘
4)- la représentation des Variables

quantitatives supplémentaires:
• Une variable supplémentaire n’intervient

pas dans les calculs des distances entre
individus. Mais peut illustrer les axes.
4)- la représentation des Variables

qualitatives supplémentaires:
• Certes, l’ACP est faite avec des variables

quantitatives, néanmoins, dans un sens
illustratif, on peut utiliser les variables
qualitatives comme supplémentaires.
• Une modalité est le barycentre des individus la

présentant. C’est pour cela qu’on la représente
sur le graphique des Individus.
• 5)- Description Automatique des axes
Grâce au logiciel R, on peut avoir une

description automatique des axes pour toutes
les variables actives et supplémentaires, c’est-
à-dire une liste, par ordre, des variables les
plus corrélés et ce pour chaque axe.
Cet aide devient très intéressant pour décrire

les axes lorsque le nombre de variables est très
grand.
• 6)- Nombre d’axes à retenir

•
• Méthode du coude :
• Posons 𝜀1 = 𝜆1 − 𝜆2 ; 𝜀2 = 𝜆2 − 𝜆3 ; 𝜀3 = 𝜆3 − 𝜆4 ; …
• 𝑒𝑡 𝛿1 = 𝜀1 − 𝜀2 ; 𝛿2 = 𝜀2 − 𝜀3 ; …
• On retient les valeurs propres 𝜆1 , 𝜆2 , 𝜆3 … , 𝜆𝑘+1 telles

que 𝛿1 ; 𝛿2 ; … ; 𝛿𝑘 soient tous positifs…
• Méthode de Kaiser :
• On prend les axes correspondant aux valeurs propres
supérieures à 1.
•
• C’est la deuxième méthode qu’on retiendra !
• 8)- Rotation VARIMAX des axes

• La rotation Varimax est celle qui maximise
la somme des carrées des facteurs(les u(k) ).
• Quand les axes ne sont pas assez
corrélées avec les variables, la rotation
varimax fourni de nouveaux axes très liées
à certaines variables et peu liées aux
autres. Mais cette procédure nécessite la
détermination du nombre d’axes retenus
(étape 6).
V- Exemple d’application de
l’ACP
•
• Le but de cette application est purement
pédagogique !
• On donne ci-après les consommations annuelles en
1972 (arrondies au Franc près) de 8 denrées
alimentaires (les variables). Les individus sont les 8
CSP (catégories socioprofessionnelles). Les données
sont donc des moyennes par CSP.
• Le tableau ci-dessous est de la forme
Observations/Variables
V- Exemple d’application de l’ACP
PAO PAA Thé JE POT LEC RAI PLP

AGRI 167 1 163 23 41 8 6 6
S AA G 162 2 141 12 40 12 4 15
PRIN 119 6 69 56 39 5 13 41
CSUP 87 11 63 111 27 3 18 39
CMOY 103 5 68 77 32 4 11 30
EMPL 111 4 72 66 34 6 10 28
OUVR 130 3 76 52 43 7 7 16
INAC 138 7 117 74 53 8 12 20
AGRI Exploitants agricoles PAO Pain ordinaire

SAAG Salariés agricoles PAA Autres pains
Professions
PRIN
indépendantes Thé
CSUP Cadres supérieurs JE Jus exotiques
CMOY Cadres moyens POT Pommes de terre
EMPL Employés LEC Légumes secs
OUVR Ouvriers RAI Raisin de table
INAC Inactifs PLP Plats préparés
• On écrit la matrice M comme suit

167 1 163 23 41 8 6 6
162 2 141 12 40 12 4 15
119 6 69 56 39 5 13 41
87 11 63 111 27 3 18 39
𝑀=
103 5 68 77 32 4 11 30
111 4 72 66 34 6 10 28
130 3 76 52 43 7 7 16
138 7 117 74 53 8 12 20
• On va traiter cette application par le logiciel XLSTAT

• Type d'ACP : Pearson (n)
Ci-dessus vous avez la matrice R. Après diagonalisation de R,
on obtient les valeurs et vecteurs propres.
La 8ème valeur propre est quasiment nulle !
Scree plot
8 100
Variabilité cumulée (%)

80
Valeur propre
6
60
4
40
2 20
0 0
F1 F2 F3 F4 F5 F6 F7
axe
Deux composantes ont suffi pour expliquer plus de 88% de

l’information (Inertie totale).
La méthode de Kaiser ne marche pas !
Mais celle des (-) (coude) permet de retenir les 2 1er axes !
Le critère du coude nous permet de retenir les deux premiers
axes comme ci-dessous :
Differences premières Différences secondes

5,32826545 4,86454518
0,46372027 0,35421382
0,10950645 -0,02850672
0,13801317 -0,01236062
0,15037379 0,13575285
0,01462094 0,01117417
Les facteurs sont les vecteurs propres normés de la matrice R

Ici par exemple, on peut écrire F1 comme suit :
F1 =
Pour tracer le cercle de corrélation, on a besoin des

𝑘
𝑅 𝐹 ,𝑍 = 𝜆𝑘 𝑢𝑘
On remarque que les coordonnées de la variable
= Corrélations entre celle-là et les axes !
Variables (axes F1 et F2 : 88,60 %)
0,75
POT
0,5
PAA
RAI
0,25 JE
Thé
LEC PAO
F2 (11,00 %)
0
PLP
-0,25
-0,5
-0,75
-1
-1 -0,75 -0,5 -0,25 0 0,25 0,5 0,75 1
F1 (77,60 %)
• Interprétations concernant la représentation des

variables dans le plan (F1 , F2) :
• Le premier axe mesure la répartition de la
consommation entre aliments ordinaires « bon
marché » (PAO, THE, LEC) et aliments plus
recherchés « chers » (PAA, JE, RAI, PLP). l’opposition
existante entre individus le long de l’axe 1 reflète,
par conséquent, l’opposition entre consommations
ordinaires et consommations recherchés.
• Le deuxième axe est caractéristique de la
consommation de pommes de terre, l’aliment le
plus consommé par les « inactifs »
Observations (axes F1 et F2 : 88,60 %)
4
INAC
2
F2 (11,00 %)
CSUP
0 PRIN
OUVR AGRI
SAAG
CMOY EMPL
-1
-2
-3
-5 -4 -3 -2 -1 0 1 2 3 4
F1 (77,60 %)
L’origine de la représentation des individus, montre un

individu (catégorie fictive) de consommation moyenne. On
voit aussi les coordonnées des 8 catégories sur le plan
principale F1 et F2
• Interprétations concernant la représentation des individus

dans le plan (F1 , F2) :
• Seule la catégorie « ouvrier » est mal représentée sur le plan (F1 , F2).
• Le premier axe met en évidence l’opposition (quant aux
consommations alimentaires évoquées dans le tableau) existant
entre cadres supérieurs et agriculteurs. Les autres catégories
s’échelonnent le long de cet axe selon la hiérarchie sociale
habituelle.
• Le deuxième axe est caractéristique des « inactifs »avec 75,6% ; qui
sont opposés à presque toutes les autres catégories.
VI- Exemple d’application de
l’ACP
•
• Le but de cette application est la comparaison des
deux logiciels Xlstat et R
• On reprend les consommations annuelles en 1972
(arrondies au Franc près) de 8 denrées alimentaires
Les individus sont les 8 CSP (catégories
socioprofessionnelles). Les données sont donc des
moyennes par CSP.
• Le tableau ci-dessous est de la forme
Observations/Variables
VI- Exemple d’application de l’ACP
• On écrit la matrice M comme suit

167 1 163 23 41 8 6 6
162 2 141 12 40 12 4 15
119 6 69 56 39 5 13 41
87 11 63 111 27 3 18 39
𝑀=
103 5 68 77 32 4 11 30
111 4 72 66 34 6 10 28
130 3 76 52 43 7 7 16
138 7 117 74 53 8 12 20
• On va traiter cette application par le logiciel R

• Type d'ACP : scale.unit =TRUE (acp normée)
> library("PerformanceAnalytics")
> chart.Correlation(don, histogram=TRUE, pch=19)
2 6 10 20 60 4 8 12 5 20 35
PAO .
* *** ** ** * **
100 140
Density
-0.77 0.93 -0.91 0.66 0.89 -0.83 -0.86

.
6 10
PAA ** *** *
Density
x
-0.60 0.90 -0.33 -0.67 0.96 0.77
2
The .
* * *
Density
120
-0.75 0.52 0.79 -0.67 -0.83
x
60
JE ** ** *
Density
-0.84 0.92 0.72

20 60
-0.42
x
30 40 50
POT
Density
0.60 -0.41 -0.55

x
12
Density LEC * *
8
-0.82 -0.75
x
4
RAI **
Density
14
0.83
4 8
x
PLP
20 35
Density x
5
100 140 60 120 30 40 50 4 8 14
x
> cons=read.csv2(file.choose,row.names=1)
> res=PCA(cons) ; res
> summary(res)
Call:
"res<-PCA(cons.PCA , scale.unit=TRUE, ncp=5, graph = FALSE)"
Eigenvalues
Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6 Dim.7
Variance 6.208 0.880 0.416 0.306 0.168 0.018 0.003
% of var. 77.599 10.996 5.200 3.831 2.106 0.226 0.043
Cumulative % of var. 77.599 88.595 93.795 97.626 99.731 99.957 100.000
Individuals
Dist Dim.1 ctr cos2 Dim.2 ctr cos2 Dim.3 ctr cos2
AGRI | 3.585 | -3.372 22.889 0.884 | -0.246 0.859 0.005 | 0.840 21.183 0.055 |
SAAG | 3.716 | -3.522 24.973 0.898 | -0.447 2.844 0.014 | 0.352 3.713 0.009 |
PRIN | 1.942 | 1.472 4.363 0.575 | 0.059 0.049 0.001 | -0.553 9.188 0.081 |
CSUP | 4.491 | 4.359 38.255 0.942 | 0.176 0.441 0.002 | 1.029 31.831 0.053 |
CMOY | 1.980 | 1.718 5.944 0.753 | -0.857 10.428 0.187 | -0.175 0.916 0.008 |
EMPL | 1.233 | 0.807 1.310 0.428 | -0.809 9.289 0.430 | -0.345 3.574 0.078 |
OUVR | 1.497 | -0.899 1.628 0.361 | -0.183 0.476 0.015 | -0.978 28.724 0.426 |
INAC | 2.390 | -0.563 0.638 0.056 | 2.307 75.615 0.932 | -0.170 0.870 0.005 |
Variables
Dim.1 ctr cos2 Dim.2 ctr cos2 Dim.3 ctr cos2
PAO | -0.975 15.312 0.951 | 0.129 1.900 0.017 | 0.104 2.615 0.011 |
PAA | 0.869 12.157 0.755 | 0.413 19.412 0.171 | 0.206 10.237 0.043 |
The | -0.870 12.194 0.757 | 0.189 4.068 0.036 | 0.439 46.326 0.193 |
JE | 0.931 13.960 0.867 | 0.244 6.776 0.060 | 0.047 0.540 0.002 |
POT | -0.614 6.070 0.377 | 0.698 55.328 0.487 | -0.360 31.098 0.129 |
LEC | -0.909 13.310 0.826 | 0.120 1.639 0.014 | 0.021 0.105 0.000 |
RAI | 0.929 13.917 0.864 | 0.306 10.626 0.093 | 0.164 6.464 0.027 | •
PLP | 0.901 13.081 0.812 | -0.047 0.252 0.002 | -0.104 2.614 0.011 |
Individuals factor map (PCA)
4
3
INAC
2
Dim 2 (11.00%)
CSUP
0
PRIN
AGRI OUVR
SAAG
EMPL CMOY
-1
-2
-4 -2 0 2 4
Dim 1 (77.60%)
4
3
Individuals factor map (PCA)
INAC
2
Dim 2 (11.00%)
1
0
AGRI CSUP
PRIN
OUVR
SAAG
CMOY
-1
EMPL
-2
-4 -2 0 2 4
Dim 1 (77.60%)
1.0 Variables factor map (PCA)
POT
0.5
PAA
RAI
The
PAO JE
Dim 2 (11.00%)
LEC
0.0
PLP
-0.5
-1.0
-1.5 -1.0 -0.5 0.0 0.5 1.0 1.5
Dim 1 (77.60%)
> require(LeLogicielR)
> barplot(res$eig[,1],names.arg
=expression(lambda[1],lambda[2],lambda[3],lambda[4],lambda[5],lambda[6],lambda[7]))
> fleches()
6
5
4
3
2
1
0
1 2 3 4 5 6 7
Description automatique des axes:
dimdesc(res , prob=0.06)
• $Dim.1
• $Dim.1$quanti
• correlation p.value
• JE 0.9309151 7.821882e-04
• RAI 0.9294859 8.308315e-04
• PLP 0.9011429 2.239726e-03
• PAA 0.8687483 5.110853e-03
• The -0.8700402 4.966446e-03
• LEC -0.9089814 1.758745e-03
• PAO -0.9749797 3.842664e-05
• $Dim.2
• $Dim.2$quanti
• correlation p.value
• POT 0.6976447 0.05437981
plot(res,choix="ind",select="contrib 4")
plot(res,choix="ind",select="contrib 4")
> plot(res , choix="ind" , col.ind=2 , cex=1.1 , select="cos2 .9")
> plot(res,choix="var",lim.cos2.var = 0.95 , col.var=4)
1.0
0.5
Variables factor map (PCA)
RAI
Dim 2 (11.00%)
PAO
0.0
-0.5
-1.0
-1.5 -1.0 -0.5 0.0 0.5 1.0 1.5
Dim 1 (77.60%)
> HCPC(res.cons)
Factor map
cluster 1
3
cluster 2
cluster 3
cluster 4
INAC
2
Dim 2 (11.00%)
CSUP
0
PRIN
AGRI OUVR
SAAG
EMPL CMOY
-1
-4 -2 0 2 4
Dim 1 (77.60%)
Hierarchical clustering on the factor map
cluster 1
cluster 2
cluster 3
cluster 4
5
4
3
height
Dim 2 (11%)
2.5
2.0
1
INAC
1.5
1.0
0.5
0.0
PRIN CSUP -0.5
AGRI OUVR
0
SAAG -1.0
EMPL CMOY
-4 -2 0 2 4 6
Dim 1 (77.6%)

2.Ch2 ACP 2022

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

2.Ch2 ACP 2022

Transféré par

Droits d'auteur :

Formats disponibles

Chapitre 2

• L’analyse en composantes principales ACP : Ensemble de

• Un tableau (Observation / Variable) à double

• Dans ce chapitre on se ramène à la matrice centrée

• La ième ligne de Fk s’écrit alors : 𝐹𝑖𝑘 = 𝑍𝑖𝑗 𝑢𝑗 𝑘

• Le nuage de points est formé de n individus

• 1)- Espace des individus (Nn )

• 2)- Dans l’espace des variables (Np ) :

• A l’étape 1, on détermine F1 tel que 𝑅2 𝐹1 , 𝑍𝑗 soit maximale.

• 2)- Dans l’espace des variables (Np ) :

• On démontre que F1 est la meilleure synthèse des p

second vecteur propre associé à la deuxième plus grande

• 3)- Conclusion : comparaison des deux approches

• Les deux solutions sont équivalentes, en effet :

• 4)- Part de variance expliquée par un axe factoriel

• 4)- Part de variance expliquée par un axe factoriel

• De même dans l’espace des variables, on a :

• Remarque: Puisque les k sont décroissantes, l’information

• Un individu se trouvant donc du côté d’une

• Remarque : Attention aux erreurs de perspectives

• Pour une meilleur lecture de ces graphiques, on a

• 1)- la représentation des individus

• 1)- la représentation des individus

b)- La QR de l’individu i sur le plan principal (k ,k’)

• 1)- la représentation des individus

• Un individu est bien expliqué par un axe k si

• Conséquence : lorsque la projection d’un

• 1)- la représentation des individus

• b)- Les points individus remarquables :

• On dit qu’ un individu est remarquable

• 1)- la représentation des individus

• Chaque individu a une part de la

• La contribution de chaque individu i à la

• 1)- la représentation des individus

• Pour un k donné 𝐶𝑖𝑘 = 100% ;

• plus Cik est grande plus l’individu i est

• 1)- la représentation des individus

• 2)- La représentation des variables :

• Dans la nouvelle base, les coordonnées de 𝑍𝑗 sont :

⇒ 𝑅 2 𝐹 𝑘 , 𝑍𝑗 = 1 𝑐𝑎𝑟 𝑍𝑗 𝑒𝑠𝑡 𝑛𝑜𝑟𝑚é𝑒

• 2)- La représentation des variables :

i. Le point représentatif de 𝑍𝑗 est situé à

si  𝑍𝑗 et 𝑍𝑗 ′ sont très fortement corrélées

En fin le cercle de corrélation décrit l’essentiel de la matrice de

• 3)- Calcul des coefficients de corrélation :

• Soit la matrice 𝑍 , alors

4)- la représentation des Variables

• Une variable supplémentaire n’intervient

4)- la représentation des Variables

• Certes, l’ACP est faite avec des variables

• Une modalité est le barycentre des individus la

• 5)- Description Automatique des axes

Grâce au logiciel R, on peut avoir une

Cet aide devient très intéressant pour décrire

• 6)- Nombre d’axes à retenir

• On retient les valeurs propres 𝜆1 , 𝜆2 , 𝜆3 … , 𝜆𝑘+1 telles

• 8)- Rotation VARIMAX des axes

PAO PAA Thé JE POT LEC RAI PLP

AGRI Exploitants agricoles PAO Pain ordinaire

• On écrit la matrice M comme suit

• On va traiter cette application par le logiciel XLSTAT

Variabilité cumulée (%)

Deux composantes ont suffi pour expliquer plus de 88% de