Académique Documents
Professionnel Documents
Culture Documents
Le nuage des points ligne : L1,L2…Lp ( c'est-à-dire les observations ou les individus) sur un
espace IRq de dimension q est le suivant :
Définition : L’ACP (Hotelling 1933) a pour objectif de réduire le nombre de données, souvent
1
[FSEG Tunis El Manar, Cours de Mr Hechmy Badry] 16 mars 2020
très élevé, d’un tableau de données représenté, algébriquement comme une matrice et
géométriquement comme un nuage de points. Elle consiste à l’étude des projections des points
de ce nuage sur un axe (appelé axe factoriel ou principal), un plan ou un hyperplan
judicieusement déterminé.
Le problème est que lorsque on passe d’un espace de q dimensions à un espace de dimensions
plus petites, l’information retenue ne sera pas la même, il y’aura sans doute une déformation de
l’information. Le rôle de l’ACP est de trouver des espaces de dimensions plus petites
minimisant ces déformations.
Une part contributive importante de la Tr(X’X) est déterminée par les s premières valeurs
propres 1, 2 ,...s avec s q en raison des valeurs numériques décroissantes de ces valeurs.
On dit que l’information perdue est alors relativement faible. Si c’est le cas le nombre d’axe
factoriel à retenir serait égal à s.
2
[FSEG Tunis El Manar, Cours de Mr Hechmy Badry] 16 mars 2020
L’interprétation de ce concept dépend des opérations avec lesquelles il s’est développé. Si ces
opérations se sont réalisés sans aucune référence économique, par exemple, on ne peut attendre
que ces facteurs ainsi obtenus, n’auront aucune interprétation économique, sauf par chance !
Dans le cas où le problème étudié est bien spécifié. Par exemple, dans une analyse des budgets
de consommations des particuliers, souvent le premier axe sera un indicateur de la position
sociale des familles les uns par rapport autres, tandis que les axes suivants ne peuvent pas être
interpréter que par le comportement subjectif de la personne qui fait l’étude.
En pratique, des points voisins du nuage représentent des comportements (économiques)
analogues. D’où la notion de proximité (de deux ou plusieurs points du nuage).
j1
3
[FSEG Tunis El Manar, Cours de Mr Hechmy Badry] 16 mars 2020
Ln
Lm
Fu
u lm ln
Rappel : Le segment lmln résultat de la projection du vecteur Lm-Ln sur Fu est égale au produit
La distance d(lm, ln) serait plus proche de la distance d(Lm,Ln) lorsqu’elle est plus grande.
Autrement, la déformation produite par la projection serait plus faible lorsque l’amplitude de la
projection lmln serait plus grande.
m, n m, n m, n
u T Lm Ln L m Ln u u T Lm L n Lm Ln u u T 2p²u 2p² u Tu
T
m,n m , n
Avec la matrice des variances-covariances du nuage des p points
4
[FSEG Tunis El Manar, Cours de Mr Hechmy Badry] 16 mars 2020
données et par conséquent ses vecteurs propres associés qui représenteront ces sous espaces
vectoriels (axes factoriels ou principales). La démarche à suivre pour une ACP non normée peut
être résumée ainsi :
a. Trouver la matrice X’X
b. Chercher les valeurs propres
Ecrire le polynôme caractéristique de X’X
Déterminer les valeurs propres de la matrice symétrique X’X
Classer les valeurs propres selon l’ordre décroissant,
A noter que : Tr X' X Tr AA P1 Tr 1 2 ... q
5
[FSEG Tunis El Manar, Cours de Mr Hechmy Badry] 16 mars 2020
Exercice :
5 1 1
1. Soit A 2 4 2 , réaliser l’ACP de la matrice A
1 1 3
2. Expliquer la liaison entre le choix de la composante et l’écart type de la variable.
2. L’importance que prendront les variables dans le calcul des composantes principales
est fonction de leur ordre de grandeur. Une variable ayant un écart type important
aura plus de poids qu’une variable de faible écart-type. Il s’ensuit donc que les
variables de fort écart-type construiront les premières composantes. Toutefois la
lecture des résultats d’une ACP peut devenir compliquée. C’est pour remédier à
ça qu’il convient de centrer et réduire les variables.
…
5. Limite de l’ACP
D’un point de vue technique, l’ACP a pour objet l’étude de la structure de la matrice des
variances-covariances ou de la matrice des corrélations.
Mais, ce procédé est imparfait dans la mesure que le nuage est déformé par la projection, même
si cette dernière est la plus idéale possible. Certains points sont plus altérés que d’autres par la
transformation.
L’inconvénient majeur réside dans l’interprétation des axes. Parfois, l’explication est évidente
et fait que l’ACP soit redondante ; ou bien elle est contingente pour l’analyste et dans ce dernier
cas elle n’apporte pas des renseignements très convaincantes pour l’analyse économétrique
postérieure.
6
[FSEG Tunis El Manar, Cours de Mr Hechmy Badry] 16 mars 2020
On a vu que l’objectif de l’ACP est de projeter un nuage de p points de IR q sur un axe, un plan
ou un hyperplan déterminé de telle manière que la projection déforme le moins possible le
nuage.
Souvent on réalise une ACP normée (ou réduite) pour se débarrasser des effets des unités de
mesure différentes.
Toutefois cette réduction peut être omise parfois par choix plutôt arbitraire, d’autres fois par
nécessité. Voici quelques éléments qui diffèrent entre les deux types d’ACP :
7
[FSEG Tunis El Manar, Cours de Mr Hechmy Badry] 16 mars 2020
2. Critère d’interprétation : on retient que les axes que l’on peut attribuer une
forme d’interprétation économique, par exemple, soit directement, soit en terme
des variables avec lesquelles ils sont très corrélés.
3. Critère d’éboulis : on cherche un ‘’coude’’ dans le graphe des valeurs propres
et on ne conserve que les valeurs jusqu’au ce coude.
Valeur propre
Exemple :
0,15
Scree plot 100
80
Valeur propre
Inertie (%)
0,1
60
40
0,05
20
0 0
F1 F2 F3 F4 F5 F6 F7 F8 F9
axe
Dans la pratique Elle consiste à retenir les 2 premiers axes au moins, puis de "couper"
l'éboulis (ou scree plot) des valeurs propres entre les valeurs propres dont la différence
est maximum.
Considérons les valeurs propres suivantes relatives aux axes factoriels F1,F2…F6
Axe F1 F2 F3 F4 F5 F6
Valeur propre 3,193 1,247 0,855 0,475 0,169 0,061
Dans cet exemple, les différences entre valeurs propres à partir de la deuxième sont :
vp(2)-vp(3)= 0,392
vp(3)-vp(4)= 0,380
vp(4)-vp(5)= 0,307
8
[FSEG Tunis El Manar, Cours de Mr Hechmy Badry] 16 mars 2020
vp(5)-vp(6)=0,108.
La différence maximum est entre les axes 2 et 3, on retient donc 2 axes.
Remarque. Il existe d'autres règles de choix du nombre d'axes. La règle de l'éboulis combinée
avec celle de Kaiser est une des meilleures. En effet, on commence par regarder combien de
valeurs propres sont supérieures à la moyenne. Puis on regarde si la dernière valeur propre
retenue (supérieure à la moyenne) est suffisamment éloignée de celle qui la suit (inférieure à la
moyenne). Si oui, on reste sur la décision de la règle de Kaiser, si non, on coupera au saut plus
important le plus près.
La prise en compte de la part d'inertie expliquée peut faire pencher la balance vers plus d'axes
ou moins d'axes que ce que la règle de Kaiser amène.
On se limite dans ce cours à la règle de Kaiser qui consiste à ne retenir que les axes associés
à des valeurs propres supérieurs à 1, c'est-à-dire dont la variance est supérieure à celle
des variables d’origine. (Autrement la moyenne des valeurs propres étant 1, on ne garde
que celles qui sont supérieures à cette moyenne).
x ij X j x ij
Avec z ij
X j
, Xj i 1
p
, X j
1 ip
p i 1
x ij X j ²
Cette matrice n’est autre que la matrice de corrélations puisque les variables sont
9
[FSEG Tunis El Manar, Cours de Mr Hechmy Badry] 16 mars 2020
1 T
centrées réduites. Z Z
p
n’est autre que la somme des variances des variables Zj : tr VZ j .
q
j1
En pratique, on arrête l’extraction des valeurs propres lorsque la somme des s valeurs
propres que l’on a déterminé représentent un pourcentage satisfaisant de la variance.
10
[FSEG Tunis El Manar, Cours de Mr Hechmy Badry] 16 mars 2020
F2 F2
1
F1 F1
-1 1
11
[FSEG Tunis El Manar, Cours de Mr Hechmy Badry] 16 mars 2020
Remarques :
L'inertie totale du nuage des individus (qui est un nuage dans un espace à q dimensions),
est égale à la somme des variances des variables. Elle est la même pour le tableau de
données réduites (c'est-à-dire q) que pour le tableau des composantes principales.
Les variances des composantes principales sont appelées valeurs propres. Elles sont
ordonnées dans l'ordre décroissant.
On appelle aussi les composantes principales des "axes" ou "dimensions" ou "facteurs".
Le vocabulaire qu'on emploiera, qui a une signification bien précise dans un contexte
plus mathématique, utilisera indifféremment ces termes pour désigner la même notion,
c'est-à-dire les différents résumés de l'ensemble des variables.
III. Applications
12
[FSEG Tunis El Manar, Cours de Mr Hechmy Badry] 16 mars 2020
Individus Variables
X1 X2 X3
1 0 4 6
2 0 0 6
3 8 4 2
4 8 0 2
13