Académique Documents
Professionnel Documents
Culture Documents
Présentation ACP
Présentation ACP
ACP
• Variable qualitative :
* nominale (exemple: couleur [jaune, vert, ..], type de brouillard
[dense, de convection, néant])
Moyenne :
Variance :
Ecart type :
Variable centrée :
Corrélation :
Ŷ=r*Sy/Sx*x + b
10
yi 6
2
NOY
0 Rcarrée = 0,7579
0 2 4 6 8 10
xi
NOX
n individus
n lignes
(scalaire)
(valeur de la j ème
variable pour le i ème
individu)
La notation était :
n=76
: : : : : : : : : : : : : : 76 individus
76 modèles d’ordinateurs
Question :
Analyser les jugements donnés par
les centres informatiques sur les
*Analyser la variation des notes d'un critère à l'autre pour chaque modèle d'ordinateur
i (i=1,76)
* puis analyser la variation des notes d'un ordinateur à l'autre pour chaque critère
j (j=1,12)
• Condenser/synthétiser l'information :
• Rendre l’information plus facile à analyser;
et ce :
Comment ?
à:
Et on écrira :
Avec :
Composantes principales
Axes factoriels
3cm de diamètre
30cm de longueur
3m
Réponse
30cm
Feuille de papier
3m
En général:
L'objet décrit dans l'exemple d'analogie est, dans notre cas, un nuage
de n points dans l'espace de dimension =< p
1. Proximité:
❑ Deux individus proches sont semblables
(ils possèdent des valeurs proches pour l'ensemble
des variables)
• La dispersion du nuage de points est mesurée par son inertie par rapport au centre
de gravité :
Etape 1: Recherche de l'axe (unitaire) tel que le nuage des points a une
variance (allongement) maximale sur cet axe
C.ad. Trouver l'axe factoriel (F1) qui déforme le moins possible le nuage
u1 (F1)
O Hi
C.ad. Trouver l'axe factoriel (F2) tel que le plan (O,F1, F2) déforme le moins
possible le nuage A i
e2
G e1
O
e2
e2
U2
O
e1
U1
On montre que :
Les vecteurs directeurs des axes recherchés sont les vecteurs propres de la
matrice de variance covariance Σ (i.e. matrice d’inertie).
Ces vecteurs unitaires sont rangés dans l'ordre décroissant des valeurs
propres associées :
Propriété de la variance:
Propriété de la corrélation:
Hi
zik
O
Ai
O
zik
zil Hi
Fk
Fl
La variance expliquée par les q premiers axes principaux est :
(x100%)
Formule de reconstitution :
Formule d’approximation :
p variables q CP q << p
P=12
(1/P)=0,0833 =8,33%
Attention : il ne faut commenter la position d’un individu sur un plan que s’il est bien
représenté sur ce plan;
Comment vérifier ?
𝑂𝐻𝑖2
Contribution de l’axe Uk à l’individu Ai : =
𝑂𝐴2𝑖
Annexe mathématique
Ai
L’inerte de Ai suivant le plan dirigé par les axes Uk et Ul est :
O Zik
Uk
Zil
Hi
Contribution du plan (O,Uk ,Ul) à l’individu Ai : Ul
=
Annexe mathématique
O Zik
Uk
Ul
• =1 Hi
• ~0
i.e. Ai est mal représenté par Hi
Représentation d’un individu
zi,2
i=
zi,1
: : : : : : : : : : : : : :
Remarque pratique
NB: Les individus projetés loin du centre O méritent plus d’attention car leur
contribution au calcul de l’inertie est grande
Représentation d’un individu
Il faut se méfier de l’interprétation des individus mal représentés:
il ne faut les interpréter que sur les plans sur lesquels ils sont bien
représentés
Chaque Xj (vecteur des n coordonnées de xj est représenté sur le plan (O, Fk, Fl )
Fl
1
-1 1 Fk
La qualité de représentation d’une variable
sur le plan (O, Fk, Fl) est mesurée par:
𝑟2 𝑥 𝑗 , 𝑧𝑘 + 𝑟2 𝑥 𝑗 , 𝑧𝑙
-1
Said EL KHATRI : elkhatri@gmail.com 60
Annexe mathématique
Cercle de corrélation:
A
α B
A’ r(x,y) 1 α 0°
B’
O
r(x,y) 0 α 90°
r(x,y) -1 α 180°
Cercle de corrélation:
Aj Aj
1 A’j A’j
Zk’
O O r(Xj ,Zk )
Cercle de corrélation:
Am
α Aj
A’ m
A’j
1 α 0°
0 α 90°
-1 α 180°
Légère Grande
déformation déformation
de l’angle A1 A2 α de l’angle
A1
α
A2
La corrélation entre deux variables xm et xj est donnée par la lecture graphique du cosinus
de l'angle (O,Amkl; O,Ajkl )
à condition que les points Amkl et Ajkl soient proches du cercle de corrélation
Proche du X1 et X2 : corrélées
Sur le cercle =
centre = Parfaitement X8 et X4 : anti- corrélées
Très mal représentée
représentée X1 et X3 : dé-corrélées
1
X6 et X3 : on ne peut rien dire
car X6 est mal représentée
X3 et Zl : corrélées
r(X6,Zk)
-1 1 X6 et Zk : dé-corrélées
corr(rap-maint, Z1)
Axe factoriel 2
corr(rap-maint, Z2)
Axe factoriel 1
Axe factoriel 2
Axe factoriel 1
1) Donner un sens à chaque axe factoriel
2) Interpréter la position des individus par rapport aux sens des axes.
+ : sens de Uk
- : sens inverse de Uk
Said EL KHATRI : elkhatri@gmail.com 68
Projection des variables
Deux cas :
Utilisation
39.4% Aspect Général
Axe factoriel 2
Maintenance
Axe factoriel 1
Utilisation
39.4% Aspect Général
Axe factoriel 2
Maintenance
Axe factoriel 1
Qualité
Aspect Général
39.4%
Axe factoriel 3
Axe factoriel 1
Qualité
Aspect Général
39.4%
Axe factoriel 3
Axe factoriel 1
Utilisation
Aspect Général
39.4%
Maintenance
Axe 2
Qualité
39.4%
Aspect Général
Axe 3
Axe 1
Said EL KHATRI : elkhatri@gmail.com 75
Les données sont-elles factorisables ?
1) Plusieurs variables sont corrélées (ou anti-corrélées) ?
Analyse de la matrice de corrélation
Moyen
Très significatif
En pratique:
Les données sont factorisables si au moins 2 conditions parmi
ces 3 conditions sont favorables
diagonaliser L diagonaliser Σ
-,4 -,4
-,6 -,6
-,8 -,8
-1,0 -1,0
-1,0 -,8 -,6 -,4 -,2 ,0 ,2 ,4 ,6 ,8 1,0 -1,0 -,8 -,6 -,4 -,2 ,0 ,2 ,4 ,6 ,8 1,0
Composante 1 Composante 3