Académique Documents
Professionnel Documents
Culture Documents
Pr : RAZZOUK REDOUANE
! OBJECTIF DE L’ACP
!
lignes : ressemblances
i - - - - - -Xik - - - - -
similarité et typologie
!
!
colonnes : liens
corrélation et typologie
I !
Calcul des distances dans l’ACP
Pour les observations
mesurer la ressemblance entre deux observations
d 2
(i, l) (x ik x )
lk
2
k K
1 xik xk xih xh
r(k, h) ( )( )
I i I sk sh
Rappels
• Matrice de variance-covariance : mesure la liaison entre les
différents variables
! i
x x
x
observations
x Variable k
xik xk x G
i ( )
sk x
! xik xk
( )
sk
I !
Variables
Types Couleur Puissance Vitesse Prix
Renault 11 60 110 40
Golf 12 62 93 25
Peugeot 15 80 113 39
Citroën 14 75 94 25
Fait 14 82 100 30
Toyota 13 72 102 32
Statistiques descriptives
Vitesse -- -- 1 0,986
Prix -- -- -- 1
Remarques
Le tableau 1 est difficile à lire (en particulier
lorsqu’on a plusieurs variables et sujets).
Par conséquent les relations entre les
différents variables sont indécelables à
première vue.
La matrice de corrélation (matrice de liaison
sans dimension) montre que la Couleur est
fortement corrélée avec la Puissance ; il en
est de même pour les variables 3 et 4.
Comment résoudre notre problématique
• Les variables de départ sont remplacées par
« des vecteurs propres » de la matrice Σ ou
de la matrice R, appelés Composantes
principales.
• Y-a-t-il un critère d’arrêt ? généralement on
s’arrête quand au moins 75% de la variance
est expliquée par la variance cumulée par
les CP.
Qu’est-ce qu’un vecteur propre ?
• est une valeur propre de la matrice A si et
seulement si
Av = v
• Le vecteur v dans la relation ci-dessus est appelé
vecteur associé à
• Les valeurs propres s’obtiennent en résolvant le
système d’équations det(A- I) = 0.
vecteur propre (Suite)
• Le nombre de valeurs propres, 1> … > p,
est égal au nombre de lignes = nombre de
colonnes de la matrice A
PRIN 119 6 69 56 39 5 13 41
CSUP 87 11 63 111 27 3 18 39
CMOY 103 5 68 77 32 4 11 30
EMPL 111 4 72 66 34 6 10 28
OUVR 130 3 76 52 43 7 7 16
Le test de Kaiser-Meyer-Olkin
Indice KMO
Mesure de précision de l'échantillonnage de Kaiser-
Meyer-Olkin. ,67
p(p 1)
est supérieur au seuil 1-
2
2
Exemple