Vous êtes sur la page 1sur 4

ANAD 2CS SIQ Année 2021/2022 TD2- ACP suite

Interprétation des résultats d’une ACP sur un jeu de données

Exemple 1 Marques de voitures Une ACP a été appliquée sur un jeu de données concernant
les marques de voitures ; les variables considérées sont : économie, service, valeur, prix, design,
sportif, sécurité et manutention ( economy, service, value, price, design, sporty, safety and
handling ). Le tableau de données contient les notes moyennes de 24 types de voitures sur
un échantillon de 40 personnes. Les notes sont ordonnées de 1 (très bien) à 6 ( très mauvais).
Résultat ACP :
— les valeurs propres de la matrice des covariances sont :
(5.56 − 1.15 − 0.37 − 0.1 − 0.08 − 0.05 − 0.04 − 0.02)
— les vecteurs propres :
ut1 = (−0.22; 0.31; 0.44; −0.48; 0.33; 0.39; 0.42; −0.01) et
ut2 = (0.54; 0.28; 0.22; 0.30; −0.14; −0.16; 0.46; 0.49)
— les deux premières composantes principales sont définies par : Y1 = −0.22 × econ + 0.31 ×
serv + 0.44 × value − 0.48 × price + 0.33 × desi + 0.39 × sport + 0.42 × saf e − 0.01 × easy
Y2 = 0.54 × econ + 0.28 × serv + 0.22 × value + 0.30 × price − 0.14 × desi − 0.16 × sport +
0.46 × saf e + 0.49 × easy
— Tableau de données

Figure 1 – Extrait du tableau de données

— Les graphes correspondants : Voir les figures 2 et 3

Interprétation
1. Le cercle des corrélations, variables-facteurs, montre que les variables d’origine sont très
bien expliquées par les deux premières CP car tous les points se trouvent très près du
cercle unité.
2. Les corrélations, variable-facteur, suggèrent que la première composante principale dis-
tingue les voiture chère et "design" des voitures moins chères et moins sportives.
3. Sur le graphe, des individus, du côté droit, nous observons les marques moins cool telles
que Wartburg, Trabant, Lada ou Fiat, tandis que sur le côté gauche, nous voyons Jaguar,
Ferrari, BMW et Mercedes-Benz.
4. La seconde composante principale distingue les voitures économiques faciles à manipuler,
telles que Volkswagen et Opel, des voitures qui consomment beaucoup d’essence et dont
la maniabilité est plus problématique, comme Ferrari, Wartburg, Jaguar et Trabant.

1
Figure 2 – Corrélation variables avec les deux premières C.P.

Exemple 2 Santé Interpréter les résultats de cette analyse

Cette étude concerne les causes de décès dans 50 états d’Amérique ; les variables considérées
sont X1 : accident (acc) ; X2 : cardiovascular (card) ; X3 : cancer (canc) ; X4 : pulmonary (pul) ;
X5 : pneumonia flu (pneu) ; X6 : diabetes (diab) ; X7 : liver (liv)
— les valeurs propres de la matrice des covariances sont :
(8069.40 − 189.22 − 76.03 − 25.21 − 10.45 − 5.76 − 3.47)
— Proportions des variances expliquées : (0.96 − 0.99 − 0.99 − 1 − 1 − 1 − 1)
— les vecteurs propres
ut1 = (−0.06; 0.94; 0.34; 0.03; 0.02; 0.03; 0.01) et
ut2 = (−0.34; −0.34; 0.86; 0.01; −0.11; 0.09; 0.11)
Un extrait de la table US-Health dans la figure 4

Exercice-TP A partir du lien ci dessous, choisir un jeu de données qui convient, faire une
ACP puis interpréter.
Le lien

http://vincentarelbundock.github.io/Rdatasets/datasets.html

2
Figure 3 – Projection des individus et graphe des valeurs propres

Figure 4 – Données sur la santé

3
Figure 5 – Graphe des variables Exemple 2

Figure 6 – Répartition des individus Exemple 2

Vous aimerez peut-être aussi