Vous êtes sur la page 1sur 4

Exercice ACP On considre le tableau R de notes sur 20 suivant ( n = 9 individus, p = 5 variables) :

Mathmatiques Jean Aline Annie Monique Didier Andr Pierre Brigitte Evelyne 6 8 6 14,5 14 11 5,5 13 9 Sciences 6 8 7 14,5 14 10 7 12,5 9,5 Franais 5 8 11 15,5 12 5,5 14 8,5 12,5 Latin 5,5 8 9,5 15 12 7 11,5 9,5 12 Musique 8 9 11 8 10 13 10 12 18

Le tableau des moyennes par matire est :


Mathmatiques Moyenne 9,67 Sciences 9,83 Franais 10,2 Latin 10,1 Musique 11,0

On dsire soumettre le tableau R une ACP. Pour cela on est conduit rechercher les vecteurs propres de la matrice T X X des covariances empiriques des cinq variables, qui est

Math. Sciences T XX = Franais Latin Musique

Math. 11,4

Sciences 9,92 8,94

Franais 2,66 4,12 12,1

Latin 4,82 5,48 9,29 7,91

Musique 0,111 0,056 0,389 0,667 8,67

i) Indiquer la transformation qui permet de passer de la matrice R la matrice X . Calculer la premire ligne de X . ii) Les trois plus grandes valeurs propres de la matrice T X X des variances-covariances sont 1 = 28,253 , 2 = 12,075 et 3 = 8,616 . Quels sont les taux d'inertie explique par chacun des trois axes factoriels correspondants ? En limitant la reprsentation l'espace des 3 premiers facteurs, quel est le taux d'inertie totale explique par cette reprsentation ? Que peut-on en conclure ? iii) Les trois premiers vecteurs propres norms de T X X sont donns dans le tableau ci-dessous :
1 Maths Sciences Franais Latin Musique 0,515 0,507 0,492 0,485 0,031 2 -0,567 -0,372 0,650 0,323 0,113 3 -0,051 -0,014 0,108 0,023 -0,992

Calculer les coordonnes de Jean sur les trois axes factoriels. iv) Calculer les coefficients de corrlation linaire entre le premier facteur et les 5 variables. v) Les corrlations entre les variables et les deux autres facteurs sont donnes ci-dessous :

Facteur 2 Maths Sciences Franais Latin Musique -0,584 -0,432 0,651 0,399 0,133

Facteur 3 -0,045 -0,014 0,091 0,024 -0,990

Donner brivement une interprtation possible pour les 3 facteurs. vi) En utilisant les rsultats obtenus la premire et la troisime question, calculer l'indice ponctuel de qualit de la reprsentation de Jean sur le premier axe factoriel, puis sur le plan des deux premiers facteurs, puis sur l'espace des trois premiers facteurs. Conclure.

Solution i) On passe de la matrice R la matrice X par centrage par rapport aux variables, soit :

xij =

rij r j n 1

, i = 1, 2, , n , j = 1, 2, , p

Pour la premire ligne de X on trouve donc x11 = (6 9,67 ) 2,828 = 1,298 , x12 = (6 9,83) 2,828 = 1,354 , x13 = (5 10,2 ) 2,828 = 1,839 , x14 = (5,5 10,1) 2,828 = 1,626 , x15 = (8 11) 2,828 = 1,06 ii) On a
T 5 =1 = trace X X = 11,4 + 8,94 + 12,1 + 7,91 + 8,67 = 49,02 . Les taux d'inertie explique par les

trois premiers axes factoriels sont donc :

1 =

1
=1


3 =

28,253 49,02

= 0,576 , 2 =

2
=1

12,075 49,02

= 0,246 ,

3 =

8,616 49,02

=1

= 0,176

Le taux d'inertie totale explique par cette reprsentation est la somme des taux calculs la question prcdente.

1 + 2 + 3
=1

= 0,576 + 0,246 + 0,176 = 0,998

Le nuage est pratiquement dans un espace 3 dimensions. iii) Les coordonnes des individus sur l'axe factoriel (valeur propre ) sont donnes par X u (ce sont les composantes). La coordonne du premier individu sur l'axe factoriel est donc le produit de la premire ligne T L1 de la matrice X , calcule la question 1, par u . Pour le premier axe de vecteur u1 :
T

L1 u1 = [ 1,298 1,354 1,839 1,626 1,060] [0,515 0,507 0,492 0,485 0,031] = 2,317
T

On trouve, de mme, pour le deuxime axe u 2 , T L1 u 2 = 0,566 , et pour le troisime axe u 3 , T L1 u3 = 0,850 . iv) Commenons par calculer les coordonnes des variables sur le premier axe factoriel v1 de lanalyse du nuage des variables, obtenu par T X v1 = 1 u1 . Puisque

1 =

28,253 = 5,315 , on a

Maths 0,515 5,315 = 2,737 Sciences 0,507 5,315 = 2,695 Franais 0,492 5,315 = 2,615 Latin 0,485 5,315 = 2,578 Musique 0,031 5,315 = 0,165
Le coefficient de corrlation linaire j entre la variable j et l'axe factoriel est le cosinus de l'angle j ainsi form.

xj

j
v
Figure A.1. Angle form entre la variable j et l'axe factoriel

j est l'angle entre la variable et sa projection sur l'axe factoriel :


cos j =

( )

x j v xj
d'o T x j v = u j . De plus, x j =

Or, u = T X v

r j rj n 1

d'o x j

1 n 2 ( rij rj ) = 2j ( j est n 1 i =1

l'cart-type de la variable j ) et donc x j = j . Finalement, j = u j j . Il suffit donc de diviser chaque composante de la matrice prcdente par l'cart type de la variable correspondante. Le tableau suivant donne les corrlations entre les variables et le premier facteur :

Maths 2,737 / Sciences 2,695 / Franais 2,615 / Latin 2,578 / Musique 0,165 /

11,4 = 0,811 8,94 = 0,901 12,1 = 0,752 7,91 = 0,916 8,67 = 0,056

v) Le premier facteur est fortement et positivement corrl avec les quatre matires principales : c'est un facteur de taille. Le deuxime facteur oppose les matires scientifiques et littraires. Le troisime facteur est fortement corrl avec la musique et caractrise l' aptitude artistique (musicale ici). vi) L'indice ponctuel est dfini par cos 2 (i ) o i est l'angle entre le vecteur individu (centr) L i et le sous-espace vectoriel de la reprsentation l i (ici le premier axe factoriel).

L1 (Jean)

1
l1 F1

Figure A.2. Angle form entre l'individu Jean et le premier axe factoriel

On a donc cos 2 (i ) = Gl i

GLi

, Gl1

= ( 2,904 )2 = 8,433 ,

GL1 = x12j
2 j =1

Ainsi, cos 2 (1 ) = Gl1

GL1

= 0,890 pour le premier axe. Notons maintenant l1 j la projection de l'individu 1

sur le j -ime axe factoriel. Considrons le plan des deux premiers axes factoriels :

cos2 (1 ) =

Gl11

+ Gl12 2 GL1
2

= 0,923

Considrons le plan des trois premiers axes factoriels :

cos 2 (1 ) =

Gl11

+ Gl12 + Gl13 2 GL1


2

= 1,000

cos 2 (1 ) vaut 1,000.

Jean est dj bien reprsent sur le premier axe factoriel et idalement dans l'espace des 3 premiers axes puisque

Vous aimerez peut-être aussi