Vous êtes sur la page 1sur 3

Master 1 BEM

MQEM

T. D. n II . LACP pratique. Exercice n 1. Une tude sur des fournisseurs de matriel informatique a conduit apprcier le service, la qualit et le prix de quatre fournisseurs. Pour cela un expert a not ces entreprises avec des notes allant de -3 3. Les rsultats sont consigns ci-dessous Ent Service Qualit Prix E1 -2 3 -1 E2 -1 1 0 E3 2 -1 -1 E4 1 -3 2 1) Calculer le vecteur moyen des individus. Quen conclure? 2) Calculer la covariance entre x1 et x1 . Que reprsente cette quantit? 3) Calculer la covariance entre x1 et x2 . 4) Donner la matrice de corrlation. On veut faire une ACP centre avec des poids uniformes. 5) Sur quelle matrice faut-il travailler? Vrier quelle admet une valeur propre nulle. Quest ce que cela implique? 6) On donne 1 = 61/8. En dduire 2 . 7) Calculer les pourcentages dinertie. Quelle dimension retenez-vous? 8) Soient les vecteurs propres a1 = (1/2, 4/5, 3/10)0 et a2 = (0.65, 0.11, 0.75)0 . Calculer les composantes principales. 9) Reprsenter les individus et les variables dans le plan principal (1, 2). Interprter. 10) Calculer la corrlation entre les variables initiales et les composantes principales. Exercice n 2. Soit X = (x1 , x2 , x3 ) tel que 1 R= 1 1

avec 1 1. On veut faire une ACP centre rduite de X. 1 1) Vrier que R admet pour vecteur propre 1 = 3 (1, 1, 1)0 . 2) Dterminer les autres lments de la dcomposition aux valeurs propres de R. 3) Quels sont les % de variance explique? Quels axes retenir? Corrections 1) Il sut de faire la moyenne des colonnes du tableau, ce qui donne x = (x1 , x2 , x3 )0 = (0, 0, 0)0 . Le tableau est donc centr. 2 1 2) cov (x1 , x1 ) = x1 x1 1, x1 x1 1 Dp = n x10 x1 = kx1 kDp o Dp est la matrice associe la mtrique diagonale des poids des individus. 1

4) Lamatrice de corrlation R a pour terme gnral cov xj , xk 1 . Elle est telle que R = M1/2 VM1/2 o M est la matrice de terme gnral jk kk kx Dp kx Dp kxj k2 p D et V la matrice de variance-covariance. Aprs calculs :

1 3) cov (x1 , x1 ) = n x10 x2 puisque les donnes sont dj centres. On obtient cov (x1 , x1 ) = 1 (2, 1, 2, 1) (3, 1, 1, 3)0 = 3. On peut galement calculer la matrice de variance 4 5 6 1 1 V = 6 10 4 2 1 4 3

5) On travaille sur la matrice de covariance (tableau initial non rduit). Exercice n 2. 1. Si R admet pour vecteur propre 1 alors il vrie R 1 = 1 1 , 1 R+ . On calcule R1 : 1 1 1 2 1 1 1 1 = 2 1 = (1 2) 1 3 1 3 1 2 + 1

donc, 1 est bien vecteur propre de R pour la valeur propre 1 = 1 2. Cette valeur propre tant positive (proprit de R matrice symtrique dnie positive) on doit avoir 1 1 . 2

2. Pour dterminer les autres lments propres de R, on rsout det (R I) = 0, ce qui quivaut (1 ) (1 )2 2 22 (1 + ) = 0 (1 + ) (1 ) (1 ) 22 = 0 (1 + ) 2 (2 ) + 1 22 = 0

Il nous faut maintenant trouver des valeurs arbitraires de x, y et z qui vrient ce systme. On en trouve facilement 2 tiercs avec (1, 1, 0) et (1, 0, 1) qui ne soient pas combinaison linaire lun de lautre. En normalisant ces vecteurs, on obtient nalement les deux vecteurs propres 1 1 2 = 2 (1, 1, 0)0 et 3 = 2 (1, 0, 1)0 . Finalement, la matrice des corrlations R peut tre dcompose sous la forme R = PP0 avec P = [ 1 , 2 , 3 ], matrice des vecteurs propres et , matrice des valeurs propres de termes diagonaux (1 2, 1 + , 1 + ). 2

On sait que 1 = 1 2 est valeur propre de R. Ceci permet de calculer par identication la racine du polynme ci-dessus. On montre que = 1 + est racine double. On peut maintenant dterminer les vecteurs propres pour cette valeur propre. Soit = (x, y, z)0 un vecteur vriant R = . En dveloppant, on obtient le systme x + y z = 0 x y + z = 0 . x + y z = 0

3. Les pourcentages dinertie explique sont donns, dans chaque direction propre, par le rapport dune valeur propre sur la somme totale des valeurs propres, gale dans ce cas 3, puisquelle correspond linertie totale calcule partir de la matrice des corrlations (variables rduites). Nous avons dj vu que les valeurs possibles de sont 1 1 pour assurer la positivit des 2 valeurs propres. Supposons maintenant que 1 < < 0. On peut ranger les valeurs propres par ordre dcroissant avec 12 > 1 +. On se rend alors compte que lespace initial 3 variables peut tre rduit une seule variable, combinaison linaire des 3 variables initiales. En eet, si lon considre le sous-espace propre de dimension 2 associ la valeur propre double, linformation du nuage de points rsum dans cet espace est identique dans les deux directions. Cela napporte rien de les conserver : on ne gardera quun axe. Dans ce cas, lboulis correspond au trac, sur le mme graphique, de barres de hauteur (1 2) /3, (1 + ) /3 et (1 + ) /3. Voyons maintenant le cas o = 0. Dans ce cas, la matrice de corrlation est diagonale : les variables sont non corrles deux deux. Les valeurs propres sont toutes gales 1 : le nuage de point est sphrique. Si 0 < < 0.5, les valeurs propres sont telles que 1 + > 1 2 : les deux premiers sous-espaces sont retenir, de mme inertie. A vous de regarder les cas extrmes = 1 et = 0.5 et den dduire les axes retenir et les variances associes.

Vous aimerez peut-être aussi