Vous êtes sur la page 1sur 10

Analyse des données S6, Option : Gestion Prof.

Mohamed El Merouani

ACP

Exercices

Exercices corrigés
Exercice 1 :

On considère la matrice de données X de type (2,3) suivante :


®E

 − 1 0 1
X =  
 0 − 1 1
lM

1) Calculer le produit matriciel X’X et s’assurer que c’est une matrice carrée et
symétrique.
2) Chercher les valeurs propres λi de X’X et ses vecteurs propres associés ui. Donner la
ero
matrice diagonale Λ semblable à X’X et la matrice de passage A.
3) Vérifier que tr ( X ' X ) = tr (Λ) = ∑ λi
i
ua
Solution 1 :

−1 0  −1 0  1 0 − 1
    − 1 0 1  
ni
1) X ' =  0 − 1 ; X ' X =  0 − 1  =  0 1 − 1
0 − 1 1 
1 1
 
1
 1  −1 −1 2 

qui est bien une matrice carrée d’ordre 3 et elle est symétrique.
FP

1− λ 0 −1
2) det( X ' X − λI ) = 0 ⇒ 0 1− λ −1 = 0
−1 −1 2−λ
Te

Si on développe suivant la 1ère ligne, on aura :

1− λ −1 1− λ
tou
4 0
(1 − λ )(− 1)2 − (− 1) = 0 ⇒ (1 − λ )[(1 − λ )(2 − λ ) − 1] − (1 − λ ) = 0
−1 2−λ −1 −1
[ ]
⇒ (1 − λ )[(1 − λ )(2 − λ ) − 1 − 1] = 0 ⇒ (1 − λ ) λ2 − 3λ = 0
λ (1 − λ )(λ − 3) = 0 ,
an
D’où, l’équation caractéristique
Alors, les valeurs propres de X’X sont : λ1=3 ; λ2=1 ; λ3=0
Déterminons les sous-espaces propres associés ;
 1 0 − 1  x   3x 
    
Si λ1=3, alors X’Xu=λ1u, c'est-à-dire  0 1 − 1  y  =  3 y 
 − 1 − 1 2   z   3z 
    
avec x,y et z sont les coordonnées du vecteur propre u cherché.

1
www.elmerouani.jimdo.com
Analyse des données S6, Option : Gestion Prof. Mohamed El Merouani

 −1
 x= z
 x − z = 3x  − 2x = z 
2
  −1
⇒  y − z = 3y ⇒  − 2y = z ⇒  y= z
− x − y + 2 z = 3 z − x − y = z  2
   z (quelconque)∈ IR


 1 1     1 1  
D’où Fλ1 =  − z , − z , z  / z ∈ IR  =  z  − ,− ,1 / z ∈ IR
 2 2     2 2  
®E

Fλ1 est un espace vectoriel de dimension 1 (c’est une droite vectoriel, un axe, le
 6 6 6
premier axe principal). Un vecteur unitaire de Fλ1 est u1 =  − ;−  , sa
lM
;
 6 6 3 
6 6 6
norme est u1 = + + =1.
36 36 9
ero

 1 0 − 1  x   x 
    
Si λ2=1, alors  0 1 − 1  y  =  y 
−1 −1 2  z   z 
ua
    
avec x,y et z sont les coordonnées du vecteur propre cherché.
 x−z = x  x = −y
ni
 
⇒ y−z = y ⇒  y (quelconque)∈ IR
− x − y + 2 z = z  z=0
 
Fλ2 = {(− y, y, 0 ) / y ∈ IR} = {y (− 1,1,0) / y ∈ IR}
FP

D’où
Fλ 2 est un espace vectoriel de dimension 1 (c’est une droite vectoriel, un axe, le
− 2 2 
Te
deuxième axe principal). Un vecteur unitaire de Fλ 2 est u 2 =  ; ;0  , sa norme
 2 2 
2 2
tou
est u 2 = + = 1.
4 4

Si λ3=0, alors si on note x,y et z les coordonnées du vecteur propre cherché.


an
 x−z =0  x=z
 
 y−z=0 ⇒ y=z
− x − y + 2 z = 0  z (quelconque)∈ IR
 
D’où Fλ3 = {( z, z, z ) / z ∈ IR} = {z (1,1,1) / z ∈ IR}

2
www.elmerouani.jimdo.com
Analyse des données S6, Option : Gestion Prof. Mohamed El Merouani

Fλ 3 est un espace vectoriel de dimension 1 (c’est une droite vectoriel, un axe, le


 3 3 3
troisième axe principal). Un vecteur unitaire de Fλ 3 est u 3 =  ; ;  , sa norme

 3 3 3 
3 3 3
est u 3 = + + = 1.
9 9 9

 −1 
 − 1 1
®E
3 0 0  2 
   −1
Λ =  0 1 0 ; A= 1 1 ; donc Λ = A −1 X ' XA
 2 
0 0 0  1
  0 1
lM
 
 
( ) ( )
3) tr (Λ ) = tr A −1 X ' XA = tr A −1 AX ' X = tr (I X ' X ) = tr ( X ' X )
et on a tr ( X ' X ) = 1 + 1 + 2 = 4 = tr (Λ ) = 3 + 1 + 0
ero

Exercice 2 :

Soit la matrice des données suivantes :


ua

4 5
 
X = 6 7
ni
8 0
 

1) Soient C1 et C2 les vecteurs colonnes de X. Centrer et normer les variables C1 et C2.


FP
2) Déterminer la matrice V des variances-covariances et la matrice Γ des corrélations.
3) Diagonaliser la matrice V. On note λi ses valeurs propres.
4) Déterminer les vecteurs propres Fi associés aux valeurs propres λi.
Te

Solution 2 :

 4 5
tou
   
1) C1 =  6  et C2 =  7  ,
8 0
   
8+6+4 5+7+0
Les moyennes : C1 = X 1 = =6 C2 = X 2 = =4
an
et
3 3
Center les variables (xij − x j ) :
4-6=-2 5-4=1
6-6=0 7-4=3
8-6=2 0-4=-4

3
www.elmerouani.jimdo.com
Analyse des données S6, Option : Gestion Prof. Mohamed El Merouani

Leur normes (écart-types σ Xii ) :

[(− 2) + (2) ] =
1 1 2
C1 = σ X 1 = [4 + 4] = 2
2 2

3 3 3

[1 + 3 2 + (− 4) ] =
1 2 26
C2 = σ X 2 =
2
et
3 3
−2 3  3
 
 2 2 26
  xij − x j
®E
3 3
2) Y =  0  avec yij =
 26  σX i
 3 −4 3
 
lM

 2 26 
⇒ Y1 = C1∗ = 0 et Y2 = C 2∗ = 0
σ yj = 1; j = 1,2
Cov ( X , Y )
ero

De plus r = entre deux variables X et Y, mais si σ ( X ) = σ (Y ) = 1,


σ ( X )σ (Y )
alors r = Cov( X , Y ) .
ua
1
Calcul du produit matriciel Y 'Y :
p
 
− 3 3
ni

 3 3  2  26  − 15   −5 
− 0   3   1 
1 2 
2  0  3 3 1 2 13  =  2 13 
 =
3 3 3 3 − 4 3  26  3  − 15   −5 
FP
   3   1 
 26 26 26  3 −4 3  2 13   2 13 
 
 2 26 
Le résultat de ce calcul est la matrice Γ=V.
Te
3) Valeurs propres de V=Γ :
1 − λ − 0,69
det (Γ − λI ) = 0 ⇔ =0
− 0,69 1 − λ
tou

⇔ (1 − λ ) − (− 0,69) = 0
2 2

⇔ (1 − λ − 0,69)(1 − λ + 0,69) = 0
⇔ (0,31 − λ )(1,69 − λ ) = 0
an

⇒ λ1 = 1,69 ; λ2 = 0,31
Ce sont les deux valeurs propres de Γ.
4) Calcul des vecteurs propres associés :
Pour λ1 = 1,69 ;
 1 − 0,69  x1  x 
Γu1 = λ1u1 ⇔    = 1,69 1 
 − 0,69 1  x 2   x2 

4
www.elmerouani.jimdo.com
Analyse des données S6, Option : Gestion Prof. Mohamed El Merouani

 x − 0,69 x 2 = 1,69 x1
⇒ 1
− 0,69 x1 + x 2 = 1,69 x 2
− 0,69 x1 − 0,69 x 2 = 0
⇒ ⇒ x1 = − x 2
− 0,69 x1 − 0,69 x 2 = 0
Donc Fλ1 = {( x1 , − x1 ) / x1 ∈ IR} = {x1 (1, − 1) / x1 ∈ IR}
Fλ1 est un espace vectoriel de dimension 1 (c’est une droite vectoriel, un axe, le
 2 
®E
 
premier axe principal). Un vecteur unitaire de Fλ1 est u1 =  2  , sa norme est
 2
− 
 2 
lM

2 2
u1 = + = 1.
4 4
Pour λ2 = 0,31 ,
ero

 1 − 0,69  x1   x   x − 0,69 x 2 = 0,31x1


   = 0,31 1  ⇒  1
 − 0,69 1  x 2   x 2  − 0,69 x1 + x 2 = 0,31x 2
 0,69 x1 − 0,69 x 2 = 0
ua
⇒
− 0,69 x1 + 0,69 x 2 = 0
⇒ x1 = x2
Donc Fλ 2 = {( x1 , x1 ) / x1 ∈ IR} = {x1 (1,1) / x1 ∈ IR}
ni

Fλ 2 est un espace vectoriel de dimension 1 (c’est une droite vectoriel, un axe, le


 2
FP
 
deuxième axe principal). Un vecteur unitaire de Fλ 2 est u 2 =  2  , sa norme est
 2
 
 2 
Te

2 2
u2 = + = 1.
4 4
u1 . u 2 = 0 ⇒ {u1 , u 2 }est une base orthonormée.
tou

Exercice 3 :

Réaliser l’ACP de la matrice suivante, à partir de sa matrice de dispersion (données centrées


an

mais non réduites) :

2 2
 
6 2
6 4
 
10 4 

5
www.elmerouani.jimdo.com
Analyse des données S6, Option : Gestion Prof. Mohamed El Merouani

Solution 3 :

2 2
 
6 2
Soit Y =  centrée mais non réduites,
6 4
 
10 4 

On a : C1 = σ 1 =
1 2
( )
2 + 6 2 + 6 2 + 10 2 = 44 = 2 11
®E
4

C2 = σ 2 =
1 2
(
2 + 2 2 + 4 2 + 4 2 = 10 )
lM
4

 2 2   1 2 
   
 2 11 10   11 10 
 6 2   2 
ero
3
 10  =  10 
Alors : Z =  2 11  
11

 6 4   3 4 
 2 11 10   11 10 
 10 4   4 
ua
5
   
 2 11 10   11 10 
ni
1
La matrice des corrélations est Z ′Z = Γ
4

 2 
FP
1
 
 11 10 
 1 3 3 5  3 2   2   1 
   4   1 
Γ=
1  11 11 11 11  11  1
10 =  11  =  44 
 
Te
4 2 2 4 4  3 4  4 2   1
4   1 

  
 10 10 10 10  11 10   11   44 
 5 4 
 
tou
 11 10 

Les valeurs propres de Γ :


an
1
1− λ
det (Γ − λI ) = 0 ⇔ 44 = 0
1
1− λ
44
2
 1 
⇔ (1 − λ ) −   =0
2

 44 
 1  1 
⇔  (1 − λ ) − ( )  (1 − λ ) + ( ) = 0
 44  44 

6
www.elmerouani.jimdo.com
Analyse des données S6, Option : Gestion Prof. Mohamed El Merouani

⇔ (0,85 − λ )(1,15 + λ ) = 0

Alors λ1 = 1,15 et λ2 = 0,85 sont les valeurs propres de Γ.

Cherchons, maintenant, leurs vecteurs propres associés :

• Pour λ1 = 1,15 :

 1 
 1 
44  x  = 1,15 x  ⇒  x + 0,15 y = 1,15 x
®E

 1    y  0,15 x + y = 1,15 y
 1  y    
 44 
lM

⇒x = y

D’où Fλ1 = {( x, x ) / x ∈ IR} = {x(1,1) / x ∈ IR}


ero

Fλ1 est un espace vectoriel de dimension 1 (c’est une droite vectoriel, un axe, le premier axe
 2
 
2 2
principal). Un vecteur unitaire de Fλ1 est u1 =  2  , sa norme est u = + = 1.
ua
 2
1
4 4
 
 2 
ni
• Pour λ2 = 0,85 :

 1 0,15  x   x   x + 0,15 y = 0,85 x


   = 0,85  ⇒  ⇒ x = −y
FP

 0,15 1  y   y  0,15 x + y = 0,85 y

Donc Fλ 2 = {( x, − x ) / x ∈ IR} = {x(1, − 1) / x ∈ IR}


Te

D’où Fλ 2 est un espace vectoriel de dimension 1 (c’est une droite vectoriel, un axe, le

 2 
 
tou

premier axe principal). Un vecteur unitaire de Fλ 2 est u 2 =  2  , sa norme est


− 2
 
 2 
2 2
an
u1 = + = 1.
4 4

Leur produit scalaire est nul : u1 . u 2 = 0 ⇒ {u1 , u 2 }est une base orthonormée.

7
www.elmerouani.jimdo.com
Analyse des données S6, Option : Gestion Prof. Mohamed El Merouani

Exercices proposés
Exercice 1 :

On veut faire l’ACP centrée de la matrice :

1 0 0 0
 
1 1 0 0
X = de type (4,4).
1 1 1 0
 
®E
1 1 
 1 1

On a 4 lignes-individus et 4 colonnes-variables. La pondération des lignes est uniforme, la


lM
pondération des colonnes est unitaires, la transformation préalable est le centrage par colonne.

1) Donner les moyens des 4 variables. Donner les variances des 4 variables. Donner la
matrice des variances-covariances de la matrice X.
ero
3 2 1
 
2) Donner les valeurs propres de la matrice A =  2 4 2  . En déduire les valeurs
1 2 3
 
ua
propres de l’ACP de X.
3) Donner tr (Λ ) , où Λ est la matrice diagonale des valeurs propres.
4) Donner le 2ème axe principal de l’ACP de X.
ni
5) Donner les coordonnées des lignes sur le 2ème axe principal de l’ACP de X.
6) Donner les coordonnées des colonnes sur le 2ème axe principal de l’ACP de X.
FP
Exercice 2 :

Une étude gastronomique a conduit à apprécier le service, la qualité et le prix de quatre


restaurants. Pour cela, un expert a noté ces restaurants avec des notes allant de -3 à 3. Les
Te
résultats sont les suivants :

Restaurant Service Qualité Prix


R1 -2 +3 -1
tou

R2 -1 +1 0
R3 +2 -1 -1
R4 1 -3 2
La matrice des variances-covariances est :
an

 5 1 
 −3 
 2 2 
V =  − 3 5 − 2
 1 −2 3 
 2 2 

Et celle des corrélations (aux erreurs d’arrondi près) est :

8
www.elmerouani.jimdo.com
Analyse des données S6, Option : Gestion Prof. Mohamed El Merouani

 1 − 0,85 0,26 
 
Γ =  − 0,85 1 − 0,73
 0,26 − 0,73 1 

Pour l’étude, on effectue une ACP centrée avec des poids equi-répartis.

1) Étude des valeurs propres :


a) Vérifier simplement que V admet une valeur propre λ3=0.
30,5
®E
b) On donne λ1 = . En déduire λ2.
4
c) Calculer les pourcentages d’inerties. Quelle est la dimension à retenir?
 0,5   0,65 
lM

   
2) a) On donne, aux erreurs d’arrondi près, v1 =  − 0,8  et v 2 =  0,11  . Calculer les
 0,3   − 0,75 
   
composantes principales.
ero

b) Représenter les individus dans le plan principal (1,2).


3) a) Déterminer les corrélations entre les variables et les composantes.
b) Représenter les variables sur le cercle des corrélations dans le plan factoriel (1,2).
ua
c) Interpréter les résultats.

Exercice 3 :
ni
Soit la matrice X=(X1,X2,X3) dont les variables ont pour matrice des corrélations
 1 r − r
 
Γ =  r 1 r  avec − 1 ≤ r ≤ 1 . On désire effectuer une ACP centrée réduite de X.
FP

− r r 1 
 

1
1  
Te
1) Vérifier que Γ admet pour vecteur propre  − 1 .
3 
1
tou
2) Déterminer les autres valeurs propres et vecteurs propres de Γ.
3) Quelles sont les valeurs possibles de r ?
4) Justifier le fait que l’ACP n’a d’intérêt que si -1< r <0.
5) Calculer dans ce cas les pourcentages de variance expliquée.
an
6) Comment s’interprète par rapport à X1, X2 et X3 l’unique composante à retenir ici ?

9
www.elmerouani.jimdo.com
Analyse des données S6, Option : Gestion Prof. Mohamed El Merouani

Exercice 4 :

2 2 3
 
3 1 2
Soit la matrice T = 10  1 0 3  des mesures de 5 individus munis de poids statistiques
 
2 1 4
2
 1 3 
égaux ; sur 3 variables notées T1, T2 et T3. On désire effectuer une ACP sur variables
®E
centrées-réduites.

1) Calculer l’individu moyen, le vecteur (σ1,σ2,σ3) des écarts types et la X des variables
lM
centrées-réduites.
2) Calculer la matrice Γ des corrélations.
3) Calculer les éléments propres de Γ.
2
4) Les deux premiers vecteurs propres de Γ associés aux valeurs propres λ1 = 1 + et
ero
2
 2 0
1  1  
λ2 = 1 , sont : v1 =  1  et v 2 = 1 .
2  2 1
ua
 −1  
 
Déterminer les composantes principales c1 et c2 dont on vérifie les propriétés
statistiques.
ni

5) Représenter les individus et les variables dans le plan factoriels (1,2). Quelle est
l’interprétation des variables c1 et c2 ?
(
6) Représenter dans le plan (1,2) l’individu supplémentaire 10 , 2 10 , 2 10 . )
FP

Références:
• Jean-François Durand : «Eléments de Calcul Matriciel et d’Analyse Factorielle de
Te
Données », polycopie de l’Université Montpellier II, Licence MASS, Maîtrise MASS,
Maîtrise d’Ingénierie Mathématique, DEA de Biostatistique, Novembre 2002.
• Le site Web : foad.refer.org/IMG/pdf/
tou
an

10
www.elmerouani.jimdo.com

Vous aimerez peut-être aussi