Vous êtes sur la page 1sur 40

Licence 3 Ingénierie Economique Travaux

Dirigés ACP / AFC / ACM

Toutes suggestions et corrections peuvent être envoyées à


rostandler2@gmail.com
Je remercie …, pour leur relecture attentive.

CORRECTION ET EXPLICATIONS
DETAILLEES TD DE STATISTIQUE
MULTIDIMENSIONNELLE

Chapit
©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique 2017-2018
1
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

EXERCICE 1 :
On considère un nuage de point N(I) = {(Xi, mi) Xi i= 1,2….N}
On pose m ∑ mi
= N

1) Montrer que l’inertie IN(I) de N(I) par rapport à son centre de gravité G est
1 j 2
∑ ∑ mi m j‖X −X ‖ 1
i
¿ ( I )=
2m i j
On sait que l’inertie du nuage de point N(I) est donné par :
2
¿ ( I )=∑ mi‖X −G‖ 2
i

i
De l’équation 1 on a:
1
¿ ( I )= ∑
2m i j ∑ i 2
[ j 2
mi m j ‖ X ‖ +‖ X ‖ −2 X X
i j
]
1 2 1 2 1
¿ ( I )= ∑ ∑ mi m j‖X i‖ + ∑ ∑ mi m j‖X j‖ −2 X i X j ∑∑ m m
2m i j 2m i j 2m i j i j

1 i 2 1 j 2 1
m ∑ mi‖ X ‖ + m ∑ m j‖ X ‖ − ∑ ∑ ¿ mi X ;m j X > ¿ ¿
i j
¿ ( I )=
2m i 2 m j m i j

1 2 1 2 1
¿ ( I )= ∑ mi‖ X i‖ + ∑ m j‖ X j‖ − ∑ ∑ ¿ mi X i ; m j X j> ¿ ¿
2 i 2 j m i j
On sait que :
1
G=
m i
∑ mi X i ⟹ mG=∑ mi X i
i
2 1
¿ ( I )=∑ mi‖X i‖ − <mG ; mG >¿
i m
i 2 1
¿ ( I )=∑ m i‖X ‖ − ∑ mi X ∑ mi X
i i

i m i i
2
¿ ( I )=∑ m i‖X i−G‖
i

Donc :
1 2
¿ ( I )= ∑ ∑ mi m j‖X i−X j‖
2m i j

©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique


2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP
2)
Soit D, un axe passant par l’origine, c’est donc un sous espace de dimension 1.
Il est déterminé par un vecteur unitaire u dont les composantes vérifient
t
uu=1

i
M

Hi
u
O

3) Déterminer l’inertie expliquée par D.


n
1
I exp ( D ) = ∑ d 2 ( g , ^
Xi)
n i=1
I exp ( D ) =∑ O H i = ( Xu ) Xu=u ' X ' Xu
2 '

4) Déterminer graphiquement l’inertie résiduelle et en déduire l’inertie totale


Soit d le sous espace passant par g.
- L’inertie expliquée par d est définie par :
n
1
I exp ( D ) = ∑ d 2 ( g , ^
Xi)
n i=1

- L’inertie résiduelle ( par rapport à D) est définie par :

n
1
I res ( D )=∑ d 2 ( ^X i , X i)
n i=1
inertie totale=inertie résiduelle+inertie expliquée .

©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique


2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

D
x

5) Déterminer le programme d’optimisation qui maximise cette inertie expliquée par


D sous la contrainte que le vecteur u soit de norme 1.

On choisit la droite qui maximise l’inertie expliquée et qui minimise l’inertie


résiduelle.

Le programme d’optimisation s’écrit :

{ Max u ' X ' Xu


sous contrainte:u ' u=1

EXERCICE 2 :

On considère la matrice de données X :

(−10
X=
0 1
−1 1 )
1) Calculer le produit matriciel V=X ' X et W=XX '

(−10
X=
0 1
−1 1 )

( )
−1 0
X ' = 0 −1
1 1

©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique


2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

( )( ( )
−1 0 1 0 −1
'
V = X X = 0 −1
1 1
−1 0 1
0 −1 1
= 0 )
1 −1
−1 −1 2

)( )(
−1 0
(
W =X X ' = −1 0 1
0 −1 1
0 −1 =
1 1
2 1
1 2 )

2) Montrer que V et W sont symétriques

Soit à Montrer que V et W sont symétriques

Par définition, Une matrice A est symétrique si elle est égale à sa transposée soit :
A’ = A
On a aussi (AB)’ = B’A’ et (A’)’ = A

( ) ( )
1 0 −1 1 0 −1
'
V= 0 1 −1 ;V = 0 1 −1 =V D’où V est symétrique
−1 −1 2 −1 −1 2

( ) ( )
W = 2 1 ;W ' = 2 1 =W D ’ où W est symétrique
1 2 1 2
3) Montrer que V et W ont le même rang
Si on calcule le rang dans une base de vecteur propre on constate que,
pour une matrice diagonalisable, le rang est égal au nombre de valeurs
propres non nuls en comptant la multiplicité) tXX et XtX ont même
rang.
D’où V et W ont le même rang.
Rang (V )=rang ( W )=2 vecteurslinéairements indépendants .

( )( )( )
1 0 −1 1 0 −1 1 0 −1
V= 0 1 −1 = 0 1 −1 = 0 1 −1
−1 −1 2 0 −1 1 0 0 0

4) déterminer les valeurs propres λ i de X’X et ses vecteurs propres


associés ui (ui sont des axes factoriels)
 VALEURS PROPRES DE V = X ’ X

pour trouver les valeurs propres de V = X ’ X , il suffit de diagonaliser


cette matrice.

©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique


2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

( )
1 0 −1
'
V = X X= 0 1 −1
−1 −1 2
∀ λ ≠ 0 , on a la relation suivante :
|V −λI|=0

|( ) ( )|
1 0 −1 1 0 0
V − λI =0 ⟺ 0 1 −1 − λ 0 1 0 =0
−1 −1 2 0 0 1

| |
1−λ 0 −1

| |
1−λ 0 −1 0 1− λ −1
0 1−λ −1 =0 ⟺ −1 −1 2−λ =0
−1 −1 2−λ 1−λ 0 −1
0 1− λ −1
⟺ [ ( 1−λ )( 1−λ ) ( 2−λ )+ 0+0 ] −[ ( 1−λ )+ (1−λ ) +0 ] =0
⟺ [ ( 1−λ )( 1−λ ) ( 2−λ ) ] −2+2 λ=0
3 2
⟺−λ + 4 λ −3 λ=0
On multiplie par "-" et on obtient :
3 2
⟺ λ −4 λ +3 λ=0
on met λ en facteur , ce qui donne :
λ ( λ −4 λ+3 )=0
2

λ=0 ou ( λ −4 λ+3 )=0


2

On calcule le déterminant de l’équation ( λ 2−4 λ+3 ) =0


2
∆=(−4 ) −4 ( 1 ) ( 3 )=16−12=4>0
donc l' équation ( λ2 −4 λ +3 ) =0 possède deux racines λ1 et λ 2avec :
− (−4 )+ √ 4 4 +2 6
λ 1= = = =3 ⟹ λ1=3
2 ×1 2 2
− (−4 )−√ 4 4−2 2
λ 2= = = =1 ⟹ λ2=1
2 ×1 2 2
 VECTEURS PROPRES DE V = X ’ X

V étant la matrice d’inertie, on vérifie bien que la trace de V est égale à


la somme des valeurs propres soit :
tr ( V ) =somme des nombres de la diagonale principale=1+ 1+ 2=4
on a donc λ1 + λ 2=3+1=4=tr ( V )

©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique


2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

() ()
x x'
Ainsi soitu1 de coordonnées y et u2 de coordonnées y ' les vecteurs propres deV
z z'
associés respectivement à la première et à la seconde valeur
propre, on a les deux relations suivante:

{
V u 1=λ1 u1
V u 2=λ2 u2

( )( ) ( ) { {
1 0 −1 x x x−z =3 x z=−2 x
V u1=λ 1 u1 ⟺ 0 1 −1 y =3 y ⟺ y−z =3 y ⟺ z =−2 y
−1 −1 2 z z −x − y+ 2 z=3 z z=−x− y

{( )
⟺ z=−2 x ⟹ x= y et z=−x − y ⟹ z=−2 x ou z =−2 y
z=−2 y
D' où x =1, y=1 et z=−2 ou x=−1 , y=−1 et z =2

()
1
u1= 1
−2

( )( ) ( ) { {
1 0 −1 x ' x' x '−z =x ' −z '=0
V u2=λ 2 u2 ⟺ 0 1 −1 y ' =1 y ' ⟺ y '−z '= y ' ⟺ −z '=0
−1 −1 2 z ' z' −x ' − y ' +2 z ' =z ' −z '=−x '− y '

{ '
z ' =0
' ' ' '
−x − y =0 ⟹−x = y ou x =− y '
'
D où x =1, y=−1et z=0 ou x=−1 , y=−1 et z =2

()
1
u2= −1
0

5) Montrer que V et W ont les mêmes valeurs propres non nulles

( )
1 0 −1
'
V = X X= 0 '
1 −1 et W =X X =
−1 −1 2
2 1
1 2 ( )
Soit ui et vi des vecteurs.
ui est un vecteur propre de V associé à la valeur propre λ i ssi :
V ui=¿ λ i ui 1
'
⇔ X X u i=λi ui

( )( ) ( )
1 0 −1 1 3
V u1=λ 1 u1 ⟺ 0 1 −1 1 = 3
−1 −1 2 −2 −6

( )( ) ( )
1 0 −1 1 1
V u2=λ 2 u2 ⟺ 0 1 −1 −1 = −1
−1 −1 2 0 0
©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique
2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

Pré multiplions la relation 1 par X = 0 (−1 0 1


−1 1 )
. on obtient :

'
XX X u i=Xλ i ui
⇔ XX ' ( X ui ) =λi ( X ui )

)( ) ()
3
(−1 0 1
0 −1 1
3
3 = =3
−6
3
1
1 ()
⇔ W ( X ui )= λi ( X ui )

λ 1 ( X u1 ) =3 (11 )⟹ λ =3 et X u =v =(11)
1 1 1

)( )(
1
(−1 0 1
0 −1 1
−1 =
0
−1 =1 −1
1 1 ) ( )
λ 2 ( X u2 ) =1 (−11 )⟹ λ =1 et X u =v =(−11)
2 2 2

X ui est aussi un vecteur propre de W associé à la même valeur propre λ i.


Avec λ i ≠ 0
d où V et W ont les mêmes valeurs propres non nulles.
'

6) Montrer que V et W sont semi-définies positives


Par définition, une matrice symétrique est dite semi-définie positive si elle est
positive et inversible. Autrement dit si elle vérifie l’une des 4 propriétés
équivalentes suivantes :
 Pour toute matrice colonne non nulle X à n éléments réels, on a :
X ’ VX >0
 Toutes les valeurs propres de V (qui sont nécessairement réelles)
sont strictement positives.
 La forme bilinéaire symétrique Rn × Rn ⟶ R , ( X , Y ) ⟼ X ' VY est un
produit scalaire sur Rn
 Il existe une matrice N ∈ M n ( R ) inversible telle que V =N ’ N
X ’ VX= X ’( X ’ X )X =X ’ XX ’=V 2 >0
X ’ WX =X ( X X ) X =X X X X =W >0
' ' ' ' 2

D’où les matrices V et W sont semi-définies positives

7) Déduire la matrice diagonale ∆ semblable à V.


©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique
2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

( )
3 0 0
∆= 0 1 0
0 0 0

8) Déduire la matrice de passage P.

9) Vérifier que trace( X ’ X )=trace( Δ)


Par définition, une matrice symétrique est dite semi-définie positive si elle est
positive et inversible. Autrement dit si elle vérifie l’une des 4 propriétés
équivalentes suivantes :
10) Montrer que la trace (V) = trace (W)
La trace d’une matrice est égale à la somme de ses coefficients diagonaux. Elle
vérifie l’identité :

( )
1 0 −1
V= 0 1 −1
−1 −1 2

W= (21 12)
Tr ( V )=1+1+2=4
TR ( W )=2+2=4
D’où Tr ( V )=TR ( W )=4
Donc
Tr ( V )=TR ( W )

11) Exprimer trace (V) en fonction des termes xij de la matrice X

©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique


2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

( )
x 11 … x 1 p
X= ⋮ ⋱ ⋮
x n 1 … x np

( )
x11 … x 1 n
X '= ⋮ ⋱ ⋮
x 1 p … xnp

( )( )
x 11 … x1 n x11 … x1 p
V = X ' X= ⋮ ⋱ ⋮ ⋮ ⋱ ⋮
x 1 p … x np x n 1 … xnp

( )
∑ x i 12 … ∑ xi 1 xip
V= ⋮ ⋱ ⋮
∑ x¿ xi 1 … ∑ xip2

TR ( V )=∑ x i 1 + ∑ xi 2 +…+ ∑ x ip
2 2 2

EXERCICE 3

Six étudiants ont obtenu les notes suivantes en cinq matières

Etudiant Algèbr Economi Econométri Sondag Langu


s e e e e e
Landry 1 13 15 1 1
0 0 0
Rémy 11 13 17 1 9
0
Joseph 12 15 19 12 8
Odile 9 7 13 4 11
Vincent 11 9 17 6 9
Vanessa 7 15 9 12 13

On se propose de faire une analyse en composantes principales normées de ce


tableau

1) Calculer la matrice de corrélation A de ce tableau


2) Calculer l’inertie des nuages colonnes. Que constater vous ?
3) Déterminer le rang de V et en déduire les valeurs propres non nulles de A
4) En déduire le nombre d’axes factoriels de l’ACP normé du tableau
©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique
2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

5) Montrer que le vecteur est vecteur propre de A


6) En déduire les axes factoriels du nuage des individus et calculer l’inertie
expliquée par chaque axe. On note U1 et U2 les deux premiers axes 7) Quelle est
la part d’inertie expliquée par :
• Le premier axe factoriel
• Le deuxième axe factoriel
• Les deux premiers axes factoriels. Commenter les résultats
8) Déterminer les coordonnées des matières respectivement V1, V2, V3, V4 et V5
dans le plan
(W1, W2) les deux premiers axes factoriels des nuages des colonnes.
Représenter graphiquement le nuage des variables dans ce plan.
9) Représenter le nuage des étudiants dans le plan factoriel (U 1, U2)

Correction

1- Calculer la matrice de corrélation A de ce tableau


X i−X
X=
σ √n
Etudiants Algèbre Economie Econométrie Sondag Langue
e
Landry 10 13 15 10 10
Rémy 11 13 17 10 9
Joseph 12 15 19 12 8
Odile 9 7 13 4 11
Vincent 11 9 17 6 9
Vanessa 7 15 9 12 13
MOYENNE 10 12 15 9 10
VARIANCE 2,67 9 10,67 9 2,67
ECART-TYPE 1,63 3 3,27 3 1,63

Etudiants Algèbre Economie Econométrie Sondage Langue

Landry 0 0,33 0 0,33 0


Rémy 0,61 0,33 0,61 0,33 -0,61

X= Joseph
Odile
1,23
-0,61
1
1,67
19
13
1
1,67
-1,22
0,61
©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique
2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

1 Vincent 0,61 -1 17 -1 -0,61


√6 Vanessa 1,84 1 9 1 1,84

Etudiant Algèbr Economi Econométri Sondag Langu


s e e e e e
Landry 0 0,136 0 0,136 0
Rémy 0,25 0,136 0,25 0,136 -0,25

X Joseph
Odile
0,5
-0,25
0,4
0,68
0,5
-0,25
0,4
0,68
-0,5
0,25

= Vincent
Vanessa
0,25
-0,75
-0,4
0,4
0,25
-0,75
-0,4
0,4
-0,25
0,75

MATRICE DES CORRELATIONS


A=X ’ X

Algèbre Economie Econométri Sondage Langue


e
A Algèbre 1 0 1 0 -1
Economie 0 1 0 1 0
Econométrie 1 0 1 0 -1
Sondage 0 1 0 1 0
Langue -1 0 -1 0 1

2- Calcul de l’inertie des nuages colonnes. Que constater vous ?


L’inertie du nuage des colonnes est égale à la trace de la matrice
d’inertie (V).
Or la matrice d’inertie est encore égale à la matrice des corrélations.
INERTIE TOTALE=¿ Somme des nombre de la diagonale principale
¿ 1+1+1+1+ 1=5.
Constat : l’inertie totale est égale au nombre de variables.
3- Déterminer le rang de V et en déduire les valeurs propres non
nulles de A

©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique


2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

Le rang de V est égale au nombre de vecteurs linéairement


indépendant de V. mettons la matrice V sous la forme échelonné
réduite.
Algèbre Economie Econométri Sondage Langue
e
V Algèbre 1 0 1 0 -1
Economie 0 1 0 1 0
Econométrie 0 0 0 0 0
Sondage 0 1 0 1 0
Langue 0 0 0 0 0

Algèbre Economie Econométri Sondage Langue


e
V Algèbre 1 0 1 0 -1
Economie 0 1 0 1 0
Econométrie 0 0 0 0 0
Sondage 0 0 0 0 0
Langue 0 0 0 0 0
D’après la forme échelonnée nous avons juste 2 pivots non nul d’où
nous avons 2 vecteurs linéairement indépendants. Donc la matrice V
est de rang 2.
4- En déduire le nombre d’axes factoriels de l’ACP normé du
tableau
Le nombre d’axes factoriels de l’ACP est égale au rang de la matrice
d’inertie V.

()
1
0
5- Montrer que le vecteur a 1 = 1 est vecteur propre de V
0
−1

Il suffit de vérifier la relation suivante :


Va1= λ1 a1

( )( ) ( ) ( )
1 0 1 0 −1 1 3 1
0 1 0 1 0 0 0 0
Va1= 1 0 1 0 −1 1 = 3 =3 1 =λ1 a1 avec λ1=3
0 1 0 1 0 0 0 0
−1 0 −1 0 1 −1 −3 −1

Donc a 1 est un vecteur propre de V


©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique
2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

6- En déduire les axes factoriels du nuage des individus et


calculer l’inertie expliquée par chaque axe. On note U1 et U2
les deux premiers axes
Soit u1 et u2 les deux premiers axes factoriels. a 1 étant la première
colonne de V, prenons a 2la deuxième colonne.

( )( ) ( ) ( )
1 0 1 0 −1 0 0 0
0 1 0 1 0 1 2 1
Va2= 1 0 1 0 −1 0 = 0 =2 0 =λ 2 a 2 avec λ2 =2
0 1 0 1 0 1 2 1
−1 0 −1 0 1 0 0 0

( )
1/ √ 3
a a 0
u1= 1 = 1 = 1/ √ 3 avec |a 1|=√ 12+ 02 +12+ 02 +12=√ 3
|a1| √3 0
−1/ √ 3

()
0
a2 a2 1/ √ 2
= = 0 avec|a2|=√ 0 + 1 + 0 + 1 +0 =√ 2
2 2 2 2 2
u2=
|a2| √2 1/ √2
0
Inertie expliquée par chaque axe :
I U ( N )= λ1=3
1

I U ( N )= λ2=2
2

I T = λ1 + λ2=3+2=5

7- Quelle est la part d’inertie expliquée par :


- Le premier axe factoriel :

λ1 3
I U ( N )= × 100= ×100=60 %
1
IT 5
- Le deuxième axe factoriel :
λ2 2
I U ( N )= × 100= ×100=40 %
2
IT 5
©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique
2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

- Les deux premiers axes factoriels :


λ1 + λ2 3+2
IU 1 ,U 2
( N )= × 100= × 100=100 %
IT 5
- Commenter les résultats :

Les deux premiers axes expliquent 100% d’inertie.


Ce qui signifie que les 3 autres axes n’expliquent aucune part de
l’inertie. D’où les deux premiers axes forment le plan factoriel.
Déterminer les coordonnées des matières respectivement
V1, V2, V3, V4 et V5 dans le plan (W1, W2) les deux premiers
axes factoriels des nuages des colonnes. Représenter
graphiquement le nuage des variables dans ce plan.

( )( )
1/ √ 3 1
0 0
φ 1=X w1= √ λ 1 u1= √ 3 1/ √ 3 = 1
'

0 0
−1/ √ 3 −1

( ) ()
0 0
1/ √2 1
φ 2=X w2= √ λ 2 u2 =√2 0 = 0
'

1/ √2 1
0 0

Représentation du nuage des variables

©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique


2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

Valeur des Y
1.2

0.8

0.6

0.4

0.2

0
-1.5 -1 -0.5 0 0.5 1 1.5

8- Représenter le nuage des étudiants dans le plan factoriel


(U1, U2)
Coordonnées des individus dans le plan factoriel
ψ 1=X u1

Etudiants Algèbre Economie Econométrie Sondage Langue


Landry 0 0,136 0 0,136 0
Rémy 0,25 0,136 0,25 0,136 -0,25
X= Joseph 0,5 0,4 0,5 0,4 -0,5
Odile -0,25 0,68 -0,25 0,68 0,25
Vincent 0,25 -0,4 0,25 -0,4 -0,25
Vanessa -0,75 0,4 -0,75 0,4 0,75

( )
1/ √ 3
0
1/ √ 3
0
−1 / √ 3

Etudiants F1
Landry 0
Rémy 0,25 / √ 3
ψ 1=¿ Joseph 1,5/ √ 3
Odile −0,75 / √ 3
Vincent 0,75 / √ 3
Vanessa −0,75 / √ 3

©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique


2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

ψ 2= X u2

Etudiants Algèbre Economie Econométrie Sondage Langue


Landry 0 0,136 0 0,136 0
Rémy 0,25 0,136 0,25 0,136 -0,25
X= Joseph 0,5 0,4 0,5 0,4 -0,5
Odile -0,25 0,68 -0,25 0,68 0,25
Vincent 0,25 -0,4 0,25 -0,4 -0,25
Vanessa -0,75 0,4 -0,75 0,4 0,75

()
0
1/ √ 2
0
1/ √ 2
0

Etudiants F2
Landry 0,272/ √ 2
Rémy 0,272/ √ 2
ψ 2=¿ Joseph 0,8 / √ 2
Odile 1,36/ √ 2
Vincent −0,8 / √ 2
Vanessa 0,8 / √ 2

EXERCICE 4 :

©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique


2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

TABLEAU A :
Variables Procédure Délais (Jours) Couts (% du Cap minimum
(Nombre) revenu par versé (% du
habitant) rev /hab)
Procédure 1 0,44 0,394 0,065
(Nombre)
Délais (Jours) 0,444 1 0,728 -0,230
Couts (% du 0,394 0,728 1 -0,007
revenu par
habitant)
Cap minimum 0,065 -0,230 -0,007 1
versé (% du rev
/hab)

TABLEAU B :

F1 F2 F3 F4
VALEURS 2,072 1,062 0,634 0,232
PROPRE
VARIABILITE 51,807 26,549 15,856 5,788
(%)
% CUMULE 51,807 78,356 94,212 100,000

TABLEAU DES COORDONNEES


F1 F2 F3 F4
Procédure 0,685 0,336 0,634 -0,057
(Nombre)
Délais (Jours) 0,907 -0,166 -0,158 0,353
Couts (% du 0,869 0,083 -0,383 -0,304
revenu par
habitant)
©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique
2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

Cap minimum -0,158 0,956 -0,221 0,107


versé (% du rev
/hab)

TABLEAU DES CONTRIBUTIONS


F1 F2 F3 F4
Procédure (Nombre) F1 F2 F3 F4
Délais (Jours) ? ? ? ?
Couts (% du revenu ? ? ? ?
par habitant)
Cap minimum versé 1,205 86,058 7,704 4,835
(% du rev /hab)
TABLEAU DES COSINUS CARRES
F1 F2 F3 F4
Procédure (Nombre) ? ? ? ?
Délais (Jours) ? ? ? ?
Couts (% du revenu ? ? ? ?
par habitant)
Cap minimum versé 0,025 0,914 0,049 0,011
(% du rev /hab)

©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique


2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

1) Quelle est la méthode d’analyse utilisée ici ? pourquoi utilise-t-on cette


méthode ?
La méthode d’analyse utilisée ici est l’ACP. Car elle résume un ensemble de 19
pays en fonction de 4 variables quantitatives.
2) Que représente le tableau A ? relevé deux propriété de ce tableau.
Le tableau A représente la matrice des corrélations ou matrice d’inertie.
Deux propriétés de ce tableau : symétrique et semi-définie positive.
3) Que représente le tableau B ? en déduire l’inertie totale.
Le tableau B représente le tableau des valeurs propres. L’inertie totale est égale à 4.
C’est la somme des valeurs propres.
4) Combien d’axes factoriels peut-on retenir ? justifier
©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique
2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

On distingue trois critères pour déterminer le nombre d’axes factoriels à retenir :


- D’après le critère de kaiser : On retient les axes dont les valeurs propres sont
supérieures à 1. (ACP Normée).Par conséquent, on retient 2 axes factoriels (F1
et F2)
- D’après le critère de la variance cumulée, on sélectionne les axes qui ont au
moins 70% d’inertie. Ainsi, on retient les deux premiers axes factoriels car les
deux premiers axes expliquent 78,356% de l’inertie totales.
- D’après le critère du coude, on observe souvent de fortes valeurs propres au
départ, puis ensuite de faibles valeurs avec un décrochage dans le diagramme.
On retient les axes avant le décrochage.
5) Interpréter les valeurs en gras du tableau B.
- 2,072 représente la valeur propre associée au premier axe factoriel F1
- 26,549 représente l’inertie expliquée par le second axe factoriel F2
- 94,212 représente l’inertie expliquée par les trois premiers axes factoriels F1,
F2 et F3.
6) Que représente le graphique A ? d’après vous peut-on parler d’effet
taille ? justifier.
le graphique A désigne le cercle des corrélations. Non , on ne peut pas
parler d’effet taille.car les corrélations observées entre les différentes
variables ne sont pas toutes positives.
7) Que représente le graphique B ? comment l’obtient-on ? préciser les
axes.
Le graphique B représente le nuage des individus (19 pays).
On l’obtient en projetant les point individus en fonction du plan factoriel (F1,F2).
8) Compléter le tableau des contributions et celui des cosinus carrés
(préciser les formules) (retenir 3 chiffres après la virgule.
La contribution de la variable j à l’inertie de l’axe k est donnée par :
2
S jk
CTR ( j , k )=
λk
Ou S jk est la coordonnée de la variable j par rapport à l’axe k et λ k la valeur propre
associé à l’axe k.

©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique


2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

La qualité de représentation de la variable j l’axe k est donnée par :


QLT ( j, k )=cos 2 ( θ kj )=S jk 2=r 2 (C k , X j )
Ou S jk est la coordonnée de la variable j par rapport à l’axe k.

EXERCICE 5 :

EXERCICE 6 :

Soit le tableau de notes attribuées à neuf étudiants dans cinq matières.

Etudian Math Scienc Lang Histoi Moral


ts s es ue re e
Luc 6 6 5 5,5 8

©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique


2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

Octy 8 8 8 8 9
Ben 6 7 11 9,5 11
Paul 14,5 14,5 15,5 15 8
Ines 14 14 12 12 10
Elsa 11 10 5,5 7 13
Jean 5,5 7 14 11 10
Joey 13,5 12,5 8,5 9,5 12
Asraf 9 9,5 12,5 12 18

On donne les tableaux suivants :

I/ histoir
maths sciences langue e morale
maths 1,000 ,980 ,215 ,509 ,016
sciences ,980 1,000 ,397 ,659 ,006
langue ,215 ,397 1,000 ,943 ,038
histoire ,509 ,659 ,943 1,000 ,096
morale ,016 ,006 ,038 ,096 1,000

II/ III/ Matrice des composantes


Mesure de précision de ,457 Composante
l'échantillonnage de Kaiser- 1 2
59,871
MeyerOlkin. maths ,808 -,565
Test de sphéricité de Bartlett science ,904 -,417
Khi-deux approximé s
langue ,747 ,615
ddl 10
histoire ,917 ,379
Signification de Bartlett ,000
morale ,072 ,350

©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique


2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

IV/Composante Valeurs propres initiales


% de la %
Total variance cumulés
1 2,874
2 1,137
3 ,982
4 ,006
5 ,001

1. Pourquoi le résumer par une ACP?

Le résumer par une ACP parce que le tableau présente l’analyse de 5


variables quantitatives.
2. Que représente le tableau I ? déterminer l’inertie totale à partir de ce tableau.
Justifiez
Le tableau I représente la matrice des corrélations. L’inertie totale est égale
à 5 .on obtient ce résultat en calculant la trace de la matrice des
corrélations (somme des éléments de la diagonale principale)
3. Les données sont-elles factorisables ? Justifier à partir du tableau I et II

- A partir du tableau I : on constate que la plupart des variables sont corrélées
positivement (coefficients de corrélation supérieurs à 0,5) d’où les données
sont factorisables.
- A partir du tableau II : le test de sphéricité de BARLETT est significatif à
5%.dans notre tableau, il a une significativité de 0,00 par contre l’indice KMO
est de à 0,457 (inférieur à 1) .ce qui pourrait nous rendre indécis (le critère est
médiocre lorsque l’indice est inférieur à 0,5).
4. Compléter le tableau IV. Combien d’axe factoriel peut-on retenir ? justifiez.

IV/Composante Valeurs propres initiales


Total % de la %
©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique
2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

variance cumulés
1 2,874 57,475 57,475
2 1,137 22,746 80,221

3 ,982 19,643 99,864


4 ,006 ,116 99,98
5 ,001 ,020 100
Total 5 100
Il suffit de diviser chaque valeur propre par l’inertie total
x 100 pour avoir les pourcentages de variances (ou %
d’inertie).et pour les % cumulés, il convient de faire la
somme successive des % de variances.
On doit retenir deux axes ici d’après le critère de Kaiser. (Deux valeurs propres
seulement sont supérieures à 1).

5. Déterminer la qualité de représentation par rapport au facteur 1 et au facteur 2


et représenter le nuage des variables. Que constatez-vous ?

- Qualité de représentation par rapport au facteur 1 et au


facteur 2 :

Composante au Qualité de
Composante carrée représentation
1 2 1 2 1 2
maths 0,808 -0,565 0,653 0,319 0,227 0,280
sciences 0,904 -0,417 0,817 0,174 0,284 0,153
langue 0,747 0,615 0,558 0,378 0,194 0,332
histoire 0,917 0,379 0,841 0,144 0,293 0,127
morale 0,072 0,350 0,005 0,1225 0,002 0,108
Total 2,874 1,1375
(Scorede i sur l ' axe 1)2
QLT 1 ,(i)=
∑(Score de i sur l ' axe 1)2

(Scorede i sur l ' axe 2)2


QLT 1 ,(i)= ' 2
∑(Score de i sur l axe 2)

©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique


2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

Les variables qui ont une qualité de représentation proche


de 1 sont bien représentés
- Représentation du nuage des variables :

AXE 2
0.8

0.6

0.4 EXERCICE 7
:
0.2

0 Soit le tableau
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
T décrivant
-0.2
pour 6
-0.4 individus les
valeurs prises
-0.6
par les
-0.8 variables
quantitatives x,
y et z
x y z
A 2 1 0
B 1 1 0
C 0 1 1
D 2 0 1
E 1 0 1
F 0 1 0

1. Quelle est la méthode appropriée pour l’analyse factorielle de ce tableau ?


Justifiez.

La méthode appropriée pour l’analyse factorielle de ce tableau est l’analyse en


composante principales .car il s’agit, de l’analyse d’un tableau d’individus suivant des
variables quantitatives.

©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique


2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

2. Calculer la moyenne, la variance et les écart-types des variables.


X Y Z
Moyenne 1 0,67 0,5
Ecart-Type 0,894 0,516 0,548

3. Déterminer le tableau centré réduit.


X i−x
X=
σ √n
X Y Z
0,456 0,261 -0,372
1 0 0,261 -0,372
X = √6 -0,456 0,261 -0,372
0,456 -0,530 -0,372
0 -0,530 -0,372
-0,456 0,261 -0,372

4. Quel est l’intérêt du centrage-réduction.

Le centrage-réduction permet d’ajuster le nuage de point sans toutefois le


modifié. En centrant, On ramène l’origine du nuage au centre de gravité et en
réduisant, on homogénéise le nuage.

[ ]
1 0 0
5. En déduire que la matrice des corrélations est M = 0 1 −1
0 −1 1

[ ]
1 0 0
M = X ' X= 0 1 −1
0 −1 1

6. Interpréter cette matrice et préciser ces propriétés :


La matrice M est la matrice d’inertie du nuage de point, ainsi nous sommes
dans une ACP normée. Les propriétés de la matrice des corrélations sont :
- Elle est symétrique
- Inversible
- Semi-définie positive
7. Déterminer la trace de cette matrice et dire à quoi elle correspond.
Tr ( M )=1+1+1¿=3
Elle correspond au nombre de variable et représente l’inertie totale.

8. Déterminer les valeurs propres de M.


Déterminer les valeur propres de M reviens à la diagonaliser.
©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique
2018-2019 1
6

16
Licence 3 Ingénierie Economique Corrigé Travaux Dirigés d’ACP

Soit P M ( λ ) , le polynôme caractéristique associé à M

| |
1−λ 0 0
( ) |
P M λ =0 ⇔ M −λI =0⇔ 0 | 1−λ −1 =0
0 −1 1−λ
⇔ ( 1−λ )( 1− λ ) (1−λ ) −1=0 ⇔ ( 1−λ )( 1− λ ) (1−λ ) −1=¿
⇒ λ=1 ou λ=0 ou λ=2
9. Interpréter ces valeurs propres en termes d’inertie. En déduire le %
d’inertie projeté sur chaque axe.
L’objectif de l’ACP est de maximiser l’inertie expliquée par chaque axe. Ceci
implique de déterminer la direction d’allongement du nuage de point c4est à dire
retenir comme premier axe celui associé à la valeur propre maximale. Par
conséquent, le premier axe est associé à la valeur propre 2, le second à la valeur
propre 1 et le troisième à la valeur propre 0.
Le % d’inertie projeté sur chaque axe est donné dans le tableau
suivant :

10. Déterminer les vecteurs propres unitaires associés aux valeurs propres.
11. Quelle est la signification des axes définis par ces vecteurs ?
12. Quel critère permet de déterminer le nombre d’axe factoriel ? en déduire ce
nombre.

©Ornel DJEUDJI NGASSAM (Ornel Rostandler) Année Académique


2018-2019 1
6

16
Chapitre II : ANALYSE
FACTORIELLE DES
CORRESPONDANCES (AFC)
QUESTIONS DE COURS :

1) En quoi l’AFC diffère-t-elle de l’ACP ?


L’AFC traite des variables qualitatives dans un tableau de contingence, alors que l’ACP traite des
variables quantitatives.
2) En quoi la distance euclidienne diffère-t-elle de la distance de khi-deux ?
La distance euclidienne entre deux profil-lignes traduit bien la ressemblance ou la différence entre les
deux modalités d’une variable sans tenir compte des effectifs totaux de ces modalités et par
conséquent favorise les colonnes qui ont une masse f j importante.

( )
p 2
f ij f i' j
d ( i , i )=∑
2 '

j=1 f i. f i .
'

La distance khi-deux entre deux profil-lignes est calculée en pondérant chaque écart par
l’inverse de la masse de la colonne.
3)En AFC, comment détermine-t-on les valeurs propres et les vecteurs propres.

Ornel DJEUDJI NGASSAM 696694137


Les valeurs –propres s’obtiennent en effectuant des calculs duaux (même analyse pour
les profils lignes et pour les profils colonnes). On peut n’en choisir qu’un, le plus facile en
format. Une matrice V de dimension (k , k ) plutôt que la matrice W 4de dimension (n , n). En
supposant toujoursn> k . 0

- Si la matrice est haute, on aura V = X ' X


- Si la matrice est basse, on aura V = XX ' avec X ' la transposé de X .
f ij −f i . f . j
X=
√f i.× f . j
Cette matrice X sera multipliée par sa transposée pour obtenir la matrice d'inertie
qui sera diagonalisée pour obtenir les valeurs propres du nuage de points.
A partir des valeurs propres, on détermine les vecteurs propres à partir de
la relation suivante :
V uα =λ α u α
4)Comment détermine-t-on le nombre de valeurs propres ?
Dans une AFC, le nombre de valeurs propres est égales à :
Min(nombre de ligne−1, nombre de colonne−1)
5)Définir individus supplémentaire.
Les individus ne participant pas lors du calcul des composantes et qui sont intégrés parmi
les résultats sont appelés individus supplémentaires.
EXERCICE 1 :

On a relevé sur un ensemble d’individus statistique, les valeurs prises par variables qualitatives. L’origine
sociale des étudiants de 1ère année et le choix d’un secteur disciplinaire à l’université de Yaoundé 2.
TABLEAU DES EFFECTIFS OBSERVES
DROIT SCIENCE MEDECIN IUT TOTAL

Ornel DJEUDJI NGASSAM 696694137


E
EXP AGR 80 99 65 58 302
PATRON 168 137 208 62 575
4
CQDR SUP 470 400 876 79 0 1825
EMPLOYE 145 133 135 54 467
OUVRIER 166 193 127 129 615
TOTAL 1029 962 1411 382 3784
Y’a-t-il un lien entre l’origine sociale des étudiants et le choix de l’un ou l’autre des secteurs
disciplinaires. Autrement dit les variables X et Y sont-elles statistiquement dépendantes ? Formaliser
puis effectuer un test d’indépendance.

Formalisation du test de khi-deux :


- Hypothèse :

{ H 0 :les variables X et Y sont indépendantes


H 1 :les variables X et Y sont dépendantes
- Statistique calculée du khi-deux  :
2
( Oij −E ij )
=∑ CTR ij=
2
χ cal
Eij
avec Oij =Effectifs observés=Tableau des données brut et Eij =effectifs espérés
TABLEAU DES EFFECTIFS OBSERVES

DROIT SCIENCE MEDECIN IUT TOTAL


E
EXP AGR 80 99 65 58 302
PATRON 168 137 208 62 575
CQDR SUP 470 400 876 79 1825

Ornel DJEUDJI NGASSAM 696694137


EMPLOYE 145 133 135 54 467
OUVRIER 166 193 127 129 615
TOTAL 1029 962 1411 382 3784
4
0
TABLEAU DES EFFECTIFS ESPERES
Total effectif ligne ×Total effectif colonne
Eij =
effectif total
Exemple :
1029 ×302
Eexp AGR , DROIT = =82,12
3784
DROIT SCIENC MEDECINE IUT TOTAL
E
EXP AGR 82,12 76,78 112,61 30,49 302
PATRON 156,36 146,18 214,41 58,05 575
CADR SUP 501,10 463,97 680,52 184,24 1825
EMPLOYE 126,99 118,72 174,14 47,14 467
OUVRIER 167,24 156,35 229,32 62,09 615
TOTAL 1029 962 1411 382 3784

TABLEAU DES CONTRIBUTIONS


2
( Oij−E ij )
CTR ij =
E ij
DROIT SCIENC MEDECINE IUT TOTAL
E
EXP AGR 0,055 6,43 20,13 0,90 27,515

Ornel DJEUDJI NGASSAM 696694137


PATRON 0,87 0,56 0,19 0,27 1,89
CADR SUP 1,93 0,82 0,29 0,57 3,61
EMPLOYE 2,55 1,72 0,22 0,20 4,69
OUVRIER 0,009 8,59 45,65 72,104 40 126,353
TOTAL 5,909 18,12 66,48 74,044 164,58
χ 2=CTR ij =165
Critère de décision :
Si χ 2Cal > χ 2Tab , on rejette HO
Conclusion :
χ 2Tab ( 4 ddl )=21,026
2
χ Cal =165,753
2 2 ' '
χ Cal > χ Tab d où on rejette HO donc , il y a dépendance entre l originesociale
des etudiants et ≤choix des secteurs disciplinaire .
EXERCICE 2 :
On a relevé sur l’ensemble de la population aux USA les valeurs prises par deux variables qualitatives :
l’obédience religieuse et le parti politique.

PROTESTANTS CATHOLIQUES JUIFS TOTAL


REPUBLICAIN 126 61 38 225
DEMOCRATE 71 93 69 233
INDEPENDANTS 19 14 27 60
TOTAL 216 168 134 518

Le choix d’appartenance à un parti politique est-il influencé par l’obédience religieuse ? Formaliser puis
effectuer le test du Khi-deux.

Formalisation du test de khi-deux :


- Hypothèse :

Ornel DJEUDJI NGASSAM 696694137


{ H 0 :les variables X et Y sont indépendantes
H 1 :les variables X et Y sont dépendantes
- Statistique calculée du khi-deux  :
2 4
( Oij −E ij )
=∑ CTR ij= 0
2
χ cal
Eij
avec Oij =Effectifs observés=Tableau des données brut et Eij =effectifs espérés
TABLEAU DES EFFECTIFS OBSERVES

PROTESTANTS CATHOLIQUES JUIFS TOTAL


REPUBLICAIN 126 61 38 225
DEMOCRATE 71 93 69 233
INDEPENDANT 19 14 27 60
S
TOTAL 216 168 134 518

PROTESTANTS CATHOLIQUES JUIFS TOTAL


REPUBLICAIN 126 61 38 225
DEMOCRATE 71 93 69 233
INDEPENDANT 19 14 27 60
S
Une étude sur la couleur des yeux et la couleur des cheveux Pour 5387 étudiants
relève les résultats suivants :

HBROWN HRED HMEDIUM HDARK HBLACK TOTAL


EBLUE 326 38 241 110 3 718
ELIGHT 688 116 584 188 4 1580
EMEDIU 343 84 909 412 26 1774
M

Ornel DJEUDJI NGASSAM 696694137


EDARK 98 48 403 681 85 1315
TOTAL 1455 286 2137 1391 118 5387

Valeur du khi-deux à 12 degrés de libertés (12 ddl) : 1240,04 4


0
On désire effectuer une AFC sur ce tableau de contingence.
1) Etablir le tableau des fréquences conjointes et le tableau des fréquences marginales.
On divise chaque effectif du tableau de base par L’effectif total soit 5387.
HBROWN HRED HMEDIUM HDARK HBLACK TOTAL
EBLUE 0,061 0,007 0,045 0,020 0,0006 0,133
ELIGHT 0,128 0,022 0,108 0,035 0,0007 0,293
EMEDIU 0,064 0,016 0,169 0,076 0,005 0,329
M
EDARK 0,018 0,009 0,075 0,126 0,016 0,244
TOTAL 0,270 0,053 0,397 0,258 0,022 1
2) Déterminer le tableau des profils-lignes et le tableau des profils-colonnes.
f ij nij
 PROFILS LIGNES f = n
i. i.

HBROWN HRED HMEDIUM HDARK HBLACK TOTAL


EBLUE 0,454 0,053 0,336 0,153 0,004 1
ELIGHT 0,435 0,073 0,370 0,120 0,003 1
EMEDIU 0,193 0,047 0,512 0,232 0,014 1
M
EDARK 0,075 0,037 0,306 0,518 0,065 1
TOTAL 0,270 0,053 0,397 0,258 0,022 1

f ij nij
 PROFILS COLONNES f = n
.j .j

HBROW HRED HMEDIUM HDARK HBLACK TOTAL


N
EBLUE 0,224 0,133 0,113 0,079 0,025 0,133

Ornel DJEUDJI NGASSAM 696694137


ELIGHT 0,473 0,406 0,273 0,135 0,034 0,293
EMEDIUM 0,236 0,294 0,425 0,296 0,220 0,329
EDARK 0,067 0,168 0,189 0,490 0,720 0,244
TOTAL 1 1 1 1 1 40 1

2.1) calculer la distance entre la ligne EBLUE et la ligne EDARK


Pour calculer cette distance, il convient d’utiliser les valeurs du profil ligne en appliquant la formule
suivante :

( )
2
f ij f i' j
d ( i, i ' )=∑
2

f i. f i .
'

2 2 2 2 2 2
d ( EBLUE , EDARK )= ( 0,454−0,075 ) + ( 0,053−0,037 ) + ( 0,336−0,306 ) + ( 0,153−0,518 ) + ( 0,004−0,065 )
2.2) calculer la distance entre la ligne EBLUE et le profil moyen

( )
2
f ij f i' j
d ( i, i ' )=∑
2

f i. f i .
'

2 2 2 2 2 2
d ( EBLUE , PROFIL MOYEN )= ( 0,454−0,270 ) + ( 0,053−0,053 ) + ( 0,336−0,397 ) + ( 0,153−0,258 ) + ( 0,004−0,022 )
2.3) calculer la distance entre la colonne HRED et la colonne HBLACK.
Pour calculer cette distance, il convient d’utiliser les valeurs du profil-colonne en appliquant la formule
suivante :

( )
2
f ij f i ' j
d ( J , J ' ) =∑
2

f .J f .J '

2 2 2 2 2
d ( HRED, HBLACK )=( 0,133−0,025 ) + ( 0,406−0,034 ) + ( 0,294−0,220 ) + ( 0,168−0,720 )

3) quelle propriété se dégage du calcul de ces distances ?


- La propriété qui se dégage du calcul de la distance euclidienne est la propriété de PYTHAGORE.
4) calculer l’inertie totale

Ornel DJEUDJI NGASSAM 696694137


On sait que :
2 χ2
χ =n× I T ⇒ I T =
n
4
Avec χ 2=valeur du khi−deux calculée=1240,04 0
n=effectif total=5387
I T =inertie totale
1240,04
I T= =0,2302
5387
5) Le calcul des valeurs propres présente les résultats suivant :
AXE INERTIE PROPORTION CUMULE
1 0,1992 0,8656 0,8656
2 0,0301 0,1307 0,9963
3 0,0009 0,0037 1,0000

Chapitre III : ANALYSE DES


CORRESPONDANCES
MULTIPLES (ACM)
L’ACM est une méthode factorielle permettant le traitement de plusieurs variables qualitatives.
Le tableau de base de l’ACM est un tableau à n lignes (représentant les individus) et p colonnes
(représentant les modalités des différentes variables. Le plus souvent les modalités de réponses à des
questions).
Auteurs :

Ornel DJEUDJI NGASSAM 696694137


- GUTTMAN (1941)
- BURT (1950)
- HAYASHI (1956) 4
- BENZECRI (1973) 0

On interroge 4 étudiants de licence 3 option ingénierie économique et financière sur leur groupe
sanguin. On obtient le tableau suivant :
Sexe Groupe Sanguin
Etudiant 1 Masculin O
Etudiant 2 Féminin A
Etudiant 3 Masculin AB
Etudiant 4 Féminin B
Les modalités du sexe sont respectivement « masculin » et « féminin » et celles du groupe sanguin sont
A, AB, B et O.
1) Déterminer le tableau de codage condensé
Sexe Groupe Sanguin
Etudiant 1 1 4
Etudiant 2 2 1
Etudiant 3 1 2
Etudiant 4 2 3

2) Déterminer le tableau disjonctif complet


SEXE GROUPE SANGUIN
Masculin Féminin A AB B O
Etudiant 1 1 0 0 0 0 1
Etudiant 2 0 1 1 0 0 0

Ornel DJEUDJI NGASSAM 696694137


Etudiant 3 1 0 0 1 0 0
Etudiant 4 0 1 0 0 1 0
4
3) Déterminer les mages 0

SEXE GROUPE SANGUIN


Masculin Féminin A AB B O
Etudiant 1 1 0 0 0 0 1
Etudiant 2 0 1 1 0 0 0
Etudiant 3 1 0 0 1 0 0
Etudiant 4 0 1 0 0 1 0
Marges 2 2 1 1 1 1

4) Déterminer le tableau de BURT.


SEXE GROUPE SANGUIN
Masculin Féminin A AB B O
Etudiant 1 1 0 0 0 0 1

X= Etudiant 2 0
Etudiant 3 1
1
0
1
0
0
1
0
0
0
0
Etudiant 4 0 1 0 0 1 0
Le tableau de Burt s’établit en appliquant la formule suivante :
B= X ' X
SM SF A AB B O
SM 2 0 0 1 0 0
SF 0 2 1 0 1 0

Ornel DJEUDJI NGASSAM 696694137


A 0 1 1 0 0 0
AB 1 0 0 1 0 0
B 0 1 0 0 4
1 0
O 0 0 0 0 0 0 1

Ornel DJEUDJI NGASSAM 696694137

Vous aimerez peut-être aussi