Vous êtes sur la page 1sur 8

EXERCICE 2 (Application/SPSS)

On considère les variables quantitatives suivantes :

𝑋1 : 𝑇𝑎𝑢𝑥 𝑑’𝑎𝑐𝑐𝑟𝑜𝑖𝑠𝑠𝑒𝑚𝑒𝑛𝑡 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑝𝑢𝑙𝑎𝑡𝑖𝑜𝑛

𝑋2 : 𝑃𝑜𝑢𝑟𝑐𝑒𝑛𝑡𝑎𝑔𝑒 𝑑’𝑎𝑐𝑡𝑖𝑓𝑠 𝑑𝑎𝑛𝑠 𝑙’𝑖𝑛𝑑𝑢𝑠𝑡𝑟𝑖𝑒

𝑋3 : 𝑃𝑜𝑢𝑟𝑐𝑒𝑛𝑡𝑎𝑔𝑒 𝑑𝑢 𝑃𝐼𝐵 𝑒𝑛 𝑎𝑔𝑟𝑖𝑐𝑢𝑙𝑡𝑢𝑟𝑒

𝑋4 : 𝐹𝑜𝑟𝑚𝑎𝑡𝑖𝑜𝑛 𝑏𝑟𝑢𝑡𝑒 𝑑𝑢 𝑐𝑎𝑝𝑖𝑡𝑎𝑙 𝑓𝑖𝑥𝑒 𝑒𝑛 𝑝𝑜𝑢𝑟𝑐𝑒𝑛𝑡𝑎𝑔𝑒 𝑑𝑢 𝑃𝑁𝐵

𝑋5 : 𝑅𝑒𝑐𝑒𝑡𝑡𝑒𝑠 𝑐𝑜𝑢𝑟𝑎𝑛𝑡𝑒𝑠 𝑒𝑛 𝑝𝑜𝑢𝑟𝑐𝑒𝑛𝑡𝑎𝑔𝑒 𝑑𝑢 𝑃𝑁𝐵

𝑋6 : 𝑃𝑜𝑢𝑟𝑐𝑒𝑛𝑡𝑎𝑔𝑒 𝑑’𝑎𝑐𝑡𝑖𝑓𝑠 𝑑𝑎𝑛𝑠 𝑙’𝑎𝑔𝑟𝑖𝑐𝑢𝑙𝑡𝑢𝑟𝑒 𝑒𝑡 𝑙𝑎 𝑝ê𝑐ℎ𝑒

En vue d’étudier les corrélations ces 6 variables quantitatives (démographiques et


macroéconomiques) mesurées sur un échantillon de 18 pays du monde, nous avons opté
pour une analyse en composantes principales (ACP). Par utilisation du logiciel SPSS,
nous avons obtenu les résultats résumés dans les tableaux suivants :

Tableau 1 : Indice KMO et Test de Bartlett

Mesure de précision de l’échantillonnage


de Kaiser-Meyer-Olkin (KMO) 0.684

Khi-deux approximé 52.788

Test de sphéricité de Bartlett ddl 15

Signification de bartlett 0.000

Pr-HAMDACHE
Tableau 2 : Variance totale expliquée

Tableau 3 : Matrice de corrélation

Pr-HAMDACHE
Tableau 4 : Matrice des composantes après rotation

Composantes
Variables 1 2
𝑋1 -0.306 0.815
𝑋2 -0.805 -0.120
𝑋3 0.920 -0.278
𝑋4 0.328 0.586
𝑋5 -0.739 -0.238
𝑋6 0.946 -0.118

Tableau 5 : Matrice des coefficients des coordonnées des composantes

Composantes
Variables 1 2
𝑋1 -0.064 0.688
𝑋2 -0.263 -0.137
𝑋3 0.284 0.200
𝑋4 0.130 0.518
𝑋5 -0.247 -0.236
𝑋6 0.299 -0.062

Graphique 1 : Graphique des valeurs propres

Pr-HAMDACHE
Graphique 2 : Diagramme de composantes dans l’espace après rotation

Graphique 3

Pr-HAMDACHE
1) D’après les résultats obtenus, quels sont les arguments en faveur de l’adoption de
l’ACP ?
 Les variables sont toutes quantitatives.
 La problématique est descriptive (Etude des corrélations entre variables).
 Les conditions de validité sont satisfaites : Nombres d’individus 18>15 et
nombre de variables 6>4.

2) Décrire les principales méthodes adoptées en vue de tester statistiquement


l’applicabilité de l’ACP.

D’après le tableau 1, on a l’indice de KMO est égal à 0.684>0.5

 Les corrélations partielles sont faibles.


 Le test est significatif.

D’après le tableau 1, on a la signification de Bartlett est égale à 0<5%

 La matrice de corrélation est différente de la matrice identité.


 Il existe des variables qui sont corrélées entre elles 2 à 2.
 Le test est aussi significatif.

3) Sur la base des résultats de certains tableaux (à préciser), montrer que


l’application de l’ACP est justifiée.

D’après le tableau 3, on note que toutes les variables sont corrélées entre elles 2 à 2 et
on observe aussi que quelques variables sont fortement corrélées entre elles 2 à 2 par
exemple :

𝑟(𝑋3 ; 𝑋6 ) = 0.922

On conclut donc que l’application de l’ACP est justifiée.

4) Quels sont les axes factoriels à retenir (Justifier votre réponse)?

 D’après le tableau 2, on remarque que les valeurs propres associées aux 2


premières composantes sont plus grandes que 1 :
𝜆1 = 3.149 𝑒𝑡 𝜆2 = 1.159

 D’après le tableau 2, on remarque que le pourcentage d’information restituée par


les 2 premières composantes est de 71,794% (l’inertie des 2 premiers axes)(Pett
75% ; Henson 70% ; Hair 60%).

Pr-HAMDACHE
𝑽𝒂𝒍𝒆𝒖𝒓 𝒑𝒓𝒐𝒑𝒓𝒆 𝒄𝒐𝒓𝒓𝒆𝒔𝒑𝒐𝒏𝒅𝒂𝒏𝒕𝒆
𝒍’𝒊𝒏𝒆𝒓𝒕𝒊𝒆 𝒅’𝒖𝒏 𝒂𝒙𝒆 (𝒆𝒏%) =
𝑺𝒐𝒎𝒎𝒆 𝒅𝒆𝒔 𝒗𝒂𝒍𝒆𝒖𝒓𝒔 𝒑𝒓𝒐𝒑𝒓𝒆𝒔 (𝑰𝒏𝒆𝒓𝒕𝒊𝒆 𝒕𝒐𝒕𝒂𝒍𝒆)

Le coude de Cattell constitue un critère plus sévère pour déterminer le nombre de


facteurs. Il est possible de demander dans les options associées à l’ACP de réaliser un
graphique à partir des valeurs propres.

Tous les points représentent les valeurs propres des composantes. Ils sont reliés par une
ligne. On ne retient que les facteurs qui se situent avant le changement brusque de la
pente.

 D’après le graphique 1, les points qui suivent ce changement, appelé rupture du


coude, semblent former une ligne droite horizontale. L’information ajoutée par
les facteurs représentés par ces points est peu pertinente.

 D’après les 3 règles, il convient de retenir les 2 premières composantes comme


axes factoriels.

5) Préciser les variables qui contribuent amplement à la formation de l’axe 1 et de


l’axe 2.

D’après le tableau 4, on remarque que les variables 𝑋2 , 𝑋3 , 𝑋5 𝑒𝑡 𝑋6 sont fortement


corrélées à l’axe 1 tandis que la variable 𝑋1 est fortement corrélée à l’axe 2, enfin la
variable 𝑋4est plus liée à l’axe 2 (Résultats confirmés par le graphique 2).

𝒓𝟐 (𝒙𝒌 ; 𝑪𝒋 )
𝑪𝑻𝑹(𝒙𝒌 )𝑪𝒋 =
𝝀𝒋

𝒓𝟐 (𝒙𝟓 ; 𝑪𝟏 ) (𝟎. 𝟗𝟒𝟔)𝟐


𝑪𝑻𝑹(𝒙𝟔 )𝑪𝟏 = = = 𝟎. 𝟐𝟖 (𝟐𝟖%)
𝝀𝟏 𝟑. 𝟏𝟒𝟗

𝒓𝟐 (𝒙𝟏 ; 𝑪𝟐 ) (𝟎. 𝟖𝟏𝟓)𝟐


𝑪𝑻𝑹(𝒙𝟏 )𝑪𝟐 = = = 𝟎. 𝟓𝟕 (𝟓𝟕%)
𝝀𝟐 𝟏. 𝟏𝟓𝟗

Donc l’axe 1 est formé des variables 𝑋2 , 𝑋3 , 𝑋5 𝑒𝑡 𝑋6 tandis que l’axe 2 comprend les
variables 𝑋1et 𝑋4.

Pr-HAMDACHE
6) Préciser les équations des axes retenus.

D’après le tableau 5 des coefficients des coordonnées des composantes on déduit que :

𝐶1 = −0.064𝑋1 − 0.263𝑋2 + 0.284𝑋3 + 0.130𝑋4 − 0.247𝑋5 + 0.299𝑋6

𝐶2 = 0.688𝑋1 − 0.137𝑋2 − 0.200𝑋3 + 0.518𝑋4 − 0.236𝑋5 − 0.062𝑋6

7) Interpréter le nuage des individus.

D’après le graphique 3, il convient de mettre en valeur :

•les groupes d’individus ayant un comportement identique;

•Les individus isolés;

•La position des individus par rapport aux axes.

8) Calculer la distance euclidienne entre les points variables 𝑋3 et 𝑋6.

D’après le tableau 4, les coordonnées des points variables 𝑋3 et 𝑋6 dans le système


d’axe (𝐶1 , 𝐶2 ) sont :

0.920 0.946
𝑋3 : ( ) 𝑒𝑡 𝑋6 : ( )
−0.278 −0.118
Donc la distance euclidienne entre les points variables 𝑋3 et 𝑋6est :
2
𝑑2 (𝑋3 ;𝑋6 ) = (0.920 − 0.946)2 + (−0.278 − (−0.118)) = 0.0263

𝑑(𝑋3 ;𝑋6 ) = 0.162

Les 2 points variables sont assez proches (résultats confirmés dans le graphique 2
car L’angle défini par 𝑋3 et 𝑋6 est relativement de faible mesure).

9) Calculer la distance euclidienne entre les points individus Espagne et Grèce.

Les coordonnées des points précités sont les suivants :

𝑿𝟏 𝑿𝟐 𝑿𝟑 𝑿𝟒 𝑿𝟓 𝑿𝟔
Espagne 0.95 37.1 15 22 22.4 30.9
Grèce 0.7 22.5 20.3 29.7 26.9 48.2

On rappelle que :
𝟐
𝒅𝟐 (𝒊, 𝒋) = ∑(𝒙𝒊𝒌 − 𝒙𝒋𝒌 )
𝒌∈𝑲

Pr-HAMDACHE
Alors la distance euclidienne entre les points individus Espagne et Grèce est :

𝒅𝟐 (𝑬, 𝑮) = (𝟎. 𝟗𝟓 − 𝟎. 𝟕)𝟐 + (𝟑𝟕. 𝟏 − 𝟐𝟐. 𝟓)𝟐 + (𝟏𝟓 − 𝟐𝟎. 𝟑)𝟐 + (𝟐𝟐 − 𝟐𝟗. 𝟕)𝟐
+ (𝟐𝟐. 𝟒 − 𝟐𝟔. 𝟗)𝟐 + (𝟑𝟎. 𝟗 − 𝟒𝟖. 𝟐)𝟐 = 𝟔𝟐𝟎. 𝟏𝟒𝟐𝟓

𝒅(𝑬, 𝑮) = 𝟐𝟒, 𝟗

Pr-HAMDACHE

Vous aimerez peut-être aussi