Vous êtes sur la page 1sur 11

TP : Analyse en Composantes Principales sous SPSS/V20

(avec correction à la fin)


Dirigé par Said El Khatri elkhatri@gmail.com

NB : Pour avoir SPSS en français : Edit > Options > Language (French) … > Ok
Ouvrir le fichier : data_acp.xlsx, pour cela :
Démarrer /IBM SPSS Statistics/IBM Statistics SPSS 20
Ouvrir une source de données existante
Fichier de type : Excel
Choisir le fichier : data_acp.xlsx
Laisser active l’option : « lire les noms des variables à partir de la première ligne de données »
OK
Enregistrer votre fichier en format donnée de SPSS : data_acp.sav
Pour faire des calculs élémentaires : aller dans :
Analyse
Statistiques descriptives
Descriptives
La boîte de dialogue «Descriptives» apparaît alors :
on choisit les variables adaptées à l’analyse en les sélectionnant dans la partie gauche
puis en cliquant sur la flèche qui pointe vers la droite.
Cliquer sur « options » et cocher « moyenne », « écart type », « variance », « mini » et max »

Appliquer l’ACP : aller dans :

Analyse
Réduction des dimensions
Analyse factorielle :
La boîte de dialogue «Analyse factorielle » apparaît alors :
De même qu’en haut, sélectionner les variables adaptées à l’analyse
Cinq boites de dialogue d’options à examiner une à une :

« Descriptives … »
La boîte de dialogue « Analyse factorielle : Caractéristiques » apparaît.
Dans « Statistiques », cliquer sur « Structure initiale »
Dans « Matrice de corrélation » , cliquer sur «Coefficients » et « indice de KMO et test de sphéricité de
Bartlett »
Ensuite, cliquer sur « poursuivre »

« Extraction… »
La boîte de dialogue «Analyse factorielle : Extraction » apparaît.
Choisir entre matrice de corrélation et matrice de covariance ?
Cocher « Structure factorielle sans rotation » et «Diagramme des valeurs propres ».
Extraire Nombre fixe de facteurs =3 ( ?)
Ensuite, cliquer sur « poursuivre »

« Rotation… »
La boîte de dialogue «Analyse factorielle : Rotation » apparaît.
garder l’option « Aucun » dans un premier temps
Par contre, cocher l’option « Cartes factorielles ». Cette option permet d’avoir une représentation des
différents axes.
Ensuite, cliquer sur « poursuivre »
1
«Facteurs … »
La boîte de dialogue «Analyse factorielle : facteurs » apparaît.
L’option « Enregistrer dans des variables » permettra d’attribuer à chaque individu ses coordonnées
factorielles une fois l’analyse terminée (garder le choix « régression »)
Cocher l’option « Afficher la matrice des coefficients factoriels »
Ensuite, cliquer sur « poursuivre »

« Options… »
La boîte de dialogue «Analyse factorielle : Options » apparaît.
Ne rien changer
Ensuite, cliquer sur « poursuivre »
Cliquer sur OK !!

1) Projection des variables


Le « diagramme de composantes » montre une projection sur l’espace dirigé par les 3
premiers axes factoriels. Ce diagramme est obtenu lorsque le nombre de CP retenu est au
moins égale à 3. Pour revenir à des projections en 2 dimensions, cliquer 2 fois sur l’image
« diagramme de composantes » puis cliquer sur « édition » puis sur « propriétés » puis
« variables », puis cliquer sur l’axe à exclure : exemple «Axe des Z » puis « Exclure » puis
« appliquer »
Il est possible de perfectionner le graphe selon le besoin (notamment, il est préférable de
choisir une échelle commune aux axes et des extrémités entre -1 et 1 :
« Edition » > « Sélectionner l’axe des X » …> « Echelle » …>
Ajouter les axes nuls : « Options » « Ligne de référence de l’axe des X », …

2) Projection des observations :


Pour projeter les observations sur les espaces factoriels :
o Remarquer que l’option « enregistrer dans des variables » sous « facteurs » a
permis d’enregistrer dans le fichier de données les facteurs comme de nouvelles
variables à la fin ….
o ensuite tracer à partir de la fenêtre des données :
« Graphes »
« Générateur de diagrammes »
Cliquez sur l'onglet « Galerie » et cliquez sur « Dispersion/Points »
Faites glisser l'icône « diagramme de dispersion simple » sur le canevas..
Placez la variable « REGR factor score 2 for analysis 1 » sur l'axe des y et la
variable « REGR factor score 1 for analysis 1 » sur l'axe des x.
Aller dans Groupe/ID point et cocher « Etiquette ID point » puis glisser la
variable « modèle » dans la case : »variable d’étiquette de point »
Cliquer sur OK
Vous pouvez améliorer le graphe : cliquer 2 fois sur le graphe qui apparaitra dans
une nouvelle fenêtre puis :
- tracer les lignes de référence 0 : « option »/ « ligne de référence de l’axe
des X » puis choisir 0 de même pour l’axe des Y …
- changer le nom des axes et le titre : double cliquer et faites votre choix …
- améliorer la graduation et le format des nombres sur les axes : double
cliquer sur les nombres des axes …
- ajouter une zone de texte sur le graphe ou une annotation : cliquer à
droite sur le graphe …
- etc.
Enfin vous pouvez sauvegarder le type de graphe que vous avez élaboré pour un usage
ultérieur : « fichier »/ « enregistrer modèle de diagramme ». Après, lors d’une nouvelle

2
utilisation il suffit de choisir : « fichier »/ « appliquer modèle de diagramme », mais
attention au nom des titres et étiquettes ....

Compte rendu demandé :

Travail demandé : Analyser les résultats et répondez aux questions suivantes (dans un
document word )
NB : (les résultats de SPSS peuvent être copiés dans un document word …)

1) A votre avis dans quel objectif utiliserons-nous l’ACP dans cet exemple ?

2) Les données sont-elle factorisables ? Justifiez votre réponse ?

3) Pourquoi a-t-on choisi de diagonaliser la matrice de corrélation ?

4) A votre avis, qu’explique-t-il l’axe 1 ? l’axe 2 ?

5) Combien d’axes suffisent pour l’analyse ?

6) Quel est le pourcentage de variance expliqué par le meilleur plan d’ajustement ?

7) Vérifier la cohérence des valeurs des corrélations entre les variables et la projection plane
de ces dernières sur le plan 1,2

8) Interpréter les différents types de voitures à partir de la projection plane de ces dernières
sur le plan 1,2?

3
Résultats :
Statistiques descriptives

Moyenne Ecart-type
Cylindrée 1906,13 527,909
Puissance 113,67 38,784
VITESSE 183,08 25,215
POIDS 1110,83 230,291
LONGUEUR 421,58 41,340
LARGEUR 168,83 7,654

Matrice de corrélation

Cylindrée Puissance VITESSE POIDS LONGUEUR LARGEUR


Cylindrée 1,000 ,861 ,693 ,905 ,864 ,709
Puissance ,861 1,000 ,894 ,746 ,689 ,552
VITESSE ,693 ,894 1,000 ,491 ,532 ,363
POIDS ,905 ,746 ,491 1,000 ,917 ,791
LONGUEUR ,864 ,689 ,532 ,917 1,000 ,864
LARGEUR ,709 ,552 ,363 ,791 ,864 1,000

Indice KMO et test de Bartlett

Mesure de précision de l'échantillonnage de Kaiser-


Meyer-Olkin. ,705

Test de sphéricité de Khi-deux approximé 178,583


Bartlett ddl 15
Signification de Bartlett ,000

Valeurs propres
Valeurs % de la
propres variance % cumulés
1 4,656 77,600 77,600
2 ,915 15,254 92,854
3 ,240 4,007 96,861
4 ,103 1,712 98,573
5 ,065 1,078 99,651
6 ,021 ,349 100,000
.

4
Graphique des valeurs propres
5

2
Valeur propre

0
1 2 3 4 5 6

Numéro de composant

Matrice des corrélations entre les variables et les Composantes

Composante
1 2 3 4 5 6
Cylindrée ,958 ,032 -,197 -,016 -,203 -,002
Puissance ,894 ,403 -,019 -,157 ,078 -,081
VITESSE ,741 ,635 ,181 ,103 ,002 ,065
POIDS ,929 -,244 -,238 -,039 ,120 ,076
LONGUEUR ,928 -,283 ,022 ,228 ,042 -,063
LARGEUR ,815 -,458 ,334 -,117 -,033 ,017

Matrice de passage

0,44 0,03 -0,40 -0,05 -0,80 -0,01


0,41 0,42 -0,04 -0,49 0,31 -0,56
0,34 0,66 0,37 0,32 0,01 0,45
0,43 -0,26 -0,48 -0,12 0,47 0,53
0,43 -0,30 0,04 0,71 0,17 -0,44
0,38 -0,48 0,68 -0,37 -0,13 0,12

5
Diagramme de composantes
1,0

vitesse

,5 puissance

cylindrée
0,0
poids
longueur
Composante 2

largeur
-,5

-1,0
-1,0 -,5 0,0 ,5 1,0

Composante 1

Diagramme de composantes
1,0

,5
largeur
vitesse
longueur
puissance
0,0
cylindrée
poids
Composante 3

-,5

-1,0
-1,0 -,5 0,0 ,5 1,0

Composante 1

6
Diagramme de composantes
1,0

,5
largeur
vitesse
longueur
puissance
0,0
cylindrée
poids
Composante 3

-,5

-1,0
-1,0 -,5 0,0 ,5 1,0

Composante 2

7
4

Peugeot205 Rallye
BMW325iX
Citroen AX sport
1 Seat Lbiza SXI
Audi 90 quattro BMW530i
Rover827i
Peugeot 205 Renault25
Honda Civic
Peugeot 405 Break
Fiat Uno
0
Renault19 Citroen BX Ford Scorpio
Ford sierra
Fiat Tipo Opel oméga
Puegeot 405
Renault21
-1 Renault Espace
FORd Fiesta

Nissan Vanette

-2
VW Caravelle

-3

Z2
-4

-4 -3 -2 -1 0 1 2 3 4

Z1

8
Réponses aux questions :

QUESTION1

On va réduire la quantité des données à analyser et tirer les meilleurs conseils :

Pour un fabricant, l'objectif est de chercher à s'améliorer par rapport aux autres concurrents.
Pour un client, l'objectif de choisir la voiture la plus convenable selon son besoin

QUESTION2

Les données sont bien factorisables car elles vérifient les 3 critères suivantes:
1-l'INDICE de KMO = 0.705 (moyen)
2-Signification de Bartlett tend vers 0
3-La plupart des variables sont significativement corrélées

QUESTION3

On choisit la matrice de corrélation, car les variables sont hétérogènes en unité de mesure.

QUESTION4
2 axes suffisent, car selon CATELL, on ne retient que les 2 premières CP dont le % en variance
est important.

QUESTION5
Toutes les variables sont bien représentées (loin du centre).
L'axe 1 : désigne la performance générale de la voiture, car il regroupe l'ensemble des variables.

L'axe 2 : désigne l'opposition entre la performance du moteur et la forme de la voiture. (en fait
l’axe est corrélé positivement avec la vitesse et la puissance et corrélé négativement avec la
largeur, la longueur et le poids)

QUESTION6
Le pourcentage de variance expliqué par le meilleur plan d'ajustement est celui suivant les deux
1ers axes ( Q=92.854%)

QUESTION7
Les valeurs de corrélation entre poids, longueur et largeur sont importantes dans la matrice de
corrélation (0.864,0.917, 0.791). Cette forte corrélation se manifeste dans les très petits angles
formés par ces variables sur leur projection dans le plan 1,2 (poids, longueur, largeur
positivement liés). Ainsi, la cohérence des valeurs de corrélation entre les variables et leurs
projections planes sur 1,2 est vérifiée.

9
QUESTION8 (réponse générale)

Peugeot205 Rallye
BMW325iX
Citroen AX sport
1 Seat Lbiza SXI Audi 90 quattro BMW530i
Rover827i
Peugeot 205
Honda Civic Renault25
Peugeot 405 Break
0 Fiat Uno
Renault19 Citroen BX Ford Scorpio
Ford sierra
Fiat Tipo Opel oméga
Puegeot 405
Renault21
-1 Renault Espace
FORd Fiesta

Nissan Vanette

-2
VW Caravelle

-3

Z2
-4

-4 -3 -2 -1 0 1 2 3 4

Z1

10
La région au centre (à l’intérieur du cercle) : des voitures moyennes en appréciation générale et
équilibrées entre puissance et forme
En haut à droite (rectangle noir) : les meilleurs voitures au niveau de l'appréciation général
avec puissance moteur supérieure à la forme de la voiture
En bas à gauche (rectangle vert) : les voitures moins appréciées avec puissance moteur inférieure
à la forme de la voiture
En haut à gauche (rectangle rouge) : voitures moins appréciées mais avec puissance moteur assez
grande par rapport à la forme de la voiture
En bas à droite (rectangle bleu) : voitures bien appréciées avec puissance moteur faible par
rapport à la forme de la voiture
A l’intérieur de la flèche vers la droite : voitures bien appréciées et équilibrées entre puissance
du moteur et forme
A l’intérieur de la flèche vers la gauche : voitures mal appréciées mais équilibrées entre
puissance du moteur et forme
A l’intérieur de la flèche en vers le haut : voitures moyenne en appréciation globale mais le
moteur est puissant par rapport à la forme
A l’intérieur de la flèche en vers le bas: voitures moyenne en appréciation globale mais la forme
est plus grande par rapport à la puissance du moteur

11

Vous aimerez peut-être aussi