Vous êtes sur la page 1sur 21

Exemple ACP

SPSS
Les données
client solde chèque NB_DEC MT_DEC NB_PR NB_EMP MT_EMP P_va_DE MT_DEP_E NT_RET_E P_VA_R_E
1 2305 253 7 2,3 0 1 8,5 -2 3,1 0,7 3
2 15259 1024 0 0 3 1 25 9 500 0 0
3 1236 156 10 5,4 1 0 0 3 6 2 1
4 8241 455 1 0,1 6 4 210 4 32 36 3
5 6210 1022 2 0,3 5 3 113 3 150 80,5 2
6 6871 321 1 3 6 4 200 3 125 98 3
7 1580 150 9 6,1 2 1 8 2 6,5 5,5 1
8 9630 562 1 4 5 3 111 4 225 110,5 2
9 4230 63 3 2,7 2 0 0 1 5,1 20 -3
10 3620 84 5 9,8 1 1 81 -3 7,2 3,1 8
11 10258 1255 0 0 6 4 310 5 252 253,7 3
12 23698 52 1 2,9 2 0 0 12 523 2 1
13 3698 854 0 0 1 1 5 -2 1,5 3,2 1
14 231 68 12 8,9 1 0 0 -1 0,5 0,1 0
15 501 255 0 0 1 1 5 -3 10,2 10,1 1
16 3693 24 0 0 2 0 0 2 1,2 21,5 2
17 963 92 1 0,9 1 0 0 -1 105 6,1 -1
18 15802 1122 0 0 2 0 0 10 611 0,1 -1
19 502 751 6 3 2 2 8,5 1 61,2 0,8 6
20 7896 1236 1 6 6 3 250,7 3 188 98,1 3
21 23698 969 0 0 3 0 0 12 916 8,1 -1
22 27896 425 1 2,3 3 0 0 15 523 0 0
23 5687 303 1 3,6 5 3 155 3 261 110 2
24 1269 451 0 0 1 2 15 -1 51,3 5,1 3
25 3687 152 3 0,6 2 1 25 -2 0,1 52 -3
26 9631 147 0 0 2 0 0 9 656 0 0
27 75632 954 0 0 3 0 0 13 889 0 0
28 5523 136 1 1,2 5 4 110,1 5 110 110,5 2
29 6984 254 2 0,3 4 3 125,1 3 131 85,1 3
30 85214 2360 0 0 3 0 0 9 633 1 -1
31 4235 258 1 0,4 4 1 30 -2 32,7 13,6 1
32 3691 1025 2 2 3 0 0 1 52 0,1 3
33 4563 655 3 0,2 4 0 0 -2 12 10,8 7
34 2587 489 0 0 3 0 39,1 4 65,7 45,1 -1
35 3654 257 4 0,4 1 8 25,6 -2 0,5 42,5 -1
36 547 98 0 0 2 2 25 6 72,5 0,1 7
37 5821 1025 0 0 5 3 110 4 115 135,2 4
38 12587 587 0 0 3 0 0 8 452 5 1
39 6981 163 1 3 4 3 98 3 92,3 85,2 2
40 25871 125 0 0 3 0 0 11 754 0,1 0
41 15236 254 0 0 6 3 221 3 123 97 2
42 12369 128 0 0 3 0 0 9 651 0 0
43 4563 962 8 5,6 3 0 0 -1 23,1 9,2 2
44 12258 2301 0 0 3 1 15 8 591 10 1
45 7529 587 0 0 5 2 200 3 117 81 5
46 6987 1027 1 0,4 6 30 158 4 165 80,1 -1
47 9632 238 1 0,8 4 2 151 3 127 77 2
48 3654 1456 0 0 2 5 65 -1 65 6 2
49 25412 698 0 0 2 0 0 12 658 0 -1
50 3654 150 1 0,9 0 0 0 -2 7 42 9
Les variables
• Solde: solde moyen du compte
• Chèque: Montant moyen des chèques tirés lors du dernier semestre.
• NB_DEC: Nombre de mois avec découvert lors de l’année précédente.
• MT_DEC: Montant cumulé des découverts lors de l’année précédente.
• NB_PR: Nombre de produits de la banque utilisés en plus du compte courant.
• NB_EMP: Nombre d’emprunts divers effectués lors des 5 dernières années.
• MT_EMP: Montant total des emprunts effectués lors des 5 dernières années.
• P_VA_DE: Pourcentage de variation des dépôts d’épargne pour les 12 derniers
mois.
• MT_DEP_E: Montant total des dépôts sur les comptes d’épargne effectués lors de
l’année précédente.
• MT_RET_E: Montant total des retraits sur les comptes d’épargne effectués lors de
l’année précédente.
• P_VA_DE: Pourcentage de variation des retraits sur les comptes d’épargne pour
les 12 derniers mois.
Analyse factorielle
Varimax: rotation orthogonale qui maintient les axes de l’espace factoriel en angle
droit. Elle permet de minimiser le nombre d’items ayant des contributions élevées sur
un axe et donc de simplifier les facteurs et leurs interprétations.
Oblimin directe: rotation oblique où les axes se positionnent en fonction des items
lorsque ces derniers sont corrélés.
Quartimax: minimise le nombre de facteurs requis pour expliquer chaque variable et
son interprétation.
Equamax: combinaison de Varimax et Equamax
Résultats SPSS

En rapportant l’écart type à la moyenne, on peut conclure que


toutes les variables sont très dispersées, ce qui indique un
comportement très hétérogène des clients.
Dans l’ensemble, les variables sont faiblement corrélées entre elles. On note
cependant une corrélation relativement forte entre P_VA_DE et MT_DE_PE.
L’indice KMO (0,7) ainsi que le test de Bartlett permettent d’accepter les résultats de
cette analyse factorielle.
SPSS a calculé 11 composantes, la première a une valeur propre,
c-à-d variance de 3,436 qui représente 31,237% de la variance
totale des variables initiales. Les deux première composantes
contribuent ensemble à 58,844% de la variance initiale.
D’après le graphique, on peut retenir deux composantes
principales. En effet la différence de variance entre la
deuxième composante et la troisième est très importante.
La qualité de représentation exprime la part de la variance des variables initiales qui
est restituée par les composantes retenues. Ainsi les 2 composantes contribuent à
63,2% de la variance du solde moyen du compte courant.
Les deux composantes sont suffisantes pour synthétiser les variances de la majorité
des variables.
Les 4 variables chèques, MT_D_EC, NB_EMP et P_VA_RE ne sont pas bien prises en
compte par les 2 composantes (coeff <50%), ce qui suggère l’existence d’une ou
plusieurs autres composantes principales pertinentes.
La 1 composante est fortement corrélée positivement avec les trois première variables.
Elle est corrélée négativement NB et MT.
Donc la première composante met en opposition 2 catégories de clients: une catégorie
de clients épargnants et une autres dépensiers.
La 2 composante est fortement corrélées avec les 3 dernières variables. Il s’agit d’un
comportement d’investissement.
Donc la deuxième composante permet de distinguer une troisième catégorie de clients
qu’on peut qualifier d’investisseur.
Analyse de fiabilité
Graphique des individus
Le graphe indique que les clients 30 et 27 représentent les plus grands épargnants,
les clients 10 et 14 sont des grands dépensiers alors que 11 et 46 sont des grands
investisseurs. Les clients proches du barycentre sont des clients dont le
comportement n’est pas très bien définit

Vous aimerez peut-être aussi