Académique Documents
Professionnel Documents
Culture Documents
Rédigé par :
ALATSA DONGHO Geovanel
ASSOUMANE DJIBRILA
Sous la supervision de :
Dr DONGMEZO KENFAC PAUL BRICE
Enseignant permanent à l’ISSEA
1
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
INTRODUCTION GENERALE ........................................................................................ 5
CHAPITRE 1 ANALYSE DES COMPOSANTES PRINCIPALES ................................... 6
Introduction ............................................................................................................................ 6
I. Présentation de la base de données et traitement de données ............................................ 6
II. Réduction de dimension ..................................................................................................... 8
1. Analyse de la matrice de corrélation ............................................................................... 8
2. Indice KMO et test de Bartlett ........................................................................................ 9
3. Qualité de représentation et choix de nombre d’axes factoriels ...................................... 9
4. Réalisation de l’ACP ..................................................................................................... 10
5. Qualité de représentation d’un point et contribution à la formation des axes ............... 10
6.Liaison entre les variables ..................................................................................................... 11
7. Liaison entre les individus............................................................................................. 12
Conclusion ............................................................................................................................ 13
CHAPITRE 2 ANALYSE FACTORIELLE DES CORRESPONDANCES .................... 14
INTRODUCTION ................................................................................................................ 14
I. Présentation des données ............................................................................................... 14
1. Présentation et description du jeu de données ............................................................... 14
b) Sources de données ......................................................................................................... 14
c) Description du tableau de données ................................................................................ 14
d) Présentation des données ............................................................................................... 15
2. Statistiques descriptives ................................................................................................ 15
3. Interprétation des résultats ............................................................................................... 17
Test du Khi-2 ................................................................................................................. 17
a)
Présentation des différents profils ................................................................................. 17
b)
Choix du nombre d’axe factoriel ................................................................................... 18
c)
d)
Contributions à la formation des axes factoriels et qualité de représentation des points
19
Conclusion ........................................................................................................................... 20
CHAPITRE 3 ANALYSE DES CORRESPONDANCES MULTIPLES .......................... 22
Introduction .......................................................................................................................... 22
1. Présentation et description du jeu de données ............................................................... 22
2. Problématique et objectifs de l’étude ............................................................................ 23
3. Statistiques descriptives ................................................................................................ 23
4. Interprétation des résultats d’analyse ............................................................................ 24
5. CHOIX DU NOMBRE D’AXE FACTORIELE .......................................................... 26
6. MESURE DE LA DISCRIMINATION ........................................................................ 28
7. PRESENTATION DES PROFILS ................................................................................ 30
8. POLITIQUE POUR L’AMELIORATION DES RENDEMENTS DE LA Kmer Bank.
32
CONCLUSION ....................................................................................................................... 33
2
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
LISTE DES TABLEAUX
Tableau 1 : Quelques statistiques descriptives ........................................................................... 7
Tableau 2: Tableau de corrélation .............................................................................................. 8
Tableau 3 : Indice KMO et test de Bartlett ................................................................................ 9
Tableau 4: Valeurs propres et pourcentages d’inertie ................................................................ 9
Tableau 5 : Répartition des Filières de formation par niveau d’étude et de sexe..................... 15
Tableau 6 : Test du Khi-2 ......................................................................................................... 17
Tableau 7: Profils ligne ............................................................................................................ 17
Tableau 8 : Profils colonne....................................................................................................... 17
Tableau 9 : Présentation des variables ..................................................................................... 23
Tableau 10: Statistiques descriptives ....................................................................................... 24
3
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
SIGLES ET ABBREVIATIONS
AMD : Analyse Multidimensionnelle des Données
ACP : Analyse En Composantes Principales
CAH : Classification P a g e | 4Hiérarchique Ascendante
AFC : Analyse Factorielle Des Correspondances
ACM : Analyse Des Correspondances Multiples
KMO : Kaiser Meyer Olkin
4
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
INTRODUCTION GENERALE
L’Analyse des données, aujourd’hui plus que par le passé est un outil
incontournable d’aide à la prise de décision. En effet il y a une nécessité de mieux
comprendre ou cerner les problèmes et les phénomènes auxquels nous faisons face
au quotidien ; les méthodes d’analyses des données apparaissent donc comme les
moteurs de la compréhension des phénomènes, en ce sens qu’un phénomène ne
peut être compris que s’il est véritablement observé, étudié et analysé. Dans notre
projet nous nous intéressons aux méthodes d’ADD. Par ce projet nous passons de
la théorie à la pratique il convient donc pour nous dès à présent de réaliser un
travail qui sera principalement piloter par nous-même.
La tâche qui nous a été confiée est de chercher des bases de données adaptées et
appliquer sur ces bases des méthodes appropriées d’ADD pour répondre à des
problématiques spécifiques que nous avons posées au préalable. Pour cela nous
présentons dans ce rapport l’analyse en composantes principale (ACP), l’analyse
factorielle des correspondances (AFC) et enfin l’analyse des correspondances
multiples (ACM).
5
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
CHAPITRE 1 ANALYSE DES COMPOSANTES
PRINCIPALES
Introduction
L’ACP, l’analyse en composantes principales consiste à transformer des variables
corrélées statistiquement (c’est-à-dire liées entre elles) en nouvelles variables
décorrélées les unes des autres appelées composantes principales, Elle permet de
réduire le nombre de variables, de simplifier une analyse et de pouvoir identifier
le facteur qui provoque le plus de variance. Pour notre projet il est question de
savoir les villes de France qui se ressemblent démographiquement et celles
reflétant le plus l’aspect démographique de la France. Pour répondre à ces
questions nous présenterons d’abord les caractéristiques démographiques de la
population Française avant d’illustrer les villes similaires et celles qui reflètent le
plus les caractéristiques démographiques de la population en France.
1. Source de données
Les données que nous utiliserons pour notre analyse sont issues de nos de nos
enseignants en analyse de données. Ces données fournissent les informations sur
la situation démographique des 22 régions de France et la France à travers 12
variables démographiques.
2. Description du tableau de données
6
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
✓ H65 : Hommes 65 et plus 1968 (% de la population totale)
✓ F65 : Femmes 65 et plus 1968 (% de la population totale)
- Indice de vieillesse II-Fécondité – mortalité
✓ TFG : Taux de fécondité générale (67-69)
✓ DMH : Durée moyenne de vie Hommes (67-69)
✓ DMF : Durée moyenne de vie Femmes (67-69)
- Comportement global
✓ TRE : Taux net de reproduction
✓ TAN : Taux d’accroissement naturel
▪ 23 lignes dont les 22 premières sont les individus (régions de France) et la dernière
est la France sur lesquelles les 12 variables sont mesurées.
3. Statistiques descriptives
7
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
A partir de notre Tableau nous pouvons dire qu’en 1968 les femmes et les
hommes ayant un âge compris entre 0 et 25 ans représentent en moyenne chacun
20% de la population française, les hommes et les femmes dont l’âge est compris
entre 25 et 44ans représentent en moyenne chacun 12% de la population en France
puis au-delà de 65ans les hommes représentent 8,5% et les femmes 5,4% de la
population française.
Entre 1967 et 1969 le taux de fécondité en France est de 72% en moyenne avec
un écart d’environ 8%, la durée de vie moyenne chez les hommes est de 67 ans et
celle des femmes est de 75 ans avec un écart d’environ un an pour les deux sexes.
Le taux net de reproduction est de 12,5% en moyenne et le taux d’accroissement
naturel est de 57% en moyenne avec des écarts respectifs de 1% et 27%.
Nous allons maintenant nous intéresser aux corrélations qui pourraient exister
entre les variables considérées dans cette analyse et aussi les ressemblances qui
pourraient exister entre les régions de France.
8
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
2. Indice KMO et test de Bartlett
Il est question dans l’analyse du tableau 2 ci-dessous de s’assurer de la pertinence
de nos résultats.
Tableau 3 : Indice KMO et test de Bartlett
Indice de Kaiser-Meyer-
Olkin pour la mesure de la 0,741
qualité d'échantillonnage.
Khi-carré
Test de 614,473
approx.
sphéricité de
ddl 66
Bartlett
Signification 0
Source : Sortie Spss élaborée par Auteurs
On observe que KMO>0,7 et Test de Bartlett<0,05 ceci dit qu’il existe une bonne
corrélation entre les variables et nous aurons une factorisation intéressante qui
résume l’information contenue dans les données en utilisant l’analyse en
composante principale (ACP).
Nous avons retenu les deux premiers axes factoriels qui résument 89,4% de
l’information contenue dans nos données, en appliquant la règle de Kaiser qui
préconise de garder que les axes dont les valeurs propres sont supérieures ou
égales à 1. Ceci s’illustre bien dans le tableau 4.
4. Réalisation de l’ACP
La première valeur propre vaut 8,304 et la deuxième valeur propre 2,434 l’écart
entre ces deux valeurs est significatif pour justifier notre choix pour ces deux
premiers axes, nous visualisons cela sur le graphique 1.
10
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
89%
TRE 95%
71%
DMH 68%
92%
IVI 98%
98%
H65 96%
94%
H25 81%
97%
H00 97%
0 0,2 0,4 0,6 0,8 1 1,2
Conclusion
Au terme de notre analyse nous constatons qu’il était de mieux visualiser les
résultats que nous avons obtenues en ACP, il en ressort donc que nous pouvons
regrouper les régions de France en trois selon leur ressemblance ou leur proximité
ainsi qu’une région qui pourras refléter les caractéristiques démographiques de la
France. Ces groupes de régions ont chacune leurs particularités en termes de
variables démographiques.
13
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
CHAPITRE 2 ANALYSE FACTORIELLE DES
CORRESPONDANCES
INTRODUCTION
L’analyse factorielle des correspondances (AFC) est l’une des méthodes
d’analyse des données permettant d’analyser le lien entre deux variables
qualitatives nominales observées sur des individus et le comportement de l’une
par rapport à l’autre. Pour notre travail, il sera question de savoir les disciplines
est le même, Quelles sont les disciplines privilégiées par les femmes
(respectivement les hommes). Pour répondre à ces questions nous allons dans un
premier temps présenter la répartition des formations en fonction du diplôme
d’étude et le sexe, dans un second temps nous montrerons le lien existant entre les
deux variables.
I. Présentation des données
1. Présentation et description du jeu de données
b) Sources de données
Le jeu de données représente le nombre d’étudiants des universités françaises par
discipline et par cursus selon le sexe lors de l’année 2007-2008. Le tableau croise
les variables qualitatives Discipline et Niveau-sexe. Il comprend en lignes les 10
disciplines de l’université et en colonnes les croisements des variables niveau
(licence, master et doctorat) et sexe (homme et femme). L’AFC est alors
appliquée entre une variable (Discipline) et le croisement de deux variables
(Niveau-sexe), ce qui est fréquent en AFC. Nous disposons de plus par discipline
du nombre total d’étudiants par niveau, par sexe et du total global (cf. Tableau 6).
c) Description du tableau de données
Nos données sont répertoriées dans un tableau de contingence à 10 lignes et 9
colonnes dont :
▪ Les lignes sont ventilées par les disciplines
▪ Et les colonnes par les 6 cursus selon le sexe et de nombre total d’étudiant
par niveau
▪ Et à l’intersection de la ligne i et de la colonne j se trouve le nombre d’étudiant
en niveau j et en filière i.
14
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
d) Présentation des données
Les données utilisées pour faire notre AFC se présentent dans le tableau de
contingence suivant :
2. Statistiques descriptives
4% Pluri-lettres-langues-sciences
21% humaines
9% Sciences fondamentales et
10% applications
Sciences de la nature et de la vie
15
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
politiques,15% sont en sciences de la nature et de la vie,13% sont en sciences
économiques et gestion,10% sont en langues,9% sont en lettres, sciences du
langage et arts,7% sont en Administration économique et sociale, et enfin ceux
des filières suivantes sont peu représentés : sciences et techniques des activités
physiques et sportives (3%) et pluri-lettres-langues-sciences (1%).
600000
NOMBRE D'ÉTUDIANT
400000
200000
0
Licence-F Licence-H Master-F Master-H Doctorat-F Doctorat- Licence Master Doctorat
DIPLÔME H
Droit, sciences politiques
Sciences economiques, gestion
Administration economique et sociale
Lettres, sciences du langage, arts
Langues
Sciences humaines et sociales
Pluri-lettres-langues-sciences humaines
16
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
3. Interprétation des résultats
a) Test du Khi-2
17
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
Licence-F Licence-H Master-F Master-H Doctorat-F Doctorat-H Licence Master Doctorat
Droit, sciences politiques 0,18 0,15 0,23 0,15 0,13 0,13 0,17 0,20 0,13
Sciences economiques, gestion 0,10 0,15 0,16 0,19 0,07 0,07 0,12 0,17 0,07
Administration economique et sociale 0,05 0,05 0,02 0,02 0,00 0,00 0,05 0,02 0,00
Lettres, sciences du langage, arts 0,13 0,07 0,10 0,04 0,15 0,07 0,10 0,07 0,11
Langues 0,16 0,08 0,07 0,03 0,06 0,03 0,13 0,05 0,04
Sciences humaines et sociales 0,24 0,16 0,24 0,14 0,26 0,20 0,21 0,19 0,23
Pluri-lettres-langues-sciences humaines 0,00 0,00 0,01 0,01 0,00 0,00 0,00 0,01 0,00
Sciences fondamentales et applications 0,06 0,22 0,09 0,34 0,14 0,34 0,12 0,20 0,25
Sciences de la nature et de la vie 0,06 0,06 0,06 0,06 0,19 0,15 0,06 0,06 0,17
Sciences et techniques des activites physiques et sportives 0,02 0,07 0,01 0,03 0,01 0,01 0,04 0,02 0,01
Moyenne 0,10 0,10 0,10 0,10 0,10 0,10 0,10 0,10 0,10
Pour le choix du nombre d’axe factoriel, nous allons utiliser la méthode de la part
d’inertie et celle du coude.
Au regard du Graphique 6, d’une part on observe qu’avec seulement trois
premiers axes factoriels on a plus de 90% de l’inertie. Donc les trois (3) axes
factoriels portent une très grande partie de l’information. Ainsi d’après la règle de
la part d’inertie on retient les trois (3) premiers axes. De plus, on observe que le
coude qui correspond à une forte diminution d’inertie se situe de la troisième
valeur propre. Donc la règle du coude nous permet de retenir aussi les trois (3)
premiers axes factoriels. Ainsi la méthode du coude vient confirmer le résultat
obtenu en utilisant la méthode d’inertie.
18
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
Source : sortie sous R élaborée par auteurs
19
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
Le graphique 8 montre que les nuages sont bien représentés sauf les nuages des
modalités colonne 1 et 7 qui sont très proche de l’origine, on observe que les
femmes sont pour la plupart inscrites en licence Lettre, sciences du langage et en
master pluri-lettres-langues-sciences humaines et sciences de la nature et de la vie
par contre les hommes sont en master dans les sciences fondamentales et
applications.
Conclusion
Cette analyse nous permis de faire quelques rapprochements entre la filière
de formation et le niveau par sexe. Nous avons noté que la proximité entre les
filières et les niveaux par sexe est expliquée par l’effectif des étudiants dans ces
filières et l’effectif des étudiants dans les niveaux d’études par sexe. Nous avons
réussi à faire un rapprochement entre trois filières de formation et 2 niveaux de
formation par sexe. Mais rappelons que la liaison entre les deux variables est
faible.
20
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
21
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
CHAPITRE 3 ANALYSE DES CORRESPONDANCES
MULTIPLES
Introduction
Le jeu de données sur lequel porte notre étude est un ensemble de données
constitué de dix (10) variables, résumés dans les tableaux ci-dessous :
22
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
Tableau 9 : Présentation des variables
Variables signification
Marche Indique la façon dont le client se déplace au quotidien
Assurance indique le type d'assurance dont bénéfice le client
Endettement indique le type d'endettement d client
Famille indique la situation matrimoniale du client
Enfants indique le nombre d'enfant du client
Logement indique si le client possède le logement dans lequel il vit
Profession indique le rang que le client occupe au sein de l'entreprise dans laquelle il travail
Age indique l’Age du client
intitulé indique si le client est un monsieur ou une dame
impayé indique si le client a des dettes impayées à la banque
Source : sortie sous Excel élaborée par auteurs
L’objectif de cette étude est de ressortir le profil ou les caractéristiques des clients
ayant pris des crédits à la Kmer Bank. Par la suite, ces résultats pourront être
utilisés afin détecter les créanciers douteux de la banque, et permettre à l’avenir
d’éviter l’accès au crédit à des clients présentant un certain profil.
Plus spécifiquement, notre travail visera à répondre à la question suivante :
- Quel est le profil du client le plus enclin à rembourser son crédit ?
- Quels sont les clients dont le crédit peut être qualifié de douteux ?
- Quelles politiques la banque peut-elle mettre en œuvre pour encourager
le remboursement des dettes ou empêcher la survenue des clients
douteux
3. Statistiques descriptives
Les variables de notre base étant qualitatives, il sera question de présenter les
effectifs et les fréquences des variables. Le tableau ci-dessous :
23
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
Tableau 10: Statistiques descriptives
Variables Modalités Effectifs Fréquence Variables Modalités Effectifs Fréquence
End_1 18 27,27% Accedant a la propriete 6 9,09%
End_2 15 22,73% Locataire 23 34,85%
Endettement Endettement
End_3 19 28,79% Loge par la famille 6 9,09%
End_4 14 21,21% Loge par l'employeur 3 4,55%
Mobilier / Ameublement 17 25,76% Proprietaire 28 42,42%
Moto 8 12,12% Cadre moyen 17 25,76%
Marche Renovation 18 27,27% Cadre sup. 8 12,12%
Marche
Scooter 6 9,09% Ouvrier non qualifie 11 16,67%
Voiture 17 25,76% Ouvrier qualifie 18 27,27%
AID 31 46,97% Retraite 12 18,18%
AID + Chomage 13 19,70% MLLE 5 7,58%
Assurance
Sans Assurance 12 18,18% Assurance MME 8 12,12%
Senior 10 15,15% MR 53 80,30%
Celibataire 17 25,76% Imp_0 42 63,64%
Impayé
Divorce 5 7,58% Imp_1 24 36,36%
Famille Marie 25 37,88% Au moins un 1 27 40,91%
Enfants
Union libre 13 19,70% Sans Enfants 39 59,09%
Veuf 6 9,09%
24
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
Corrélations entre les variables
Assuranc Endett Famill Logeme Professi
Marche Impaye e ement e Enfants nt on Intitule Age2
Marche 1,000 0,721 0,598 0,700 0,660 0,685 0,602 0,670 0,765 0,678
Impaye 0,721 1,000 0,638 0,787 0,678 0,804 0,679 0,695 0,822 0,735
Assurance 0,598 0,638 1,000 0,502 0,685 0,819 0,748 0,801 0,721 0,822
Endettement 0,700 0,787 0,502 1,000 0,746 0,602 0,562 0,591 0,786 0,626
Famille 0,660 0,678 0,685 0,746 1,000 0,692 0,700 0,732 0,780 0,742
Enfants 0,685 0,804 0,819 0,602 0,692 1,000 0,768 0,797 0,847 0,819
Logement 0,602 0,679 0,748 0,562 0,700 0,768 1,000 0,720 0,815 0,651
Profession 0,670 0,695 0,801 0,591 0,732 0,797 0,720 1,000 0,784 0,862
Intitule 0,765 0,822 0,721 0,786 0,780 0,847 0,815 0,784 1,000 0,736
Age2 0,678 0,735 0,822 0,626 0,742 0,819 0,651 0,862 0,736 1,000
Valeur propre 7,490 0,753 0,415 0,378 0,308 0,191 0,157 0,141 0,101 0,066
Variance représentée
Alpha de Total (Valeur
Dimension Cronbach propre) Inertie % de la variance
1 1,000 10,000 1,000 100,000
2 ,854 4,317 ,432 43,174
Total 14,317 1,432
25
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
L’on peut voir grâce au tableau précèdent, que la moyenne des alphas de
Cronbach est de 0,956. Étant supérieur à 0,7, il est acceptable, il est une mesure
de la corrélation entre toutes les variables de notre jeu de données. Et les
résultats issus de notre analyse des Correspondances Multiples.
𝐾
𝐼= −1
𝑃
Notre inertie totale est donc égale à 3. Toutefois cette valeur n’est pas
intéressante. Nous appuyons notre choix de la dimension du sous espace de
projection sur l’ajustement des parts d’inertie des axes factoriels dont les valeurs
propres associées sont supérieures à 0,2. Pour ce faire nous recalculons lesdites
valeurs propres par la formule proposée par Benzecri.
𝑃 1
β′ = ( )2 ∗ (𝛽 − )2 Avec P la valeur propre supérieure à 1/𝑃 et 𝑃 le nombre
𝑃−1 𝑃
de variables.
26
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
Source : Sortie SPSS à partir des données de la Kmer Bank
27
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
Au regard du Graphique précédent, d'une part on observe qu’avec
seulement deux (2) premiers axes factoriels on a plus de 78% d’inertie. Donc les
deux (2) premiers axes factoriels portent une très grande partie de l'information.
Ainsi d'après la règle de la part d’inertie on retient les deux (2) premiers axes
factoriels. D'autre part, on observe que le coude qui correspond a une forte
diminution d'inertie se situe au niveau de la deuxième valeur propre. Donc la
règle du coude nous permet de retenir aussi deux (2) premiers axes factoriels.
Ainsi la méthode du coude vient confirmer le résultat obtenu en utilisant la
méthode de la part d’inertie.
6. MESURE DE LA DISCRIMINATION
L’analyse de la discrimination permet d’analyser les variables, afin de
déterminer comment ces dernières sont regroupées et discrimine les individus
de la population.
28
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
graphique 1 : Mesure de discrimination 1
29
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
le logement, la famille et l’endettement. Ces variables permettent
également de discriminer les clients de la banque, mais dans une moindre
mesure que celles du premier groupe. Ainsi, elles peuvent également
donner lieu à l’objet de critère de second rang lors du traitement des
demande de clients pour l’accès au crédit.
Enfin, le troisième regroupement, est celui des variables qui ne
discriminent quasiment pas les clients de la Kmer Bank, il s’agit de :
Intitulé, Enfant et Impaye. Ces variables corrélées entre elles, une
condition ou une politique d’accès aux crédits axés sur l’une d’entre elle
aurait un impact négligeable sur le nombre de crédit douteux accordés aux
clients.
30
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
Source : Sortie Python à partir des données de la Kmer Bank
On peut ressortir ici trois principaux profils de clients qui peuvent être
discriminé au moyen des variables retenu précédent : l’Age, la Profession
l’Assurance, la marche, le logement, la famille et l’endettement.
Le premier groupe, qui nous intéresse le plus, celui des clients favorables
au remboursement de leur crédit, du fait de leur proximité par rapport à la
modalité qui traduit le fait de ne pas avoir d’impayé. Sur la figure précédente, ce
profil est distingué par l’encadré vert. En nous référant aux résultats sur la
discrimination, on retient que les bons clients de l’entreprise (ceux qui sont
31
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
favorables au crédit) sont pour la plupart grand (âgée de plus de 50 ans, sont des
cadres moyens, ou supérieur, marié et roulant en moto ou en voiture et ayant
souscrit à une Assurance invalidité et Décès.
CONCLUSION
Parvenus au terme de projet sur l’analyse des correspondances multiples.
Il en ressort donc que ces méthodes viennent répondre à des problématiques
clairement posées. Nous avons abordé dans le cade de ce travail, la
problématique associée à l’analyse des données d’une banque afin de l’aider à
mieux cerner le profil de ses clients et d’accroitre la rentabilité de son service de
crédit. Il est à noter qu’aux sorties de ces travaux, nous avons donné des
éléments de réponses aux questions posées ; Il est important de noter que les
variables capitales lors de l’analyse d’un dossier de demande de crédit sont :
33
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)
l’Age, la Profession, l’Assurance la marche, le logement, la famille et
l’endettement.
34
ANALYSE MULTIDIMENSIONELLE DES DONNEES (ACP – AFC -ACM)