Académique Documents
Professionnel Documents
Culture Documents
Assistants de recherche
Faculté des Sciences Economiques et de Gestion
Université Evangélique en Afrique
Objectif :
L’objet de ce papier est d’une part d’identifier les principaux déterminants de défaut de
remboursement et sa probabilité d’autre part à la MECREUVIRA.
Méthodologie :
Après une revue de littérature sur les différents déterminants du défaut de remboursement ainsi
que sa probabilité, nous avons fait recours d’un coté à l’analyse discriminante linéaire pour
mettre en place une fonction score permettant de différencier les bons et les mauvais
emprunteurs et de l’autre coté à la régression logistique qui permet de dégager les
déterminants de défaut ainsi que sa probabilité de survenance.
Résultats :
- Les résultats du test de comparaison des moyennes des bons et mauvais emprunteurs
indiquent une différence significative entre eux.
- Le test de normalité de Shapiro-Wilk et celui d’égalité de la matrice des covariances
entre les deux groupes indiquent que les hypothèses d’application du credit scoring
sont valides pour nos données.
- La fonction discriminante établie est départ les différents test de validité est
significativement performante que le hasard pour reclasser correctement les emprunteurs.
- Le type de prêt accordé et l’activité de l’emprunteur influencent significativement le
défaut de remboursement.
- Le test LR permet de rejeter la nullité des coefficients du modèle logistique en faveur
d’une significativité globale.
Originalité :
Le présent est innovant car il s’agit d’un premier effort empirique dans la région qui essaie
de combiner à la fois les déterminants du risque de crédit et les possibilités de savoir qui est
bon ou mauvais emprunteur avant d’accorder le crédit.
1. INTRODUCTION
Ainsi, depuis les dernières décennies, des études ont été conduites et leurs les résultats
donnent la possibilité de réduire ledit risque à travers des outils statistiques qui permettent
d’identifier les déterminants du défaut de remboursement et d’en prévoir la probabilité de
survenance.
C’est sous cet angle que B. DIALLO (2006) développe un modèle de crédit scoring
pour une institution de microfinance au Mali. Utilisant un échantillon de 269 emprunteurs
individuels, l’auteur montre l’importance de la relation de long terme, du taux d’intérêt, des
Dans le même ordre d’idées, la présente étude vise à examiner les différents facteurs
explicatifs du défaut de remboursement du crédit et la prévision du risque de crédit lié à un
emprunteur, par deux types de méthodes, en l’occurrence l’analyse discriminante et la
régression logistique et ce à la MECRE/UVIRA.
Les questions principales suivantes guideront notre réflexion tout au long de ce travail :
Quelles sont les principaux déterminants du défaut de remboursement à la mutuelle d’épargne et
de crédit d’Uvira ? En plus, quelles sont les variables qui permettent de différencier les bons de
mauvais emprunteurs ? Eu égard aux questions posées précédemment dans notre problématique,
nous pouvons anticiper que les principaux déterminants de défaut de crédit à la MECRE/UVIRA
seraient le montant du crédit octroyé, l’ancienneté dans l’activité exercé, le niveau d’étude du
demandeur de crédit, le taux d’intérêt pratiqué, le degré de rationnement ; que le montant du
crédit demandé serait la principale variable pouvant discriminer les bons de mauvais
emprunteurs ;
Comme nous l’avons signalé dans les lignes précédentes, nous allons identifier
l’influence des caractéristiques des clients sur le défaut de crédit, la capacité et la qualification
Page 5 of 34
du client qui influent sur la décision d'octroi du crédit et la prédiction du risque de non
remboursement de crédits octroyé aux clients.
Il faut signaler que la présente étude s’inspire de l’étude menée par DIALLO (2006) au Mali
dans le secteur de Microfinance. En la différence de ce dernier, notre étude s’applique au
niveau local en dépit du fait que les variables utilisées sont similaires.
2. REVUE DE LA LITTERATURE
a. Revue de littérature théorique
a.1. Risque de Crédit
Un des premiers modèles de Credit Scoring dans un contexte africain fut développé par
Viganò pour la Caisse Nationale du Crédit Agricole (CNCA) du Burkina Faso (Viganò, 1993).
En faisant usage d’un échantillon plus important, Schreiner (2004) a développé un modèle de
Scoring pour une IMF bolivienne.
A en croire DIALLO(2006), très peu d’études ont été menées sur le Scoring dans le
domaine de la micro-finance dans les pays en développement. L’objectif principal de cette
recherche est de développer un modèle de Credit Scoring pour une institution de micro-finance à
la MECRE, en utilisant les crédits individuels.
Le Credit Scoring est le processus d’assignation d’une note (ou score) à un emprunteur
potentiel pour estimer la performance future de son prêt (Flaman, 1997).
Le Credit Scoring utilise des mesures quantitatives de performance et les caractéristiques des
prêts précédents pour prédire performance des prêts futurs avec des caractéristiques similaires.
Le Credit Scoring n’approuve, ni ne rejette une demande de prêt, il peut plutôt prédire la
probabilité d’occurrence de mauvaise performance (défaut) telle que définie par le préteur (Caire
et Kossmann, 2003).
Le Credit Scoring constitue un ensemble de modèles de décision et les techniques sous-jacentes
qui aident dans la décision d’octroi des crédits de consommation (Thomas et al. 2002).
En résumé, on peut dire que le Credit Scoring est outil de gestion de risques qui vise à
prédire la probabilité de défaut d’un nouveau prêt en utilisant les prêts précédents. Ainsi,
l’objet du Credit Scoring est de prédire le risque et non de l’expliquer; il est toutefois
important d’analyser les facteurs important permettant de discriminer entre bons et mauvais
prêts.
Plusieurs auteurs ont déjà travaillé sur l`application de la méthode de Credit Scoring,
pour les microfinances ainsi que pour les banques en Afrique.Voici dans les lignes qui suivent,
les principaux résultats obtenus à partir de leurs études :
Page 8 of 34
Hamadi Matoussi et al. (2004) dans une portant sur le risque de non remboursement des crédits
de gestion par une banque commerciale Tunisienne montre que , la maîtrise du risque de défaut
des crédits est devenue l'un des axes stratégiques majeurs de la gestion des organismes bancaires.
Son objectif était de comparer le pouvoir prédictif de deux méthodes d’analyse du Credit
Scoring pour la prévision du risque de défaut à savoir : la régression logistique et les réseaux de
neurones artificiels. Il a utilisé une base de données composée de 1435 dossiers de crédit
octroyés aux entreprises industrielles tunisiennes en 2003, 2004,2005 et 2006. Les résultats
montrent la supériorité des réseaux de neurones artificiels par rapport aux autres méthodes
classiques en matière de détresse financière des firmes emprunteuses. Dans ce sens, ils ont
obtenu un taux de bon classement global de 97% pour l’échantillon d’apprentissage et 89.9%
pour l’échantillon test.
3. METHODOLOGIE
Variables Définition
Age Age de l’emprunteur +
Sexe Sexe de l’emprunteur /
Exp Nombre d’année d’expérience dans l’activité -
Cont Année de contact avec la MECRE -
Md Montant du crédit demandé +/
Mr Montant de crédit reçu +/
Dera (Montant de prêt demandé-Montant de prêt réellement -
reçus) / Montant de prêt réellement reçu.
Ceci indique le degré de rationnement
Ec Le nombre de jours entre la date de demande du crédit et +
la date de réception du crédit
VGa Valeur estimée du bien donné en garantie -
Tx Taux d’intérêt +
Cf Montant de conditions financières +
Np Nombre de prêts reçus par le membre depuis son +/
Adhésion à la coopérative
2
Nous avons retenu la définition suivante de « bons » et « mauvais » : un bon client est celui ayant remboursé la
totalité du crédit demandé dans un délai de moins de 90 jours. Dans le cas contraire, le client est qualifié de
mauvais
Page 10 of 34
L’analyse discriminante est utile pour étudier des données lorsque la variable dépendante est
nominale et que les variables explicatives ou indépendantes sont quantitatives. Elle est connue
sous le nom d’analyse discriminante à deux classes, lorsque la variable dépendante possède deux
classes, elle est dite multiple dans le cas où au il ya moins trois classes.
L’analyse factorielle discriminante ou analyse discriminante est une technique statistique qui
vise à décrire, expliquer et prédire l’appartenance à des groupes prédéfinis (classes, modalités de
la variable à prédire, …) d’un ensemble d’observations (individus, exemples, …) à partir d’une
série de variables prédictives (descripteurs, variables exogènes, …).
1. La formulation du problème
En fin, il a été suggéré que la validation de la fonction discriminante devrait être menée à
plusieurs reprises. A chaque fois, l’échantillon devrait être fractionné entre les deux parties
d’analyse et de validation, la fonction discriminante estimée est l’analyse de la validation menée.
L’évaluation de la validation devrait donc être fondée sur un certains nombres d’essais. Des
méthodes pour estimer les coefficients rigoureuses ont aussi été avancées.
Une fois que l’échantillon d’analyse a été identifié, il est possible d’estimer les coefficients de la
fonction discriminante. Deux grandes approches existent. La méthode directe réalise l’estimation
de la fonction discriminante de telle façon que toutes les variables explicatives soient incluses
simultanément, et que chaque variable indépendante le soit également, quel que soit son pouvoir
discriminant. Cette méthode est adaptée lorsque, à partie de recherches antérieures ou d’un
modèle théorique, le chargé d’études tient à ce que la discrimination soit fondée sur toutes les
variables explicatives. L’autre approche est l’analyse discriminante pas à pas, dans laquelle les
variables explicatives sont intégrées successivement, selon leur capacité de discrimination entre
les classes. Cette méthode convient dans le cas où le chargé d’études veut sélectionner un sous-
ensemble des variables explicatives à inclure dans la fonction discriminante. On peut obtenir une
appréciation intuitive des résultats de l’analyse grâce à l’examen des moyennes des catégories et
des écart-types.
Il n’y aurait aucun sens d’interpréter l’analyse si la fonction discriminante estimée n’était pas
statistiquement significative. L’hypothèse nulle que, dans la population, les moyennes de toutes
les fonctions discriminantes pour toutes les classes sont égales peut être statistiquement testée.
Sur SPSS, ce test s’appuie sur le λ de Wilks.
La validation croisée effectuée uniquement pour les individus participant à l’analyse. Chaque
individu est classé selon les fonctions déduites à partir des tous les autres individus excepté
celui- là.
Page 12 of 34
Si plusieurs fonctions sont testées simultanément (comme dans le cas de l’analyse discriminante
multiple), le λ de Wilks statistique est le produit du λ univarié pour chaque fonction. Le seuil de
signification est estimé à partir d’une transformation du khi-deux de la statistique. Aucun test de
signification n’est disponible sur munitab. Si l’hypothèse nulle est rejetée, ce qui indique une
discrimination significative, on peut alors procéder à l’interprétation des résultats.
L’interprétation des poids ou des coefficients discriminants est comparable à celle de l’analyse
par régression multiple ; la valeur du coefficient pour une variable particulière dépend des autres
variables incluses dans la fonction discriminante. Le signes des coefficients sont arbitraires et
indiquent les valeurs des variables qui aboutissent à des valeurs de fonctions grandes et petites et
les associent à des groupes particuliers. Il est aussi possible d’interpréter les résultats de l’analyse
discriminante en développant un profil type pour chaque classe, en d’autres termes, en la
décrivant selon les moyennes pour chaque variable explicative. Si les variables explicatives
importantes ont été identifiées, une comparaison des moyennes par classe sur ces variables peut
alors faciliter la compréhension des différences entre les groupes. Cependant, avant que les
conclusions ne puissent être interprétées de façon sûre, il est nécessaire de valider les résultats.
De nombreux logiciels, comme SPSS, offrent une option de validation croisée de classification
par élimination. Le modèle discriminant est réestimé autant de fois qu’il ya de personnes
interrogées dans l’échantillon. Chaque modèle réestimé exclut un individu de l’échantillon et sert
à prédire les données relatives à celui-ci. Quand on ne dispose pas d’un échantillon d’analyse
important, cette pratique donne une idée de la robustesse de l’estimation en utilisant chaque
individu, tour à tour, comme échantillon d’analyse.
Comme expliqué précédemment et lorsque c’est possible, les données doivent être divisées de
façon aléatoire en deux échantillons ; l’un, l’échantillon d’analyse, sert à estimer la fonction
discriminante ; l’autre sert à développer la matrice de confusion. Les coefficients discriminants,
estimés à partir de l’échantillon d’analyse, sont multipliés par les valeurs des variables
explicatives dans l’échantillon de validation pour générer des scores discriminants relatifs à ce
dernier. On affecte alors des classes aux individus à partir de leurs scores discriminants et d’une
Page 13 of 34
règle de décision adéquate. Par exemple dans l’analyse discriminante à deux classes, un individu
sera assigné à la classe dont le barycentre est le plus proche. Le pourcentage d’individus
correctement classés, peut alors être déterminé en additionnant les éléments de la diagonale,
divisés ensuite par le nombre total d’individus.
La plupart des programmes d’analyse discriminante estiment aussi une matrice de confusion à
partir de l’échantillon d’analyse. Parce qu’ils capitalisent sur les variations aléatoires dans les
données, de tels résultats sont toujours meilleurs que ceux de la classification par élimination ou
ceux de la classification obtenue sur l’échantillon de la validation.
Z= Score discriminant
Les valeurs Statistiques importantes associées à l’analyse discriminante sont les suivantes:
La corrélation canonique : Elle mesure l’étendue de l’association entre les scores discriminants
et les classes, entre la fonction discriminante unique et l’ensemble des variables dichotomiques
qui définissent la classe d’affectation.
Le barycentre : Barycentre ou centroïde, il représente les valeurs moyennes pour les scores
discriminants pour une classe particulière ? Il ya autant de barycentres qu’il ya des classes. Les
moyennes de toutes les fonctions pour une classe sont les barycentres de classe ;
Les scores discriminants : Les coefficients non standardisés sont multipliés par les valeurs des
variables. Ces produits sont additionnés puis ajoutés au terme constant pour obtenir les scores
discriminants.
La valeur propre : C’est le rapport entre la somme des carrés classe et des carrés interclasse,
pour chaque fonction discriminante. Les valeurs propres élevées correspondent à des fonctions
supérieures.
Les valeurs F et leur signification : Elles sont calculées à partir d’une ANOVA à un facteur,
avec pour variable nominale indépendante la variable de classement. Les variables explicatives
servent, l’une après l’autre, de variable dépendante dans l’analyse de la variance.
Les moyennes des classes et les écart-types : Ils sont calculés pour chaque variable explicative
et pour chaque classe.
Page 15 of 34
La matrice de corrélation intraclasses : Elle est réalisée à partir de la moyenne des matrices de
covariances pour chaque classe.
Les corrélations structurelles : Elles représentent les corrélations simples entre les variables
explicatives et la fonction discriminante.
La matrice de corrélation totale : Elle est obtenue lorsque les cas sont traités comme s’ils
provenaient d’un échantillon unique et que les corrélations sont calculées.
Le lambda de Wilks : Aussi appelé parfois statistique U, le λ de Wilks pour chaque variable
explicative est le rapport entre la somme des carrés intraclasses et la somme des carrés totales. Sa
valeur vraie entre 0 et 1. Des valeurs élevées de λ (proches de 1) indiquent que les moyennes des
classes ne semblent pas être différentes, alors que les valeurs faibles (proches de 0) indiquent
qu’elles semblent l’être.
Les hypothèses de l’analyse discriminante sont que chaque groupe est un échantillon extrait
d’une population multivariée normale et que toutes les populations ont la même matrice de
covariance. Le rôle de ces hypothèses ainsi que ces valeurs statistiques sont éclaircis lorsqu’on
étudie la méthode par laquelle on mène une analyse discriminante.
B. Régression logistique
La régression logistique est une technique statistique qui a pour objectif, à partir d'un
fichier d'observations, de produire un modèle permettant de prédire les valeurs prises par une
variable catégorielle, le plus souvent binaire, à partir d'une série de variables explicatives
continues et/ou catégorielles. La régression logistique recourt à l'approche du Maximum de
Page 16 of 34
Vraisemblance pour estimer les paramètres du modèle. Le terme d'erreur est supposé suivre une
distribution logistique.
Selon Hayden et Porath (2006), cette technique est intéressante puisqu'elle a l'avantage
d'être facile à utiliser et à comprendre. Elle comporte cependant deux problèmes majeurs. Le
premier concerne la variable expliquée qui est calculée. Comme la variable dépendante
recherchée est une probabilité, sa valeur doit être comprise entre 0 et 1. Lorsque la régression
linéaire est utilisée, les valeurs calculées pourraient être inférieures à 0 ou supérieures à 1. Et le
deuxième problème majeur?
Le modèle est donc constitué par une variable dépendante dichotomique (binaire) :
Soit Y,la variable remboursement du crédit.
Y=1 si l’emprunteur ne fait pas défaut, s’il rembourse le crédit en totalité et dans le délai(moins
de 30 jours pour notre cas) ;
Y= 0 si l’emprunteur fait défaut.
Pour traiter ce genre de modèle, l’estimation linéaire n’est pas appropriée (Doucouré, 2008 ; cité
par BAHATI N., 2011)dans la mesure où les valeurs prédites peuvent être en dessous de 0 et au
dessus de 1, ou comprises entre les deux (Kpodar, 2007 cité par BAHATI, 2011). En d’autres
termes, les informations relatives à ce type de choix ne peuvent pas être spontanément
ordonnées.
Dans la pratique, deux approches sont souvent utilisées pour croiser les réalisations de la
variable binaire (notée généralement par Y) avec celles d’un certain nombre de variables
explicatives Xjdont les réalisations peuvent être indifféremment de natures qualitative ou
quantitative : les modèles Logit et Probit. On suppose, à travers ces approches, que les valeurs
prises par les variables explicatives déterminent (à un alea près) celles d’une variable latente
∗
(non observable) qu’on peut interpréter comme une propension à engendrer un événement de
type Yi = 1 :
Page 17 of 34
∗
= �′ +�
où β est un vecteur de paramètres associé au vecteur de variables explicatives X.
On suppose en outre que cet événement ou choix serait observé sous un certain seuil tel que Yi =
1 si y* > 0 etYi = 0 si y* < 0. En d’autres termes, ces approches ne modélisent pas la variable
dépendante elle-même, mais plutôt la probabilité qu’elle prenne la valeur 1 ou 0(ici la probabilité
que le client rembourse ou fasse défaut). On en déduit ainsi :
Pr = =� �
Pr = = −� �
La différence entre les deux types d’approches (logit et probit) dépend de la forme de la fonction
de répartition F et/ou loi de répartition du terme de l’erreur.
Le modèle Logit est choisi lorsque la fonction de répartition F est une loi logistique. Dans ce
cas, la probabilité Pi est définie de la manière suivante :
��′ �
′ ′
=� � = = =⋀ �
��′ � −��′ �
+ +
′
′ ′ � −�� �
avec ⋀ � = −�′ �
, la fonction de répartition et � = ′ 2 , la fonction de densité.
+� � ( +� −�� � )
La modèle Probit est choisi lorsque la fonction de répartition F est une loi normale centrée et
réduite. Dans ce cas, la probabilité Pi est définie de la manière suivante :
��′ �
′ −� 2⁄ ′
=� � =∫ �=Φ �
−∞ √ �
La fonction de densité de la loi normale centrée réduite N(0,1) est notée :
′ −� 2⁄
� � =
√ �
Toutefois, ces deux modèles sont basés sur une même méthode d’estimation, à savoir
l’Estimateur du maximum de vraisemblance. En outre, leurs résultats sont souvent très proches3,
sauf dans quelques cas, notamment si l’échantillon contient très peu d’observations telles que
Y=1, ou très peu d’observations telles que Y =0.(BAHATI N., 2011).
3
Voir notamment Cadoret et alii (2004 ; p. 377) qui l’ont vérifié par une démonstration mathématique et graphique.
Page 18 of 34
Pour notre part, nous optons pour une méthode d’estimation fondée sur le modèle Probit, car on
suppose que la fonction de répartition est une loi normale en raison de la taille relativement plus
grande de l'échantillon.
Afin d’évaluer le risque de défaut, nous ferons recours à la régression logistique. Le
modèle utilisé est spécifié de la façon suivante :
Log p
0 1 Ag 2 Exp 3Cont 4 Md 5 Mr 6 Dera
1 p
7 Ec 8Tx 9 Cf 10 Np 11VGa
4. RESULTATS ET DISCUSSIONS
L’objectif principal de cette recherche est de développer un modèle statistique qui puisse
permettre de distinguer les bons emprunteurs des mauvais. Une des premières étapes est donc de
définir ce que nous nous entendons par bons et mauvais emprunteurs. Un emprunteur est
considéré comme bon s’il rembourse (ou a toujours remboursé) correctement son prêt et n’a
jamais été en retard de paiement pour trente (30) jours ou plus. Un mauvais emprunteur par
contre est un emprunteur qui a connu au moins une fois un retard dans le remboursement de son
prêt pour 30 jours ou plus. Ces définitions peuvent toutefois varier d’une institution à une autre
(Comité de Bâle cité par B. DIALLO, 2006).
C’est cette définition que nous avons retenu pour séparer les bons de mauvais
emprunteurs lors de l’encodage.
Page 19 of 34
Tableau 4.1. Statistiques descriptives pour bons et mauvais emprunteurs prix séparément
Pour les mauvais emprunteurs, l’âge moyen d’un demandeur de crédit est de 33,72 ans.
Pour les bons emprunteurs, il est de 40,3 ans. L’âge moyen des deux groupes est de 38 ans.
Les mauvais emprunteurs ont en moyenne 4,8 ans d’expérience dans leurs professions, les bons
emprunteurs ont en moyenne 8 ans d’expérience. L’ancienneté dans le métier exercé est en
moyenne de 8 ans.
Les bons et les mauvais emprunteurs sont entrés en contact avec la banque en 2008.
Quant au montant du crédit demandé, il est en moyenne de 1180$ pour les mauvais emprunteurs,
de 1578 $ pour les bons emprunteurs. Pour les deux groupes, il est de 1472$.
Le montant du crédit reçu est en moyenne de 1123$ pour les mauvais emprunteurs et de 1337$
pour les bons emprunteurs. Il est en moyenne de 1240$ pour les deux groupes.
Page 20 of 34
Le degré de rationnement les mauvais et les bons emprunteurs s’élève respectivement à 0,32 et à
0,202. En moyenne, il est de 0,234 pour les deux groupes.
Le nombre de jours séparant la date de demande de prêt et la date de réception du prêt est en
moyenne de 12,64 pour les mauvais emprunteurs et de 18,37 pour les bons
emprunteurs, et de 16,8 jours en moyenne pour les deux groupes. Le taux d’intérêt est presque le
même pour les bons et mauvais emprunteurs. Il est moyenne de 2,87% pour les deux groupes.
Les conditions financières s’élèvent en moyenne pour les mauvais emprunteurs à 32,48$ , pour
les bons emprunteurs à 37,36$. Le nombre de prêt déjà reçu est de 1,68 pour les mauvais
emprunteurs et de 2 pour les bons emprunteurs. La moyenne intra groupe est de 1,9. Enfin, la
valeur du bien donné en garantie est respectivement de 4 444 $ et de 7765$ pour les mauvais et
les bons emprunteurs. Remarquons en grosso modo que pour toutes les variables les moyennes
de bons emprunteurs sont supérieures à celles de mauvais emprunteurs
Tableau 4.2. Tests d'égalité des moyennes des groupes
Lambda de Wilks F ddl1 ddl2 Signification
4
Significatif au seuil de 5%
5
Significatif au seuil de 10%
Page 22 of 34
La probabilité critique (ici 0,3796) supérieure à 0,05 n’indique pas de liaison significative
entre le défaut de remboursement et le sexe à la MECRE UVIRA. Le sexe n’influence donc pas
le défaut de remboursement. Ce résultat est différent de celui de certaines recherches précédentes
qui ont montré que les femmes représentent un meilleur risque de crédit que les hommes
notamment dans le contexte africain (Viganò, 1993).
Il y a une liaison significative entre le défaut de remboursement et la profession du
demandeur de crédit (p-value inférieure à 0,01).
La liaison entre le risque défaut de crédit et le type de prêt accordé (prêt à la production
ou à la consommation) n’est pas significative. Cette variable influence donc faiblement le
risque de défaut.
Par objet du prêt, on entend ici l’activité dans laquelle le demandeur du crédit a investi le
montant demandé. Ces résultats ne nous montrent pas une dépendance significative entre
l’activité exercée par le demandeur de crédit et le défaut de crédit.
Point de Point de
coupure 4% coupure 5%
Pourcentage de bonnes prédictions 78,7% 79,8 %
Pourcentage de mauvaises prédictions 21,3% 20,2 %
Pourcentage de bonnes prédiction pour 79, 5% 79, 5%
les bons emprunteurs
Pourcentage de bonnes prédiction pour 43,5% 43,5%
les mauvais emprunteurs
Au point de coupure de 0,5 ; Le modèle prédit correctement à 79,8% des cas correctement. Une fixation
plus conservatrice du point de coupure de 0.5 à 0.4 n’améliore pas le pouvoir de prédiction sur les
mauvais prêts. Elle affecte toutefois la performance globale de prédiction du modèle (79,8% à 78,7%).
-2log-
Etape vraisemblance R-deux de Cox &Snell R-deux de Nagelkerke
Les pseudo-R2(de Cox et Snell) indiquent que le défaut de crédit est expliqué à 20, 3% et à
29,5% par les variables du modèle.
Tableau 4.7. Testde Hosmer-Lemeshow
1 10,109 8 0,257
L’utilisateur aura le choix entre la fonction discriminante (une seule fonction) et les
fonctions de classement (dans notre cas : deux fonctions). Le traitement de notre base des
données par le biais du logiciel SPSS16 nous a permis d’identifier la fonction score suivante
Tableau 4.8. Coefficients des fonctions discriminantes canoniques standardisés
Fonction non
Fonction standardisée standardisé
1 1
Nombre de jour entre les dates de demande et de réception crédit (Ec) 0,433 0,025
Contant 431,88
L’affectation aux groupes se fera en fonction des centroides de ces derniers, c'est-à-dire
par comparaison avec un score discriminant « moyen » pour chaque groupe. Ce score moyen est
calculé à partir de la fonction discriminante, où l’on remplace les valeurs individuelles par les
moyens des variables indépendantes pour le groupe dont on s’occupe.
Mais, il convient de signaler qu’il y a une zone d’incertitude qui se situe entre les deux centres
de gravité des deux groupes (-0,777 et 0,2822). Cette zone ne permet pas de trancher
définitivement sur la défaillance ou non des emprunteurs.
Concernant les fonctions de classement, le tableau ci-après donne les coefficients de ces deux
fonctions fournis par le traitement statistique. Ces coefficients permettent de classer les
emprunteurs dans les classes.
Bon emprunteur 24 45 69
pourcentage d’individus correctement classées est significativement plus important que celui
donné par un choix aléatoire. La statistique calculée suit une loi de Khi-deux (χ2) à 1 degré de
liberté.
L’hypothèse nulle est l’égalité des deux valeurs, c'est-à-dire le nombre d’individus bien classés
au hasard et le nombre d’individus classés par la fonction discriminante. L’expression de ce test
est la suivante :
[� − �� ∗ � ] [9 − ∗ ] 9 ∗ 9
� � � = = = = = ,
�∗ �− 9 ∗ 9 9
Avec
- n: le nombre des emprunteurs de l’échantillon;
- nc : le nombre des emprunteurs correctement classés ;
- p : le nombre de groupes.
La valeur critique du χ2 à 1 degré de liberté est égale à 3,84, l’hypothèse nulle est rejetée. La
fonction discriminante est donc significativement plus performante que le hasard pour reclasser
correctement les emprunteurs.
Tableau 4.12. Corrélation canonique
% de la
Fonction Valeur propre variance % cumulé Corrélation canonique
a
1 0,224 100,0 100,0 0,428
Source : Extrait de SPSS
Également, la valeur de Lambda de Wilks6 étant faible, et est égale à 0, 817 et donc plus
proche de 1 que de 0, avec un khi-deux ayant un degré de signification moins élevé au seuil de
5% (supérieur à 0,05). Cela veut dire qu’au niveau global, la différence des moyennes des
groupes est significative (cf. réponses trouvées à travers le test de Student).
Pour s’assurer que la fonction discriminante classifie bien les entreprises en sous-groupes,
on analyse la matrice de confusion qui regroupe les entreprises bien classées et les mal classées.
C’est le moyen le plus utilisé est aussi le plus « parlant ». La matrice de confusion de notre
fonction score se présente comme suit :
Au vu des résultats présentés dans les tableaux ci-haut, certaines variables influences
positivement et d’autres négativement le risque de défaut de crédit.
Les variables qui influencent positivement le défaut sont l’âge du demandeur de crédit,
le nombre d’années d’expérience dans l’activité exercée, le montant demandé du crédit, l’écart
entre la date de demande et de réception du crédit, les conditions financières, le nombre de
prêts.
Celles qui influencent négativement le défaut de paiement sont sont l’année de contact
avec la banque, le montant demandé, le degré de rationnement etle taux d’intérêt.
Passons dans les lignes qui suivent à une discussion de certaines de ces variables.
Le signe positif du coefficient de cette variable (temps d’attente) nous indique qu’un
emprunteur qui observe une période d’attente plus longue est, toutes choses restantes égales par
ailleurs, plus susceptible d’être un mauvais emprunteur.
Ces résultats semblent s’écarter de ceux trouvés par A. DIALLO(2006), pourquoi le
temps d’attente influence négativement la probabilité de défaut.
66
Lambda de Wilks est le rapport de la variation intra-groupes à la variation totale. La variation intra-groupes est,
pour chaque groupe, la somme des carrées des différences entre les scores discriminants individuels et le
centroïde du groupe
Page 30 of 34
Les résultats issus du modèle indiquent que le fait d’être rationné est positivement lié à la
probabilité de défaut. Plusieurs facteurs sont pris en compte dans la décision de rationnement
mais les éléments les plus déterminants demeurent le plus souvent la nature de l’activité à
fiancer, le niveau de revenus et de richesse qui détermine sa capacité de remboursement. Zeller
(1994) cité par Diallo(2006) a obtenu des résultats similaires en analysant les déterminants du
rationnement de crédit parmi les prêteurs informels et les groupes de crédit formels au
Madagascar.
Comme le note BALEMBA (2010), nombreux auteurs s’accordent sur le fait que les
conditions financières augmentent la probabilité de défaut. Ainsi, plus les conditions financières
élevées, plus lourdes deviennent les charges chez l’emprunteur et le risque de non
remboursement augmente. Cette réalité n’est pas contredite par nos résultats. Plus les conditions
financières sont élevées, plus grande est la probabilité de défaut.
Cet article s`est engagé dans une problématique cherchant à savoir les principaux
déterminants du défaut de remboursement à la MECRE/UVIRA, les variables qui permettent de
différencier les bons de mauvais emprunteurs, la prédiction du risque de non remboursement du
crédit octroyé.
En guise d’hypothèses nous avons présumé que les principaux déterminants de défaut
de crédit à la MECRE/UVIRA seraient le montant du crédit octroyé, l’ancienneté dans l’activité
exercé, le niveau d’étude du demandeur de crédit, le taux d’intérêt pratiqué, le degré de
rationnement ; le montant du crédit demandé seraient les principales variables pouvant
discriminer les bons de mauvais emprunteurs et par conséquent les déterminants de l’octroi de
crédit.
Sur le plan délimitation, ce papier a donné comme champ d`application la MECRE
UVIRA, au courant de l`année 2011 avec un échantillon de 100 emprunteurs individuels dont 94
demande ont été acceptées et 6 ont été refusées.
Afin de bien vérifier les différentes hypothèses émises, nous avons fait recours aux
différentes méthodes dont les principales sont le test de student pour la comparaison des
moyennes des variables pour les bons et les mauvais emprunteurs, le test de Khi-deux qui nous
aidé à rechercher la dépendance entre le défaut de remboursement et certaines variables
qualitatives; enfin et surtout l’analyse discriminante de Fisher et la régression logistiques qui
nous respectivement servi à trouver les fonctions qui nous permettent de séparer, différencier
les bons de mauvais emprunteur et à rechercher le probabilité de défaut associée à chaque
emprunteur.
Les résultats du test de Student nous ont montré une l’égalité des moyennes entre bons et
mauvais emprunteurs pour les variables suivantes : Montant du crédit reçu, degré de
rationnement, temps d’attente, taux d’intérêt, conditions financières, nombre de prêt déjà reçu,
valeur de la garantie. Ainsi, ces variables ne permettent pas de discriminer les bons de mauvais
emprunteur, car chaque variable est en moyenne égale pour les deux catégories.
Page 32 of 34
Par contre, une différence significative des moyennes pour les deux groupes a été
constatée pour les variables Age du demandeur de crédit, années d’expérience, année de contact
avec la banque et le montant du crédit demandé. Ces variables permettent de différencier les
bons de mauvais emprunteurs.
Le test de Khi-deux, se construisant à l’aide des variables discrètes, nous a aidé à
déterminer les variables dont dépend le défaut de remboursement. Il a été trouvé que les
variables qui influencent significativement le défaut de remboursement sont l’activité exercé et
le type de prêt. Cette première analyse, complétée avec celle de la régression logistique, nous a
permis de répondre à notre première question de départ qui cherchait à connaître les principaux
déterminants du défaut de remboursement du crédit.
L’analyse discriminante extraite de SPSS 16.0 nous a permis de mettre sur place un
premier modèle de distinction entre les bons et les mauvais emprunteurs. Dans ce modèle,
chaque emprunteur est classé bon ou mauvais selon que le score obtenu sur base de ses
caractéristiques est supérieur ou inférieur au score frontière. Une deuxième catégorie de modèles
a mis à notre dispositions une fonction score pour les bons et une autre pour les mauvais
emprunteurs. Dès lors, chaque emprunteur est classé dans la fonction où il a un score plus élevé.
Implications en termes de politique publique
Le présent travail n’est pas un simple exercice intellectuel. Ces résultats présentent une
importance dès lors qu’ils sont appliqués par la MECRE/UVIRA. En effet, les résultats de cette
recherche à la MECRE/UVIRA de prédire la probabilité de défaut de remboursement pour
tout demandeur de crédit ainsi sur base de la fonction score établie au moyen de la méthode
discriminante. Ainsi, il est possible pour cette institution de microfinance, toutes choses égales
par ailleurs de distinguer avec un faible risquer de se tromper les bons des mauvais
Page 33 of 34
Originalité
Perspectives de recherche
Enfin, nous pouvons clore notre travail en nous épargnant de toute affirmation selon
laquelle toute la matière en rapport avec notre thématique de recherche a été abordée dans la
globalité des aspects. C`est pourquoi, nous lançons un appel à tous les esprits scientifiques
désireux de travailler dans le même domaine de recherche de bien vouloir nous approfondir
cette étude en élargissant la taille de l’échantillon et en utilisant les données sur les
entreprises(les ratios) et non sur les personnes physiques scientifiques désireux de travailler dans
le même domaine de recherche de bien vouloir nous approfondir et nous corriger dans le but de
pouvoir perfectionner notre travail.
BIBLIOGRAPHIE
ARTICLES ET OUVRAGES
1. BARDOS M. (2001), Analyse discriminante, application au risque et scoring financier, Dunod
2. BOUBACAR DIALLO (2006), Un modèle de Credit Scoring pour une institution de micro-finance
africaine : le cas de nyesigiso au mali, Laboratoire d`Économie d`Orléans,.
Page 34 of 34
SITES CONSULTÉS
1. http:// www.lamicrofinance.org
2. http:// www.labanque.org