Les Determinants de La Probabilite Du de

Page 1 of 34
ANALYSE DES DÉTERMINANTS ET DE LA PROBABILITÉ DE

DÉFAUT DE REMBOURSEMENT DE CRÉDIT DANS LES IMF
D’UVIRA : CAS DE MECRE UVIRA
Paper submitted for consideration in the Bukavu Journal Of Economics

and Social Sciences
MATABARO BORAUZIMA Luc
MUGISHO MUNKWA Guershom
Assistants de recherche
Faculté des Sciences Economiques et de Gestion
Université Evangélique en Afrique
Soumis en octobre 2013

Page 2 of 34
Objectif :
L’objet de ce papier est d’une part d’identifier les principaux déterminants de défaut de
remboursement et sa probabilité d’autre part à la MECREUVIRA.
Méthodologie :
Après une revue de littérature sur les différents déterminants du défaut de remboursement ainsi
que sa probabilité, nous avons fait recours d’un coté à l’analyse discriminante linéaire pour
mettre en place une fonction score permettant de différencier les bons et les mauvais
emprunteurs et de l’autre coté à la régression logistique qui permet de dégager les
déterminants de défaut ainsi que sa probabilité de survenance.
Résultats :
- Les résultats du test de comparaison des moyennes des bons et mauvais emprunteurs
indiquent une différence significative entre eux.
- Le test de normalité de Shapiro-Wilk et celui d’égalité de la matrice des covariances
entre les deux groupes indiquent que les hypothèses d’application du credit scoring
sont valides pour nos données.
- La fonction discriminante établie est départ les différents test de validité est
significativement performante que le hasard pour reclasser correctement les emprunteurs.
- Le type de prêt accordé et l’activité de l’emprunteur influencent significativement le
défaut de remboursement.
- Le test LR permet de rejeter la nullité des coefficients du modèle logistique en faveur
d’une significativité globale.
Originalité :
Le présent est innovant car il s’agit d’un premier effort empirique dans la région qui essaie
de combiner à la fois les déterminants du risque de crédit et les possibilités de savoir qui est
bon ou mauvais emprunteur avant d’accorder le crédit.
Mots clés : Credit scoring, défaut de remboursement, analyse discriminante, risque de

crédit, emprunteur.
Page 3 of 34
1. INTRODUCTION
Les institutions de micro-finance(IMF) sont présentes dans le système financier pour

servir d’intermédiaires entre les fournisseurs de capitaux dits agents à capacité de financement
et les utilisateurs de ces capitaux dits agents a besoin de financement. En amont elles récoltent
les dépôts des particuliers et en aval elles les distribuent aux personnes qui désirent financer soit
leurs projets, soit financer leurs besoins en fonds de roulement etc. cette dualité dans le sens
d’agir, fait naître dans les activités des IMF une multitude de risques notamment le risque de
marché, le risque d’option, le risque de crédit, le risque opérationnel, etc.
La crise financière qui secoue le monde actuellement, notamment les défaillances

successives des grandes banques internationales (Lehman Brothers aux Etats-Unis par exemple)
ont remis sur le devant de la scène la problématique des risques bancaires dont le risque crédit
A. ELMMAHA (2009).
En plus, les implications de la crise financière et les conséquences des asymétries

d’information sont globales. Au niveau local, elle se manifeste par la baisse de la performance
des institutions de microfinance et les banques. Ainsi, par l’exemple, les états financiers de la
MECRE/UVIRA indiquent un accroissement significatif du taux de portefeuille à risque. ce
taux varie selon les statistiques entre 10 et 30%1.
Ainsi, depuis les dernières décennies, des études ont été conduites et leurs les résultats
donnent la possibilité de réduire ledit risque à travers des outils statistiques qui permettent
d’identifier les déterminants du défaut de remboursement et d’en prévoir la probabilité de
survenance.
C’est sous cet angle que B. DIALLO (2006) développe un modèle de crédit scoring
pour une institution de microfinance au Mali. Utilisant un échantillon de 269 emprunteurs
individuels, l’auteur montre l’importance de la relation de long terme, du taux d’intérêt, des
RAPPORT D’AUDIT FINANCIER MECRE/UVIRA,

1
Page 4 of 34
coûts des transactions et du rationnement dans la prédiction du défaut de remboursement. En

outre, le modèle mis en place affiche un pouvoir distinctif entre les bons et les mauvais
emprunteurs.
A ELHAMMA (2009) applique la méthode de crédit scoring à la Banque Populaire

de Rabat-Kénitra. En utilisant un échantillon de taille 46 clients et en suivant les différentes
étapes de la méthode, les résultats permettent de mettre en place une fonction score qui s’avère
être robuste pour distinguer les mauvais et les bons emprunteurs.
Par ailleurs, P. BOISSELIER et D. DUFOUR (2003) présente un article sur le

scoring et anticipation de défaillance des entreprises par l’approche de la régression
logistique. Appliquant une technique de régression logistique pour les travaux de la Banque
de France, pour les entreprises saines et faillies en 2002, ils trouvent des résultats significatifs
leur et proposent un modèle de prévision.
Dans le même ordre d’idées, la présente étude vise à examiner les différents facteurs
explicatifs du défaut de remboursement du crédit et la prévision du risque de crédit lié à un
emprunteur, par deux types de méthodes, en l’occurrence l’analyse discriminante et la
régression logistique et ce à la MECRE/UVIRA.
Les questions principales suivantes guideront notre réflexion tout au long de ce travail :
Quelles sont les principaux déterminants du défaut de remboursement à la mutuelle d’épargne et
de crédit d’Uvira ? En plus, quelles sont les variables qui permettent de différencier les bons de
mauvais emprunteurs ? Eu égard aux questions posées précédemment dans notre problématique,
nous pouvons anticiper que les principaux déterminants de défaut de crédit à la MECRE/UVIRA
seraient le montant du crédit octroyé, l’ancienneté dans l’activité exercé, le niveau d’étude du
demandeur de crédit, le taux d’intérêt pratiqué, le degré de rationnement ; que le montant du
crédit demandé serait la principale variable pouvant discriminer les bons de mauvais
emprunteurs ;
Comme nous l’avons signalé dans les lignes précédentes, nous allons identifier
l’influence des caractéristiques des clients sur le défaut de crédit, la capacité et la qualification
Page 5 of 34
du client qui influent sur la décision d'octroi du crédit et la prédiction du risque de non
remboursement de crédits octroyé aux clients.
Il faut signaler que la présente étude s’inspire de l’étude menée par DIALLO (2006) au Mali
dans le secteur de Microfinance. En la différence de ce dernier, notre étude s’applique au
niveau local en dépit du fait que les variables utilisées sont similaires.
Ce travail analyse les déterminants du défaut de remboursement et gestion de risque de crédit

au sein de la MECRE-UVIRA au courant de l’année 2010. La MECRE-UVIRA est située à
l’Est de la République Démocratique du Congo, dans la province du Sud-Kivu, dans le territoire
dÙVIRA, Avenue Patrice Emery Lumumba à MULONGWEen face de shop VODACOM.
Du point de vue de l’architecture, ce travail comprend, introduction et conclusion mises à

part, une revue de littérature qui présente à la fois une approche théorique et empirique
renchérissant le travail, une partie méthodologique qui permet de comprendre la démarche
scientifique utilisée pour corroborer les hypothèses émises, et enfin une partie sur les résultats
et la discussion qui permet confronter nos résultats à ceux des travaux antérieurs afin d’en
dégager des conclusions cohérentes.
2. REVUE DE LA LITTERATURE
a. Revue de littérature théorique
a.1. Risque de Crédit
Plusieurs auteurs définissent le risque de crédit différemment.

Pour FAYE(1993), le risque de crédit est défini comme étant le risque de perdre tout ou une
partie des créances au cas où l’emprunteur n’aurait plus à l’échéance la volonté ou la possibilité
d’honorer ses engagements.
Pour DEMAZY(2000), le risque de crédit est le risque auquel est exposée une
institution de crédit dans le cas où un emprunteur se relèverait incapable de respecter ses
engagements. C’est- à dire le risque de non remboursement de la créance ou de non paiement
des intérêts de la créance. Ce risque renvoie au changement de la valeur du portefeuille de
Page 6 of 34
crédit résultant de l’incapacité réelle ou perçue de l’emprunteur à respecter tout ou partie du

contrat envers le prêteur.
Pour CAMARA(2006), le risque de crédit se définit comme la probabilité de non-

paiement du crédit octroyé à un client ou membre de l’IMF pour une raison quelconque.
C’est donc le risque de non remboursement des crédits des IMF.
Quant à DESMICHT(2004), il définit le risque de crédit comme étant le risque de
perte en cas de défaillance de l’emprunteur. Il s’agit du risque d’impayé ou du risque de
défaut.
Le risque de crédit est le plus connu et constitue la plus grave des vulnérabilités d’une
institution de microfinance. C’est la détérioration de la qualité du portefeuille crédit qui cause
les pertes et créée des charges énormes en gestion de la défaillance. Ce risque aussi connue
comme le risque de défaillance, est lié à l’incapacité du client de respecter les termes du
contrat de prêt.
Ainsi, CARE International(2001), définit le risque de crédit comme étant la détérioration

de la qualité du portefeuille de crédit qui cause les pertes et des charges énormes en
gestion de la défaillance, est lié à l’incapacité du client ou membre de l’IMF pour une
raison quelconque .C’est donc le non remboursement des crédits des IMF.
Le Credit Scoring peut être globalement défini comme un ensemble de modèles de

décision et les techniques sous-jacentes qui aident les prêteurs dans la décision d’octroi des
crédits de consommation. Il est principalement utilisé par les banques formelles des pays
développés pour prédire la probabilité de défaut sur les crédits individuels de consommation.
Même si l’application du Credit Scoring est vieille de plus de soixante ans, il convient de
signaler qu’il est relativement nouveau pour la micro-finance notamment dans les pays en
développement (Schreiner, 2004). Ceci peut s’expliquer par plusieurs raisons dont la nécessite de
disposer de données en quantité suffisante et de bonne qualité, la technologie etc.
Page 7 of 34
Un des premiers modèles de Credit Scoring dans un contexte africain fut développé par
Viganò pour la Caisse Nationale du Crédit Agricole (CNCA) du Burkina Faso (Viganò, 1993).
En faisant usage d’un échantillon plus important, Schreiner (2004) a développé un modèle de
Scoring pour une IMF bolivienne.
A en croire DIALLO(2006), très peu d’études ont été menées sur le Scoring dans le
domaine de la micro-finance dans les pays en développement. L’objectif principal de cette
recherche est de développer un modèle de Credit Scoring pour une institution de micro-finance à
la MECRE, en utilisant les crédits individuels.
Le Credit Scoring est le processus d’assignation d’une note (ou score) à un emprunteur
potentiel pour estimer la performance future de son prêt (Flaman, 1997).
Le Credit Scoring utilise des mesures quantitatives de performance et les caractéristiques des
prêts précédents pour prédire performance des prêts futurs avec des caractéristiques similaires.
Le Credit Scoring n’approuve, ni ne rejette une demande de prêt, il peut plutôt prédire la
probabilité d’occurrence de mauvaise performance (défaut) telle que définie par le préteur (Caire
et Kossmann, 2003).
Le Credit Scoring constitue un ensemble de modèles de décision et les techniques sous-jacentes
qui aident dans la décision d’octroi des crédits de consommation (Thomas et al. 2002).
En résumé, on peut dire que le Credit Scoring est outil de gestion de risques qui vise à
prédire la probabilité de défaut d’un nouveau prêt en utilisant les prêts précédents. Ainsi,
l’objet du Credit Scoring est de prédire le risque et non de l’expliquer; il est toutefois
important d’analyser les facteurs important permettant de discriminer entre bons et mauvais
prêts.
b. Revue de littérature empirique
Plusieurs auteurs ont déjà travaillé sur làpplication de la méthode de Credit Scoring,
pour les microfinances ainsi que pour les banques en Afrique.Voici dans les lignes qui suivent,
les principaux résultats obtenus à partir de leurs études :
Page 8 of 34
Hamadi Matoussi et al. (2004) dans une portant sur le risque de non remboursement des crédits
de gestion par une banque commerciale Tunisienne montre que , la maîtrise du risque de défaut
des crédits est devenue l'un des axes stratégiques majeurs de la gestion des organismes bancaires.
Son objectif était de comparer le pouvoir prédictif de deux méthodes d’analyse du Credit
Scoring pour la prévision du risque de défaut à savoir : la régression logistique et les réseaux de
neurones artificiels. Il a utilisé une base de données composée de 1435 dossiers de crédit
octroyés aux entreprises industrielles tunisiennes en 2003, 2004,2005 et 2006. Les résultats
montrent la supériorité des réseaux de neurones artificiels par rapport aux autres méthodes
classiques en matière de détresse financière des firmes emprunteuses. Dans ce sens, ils ont
obtenu un taux de bon classement global de 97% pour l’échantillon d’apprentissage et 89.9%
pour l’échantillon test.
De plus Boubacar DIALLO (2006), développe un modèle de Crédit Scoring en utilisant

un échantillon de 269 emprunteurs individuels de l’institution de micro-finance Nyèsigiso au
Mali. Les résultats ont montré l’importance de la relation de long terme, du taux d’intérêt, des
coûts de transactions et du rationnement dans la prédiction du défaut de remboursement. Le
modèle qui a été développé à partir de la régression logistique et de l’analyse discriminante,
prédit correctement dans plus 70% des cas. L’analyse des cas de rejets a montré une certaine
cohérence entre les prédictions du modèle et les décisions de rejet de l’institution.
Aimé TCHUMKAM Césaire(2008) s'intéresse à la pertinence de traitement des dossiers (un

échantillon de 109 emprunteurs) à travers des outils statistiques et économétriques (test de khi
deux, analyse factorielle, analyse discriminante, régression logistique) tiré de la direction du
crédit et du contrôle des engagements (DCCE) de la banque permettant l'octroi des crédits aux
différents clients. Cela passe nécessairement par une étude du marché du crédit bancaire,
l'examen complet des informations financières du dossier de l'emprunteur, et des tests à
apprécier.
A ELHAMMA (2009) applique la méthode de crédit scoring à la Banque Populaire de

Rabat-Kénitra. En utilisant un échantillon de taille 46 clients et en suivant les différentes
étapes de la méthode, les résultats permettent de mettre en place une fonction score qui s’avère
être robuste pour distinguer les mauvais et les bons emprunteurs.
Page 9 of 34
3. METHODOLOGIE
3.1. Choix de la taille de l’échantillon
La population cible de l’étude était constituée par les clients de la MECRE/UVIRA.

L’étude n’a pas été menée sur tous les clients de la MECRE/UVIRA faute de l’accessibilité à toute la
base de données. Nous avons eu accès à uniquement 100 dossiers de demande de crédit(dont 94 dossiers
acceptés et 6 dossiers rejetés) sur les 400 enregistrés au courant de l’année. Parmi les 94 clients, 25 ont
fait défaut (mauvais clients) et 69 ont honoré leurs promesses(bon clients)2.
3.2. Définition des variables
Variables Définition
Age Age de l’emprunteur +
Sexe Sexe de l’emprunteur /
Exp Nombre d’année d’expérience dans l’activité -
Cont Année de contact avec la MECRE -
Md Montant du crédit demandé +/
Mr Montant de crédit reçu +/
Dera (Montant de prêt demandé-Montant de prêt réellement -
reçus) / Montant de prêt réellement reçu.
Ceci indique le degré de rationnement
Ec Le nombre de jours entre la date de demande du crédit et +
la date de réception du crédit
VGa Valeur estimée du bien donné en garantie -
Tx Taux d’intérêt +
Cf Montant de conditions financières +
Np Nombre de prêts reçus par le membre depuis son +/
Adhésion à la coopérative
2
Nous avons retenu la définition suivante de « bons » et « mauvais » : un bon client est celui ayant remboursé la
totalité du crédit demandé dans un délai de moins de 90 jours. Dans le cas contraire, le client est qualifié de
mauvais
Page 10 of 34
3.2. L’analyse discriminante
L’analyse discriminante est utile pour étudier des données lorsque la variable dépendante est
nominale et que les variables explicatives ou indépendantes sont quantitatives. Elle est connue
sous le nom d’analyse discriminante à deux classes, lorsque la variable dépendante possède deux
classes, elle est dite multiple dans le cas où au il ya moins trois classes.
L’analyse factorielle discriminante ou analyse discriminante est une technique statistique qui
vise à décrire, expliquer et prédire l’appartenance à des groupes prédéfinis (classes, modalités de
la variable à prédire, …) d’un ensemble d’observations (individus, exemples, …) à partir d’une
série de variables prédictives (descripteurs, variables exogènes, …).
Une analyse discriminante se déroule en cinq étapes suivantes :
1. La formulation du problème
La première étape consiste à formuler le problème en identifiant les objectifs, la variable

dépendante et les variables indépendantes. La variable dépendante doit comprendre deux ou plus
de deux classes mutuellement exclusives et collectivement exhaustives. Quand la variable
dépendante est échelonnée par intervalles, elle doit d’abord être convertie en classes.
Alternativement, il est possible de représenter graphiquement la variable dépendante et de former
des groupes égaux en taille en déterminant les bonnes frontières pour chaque classe. Les
variables explicatives doivent être sélectionnées à partir d’un modèle théorique ou de recherches
antérieures, ou, dans le cas d’une étude exploratoire, en se fondant sur le jugement du chargé
d’études.
L’étape suivante consiste à diviser l’échantillon en 2 parties. L’une, appelée échantillon

d’analyse ou d’estimation, est utilisée pour l’estimation de la fonction discriminante. L’autre,
appelé l’échantillon de contrôle est réservé pour la validation de la fonction discriminante.
Quand l’échantillon est assez grand ; il peut être divisé en deux moitiés, dont l’une sert
d’échantillon d’analyse et l’autre à la validation. Les rôles de deux moitiés sont en suite
interchangés et l’analyse est réitérée. Cette méthode appelée double validation croisée, est
analogue à celle proposée dans l’analyse par régression. Souvent, la distribution du nombre
d’individus dans l’échantillon d’analyse et de validation suit celle de l’échantillon total. Faute de
Page 11 of 34
l’accès à toute la base de données de la MECRE/UVIRA, nous n’avons pas pu constituer un

échantillon de validation.
En fin, il a été suggéré que la validation de la fonction discriminante devrait être menée à
plusieurs reprises. A chaque fois, l’échantillon devrait être fractionné entre les deux parties
d’analyse et de validation, la fonction discriminante estimée est l’analyse de la validation menée.
L’évaluation de la validation devrait donc être fondée sur un certains nombres d’essais. Des
méthodes pour estimer les coefficients rigoureuses ont aussi été avancées.
2. Estimation des coefficients de la fonction discriminante
Une fois que l’échantillon d’analyse a été identifié, il est possible d’estimer les coefficients de la
fonction discriminante. Deux grandes approches existent. La méthode directe réalise l’estimation
de la fonction discriminante de telle façon que toutes les variables explicatives soient incluses
simultanément, et que chaque variable indépendante le soit également, quel que soit son pouvoir
discriminant. Cette méthode est adaptée lorsque, à partie de recherches antérieures ou d’un
modèle théorique, le chargé d’études tient à ce que la discrimination soit fondée sur toutes les
variables explicatives. L’autre approche est l’analyse discriminante pas à pas, dans laquelle les
variables explicatives sont intégrées successivement, selon leur capacité de discrimination entre
les classes. Cette méthode convient dans le cas où le chargé d’études veut sélectionner un sous-
ensemble des variables explicatives à inclure dans la fonction discriminante. On peut obtenir une
appréciation intuitive des résultats de l’analyse grâce à l’examen des moyennes des catégories et
des écart-types.
3. La détermination de la signification de la fonction discriminante
Il n’y aurait aucun sens d’interpréter l’analyse si la fonction discriminante estimée n’était pas
statistiquement significative. L’hypothèse nulle que, dans la population, les moyennes de toutes
les fonctions discriminantes pour toutes les classes sont égales peut être statistiquement testée.
Sur SPSS, ce test s’appuie sur le λ de Wilks.
La validation croisée effectuée uniquement pour les individus participant à l’analyse. Chaque
individu est classé selon les fonctions déduites à partir des tous les autres individus excepté
celui- là.
Page 12 of 34
Si plusieurs fonctions sont testées simultanément (comme dans le cas de l’analyse discriminante
multiple), le λ de Wilks statistique est le produit du λ univarié pour chaque fonction. Le seuil de
signification est estimé à partir d’une transformation du khi-deux de la statistique. Aucun test de
signification n’est disponible sur munitab. Si l’hypothèse nulle est rejetée, ce qui indique une
discrimination significative, on peut alors procéder à l’interprétation des résultats.
4. L’interprétation des résultats
L’interprétation des poids ou des coefficients discriminants est comparable à celle de l’analyse
par régression multiple ; la valeur du coefficient pour une variable particulière dépend des autres
variables incluses dans la fonction discriminante. Le signes des coefficients sont arbitraires et
indiquent les valeurs des variables qui aboutissent à des valeurs de fonctions grandes et petites et
les associent à des groupes particuliers. Il est aussi possible d’interpréter les résultats de l’analyse
discriminante en développant un profil type pour chaque classe, en d’autres termes, en la
décrivant selon les moyennes pour chaque variable explicative. Si les variables explicatives
importantes ont été identifiées, une comparaison des moyennes par classe sur ces variables peut
alors faciliter la compréhension des différences entre les groupes. Cependant, avant que les
conclusions ne puissent être interprétées de façon sûre, il est nécessaire de valider les résultats.
5. L’évaluation de la validité de l’analyse discriminante
De nombreux logiciels, comme SPSS, offrent une option de validation croisée de classification
par élimination. Le modèle discriminant est réestimé autant de fois qu’il ya de personnes
interrogées dans l’échantillon. Chaque modèle réestimé exclut un individu de l’échantillon et sert
à prédire les données relatives à celui-ci. Quand on ne dispose pas d’un échantillon d’analyse
important, cette pratique donne une idée de la robustesse de l’estimation en utilisant chaque
individu, tour à tour, comme échantillon d’analyse.
Comme expliqué précédemment et lorsque c’est possible, les données doivent être divisées de
façon aléatoire en deux échantillons ; l’un, l’échantillon d’analyse, sert à estimer la fonction
discriminante ; l’autre sert à développer la matrice de confusion. Les coefficients discriminants,
estimés à partir de l’échantillon d’analyse, sont multipliés par les valeurs des variables
explicatives dans l’échantillon de validation pour générer des scores discriminants relatifs à ce
dernier. On affecte alors des classes aux individus à partir de leurs scores discriminants et d’une
Page 13 of 34
règle de décision adéquate. Par exemple dans l’analyse discriminante à deux classes, un individu
sera assigné à la classe dont le barycentre est le plus proche. Le pourcentage d’individus
correctement classés, peut alors être déterminé en additionnant les éléments de la diagonale,
divisés ensuite par le nombre total d’individus.
Il est utile de comparer le pourcentage d’individus correctement classés grâce à l’analyse

discriminante au pourcentage d’individus qui auraient été affectés aux classes par hasard. Quand
les classes sont de même taille, le pourcentage de classification aléatoire est 1, divisé par le
nombre de classes. Quelle amélioration doit-on attendre par rapport à une classification
aléatoire ? Il n’existe aucune règle générale, même si certains auteurs ont avancé que la précision
de la classification réalisée par l’analyse discriminante serait supérieure d’au moins 25% à celle
de la classification aléatoire.
La plupart des programmes d’analyse discriminante estiment aussi une matrice de confusion à
partir de l’échantillon d’analyse. Parce qu’ils capitalisent sur les variations aléatoires dans les
données, de tels résultats sont toujours meilleurs que ceux de la classification par élimination ou
ceux de la classification obtenue sur l’échantillon de la validation.
Le modèle utilisé a été emprunté à Boubacar Diallo(2006). Son modèle comprenait

seulement les variables : Nombre de jours entre la date de demande et de réception du prêt,
Nombre de prêts, FREQART( ratio valeur des conditions financières/Montant du prêt),
Dera(degré de rationnement) et le Taux d’intérêt.
Notre modèle de l’analyse discriminante est de la forme suivante :
Z   0  1 Ag   2 Exp   3Cont   4 Md   5 Mr   6 Dera

  7 Ec   8Tx   9 Cf  10 Np  11VGa
Z= Score discriminant
ß1… ß5 = poids ou coefficients discriminants
 Statistiques associées à l’analyse discriminante

Page 14 of 34
Les valeurs Statistiques importantes associées à l’analyse discriminante sont les suivantes:
La corrélation canonique : Elle mesure l’étendue de l’association entre les scores discriminants
et les classes, entre la fonction discriminante unique et l’ensemble des variables dichotomiques
qui définissent la classe d’affectation.
Le barycentre : Barycentre ou centroïde, il représente les valeurs moyennes pour les scores
discriminants pour une classe particulière ? Il ya autant de barycentres qu’il ya des classes. Les
moyennes de toutes les fonctions pour une classe sont les barycentres de classe ;
La matrice de confusion : Appelée aussi matrice de classification, la matrice de confusion

contient le nombre d’individus correctement et incorrectement classés. Les premiers apparaissent
sur la diagonale, puisque les classes prédites et les classes réelles sont les mêmes. Les seconds ne
se trouvent pas sur la diagonale puisqu’ils n’ont pas été classés correctement. La somme des
éléments de la diagonale divisée par le nombre total de cas donne le hit ratio, le pourcentage
d’individus bien classés.
Les coefficients de la fonction discriminante (non standardisés) : sont les coefficients

multiplicateurs des variables, quand elles sont données dans l’unité de mesure d’origine.
Les scores discriminants : Les coefficients non standardisés sont multipliés par les valeurs des
variables. Ces produits sont additionnés puis ajoutés au terme constant pour obtenir les scores
discriminants.
La valeur propre : C’est le rapport entre la somme des carrés classe et des carrés interclasse,
pour chaque fonction discriminante. Les valeurs propres élevées correspondent à des fonctions
supérieures.
Les valeurs F et leur signification : Elles sont calculées à partir d’une ANOVA à un facteur,
avec pour variable nominale indépendante la variable de classement. Les variables explicatives
servent, l’une après l’autre, de variable dépendante dans l’analyse de la variance.
Les moyennes des classes et les écart-types : Ils sont calculés pour chaque variable explicative
et pour chaque classe.
Page 15 of 34
La matrice de corrélation intraclasses : Elle est réalisée à partir de la moyenne des matrices de
covariances pour chaque classe.
Les coefficients standardisés de la fonction discriminante : Ce sont les coefficients

discriminants de la fonction. Ils sont utilisés comme facteurs multiplicateurs quand les variables
ont été standardisées à une moyenne de 0 et à une variance de 1.
Les corrélations structurelles : Elles représentent les corrélations simples entre les variables
explicatives et la fonction discriminante.
La matrice de corrélation totale : Elle est obtenue lorsque les cas sont traités comme s’ils
provenaient d’un échantillon unique et que les corrélations sont calculées.
Le lambda de Wilks : Aussi appelé parfois statistique U, le λ de Wilks pour chaque variable
explicative est le rapport entre la somme des carrés intraclasses et la somme des carrés totales. Sa
valeur vraie entre 0 et 1. Des valeurs élevées de λ (proches de 1) indiquent que les moyennes des
classes ne semblent pas être différentes, alors que les valeurs faibles (proches de 0) indiquent
qu’elles semblent l’être.
Les hypothèses de l’analyse discriminante sont que chaque groupe est un échantillon extrait
d’une population multivariée normale et que toutes les populations ont la même matrice de
covariance. Le rôle de ces hypothèses ainsi que ces valeurs statistiques sont éclaircis lorsqu’on
étudie la méthode par laquelle on mène une analyse discriminante.
B. Régression logistique
La régression logistique est une technique statistique qui a pour objectif, à partir d'un
fichier d'observations, de produire un modèle permettant de prédire les valeurs prises par une
variable catégorielle, le plus souvent binaire, à partir d'une série de variables explicatives
continues et/ou catégorielles. La régression logistique recourt à l'approche du Maximum de
Page 16 of 34
Vraisemblance pour estimer les paramètres du modèle. Le terme d'erreur est supposé suivre une
distribution logistique.
Selon Hayden et Porath (2006), cette technique est intéressante puisqu'elle a l'avantage
d'être facile à utiliser et à comprendre. Elle comporte cependant deux problèmes majeurs. Le
premier concerne la variable expliquée qui est calculée. Comme la variable dépendante
recherchée est une probabilité, sa valeur doit être comprise entre 0 et 1. Lorsque la régression
linéaire est utilisée, les valeurs calculées pourraient être inférieures à 0 ou supérieures à 1. Et le
deuxième problème majeur?
Le remboursement du crédit est un phénomène « discret » correspondant à deux modalités : (i)

soit l’emprunteurrembourse le crédit demandé ou (ii) soit l’emprunteur fait défaut. Ce processus
de choix de nature déterministe est guidé par un certain nombre de facteurs, notés variables
explicatives (PALMA et THISSE, cité par BAHATI N., 2011).
Le modèle est donc constitué par une variable dépendante dichotomique (binaire) :
Soit Y,la variable remboursement du crédit.
Y=1 si l’emprunteur ne fait pas défaut, s’il rembourse le crédit en totalité et dans le délai(moins
de 30 jours pour notre cas) ;
Y= 0 si l’emprunteur fait défaut.
Pour traiter ce genre de modèle, l’estimation linéaire n’est pas appropriée (Doucouré, 2008 ; cité
par BAHATI N., 2011)dans la mesure où les valeurs prédites peuvent être en dessous de 0 et au
dessus de 1, ou comprises entre les deux (Kpodar, 2007 cité par BAHATI, 2011). En d’autres
termes, les informations relatives à ce type de choix ne peuvent pas être spontanément
ordonnées.
Dans la pratique, deux approches sont souvent utilisées pour croiser les réalisations de la
variable binaire (notée généralement par Y) avec celles d’un certain nombre de variables
explicatives Xjdont les réalisations peuvent être indifféremment de natures qualitative ou
quantitative : les modèles Logit et Probit. On suppose, à travers ces approches, que les valeurs
prises par les variables explicatives déterminent (à un alea près) celles d’une variable latente
∗
(non observable) qu’on peut interpréter comme une propension à engendrer un événement de
type Yi = 1 :
Page 17 of 34
∗
= �′ +�
où β est un vecteur de paramètres associé au vecteur de variables explicatives X.
On suppose en outre que cet événement ou choix serait observé sous un certain seuil tel que Yi =
1 si y* > 0 etYi = 0 si y* < 0. En d’autres termes, ces approches ne modélisent pas la variable
dépendante elle-même, mais plutôt la probabilité qu’elle prenne la valeur 1 ou 0(ici la probabilité
que le client rembourse ou fasse défaut). On en déduit ainsi :
Pr = =� �
Pr = = −� �
La différence entre les deux types d’approches (logit et probit) dépend de la forme de la fonction
de répartition F et/ou loi de répartition du terme de l’erreur.
Le modèle Logit est choisi lorsque la fonction de répartition F est une loi logistique. Dans ce
cas, la probabilité Pi est définie de la manière suivante :
��′ �
′ ′
=� � = = =⋀ �
��′ � −��′ �
+ +
′
′ ′ � −��
avec ⋀ � = −�′ �
, la fonction de répartition et � = ′ 2 , la fonction de densité.
+� � ( +� −�� )
La modèle Probit est choisi lorsque la fonction de répartition F est une loi normale centrée et
réduite. Dans ce cas, la probabilité Pi est définie de la manière suivante :
��′ �
′ −� 2⁄ ′
=� � =∫ �=Φ �
−∞ √ �
La fonction de densité de la loi normale centrée réduite N(0,1) est notée :
′ −� 2⁄
� � =
√ �
Toutefois, ces deux modèles sont basés sur une même méthode d’estimation, à savoir
l’Estimateur du maximum de vraisemblance. En outre, leurs résultats sont souvent très proches3,
sauf dans quelques cas, notamment si l’échantillon contient très peu d’observations telles que
Y=1, ou très peu d’observations telles que Y =0.(BAHATI N., 2011).
3
Voir notamment Cadoret et alii (2004 ; p. 377) qui l’ont vérifié par une démonstration mathématique et graphique.
Page 18 of 34
Pour notre part, nous optons pour une méthode d’estimation fondée sur le modèle Probit, car on
suppose que la fonction de répartition est une loi normale en raison de la taille relativement plus
grande de l'échantillon.
Afin d’évaluer le risque de défaut, nous ferons recours à la régression logistique. Le
modèle utilisé est spécifié de la façon suivante :
Log p 
   0  1 Ag   2 Exp   3Cont   4 Md   5 Mr   6 Dera
1 p 
  7 Ec   8Tx   9 Cf  10 Np  11VGa
4. RESULTATS ET DISCUSSIONS
A. Présentation des caractéristiques des emprunteurs
L’objectif principal de cette recherche est de développer un modèle statistique qui puisse
permettre de distinguer les bons emprunteurs des mauvais. Une des premières étapes est donc de
définir ce que nous nous entendons par bons et mauvais emprunteurs. Un emprunteur est
considéré comme bon s’il rembourse (ou a toujours remboursé) correctement son prêt et n’a
jamais été en retard de paiement pour trente (30) jours ou plus. Un mauvais emprunteur par
contre est un emprunteur qui a connu au moins une fois un retard dans le remboursement de son
prêt pour 30 jours ou plus. Ces définitions peuvent toutefois varier d’une institution à une autre
(Comité de Bâle cité par B. DIALLO, 2006).
C’est cette définition que nous avons retenu pour séparer les bons de mauvais
emprunteurs lors de l’encodage.
Page 19 of 34
Tableau 4.1. Statistiques descriptives pour bons et mauvais emprunteurs prix séparément
Bon ou mauvais emprunteur Moyenne Ecart-type

Mauvais emprunteur Age du demandeur de crédit 33,7 8,4
Années d'expérience dans sa profession 4,8 3,8
Année de contact avec MECRE UVIRA 2 008,9 0,7
Montant du crédit demandé 1 180,0 746,7
Montant du crédit reçu 1 123,4 803,5
Degré de rationnement 0,3 1,4
Nombre de jour entre les dates de demande et de réception
crédit 12,6 6,7
Taux d'intérêt pratiqué sur le prêt 2,8 0,4
Conditions financières 32,5 23,4
Nombre de prêts déjà reçu 1,7 0,6
Valeur du bien donné en garantie 4 444,0 8 866,9
Bon emprunteur Age du demandeur de crédit 40,3 9,2
Années d'expérience dans sa profession 9,3 7,0
Année de contact avec MECRE UVIRA 2 008,5 0,7
Montant du crédit demandé 1 578,3 1 051,7
Montant du crédit reçu 1 337,5 883,8
Degré de rationnement 0,2 0,9
Nombre de jour entre les dates de demande et de réception
crédit 18,4 19,7
Taux d'intérêt pratiqué sur le prêt 2,9 0,3
Conditions financières 39,1 25,8
Nombre de prêts déjà reçu 2,0 0,7
Valeur du bien donné en garantie 8 969,6 11 783,2
Source : Nos analyses avec SPSS
Pour les mauvais emprunteurs, l’âge moyen d’un demandeur de crédit est de 33,72 ans.
Pour les bons emprunteurs, il est de 40,3 ans. L’âge moyen des deux groupes est de 38 ans.
Les mauvais emprunteurs ont en moyenne 4,8 ans d’expérience dans leurs professions, les bons
emprunteurs ont en moyenne 8 ans d’expérience. L’ancienneté dans le métier exercé est en
moyenne de 8 ans.
Les bons et les mauvais emprunteurs sont entrés en contact avec la banque en 2008.
Quant au montant du crédit demandé, il est en moyenne de 1180$ pour les mauvais emprunteurs,
de 1578 $ pour les bons emprunteurs. Pour les deux groupes, il est de 1472$.
Le montant du crédit reçu est en moyenne de 1123$ pour les mauvais emprunteurs et de 1337$
pour les bons emprunteurs. Il est en moyenne de 1240$ pour les deux groupes.
Page 20 of 34
Le degré de rationnement les mauvais et les bons emprunteurs s’élève respectivement à 0,32 et à
0,202. En moyenne, il est de 0,234 pour les deux groupes.
Le nombre de jours séparant la date de demande de prêt et la date de réception du prêt est en
moyenne de 12,64 pour les mauvais emprunteurs et de 18,37 pour les bons
emprunteurs, et de 16,8 jours en moyenne pour les deux groupes. Le taux d’intérêt est presque le
même pour les bons et mauvais emprunteurs. Il est moyenne de 2,87% pour les deux groupes.
Les conditions financières s’élèvent en moyenne pour les mauvais emprunteurs à 32,48$ , pour
les bons emprunteurs à 37,36$. Le nombre de prêt déjà reçu est de 1,68 pour les mauvais
emprunteurs et de 2 pour les bons emprunteurs. La moyenne intra groupe est de 1,9. Enfin, la
valeur du bien donné en garantie est respectivement de 4 444 $ et de 7765$ pour les mauvais et
les bons emprunteurs. Remarquons en grosso modo que pour toutes les variables les moyennes
de bons emprunteurs sont supérieures à celles de mauvais emprunteurs
Tableau 4.2. Tests d'égalité des moyennes des groupes
Lambda de Wilks F ddl1 ddl2 Signification
Age du demandeur de crédit 0,904 9,734 1 92 0,002
Années d'expérience dans sa profession 0,907 9,383 1 92 0,003
Année de contact avec MECRE UVIRA 0,941 5,783 1 92 0,018
Montant du crédit demandé 0,968 3,022 1 92 0,085
Montant du crédit reçu 0,988 1,127 1 92 0,291
Degré de rationnement 0,998 ,230 1 92 0,633
Nombre de jour entre les dates de demande

0,979 2,016 1 92 0,159
et de reception crédit
Taux d'intérêt pratiqué sur le prêt 0,997 0,314 1 92 0,577
Conditions financières 0,986 1,280 1 92 0,261
Nombre de prêts déjà reçu 0,943 5,533 1 92 0,021
Valeur du bien donné en garantie 0,968 3,052 1 92 0,084

Au vu des résultats, nous allons rejeter H0 pour les variables dont les probabilités
critiques sont supérieures à 0,05(au seuil de 5%) ou à 0,1(au seuil de 10%) comme c’est
le cas pour l’ Age du demandeur de crédit, année d’expérience dans la profession, année
Page 21 of 34
de contact avec la banque, montant du crédit demandé(seulement au seuil de 10%), le

nombre de prêt déjà reçu et la valeur du bien donné en garantie(seulement au seuil de
10%). Pour ces variables, il y a une différence significative entre les moyennes de deux
groupes.
En outre, nous n’allons pas rejeter H0 si la probabilité critique est supérieure à
0,05. Cela est le cas pour les variables Montant du crédit reçu, degré de rationnement,
nombre de jours entre la date de demande et celle d’obtention du crédit, le taux d’intérêt
et les conditions financières. La différence n’est pas significative entre les moyennes de
ces eux groupes.
B. Les determinants du risqué de credit
B.1. Test d’indépendance entre le défaut de remboursement et ses déterminants

Les résultats de ce tableau permettent de présenter une analyse de dépendance entre
la variable défaut de remboursement et les variables présumées déterminants de ce défaut par
la littérature.
Tableau 4.3.: Analyse de la contingence entre le défaut de remboursement et ses
déterminants
Variable 1 Variable 2 Statistique calculée ( p-value)
Défaut rembour Milieu de provenance 3,43 (0,3304)
Défaut rembour Sexe 0,77 (0,3796)
Défaut rembours Activité 19,92 (0,0106)**4
Défaut rembours Type de prêt 2,74 (0,0977) ***5
Défaut rembours Objet du prêt 11,00 (0,2017)
Défaut de remboursement Type de garantie 7,23 (0,1244)
Source : nos analyses avec Tanagra
Ces résultats nous indiquent une dépendance entre la défaut de remboursement et le

milieu de provenance (p-value inférieure à 0,05).
4
Significatif au seuil de 5%
5
Significatif au seuil de 10%
Page 22 of 34
La probabilité critique (ici 0,3796) supérieure à 0,05 n’indique pas de liaison significative
entre le défaut de remboursement et le sexe à la MECRE UVIRA. Le sexe n’influence donc pas
le défaut de remboursement. Ce résultat est différent de celui de certaines recherches précédentes
qui ont montré que les femmes représentent un meilleur risque de crédit que les hommes
notamment dans le contexte africain (Viganò, 1993).
Il y a une liaison significative entre le défaut de remboursement et la profession du
demandeur de crédit (p-value inférieure à 0,01).
La liaison entre le risque défaut de crédit et le type de prêt accordé (prêt à la production
ou à la consommation) n’est pas significative. Cette variable influence donc faiblement le
risque de défaut.
Par objet du prêt, on entend ici l’activité dans laquelle le demandeur du crédit a investi le
montant demandé. Ces résultats ne nous montrent pas une dépendance significative entre
l’activité exercée par le demandeur de crédit et le défaut de crédit.
Le type de garantie n’influence pas significativement le défaut de remboursement.
B.2. Estimation de la probabilité de défaut par la régression logistique
Tableau 4.4.1 Résultats de la régression logistique
IC pour Exp(B) 95,0%
Variables B E.S. Wald ddl Signif. Exp(B) Inférieur Supérieur
AGE 0,054 0,052 1,064 1 0,302 1,055 0,953 1,169
Ancien 0,095 0,094 1,028 1 0,311 1,100 0,915 1,322
Contbque -0,016 0,501 0,001 1 0,975 0,984 0,369 2,627
Demandé 0,001 0,001 1,948 1 0,163 1,001 1,000 1,002
Montrecu -0,003 0,007 0,154 1 0,695 0,997 0,984 1,011
Degrati -0,214 0,275 0,606 1 0,436 0,807 0,471 1,384
EcartJours 0,022 0,024 0,894 1 0,344 1,023 0,976 1,071
Taux -0,530 1,859 0,081 1 0,775 0,588 0,015 22,487

Page 23 of 34
Condfin 0,065 0,236 0,075 1 0,784 1,067 0,672 1,694
Nbpret 0,767 0,560 1,880 1 0,170 2,154 0,719 6,454
Valgarant 0,000 0,000 0,014 1 0,906 1,000 1,000 1,000
Constante 29,387 1006,073 0,001 1 0,977 5,787E12

Source : Nos analyses
 02,95 (1)  3,.81

Les coefficients des variables explicatives ne sont pas statistiquement différents de zéro vu
que les statistiques de Wald sont inférieur à 12 (=1) Aussi les
probabilités critiques qui sont supérieures à 0,05 le témoignent-elles.
Au seuil de 5%, aucune variable n’influence significativement le défaut de crédit.
Il arrive parfois que tous les coefficients pris individuellement soient non significatifs(R.
RAKOTOMALALA, 2009). En revanche, lorsque l'on teste leur nullité simultanée, on est amené
à rejeter l'hypothèse nulle. Ainsi la statistique khi-deux lu dans la table est inférieure au ratio
de vraisemblance (LR Stat=87,2). Cela veut dire que les coefficients estimés sont
homoscédastiques et que l’hypothèse de nullité des coefficients pris globalement est rejetée.
Si p est la probabilité de défaut, l’équation estimative du modèle est la suivante :

Log  p 

  0,054 Ag  0,095 Exp  0,016Cont  0,001Md  0,003Mr  0,214 Dera
1 p 
 0,022 Ec  0,053Tx  0,065Cf  0,767 Np  0,00VGa  1006,073
La probabilité de défaut est :

p  ( 0, 054Ag 0, 095Exp 0, 016Cont 0, 001Md 0, 003Mr 0, 214Dera 0, 022Ec 0, 053Tx 0, 065Cf  0, 767Np0, 00VGa 1006, 073)
1
1e
Page 24 of 34
Tableau 4.4.2. Table de prediction
Point de Point de
coupure 4% coupure 5%
Pourcentage de bonnes prédictions 78,7% 79,8 %
Pourcentage de mauvaises prédictions 21,3% 20,2 %
Pourcentage de bonnes prédiction pour 79, 5% 79, 5%
les bons emprunteurs
Pourcentage de bonnes prédiction pour 43,5% 43,5%
les mauvais emprunteurs
Au point de coupure de 0,5 ; Le modèle prédit correctement à 79,8% des cas correctement. Une fixation
plus conservatrice du point de coupure de 0.5 à 0.4 n’améliore pas le pouvoir de prédiction sur les
mauvais prêts. Elle affecte toutefois la performance globale de prédiction du modèle (79,8% à 78,7%).
Tableau 4.5.Tests de spécification du modèle
Khi-deux Ddl Signif.
Etape 1 Etape 21,273 11 0,031
Bloc 21,273 11 0,031
Modèle 21,273 11 0,031
Extrait de SPSS 16.0
Tableau 4.6. Récapitulatif du modèle
-2log-
Etape vraisemblance R-deux de Cox &Snell R-deux de Nagelkerke
1 87,616a 0,203 0,295
Les pseudo-R2(de Cox et Snell) indiquent que le défaut de crédit est expliqué à 20, 3% et à
29,5% par les variables du modèle.
Tableau 4.7. Testde Hosmer-Lemeshow
Etape Khi-deux Ddl Signif.

Page 25 of 34
Tableau 4.7. Testde Hosmer-Lemeshow
Etape Khi-deux Ddl Signif.
1 10,109 8 0,257
Extrait de SPSS 16.0

Le p-value est supérieur au risque usuel de 5%. Le modèle est validé, il est compatible avec les
données.
C. Résultats de l’analyse discriminante et l’approche du crédit scoring
L’utilisateur aura le choix entre la fonction discriminante (une seule fonction) et les
fonctions de classement (dans notre cas : deux fonctions). Le traitement de notre base des
données par le biais du logiciel SPSS16 nous a permis d’identifier la fonction score suivante
Tableau 4.8. Coefficients des fonctions discriminantes canoniques standardisés
Fonction non
Fonction standardisée standardisé
1 1
Age du demandeur de crédit (Ag) 0,393 0,043
Années d'expérience dans sa profession (Exp) 0,236 0,037
Année de contact avec MECRE UVIRA (Cont) -0,148 -0,216
Montant du crédit demandé (Md) 0,547 0,001
Montant du crédit reçu (Mr) -1,784 -0,002
Degré de rationnement (Dera) -0,123 -0,118
Nombre de jour entre les dates de demande et de réception crédit (Ec) 0,433 0,025
Taux d'intérêt pratiqué sur le prêt (Tx) -0,125 -0,372
Conditions financières (Cf) 1,174 0,047
Nombre de prêts déjà reçu (Np) 0,408 0,616
Valeur du bien donné en garantie (VGa) 0,163 0,000
Contant 431,88
Source : Nos analyses avec SPSS 16.0

Notre fonction score peut ainsi s’écrire :
Z 
0,043 Ag  0,037 Exp  0,216Cont  0,001Md  0,002 Mr  0,118 Dera 
0,025 Ec  0,372Tx  0,047Cf  0,616 Np  0,0VGa  431
Page 26 of 34
L’affectation aux groupes se fera en fonction des centroides de ces derniers, c'est-à-dire
par comparaison avec un score discriminant « moyen » pour chaque groupe. Ce score moyen est
calculé à partir de la fonction discriminante, où l’on remplace les valeurs individuelles par les
moyens des variables indépendantes pour le groupe dont on s’occupe.
Tableau 4.9. Fonction aux barycentres des groupes)

Fonction
Bon ou mauvais emprunteur Score moyens
Mauvais emprunteur -0,777
Bon emprunteur 0,282

Chaque score individuel discriminant individuel est ensuite comparé aux deux scores
moyens et affecté au groupe dont-il est le plus proche. Mais la question qui se pose est la
suivante : à partir de quel score peut-on affecter les individus au groupe 1 (bon emprunteur) et
non pas au groupe 0 (mauvais emprunteur) ? Pour ce faire, on doit déterminer un score qui joue
le rôle de frontière entre les groupes. Si les groupes sont de dimensions égales, le score critique
est égal à la moyenne des moyennes des scores des groupes. Dans notre cas, ce score est égal : (-
0,777+0,2822)= -0,2474
Le score frontière est de -0,2474.
La règle de classement de chaque individu dans l’un ou l’autre groupe est alors la
suivante :
Tableau 4.10. Affectation de la valeur du score selon le modele

Valeur du score Affectation selon notre modèle
Score inférieur à -0,2474 Mauvais emprunteur
Score supérieur à -0,2474 Bon emprunteur

Page 27 of 34
Mais, il convient de signaler qu’il y a une zone d’incertitude qui se situe entre les deux centres
de gravité des deux groupes (-0,777 et 0,2822). Cette zone ne permet pas de trancher
définitivement sur la défaillance ou non des emprunteurs.
Concernant les fonctions de classement, le tableau ci-après donne les coefficients de ces deux
fonctions fournis par le traitement statistique. Ces coefficients permettent de classer les
emprunteurs dans les classes.
Tableau 4.11. La matrice de confusion

Classe(s) d'affectation prévue(s)
Bon ou mauvais emprunteur Mauvais emprunteur Bon emprunteur Total
Original Effectif Mauvais emprunteur 20 5 25
Bon emprunteur 24 45 69
% Mauvais emprunteur 80,0 20,0 100,0
Bon emprunteur 34,8 65,2 100,0

De cette matrice nous lisons que la fonction score extraite ci-dessus permet de
classer 69,1489% (20+45/94) des emprunteurs correctement. Ce taux peut être décomposé ainsi
: Le pourcentage des bien classés pour les bons emprunteurs est égal à
20/23=87% ; Le pourcentage des bien classées pour les mauvais emprunteurs est égal à 45/69=
65,2174%. Par contre, le taux d’erreurs (emprunteurs mal classés) est égal (24+5)/94= 0,308511
%.
- l’erreur du premier type (classer un mauvais emprunteur par l’utilisation de la fonction
score parmi les bons emprunteurs) : ce taux est égal à 5/25=20 % ;
- et l’erreur du second type (classer un bon emprunteur comme un mauvais emprunteur par
le modèle): ce taux est égal à 24/69=34,7826%.
Cependant, le pourcentage d’individus correctement reclassées ne doit pas être

analysé dans l’absolu. Il doit être comparé au pourcentage que l’on obtiendrait si l’on reclassait
les individus au hasard. Pour ce faire, un test Q de Presses (Hair et al., 1992 ; cité par
Giannelloni et Vernette, cité par A. ELHAMMA, 2009, p.420) sera mené. Ce test vérifie que le
Page 28 of 34
pourcentage d’individus correctement classées est significativement plus important que celui
donné par un choix aléatoire. La statistique calculée suit une loi de Khi-deux (χ2) à 1 degré de
liberté.
L’hypothèse nulle est l’égalité des deux valeurs, c'est-à-dire le nombre d’individus bien classés
au hasard et le nombre d’individus classés par la fonction discriminante. L’expression de ce test
est la suivante :
[� − �� ∗ � ] [9 − ∗ ] 9 ∗ 9
� � � = = = = = ,
�∗ �− 9 ∗ 9 9
Avec
- n: le nombre des emprunteurs de l’échantillon;
- nc : le nombre des emprunteurs correctement classés ;
- p : le nombre de groupes.
La valeur critique du χ2 à 1 degré de liberté est égale à 3,84, l’hypothèse nulle est rejetée. La
fonction discriminante est donc significativement plus performante que le hasard pour reclasser
correctement les emprunteurs.
Tableau 4.12. Corrélation canonique
% de la
Fonction Valeur propre variance % cumulé Corrélation canonique
a
1 0,224 100,0 100,0 0,428
Source : Extrait de SPSS
Plus la corrélation canonique est proche de 1, meilleur est le modèle. Dans

notre cas, la corrélation canonique est égale à 0,428. Le pouvoir discriminant de la
fonction discriminante extraite est de 42,8%.
Tableau 4.13. Lambda de Wilks

Test de la ou des Lambda de
fonctions Wilks Khi-deux ddl Signification
1 0,817 17,465 11 0,095
Source : Extrait de SPSS

Page 29 of 34
Également, la valeur de Lambda de Wilks6 étant faible, et est égale à 0, 817 et donc plus
proche de 1 que de 0, avec un khi-deux ayant un degré de signification moins élevé au seuil de
5% (supérieur à 0,05). Cela veut dire qu’au niveau global, la différence des moyennes des
groupes est significative (cf. réponses trouvées à travers le test de Student).
Pour s’assurer que la fonction discriminante classifie bien les entreprises en sous-groupes,
on analyse la matrice de confusion qui regroupe les entreprises bien classées et les mal classées.
C’est le moyen le plus utilisé est aussi le plus « parlant ». La matrice de confusion de notre
fonction score se présente comme suit :
D. Interprétation et discussions des résultats
Au vu des résultats présentés dans les tableaux ci-haut, certaines variables influences
positivement et d’autres négativement le risque de défaut de crédit.
Les variables qui influencent positivement le défaut sont l’âge du demandeur de crédit,
le nombre d’années d’expérience dans l’activité exercée, le montant demandé du crédit, l’écart
entre la date de demande et de réception du crédit, les conditions financières, le nombre de
prêts.
Celles qui influencent négativement le défaut de paiement sont sont l’année de contact
avec la banque, le montant demandé, le degré de rationnement etle taux d’intérêt.
Passons dans les lignes qui suivent à une discussion de certaines de ces variables.
a) Défaut de remboursement et écart entre le jour de demande et de réception du

crédit (temps d’attente)
Le signe positif du coefficient de cette variable (temps d’attente) nous indique qu’un
emprunteur qui observe une période d’attente plus longue est, toutes choses restantes égales par
ailleurs, plus susceptible d’être un mauvais emprunteur.
Ces résultats semblent s’écarter de ceux trouvés par A. DIALLO(2006), pourquoi le
temps d’attente influence négativement la probabilité de défaut.
66
Lambda de Wilks est le rapport de la variation intra-groupes à la variation totale. La variation intra-groupes est,
pour chaque groupe, la somme des carrées des différences entre les scores discriminants individuels et le
centroïde du groupe
Page 30 of 34
b) Défaut de remboursement et degré de rationnement
Les résultats issus du modèle indiquent que le fait d’être rationné est positivement lié à la
probabilité de défaut. Plusieurs facteurs sont pris en compte dans la décision de rationnement
mais les éléments les plus déterminants demeurent le plus souvent la nature de l’activité à
fiancer, le niveau de revenus et de richesse qui détermine sa capacité de remboursement. Zeller
(1994) cité par Diallo(2006) a obtenu des résultats similaires en analysant les déterminants du
rationnement de crédit parmi les prêteurs informels et les groupes de crédit formels au
Madagascar.
c) Défaut de remboursement et conditions financières
Comme le note BALEMBA (2010), nombreux auteurs s’accordent sur le fait que les
conditions financières augmentent la probabilité de défaut. Ainsi, plus les conditions financières
élevées, plus lourdes deviennent les charges chez l’emprunteur et le risque de non
remboursement augmente. Cette réalité n’est pas contredite par nos résultats. Plus les conditions
financières sont élevées, plus grande est la probabilité de défaut.
A en croire Diallo (2006), l’exigence de conditions financières vise au moins deux

objectifs. Premièrement, les conditions financières visent à tester la disposition de l’emprunteur à
contribuer financièrement au projet à financer et son engagement envers ce projet.
Deuxièmement elles visent à sécuriser l’institution contre le risque de crédit et le risque
d’illiquidité.
d) Défaut de remboursement et Taux d’intérêt
Théoriquement, plus le taux d’intérêt est élevé, plus la probabilité de défaut

augmente. Cette hypothèse n’est pas confirmée par nos résultats. Cela est aussi pour les autres
variables dont les signes ne sont pas conformes aux signes attendus. Cela serait dû soit à la
petitesse de la taille de l’échantillon, soit à aux réalités propres de la MECRE/UVIRA.
Page 31 of 34
5. CONCLUSION : IMPLICATION EN TERMES DE POLITIQUE

PUBLIQUE, ORIGINALITE ET PERSPECTIVES DE FUTURES
RECHERCHE
Cet article sèst engagé dans une problématique cherchant à savoir les principaux
déterminants du défaut de remboursement à la MECRE/UVIRA, les variables qui permettent de
différencier les bons de mauvais emprunteurs, la prédiction du risque de non remboursement du
crédit octroyé.
En guise d’hypothèses nous avons présumé que les principaux déterminants de défaut
de crédit à la MECRE/UVIRA seraient le montant du crédit octroyé, l’ancienneté dans l’activité
exercé, le niveau d’étude du demandeur de crédit, le taux d’intérêt pratiqué, le degré de
rationnement ; le montant du crédit demandé seraient les principales variables pouvant
discriminer les bons de mauvais emprunteurs et par conséquent les déterminants de l’octroi de
crédit.
Sur le plan délimitation, ce papier a donné comme champ dàpplication la MECRE
UVIRA, au courant de lànnée 2011 avec un échantillon de 100 emprunteurs individuels dont 94
demande ont été acceptées et 6 ont été refusées.
Afin de bien vérifier les différentes hypothèses émises, nous avons fait recours aux
différentes méthodes dont les principales sont le test de student pour la comparaison des
moyennes des variables pour les bons et les mauvais emprunteurs, le test de Khi-deux qui nous
aidé à rechercher la dépendance entre le défaut de remboursement et certaines variables
qualitatives; enfin et surtout l’analyse discriminante de Fisher et la régression logistiques qui
nous respectivement servi à trouver les fonctions qui nous permettent de séparer, différencier
les bons de mauvais emprunteur et à rechercher le probabilité de défaut associée à chaque
emprunteur.
Les résultats du test de Student nous ont montré une l’égalité des moyennes entre bons et
mauvais emprunteurs pour les variables suivantes : Montant du crédit reçu, degré de
rationnement, temps d’attente, taux d’intérêt, conditions financières, nombre de prêt déjà reçu,
valeur de la garantie. Ainsi, ces variables ne permettent pas de discriminer les bons de mauvais
emprunteur, car chaque variable est en moyenne égale pour les deux catégories.
Page 32 of 34
Par contre, une différence significative des moyennes pour les deux groupes a été
constatée pour les variables Age du demandeur de crédit, années d’expérience, année de contact
avec la banque et le montant du crédit demandé. Ces variables permettent de différencier les
bons de mauvais emprunteurs.
Le test de Khi-deux, se construisant à l’aide des variables discrètes, nous a aidé à
déterminer les variables dont dépend le défaut de remboursement. Il a été trouvé que les
variables qui influencent significativement le défaut de remboursement sont l’activité exercé et
le type de prêt. Cette première analyse, complétée avec celle de la régression logistique, nous a
permis de répondre à notre première question de départ qui cherchait à connaître les principaux
déterminants du défaut de remboursement du crédit.
La régression logistique qui nous a servi à déterminer les déterminants de la probabilité

de défaut et par le même fait la probabilité de défaut associée à chaque demandeur de crédit.
Par le même outil, nous avons identifié les variables qui influencent positivement et
négativement la probabilité de défaut, mais aussi déterminer cette probabilité pour chaque
emprunteur.
L’analyse discriminante extraite de SPSS 16.0 nous a permis de mettre sur place un
premier modèle de distinction entre les bons et les mauvais emprunteurs. Dans ce modèle,
chaque emprunteur est classé bon ou mauvais selon que le score obtenu sur base de ses
caractéristiques est supérieur ou inférieur au score frontière. Une deuxième catégorie de modèles
a mis à notre dispositions une fonction score pour les bons et une autre pour les mauvais
emprunteurs. Dès lors, chaque emprunteur est classé dans la fonction où il a un score plus élevé.
Implications en termes de politique publique
Le présent travail n’est pas un simple exercice intellectuel. Ces résultats présentent une
importance dès lors qu’ils sont appliqués par la MECRE/UVIRA. En effet, les résultats de cette
recherche à la MECRE/UVIRA de prédire la probabilité de défaut de remboursement pour
tout demandeur de crédit ainsi sur base de la fonction score établie au moyen de la méthode
discriminante. Ainsi, il est possible pour cette institution de microfinance, toutes choses égales
par ailleurs de distinguer avec un faible risquer de se tromper les bons des mauvais
Page 33 of 34
emprunteurs et par conséquent minimiser le taux du portefeuille à risque et donc maximiser la

valeur de l’institution en termes financiers.
Originalité
Le présent papier bien que ne soit le premier à appliquer la fonction discriminante et la

régression logistique pour l’analyse du risque de crédit présente certains points qui impliquent
son originalité. En effet, la détermination de la probabilité de défaut de remboursement et ses
déterminants en présente une originalité d’une part et le contexte dans lequel il est appliqué
en présente une autre dans la mesure où il n’existe presque pas des travaux ayant jeté les
jalons sur cette thématique au sein de notre milieu d’étude.
Perspectives de recherche
Enfin, nous pouvons clore notre travail en nous épargnant de toute affirmation selon
laquelle toute la matière en rapport avec notre thématique de recherche a été abordée dans la
globalité des aspects. Cèst pourquoi, nous lançons un appel à tous les esprits scientifiques
désireux de travailler dans le même domaine de recherche de bien vouloir nous approfondir
cette étude en élargissant la taille de l’échantillon et en utilisant les données sur les
entreprises(les ratios) et non sur les personnes physiques scientifiques désireux de travailler dans
le même domaine de recherche de bien vouloir nous approfondir et nous corriger dans le but de
pouvoir perfectionner notre travail.
BIBLIOGRAPHIE
ARTICLES ET OUVRAGES
1. BARDOS M. (2001), Analyse discriminante, application au risque et scoring financier, Dunod
2. BOUBACAR DIALLO (2006), Un modèle de Credit Scoring pour une institution de micro-finance
africaine : le cas de nyesigiso au mali, Laboratoire d`Économie dÒrléans,.
Page 34 of 34
3. BRAILOVSKYJ. (2008), Modèles de risque de crédit à la consommation: étude du rôle de

l'économie dans la probabilité de défaut, université de Québec à Montréal, Québec
4. CHURCHILL C. et COSTER D (2001), Manuel de gestion des risques en micro finance. CARE.
5. CORNEE S. (2006), Analyse de la convergence entre performances financières et performances
sociales : application de la méthode Data EnvolpmentAnalysis sur 18 : Institutions de micro-finances
péruviennes, maitrise en science de gestion
6. FISCHER k. P. (2000), Régie, réglementation et performance des coopératives financiers, Annales
de l’économie publique sociale et coopérative, 2000, Vol. 71.
7. MISHKIN F. (2007), Monnaie, banque et marchés financiers, Nouveaux Horizons, 8e édition, Paris
8. PLATTEAU J.-P. (1987), La Nouvelle Économie Institutionnelle et la problématique
coopérative,Cahiers de la Faculté des Sciences Économiques et Sociales de Namur.
9. SARPOTA G. (S.D), La notation statistique des emprunteurs ou « scoring », Conservatoire des arts
et métiers, Paris
10. TCHAKOUTE HUBERT et LAMARQUEERIC (2008), La gestion des risques opérationnels
dans les institutions de micro finance; une approche exploratoire, université de Montesquieu,
bordereaux IV.
11. TCHUMKAM C. (2008), Analyse des déterminants de lòctroi du crédit bancaire aux entreprises :
le cas de Afriland First Bank de Yaoundé, maitrise en sciences de gestion.
SITES CONSULTÉS
1. http:// www.lamicrofinance.org
2. http:// www.labanque.org

Les Determinants de La Probabilite Du de

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Les Determinants de La Probabilite Du de

Transféré par

Droits d'auteur :

Formats disponibles

Page 1 of 34

ANALYSE DES DÉTERMINANTS ET DE LA PROBABILITÉ DE

Paper submitted for consideration in the Bukavu Journal Of Economics

MUGISHO MUNKWA Guershom

Soumis en octobre 2013

Mots clés : Credit scoring, défaut de remboursement, analyse discriminante, risque de

Les institutions de micro-finance(IMF) sont présentes dans le système financier pour

La crise financière qui secoue le monde actuellement, notamment les défaillances

En plus, les implications de la crise financière et les conséquences des asymétries

RAPPORT D’AUDIT FINANCIER MECRE/UVIRA,

coûts des transactions et du rationnement dans la prédiction du défaut de remboursement. En

A ELHAMMA (2009) applique la méthode de crédit scoring à la Banque Populaire

Par ailleurs, P. BOISSELIER et D. DUFOUR (2003) présente un article sur le

Ce travail analyse les déterminants du défaut de remboursement et gestion de risque de crédit

Du point de vue de l’architecture, ce travail comprend, introduction et conclusion mises à

Plusieurs auteurs définissent le risque de crédit différemment.

crédit résultant de l’incapacité réelle ou perçue de l’emprunteur à respecter tout ou partie du

Pour CAMARA(2006), le risque de crédit se définit comme la probabilité de non-

Ainsi, CARE International(2001), définit le risque de crédit comme étant la détérioration

Le Credit Scoring peut être globalement défini comme un ensemble de modèles de

b. Revue de littérature empirique

De plus Boubacar DIALLO (2006), développe un modèle de Crédit Scoring en utilisant

Aimé TCHUMKAM Césaire(2008) s'intéresse à la pertinence de traitement des dossiers (un

A ELHAMMA (2009) applique la méthode de crédit scoring à la Banque Populaire de

3.1. Choix de la taille de l’échantillon

La population cible de l’étude était constituée par les clients de la MECRE/UVIRA.

3.2. Définition des variables

3.2. L’analyse discriminante

Une analyse discriminante se déroule en cinq étapes suivantes :

La première étape consiste à formuler le problème en identifiant les objectifs, la variable

L’étape suivante consiste à diviser l’échantillon en 2 parties. L’une, appelée échantillon

l’accès à toute la base de données de la MECRE/UVIRA, nous n’avons pas pu constituer un

2. Estimation des coefficients de la fonction discriminante

3. La détermination de la signification de la fonction discriminante

4. L’interprétation des résultats

5. L’évaluation de la validité de l’analyse discriminante

Il est utile de comparer le pourcentage d’individus correctement classés grâce à l’analyse

Le modèle utilisé a été emprunté à Boubacar Diallo(2006). Son modèle comprenait

Notre modèle de l’analyse discriminante est de la forme suivante :

Z   0  1 Ag   2 Exp   3Cont   4 Md   5 Mr   6 Dera

ß1… ß5 = poids ou coefficients discriminants

 Statistiques associées à l’analyse discriminante

La matrice de confusion : Appelée aussi matrice de classification, la matrice de confusion

Les coefficients de la fonction discriminante (non standardisés) : sont les coefficients

Les coefficients standardisés de la fonction discriminante : Ce sont les coefficients

Le remboursement du crédit est un phénomène « discret » correspondant à deux modalités : (i)

A. Présentation des caractéristiques des emprunteurs

Bon ou mauvais emprunteur Moyenne Ecart-type

Age du demandeur de crédit 0,904 9,734 1 92 0,002

Années d'expérience dans sa profession 0,907 9,383 1 92 0,003

Année de contact avec MECRE UVIRA 0,941 5,783 1 92 0,018

Montant du crédit demandé 0,968 3,022 1 92 0,085

Montant du crédit reçu 0,988 1,127 1 92 0,291

Degré de rationnement 0,998 ,230 1 92 0,633

Nombre de jour entre les dates de demande

Taux d'intérêt pratiqué sur le prêt 0,997 0,314 1 92 0,577

Conditions financières 0,986 1,280 1 92 0,261

Nombre de prêts déjà reçu 0,943 5,533 1 92 0,021

Valeur du bien donné en garantie 0,968 3,052 1 92 0,084

Source : Nos analyses avec SPSS

de contact avec la banque, montant du crédit demandé(seulement au seuil de 10%), le

B. Les determinants du risqué de credit

B.1. Test d’indépendance entre le défaut de remboursement et ses déterminants