Académique Documents
Professionnel Documents
Culture Documents
Directeur du mmoire :
Professeur Frderic Kalala Tshimpaka
Juillet 2013
Page |i
P a g e | ii
EPIGRAPHE
One machine can do the work of 50 ordinary men. No machine can do the work of extraordinary
man.
Albert Hubban.
P a g e | iii
Remerciements
Au terme de ce travail, je tiens adresser mes remerciements au professeur Kalala
Frderic pour avoir accept dassurer la direction de ce prsent mmoire. Ses
remarques et commentaires, sa rigueur et pertinence danalyse ont prodigieusement
contribu au contenu et forme de cette tude. Il a t une rfrence pour moi
pendant ces annes passes au CCAM.
Merci galement mes parents, je noublierai jamais votre amour et les nombreux
sacrifices consentis pour ma russite tout au long de mon parcours universitaire.
Mes remerciements sadressent aussi au chef de travaux Nshue M. Mokime et au
professeur Bakengela.
Depuis linitiative de ce mmoire, de nombreuses personnes ont contribu son
dveloppement. Leurs conseils, remarques et corrections ont contribu de faon
majeure la forme et au contenu de ce prsent mmoire. Nous remercions
spcialement Dede idi Nassor, Nelson Ifeka, Albert Monzongo, Anastasie Manzanga,
patrick Dedi.
Nous souhaitons prsenter nos remerciement aux personnes suivantes, qui ont relu le
manuscrit en partie ou en en entiret : Igor Ileka, Jean-Paul Tsasa, Bachunge Samuel,
Daniella Mboni, Nelson Ifeka, Olga Mbuyi, Micheal ange Lokota, Michel Lenda, Bobo
boboy, Guya Togba, Aime masaba.
Nous remercions galement Jean-Paul Tsasa pour nous avoir fourni les ouvrages et
articles scientifiques qui ont contribu au contenu de cette tude.
Durant la rdaction de ce mmoire, nous avons immensment profit des
commentaires des agents de crdit de Life Vest et de nos collgues chercheurs
auLarq. Ces commentaires ont t essentiellement collects pendant une tude par
questionnaire et, lors de discussion informelle. Nous remercions vivement toutes ces
personnes pour avoir partag leurs points de vue et nous avoir consacr du temps.
P a g e | iv
2.
Problmatique ............................................................................................................................ 3
3.
4.
5.
B.
Page |v
A.
B.
P a g e | vi
Page |1
Introduction gnrale
1. Mise en contexte
Le taux dintrt sur le march de crdit diffre du rendement que linstitution
financire espre raliser sur le prt. Ce taux correspond au produit du taux dintrt
contractuel et la probabilit (p) que lemprunteur remboursera effectivement le prt.
A cause de linformation imparfaite et asymtrique entre les institutions de
microfinance et les emprunteurs,cette probabilit estparfois infrieure lunit.
Page |2
Et pourtant, trs peu dtudes ont t menes sur le credit scoring, tant du cot de la
finance classique que de lindustrie de la microfinance, dans les pays en
dveloppement (Scheiner 2004). La plupart des tudes publies en microfinance sont
focalises sur lAmrique latine, cependant leur application et implmentation dans
les IMF reste encore trsquestionner (Vogelgesang, 2003 et Kleimeier, 2007). Ceci
sexplique en partie, la ncessit de disposer dune bonne qualit et quantit des
statistiques relatives aux historiques de crdit.
En R.D.Congo, aucune tude na t mene en ce sens et cette mthode reste encore
marginalise malgr les nombreux avantages quelle peut prsenter.
Ce constat suscite des interrogations, tant du point de vue thorique quempirique,
sur la capacit du modle de credit scoring de prdire de faon fiable le risque de
dfaut dun nouveau client dans les pays en dveloppement.
Ce mmoire se propose donc dvaluer la pertinence de lapproche credit scoring
partir des donnes empiriques primaires dune IMF congolaise.
Page |3
2. Problmatique
Lanalyse du march de crdit, contrairement la vision classique selon laquelle le
mcanisme des prix conduit un ajustement (Pareto efficace) entre loffre et la
demande, montre que la prise en compte de linformation imparfaite et asymtrique
sur le march financier permet de montrer quil peut exister une situation dquilibre
caractrise par un rationnement de crdit et ainsi le taux dintrt sert dinstrument
de slection. Une augmentation du taux dintrt entrane deux types deffets : effet
de slection adverse et leffet ala moral (Stiglitz & Weiss, 1981).
Face ce problme dimperfection du march de crdit, la gestion du risque de crdit
est indispensable. Ceci tient au fait que le plus grand risque pour un intermdiaire
financier est doctroyer un crdit et ne pas se le faire rembourser (C. Churchill et D.
Coster, 2001 ; Microfinance banana Skins, 2011 ; Kalala, 2006). Ce risque de crdit
samplifie au sein des IMF dans la mesure o la plupart des crdits accords ne sont
soumis aucune garantie formelle (conventionnelle ou classique).
La pratique de la gestion ex ante1 du risque de crdit ncessite que les institutions de
microfinance disposent de linformation sur les clients et dune technique objective de
slection.
De manire pratique en R.D. Congo, les ISFD (IMF et COOPEC) recourent deux types
danalyses, lune base sur le cash flow dite non conventionnelle, et lautre dite
conventionnelle. Ces deux approches, fondes sur le jugement et le bon sens du
comit de crdit, ne permettent pas, dans une certaine mesure, de dceler
prodigieusement les clients susceptibles de ne pas rembourser lchance.
Toutefois, une approche complmentaire pour ltude des dossiers (celle fonde sur
la mise sur pied dun modle statistique dvaluation de risque de non
La gestion du risque de crdit se prsente sous deux aspects (C. Churchill et D. Coster, 2001) : la gestion ex ante
(les mesures prventives que les prteurs prennent avant loctroi du crdit) et la gestion ex post (les mesures
dincitation aprs le dboursement).
Page |4
remboursement) peut rduire les taux dimpays, du fait que ce modle permet de
quantifier le risque partir de sa probabilit et suppose quune bonne partie des
risques est lie aux caractristiques quantifies dans la base de donnes (Thomas,
2000).
Dans cette optique, les tudes, tant du point de vue thorique quempirique,
montrent dune part que le modle de credit scoring permet de modliser le risque de
crdit et dautre part les dterminants du dfaut de crdit diffrent selon quon mne
lanalyse du cot des IMF ou des banques classiques.
3. Hypothses de recherche
En considrant les travaux antrieurs sur le credit scoring, nous postulons que la
plupart des facteurs pris en compte dans la technique de credit scoring nexpliquent
pas totalement ( 100 %) la variance de la probabilit de dfaut des clients. Ceci
Page |5
suggre que la plupart des facteurs susceptibles dinfluencer le risque de crdit sont
difficilement perus par les IMF du fait de lopacit des informations de leurs clients.
Les caractristiques socio-conomiques des clients figurent parmi celles qui ont les
plus dinfluence sur la probabilit de dfaut des clients.
la lumire des travaux de Schreiner (1999a, 2003, 2004), nous considrons lide
selon laquelle lopacit des informations financires et non financires de la plupart
des clients des IMF, constitue un obstacle majeur dans la mise en uvre dune
dmarche de scoring statistique. Pour y remdier, il convient de refonder le systme
dinformation de gestion des IMF ainsi que leurs techniques de collecte dinformation.
4. Intrt du travail
Cette recherche vise appliquer la technique de credit scoring aux donnes des
institutions financires congolaises et dbouche sur trois apports majeurs:
Formuler les recommandations concrtes susceptibles de faciliter lintgration
du modle de credit scoring au SIG des institutions financires.
Identifier les caractristiques des clients et de leur activit pouvant justifier le
drapage en termes de remboursement.
Identifier les obstacles de la mise en uvre du credit scoring dans le chef des
IMF kinoises.
5. Dlimitation du travail
Nos investigations portent porte sur lIMF Life Vest. Il sagit spcifiquement des
agences de Gombe et de Pigeon. Ceci en raison dela facilit daccs un chantillon
plus reprsentatif des dossiers de crdit, une pratique trs dlicat pour la plupart des
ISFD congolais en raison des rgles strictes de confidentialit des renseignements de
clients ainsi que les rgles de secret bancaire. Nous considrons une priode de trois
ans et demi, allant de 2010 fin mai 2013 pour lanalyse empirique.
Page |6
Page |7
The arrival of credit cards in the late 1960s made the banks and other credit card issuers realize thesefulness
of credit scoring.The only opposition came from those like Capon (1982), who argued that "the brute force
empiricism of creditscoring offends against the traditions of our society."He believed that there should be more
dependence on credit history and it should be possible to explain why certain characteristicsare needed in a
scoring system and others are not.
Page |8
La classification de ces techniques varie selon les auteurs. Crook(1996) suggre deux techniques dvaluation
du risque de crdit (valuation subjective et statistique) contrairement notre terminologie. La terminologie
valuation subjective est utilis pour littrature
4
La terminologie valuation subjective est utilis dans littrature pour dcrire une valuation non
statistique du risque de crdit.
Page |9
risque de crdit augmente. Pour limiter ce risque, les institutions dveloppent des
politiques et procdures pour analyser chaque lment.
Le poids accord chaque lment varie selon la mthodologie (groupe de solidarit,
banque villageoise ou prt individuel), les attributs du crdit et lanciennet du client
(C. Churchill et D. Coster, 2001).
Lvaluation subjective continue faire ses preuves en microfinance en raison de
lexpansion considrable du microcrdit travers le monde. Les tudes empiriques en
microfinance permettent de relayer ces conclusions (Schreiner, 2004). Toutefois, en
dpit des avantages quelle prsente, sa valeur prdictive du risque de crdit varie
selon lagent de crdit et selon son humeur du jour. De ce fait, elle nexclut pas la
discrimination ou la slection dun nombre insuffisant de caractristiques (ou de
caractristiques inappropries).
1.2.2. Evaluation statistique
Comme susmentionn, lvaluation subjective permet d'apprhender certaines
caractristiques non quantifiables lies au profil du client de l'institution de
microfinance, notamment celles qui se rapportent sa psychologie (caractre). Cette
approche reste, cependant, imprcise et subjective. Elle est peu fiable et parfois
discriminatoire, construite sur la base des prjugs ou de mauvaises interprtations
de la ralit.
Lutilisation dun modle de notation statistique doctroi de crdit par le scoring
(credit scoring) est dune grande importance en ce sens que sa capacit de
pronostiquer, facilite lvaluation des risques des clients. Le credit scoring est objectif,
cohrent et explicite.Il permet de quantifier le risque comme probabilit de non
remboursement et suppose quune bonne partie des risques est lie aux
caractristiques quantifies dans la base de donnes.
Le lien entre le risque et les caractristiques est exprim par un ensemble de rgles ou
de formules mathmatiques qui prdisent clairement le risque sous la forme dune
probabilit (Schreiner, 2004). La mthode suppose que la performance des futurs
prts avec un ensemble donn des caractristiques sera similaire la performance des
prts passs avec des caractristiques semblables.
La somme des caractristiques pondres dfinit la probabilit que le prt, une fois
dbours, va tre mauvais ou bon, o le critre mauvais et bon sont dfinis par le
prteur. Les poids de chaque caractristique dans la fiche d'valuation (scorecard)
sont bass sur une analyse statistique du rapport entre la caractristique et le
remboursement dans la base de donnes historique du prteur.
P a g e | 10
Une fois la fiche notation est acheve, linstitution peut sen servir dans son travail
quotidien. Il peut adopter un systme de cotation quatre niveaux sr, normal,
risqu, et trs risqu. Les emprunteurs dont les risques estims par la fiche de
notation indiquent qu'ils sont srs, sont rapidement accepts et mme peuvent tre
qualifis pour des lignes de crdit ou d'autres rcompenses avantageuses. Les
candidats dont les risques estims normaux sont agrs comme d'habitude et
comme si les IMF n'avaient pas utilis aucune fiche d'valuation statistique. Pour
contrler le risque des candidats risqus, le comit du crdit devra examiner
attentivement ces candidatures, ventuellement rajuster les montants demands.
Enfin, les candidats qualifis trs risqus seront automatiquement rejets.
Par ailleurs, lutilisation de cette approche est sujet controverses dans le secteur de
la microfinance pour plusieurs raisons videntes :
(i)
(ii)
la technique apparait plus approprie pour les crdits individuels que pour
les crdits de groupe ou les banques villageoises. Ceci tient au fait que, de
part le principe de co-responsabilit, il existe une corrlation beaucoup
moins troite entre le risque li au groupe et les caractristiques du groupe
(sexe ou ge moyen des membres du groupe) quentre le risque et les
caractristiques individuelles (Schreiner, 2003).
Cette corrlation sannule par le fait que la responsabilit conjointe au sein
du groupe autorise une surveillance mutuelle et une pression des pairs pour
que les membres respectent leur contrat (Stiglitz, 1990 ; Besley et Coate,
1995 ; Diagne, 1998 ; Bassole, 2004). cet effet, le groupe peut accrotre la
volont de payer dun individu ( cause du besoin de faire comme les autres
et des sanctions sociales) et il peut galement accrotre la capacit dun
individu de payer (mentorat des pairs et assurance informelle).
Inversement, le groupe par leffet dentranement peut anantir la
volont de payer dun individu.
(iii)
P a g e | 11
certains prts sont jugs trs problmatiques et rejets, alors que ces
clients auraient t de bons payeurs, tout comme certains cas limites
auraient t acceptables sans modification. Cest pourquoi il est
pratiquement impossible pour certaines institutions daccepter lvaluation
statistique.
Certes, lvaluation subjective traditionnelle conduit galement modifier
inutilement certains prts et rejeter tort certaines demandes.
Autrement dit, lvaluation subjective ne spare pas non plus toujours le
bon grain de livraie. Mais avec lvaluation statistique, le test historique
quantifie lerreur de prvision et amliore donc le choix entre souplesse et
fermet. Avec lvaluation subjective, lerreur de prvision est inconnue et
les choix sont sous-optimaux.
(v)
P a g e | 12
ne sont pas toujours quantifies. Le fait le plus intressant pour la microfinance est
quune partie (inconnue) du risque dpend des caractristiques personnelles, qui ne
peuvent tre apprcies que si lon connat bien le client.
cet gard, lexamen des avantages lis lvaluation statistique permet de se poser
deux questions : (i) Quelle est la part de risque lie aux caractristiques quantifies ?
Et (ii) est-ce que la mthode de scoring statistique peut-elle remplacer lvaluation
subjective ? (Al Amari 2002, p. 41 ; Shreiner, 2003).
Les pratiques en microfinance permettent de montrer que certains risques sont lis
des caractristiques quantifies ; do il est prfrable dvaluer par la mthode de
scoring statistique ; dautres risques sont lis des caractristiques qualitatives quil
est prfrable dvaluer par la mthode dvaluation subjective.
Or nous pouvons constater que dans le secteur de microfinance, la part des
caractristiques qualitatives6 est trop importante pour que lvaluation statistique
puisse remplacer les agents de crdit et leur valuation subjective. Par exemple, cette
mthode ne permet pas de dterminer si un emprunteur gre bien son affaire (la
capacit managriale et entrepreneuriale du client) ou sil va gaspiller largent du prt
(fongibilit du crdit).
Eu gard aux limites lies au deux types de scoring, il importe de combiner les deux
approches. Ceci tient au fait que lvaluation subjective peut tenir compte dlments
que lvaluation statistique ignore, et lvaluation statistique permet danalyser des
relations trop nombreuses, trop complexes ou trop subtiles pour lvaluation
subjective.
Face aux considrations susmentionnes, il est important de noter que la technique
statistique de scoring nest quune voix complmentaire lvaluation du risque de
crdit et, de ce fait, elle ne doit tre sollicite quaprs lapprobation provisoire de
lagent de crdit (Schreiner, 2003, Wang, 2010). Ceci tient au fait que la technique
ignore les caractristiques qualitatives et ne tient compte que de caractristiques
quantifies, or la part de risque omise dans le scoring mais prise en compte dans
lvaluation subjective est importante en microfinance.
Par exemple, si le scoring intervient avant lapprobation et prdit un faible risque, le
comit de crdit pourrait tre tent de se passer de lvaluation subjective, qui est
plus coteuse. Cela pourrait avoir un effet dsastreux car les crdits qui semblent peu
risqus sur la base des facteurs quantitatifs pourraient savrer trs risqus au regard
des facteurs qualitatifs. Cest pourquoi les institutions de microfinance ne devraient
Lvaluation du risque crdit repose sur linformation soft qui est trs dlicat analyser.
P a g e | 13
utiliser le scoring que pour les demandes de prt provisoirement approuves lissue
dune valuation subjective (Schreiner, 1999a ; 2004).
La figure ci-dessous dcrit la dmarche type suivie par une institution de microfinance
qui utilise le scoring (Schreiner, 2004).
Rejet
Lagent de crdit vrifie la demande
par rapport aux critresde base
Rejet
Approbation
Donnes acceptes
Rejet
Saisie des donnes et calcul du
risque prvu
Rejet
Le comit de crdit
procde une valuation
Approbation provisoire
Aprs lapprobation provisoire, le comit de crdit applique la politique du scoring sur base de risque prvu
Excellent
Normal
Limit
Trs problmatique
0 % du risque
100%
Excellent
Approuv
Normal : Approuv
tel que
Limite Examin et
modifi
Trs problmatique
Rejet
P a g e | 14
P a g e | 15
P a g e | 16
Le modle de Vigano est le modle pionnier construit pour un pays en voie de dveloppement. Ce modle a t appliqu
la Caisse Nationale de Crdit Agricole du Burkina Faso.
P a g e | 17
(Lewis, 1992). La variable est aussitt utilise ds lors quelle permet daccroitre le
pouvoir prdictif (Lewis, 1992).
Toutefois, les principaux facteurs couramment utiliss dans les modles de notation
de crdit comprennent les revenus, l'ge, le sexe de l'emprunteur, l'ducation, la
profession, le type d'employeur, la rgion, le temps l'adresse actuelle, le statut de
rsidence, l'tat matrimonial, tlphone, la valeur des garanties, la dure du prt,
anciennet de lemprunteur, le nombre de cycle de prt etc. (Dinh et Kleimeier, 2007;
Roszbach, 2004; Jacobson et Roszbach, 2003; Martinelli, 1997; Crook, Hamilton et
Thomas, 1992; Boyes, Hoffman et Low, 1989; Capon, 1982 ; Thomas, 2002).
Le revenu est souvent utilis comme indicateur proxy de la sant financire de
l'emprunteur et de son/sa capacit rembourser (Dinh et Kleimeier, 2007). Il existe
une relation ngative entre le revenu et le taux de dfaut des emprunteurs; le revenu
lev est associ un faible risque de dfaut (Jacobson et Roszbach, 2003).
L'occupation est une variable communment utilise dans le modle de notation de
crdit et est fortement corrle avec le niveau de revenu des emprunteurs.
Le revenu stable (salaire, pension) est souvent associ aux faibles risques de dfaut.
Le risque d'insolvabilit diminue lorsque l'emprunteur possde un revenu permanent
(salaire, pension). Ce revenu stable constitue une alternative exploiter en cas de
survenance des problmes de remboursement.
La significativit de la variable ducation nest pas concluante dans la littrature,
dune part certaines tudes appuient que lducation renforce la capacit des
emprunteurs rembourser. Les emprunteurs instruits sont rputs plus stables, avec
les salaires plus au moins levs et donc un faible taux de dfaut (Dinh et Kleimeier,
2007)et, dautres tudes montrent que les pauvres, faiblement instruits, remboursent
mieux que les riches (M. Nowak, 2005).
Les emprunteurs plus gs sont plus rfractaires au risque, et par consquent moins
susceptibles de faire dfaut(Thomas, 2000 et Boyle et al. 1992). Ainsi, les banques sont
plus rticentes prter aux emprunteurs plus jeunes, considrs moins averses au
risque.
Le sexe est une discrimination vidente (les statistiques montrent les femmes sont
moins vulnrables au dfaut que les hommes). Il existe de nombreuses preuves que
les femmes tombent souvent moins en situation dimpays compar aux hommes du
fait quelle sont plus rfractaires au risque (Coval et al., 2000). Toutefois, il faut noter
quen microfinance, les pratiques neutralisent la pertinence de cette variable.
La variable rgion dsigne la rgion du pays habite par l'emprunteur. Comme les
gens de richesse similaire ont tendance vivre dans le mme milieu, le critre
P a g e | 18
P a g e | 19
Les nouveaux projets sont plus exposs au risque que les anciens. Ceci tient au fait
que le degr de risque associ avec les nouveaux projets peut tre attribu au
manque d'exprience de nouveaux entrepreneurs ainsi qu'aux probabilits limites
de prise de risque.
Malgr labondance des caractristiques utilises dans la littrature sur le scoring, il
existe, aucun consensus sur les variables utiliser dans la construction dune fiche de
notation. Le choix des variables dpend de plusieurs facteurs. Ainsi il convient pour
une institution dutiliser une ventilation plus pousse des donnes, de manire
slectionner, les seules variables qui sont susceptibles dinfluencer la probabilit de
dfaut (Schreiner, 2004).
Le tableau 2.1 rcence les variables utilises dans les travaux de Vigan (1993) et de
Schreiner (1999) considrs comme les modles pionniers adapts aux pays en voie
de dveloppement. Les travaux de Schreiner sont les premiers en microfinance.
Vigan (1993) a identifie cinq grands dterminants du risque de dfaut de
remboursement:
La capacit de remboursement de l'emprunteur ;
La volont de remboursement de l'emprunteur ;
La prsence des conditions externes favorables (conomiques et
environnementales) ;
La qualit de l'information qui sert de base de dcision pour l'octroi de
crdit ;
La capacit du prteur s'assurer de la bonne volont du l'emprunteur via
un contrat optimal dincitation.
Bien que les modles de Vigan (1993) et de Schreiner (1999) prsentent certaines
similarits avec les modles des banques classiques, ils restent, cependant, limiter par
lopacit des informations mis la disposition des structures dcentralises qui rend
dlicat lvaluation du risque de crdit (Allen et al., 2004). De ce point de vue, les
modles, appliques aux donnes des ISFD, recourent aux caractristiques proxies
lies lindividu afin dvaluer indirectement la capacit de remboursement.
P a g e | 20
Date du dboursement
Age
Activit professionnelle
Montant accord
Nombre d'enfant
Anciennet
Type de garantie
compte courant
Revenu
Domaine d'activit
Agent de crdit8
empoyement statut
Statut rsidentiel
Genre
statut rsidentiel
Tlphone
Secteur
Nombre d'arrirs
valeur de la maison
volume de crdit hypothcaire
anciennet
compte courant
compte pargne
carte de crdit
major credit card
change card
statut residentiel
store card
compte pargne
valeur de la maison
Outgoing
Nombre d'enfant
Volume de crdit
change card
La variable Agent de crdit mesure lexprience de lagent de crdit en supposant quelle influe significativement sur la probabilit de dfaut de lemprunteur.
P a g e | 21
P a g e | 22
Henley (1995)
Boyele et al.
(1992)
Srinivisan et
Chakrin (1987)
Yobas et al.
(1997)
Dessai et al.
(1997)
87,5
68,4
89,3
66,5
67,3
93,2
62,3
Algorithme
gntique
86
62
64,5
66,4
La lecture du tableau 2.2 montre que les techniques associes aux fortes
performances (en pourcentage des groupes correctement classifis) varient dune
tude lautre. Ceci illustre clairement les controverses autour de la meilleure
technique de construction de la fiche de notation.
Tableau 2:Comparaison des rsultats des recherches empiriques
Analyse
discriminante
Rgression
logistique
Arbre de dcision
Programmation
math.
Rseau des
neurones
Algorithme
gntique
K-nearest
neighbours
Support vestor
machine
Boyles
et al.
(1992)
77,6
Desai et
al. (1997)
West
(2000)
66,5
79,3
Lee et
al
(2002)
71,4
67,3
81,8
73,5
75
74,7
Malholtra Beesens
(2002)
(2003)
69,3
79,3
77,0
66,4
82,6
73,7
79,3
72
77
78,4
79,4
81,7
77,0
76,7
Ong et
al.
(2005)
80,8
82,8
78,2
79,7
P a g e | 23
AD
LMP Logit
RPA
Probit
RNA
AD=analyse discriminante; Logit= rgression logistique; Probit=modle probit; RPA= Recurcive Partitionning
Algorithmes RNA= Rseau des neurones artificiel.
P a g e | 24
de Zeller (1998) et celui de Sharma et Zeller (1997) sont construits sur base des
historiques de credit de groupe ce qui, pour des raisons susmentionnes, sont
inappropris.
Tirso les techniques de construction des fiches de notation varient selon les tudes, ce
qui montre les disparits des points de vue des auteurs dans le choix de la meilleure
technique.
Tableau 4:Publication sur les modles de credit scoring appliqus aux pays en dveloppement
Auteurs (Date, Pays)
Type
d'institution
chantillon
Nombre
des
inputs
Techniques
Performance
Metrics
IMF
100
53 (13)
Analyse discriminante
PCC, R
IMF
868
18(5)
N/A
IMF
168
19(7)
IMF
1641
8(8)
IMF
29956
9(9)
Rgression logistique
PCC, Pseudo-R
IMF
8002
28(12)
PCC, Pseudo-R
Vogelgesang (2001,
Bolivie)
Diallo (2006, Mali)
IMF
5956
30(13)
PCC, Pseudo-R
IMF
269
17(5)
Rgression logistique,
analyse discriminante
Rgression logistique
PCC, R
Banque de
dtail
56037
22(17)
N/A
N/A
Pendant que beaucoup dtudes en finance classique recourent aux mthodes non
paramtriques dans lvaluation du risque de credit, cause des hypothses
auxquelles postulent les techniques paramtriques, trs peu dtudes en microfinance
portent sur ces modles. De ce point de vue, pour modliser le risque de crdit, cette
tude sintresse une mthode non paramtrique les rseaux de neurones (NN)
avec larchitecture Multi-layer Perceptron (MLP) et la Fonction Base radiale (RBF).
cet effet, les rsultats issus de cette mthode seront confronts une mthode
classique (rgression logistique).
1.6. Evaluation de la performance
Deux groupes de critres peuvent tre identifis pour valuer le pouvoir discriminant
dun modle. Il sagit des critres relatifs au pouvoir de prdiction (accurate
classification) et les critres dits pratiques (Thomas, 2002).
Le pouvoir de prdiction du modle regroupe lensemble des critres importants
susceptibles dvaluation le pouvoir discriminant dun modle. Ces critres sont
P a g e | 25
Nombre
Mauvais
Bon
a
c
b
Classe actuelle
Pourcentage
Mauvais
Bon
=c/ (a+c)
=b/ (b+d)
B+c / (a+b+c+d)
P a g e | 26
En plus, dans le domaine du credit scoring, deux types derreur sont considrs
(Thomas, 2002). Il sagit du taux derreur de la premire espce mesur par et le
taux derreur de la deuxime espce mesur par .
Le taux derreur du type I est aussi appel taux du risque de crdit par le fait quil
mesure le pourcentage des emprunteurs dfaillants considrs comme non
dfaillants. Si une institution a ce taux lev, cela suppose que la pratique de la
politique de crdit est trs gnreuse et de ce fait, linstitution se trouve expose au
risque de crdit. Par contre, le taux derreur du type II, appel autrement risque
commercial, reprsente le pourcentage des bons emprunteurs classs comme
dfaillants. Une institution qui a ce taux lev supporte un cot dopportunit
important par le fait quelle refuse les crdits aux bons emprunteurs. Dans un march
concurrentiel, celle-ci peut perdre la part du march.
1.7. Receiver operating curve (ROC)
Le ROC est une courbe paramtre ayant en abscisse lerreur de la deuxime espce
et en ordonne lerreur de la premire espce. Elle permet de synthtiser de manire
plus simple lvolution des erreurs en fonction du seuil. Sa prsentation sous forme
dune densit permet de montrer les dispersions potentielles des scoring sous les
deux types derreur. Pour un seuil donn, plus lerreur du type I est faible et plus
lerreur du type II est fort, meilleur est le scoring.
La ROC se visualise en fonction du seuil, gauche du seuil le scoring est parfait et
droite scoring contientdes erreurs de classement (Mays, 2004).
P a g e | 27
Il y a une statistique gnrale, plus riche que le coefficient de Gini, qui permet de
dterminer le pourcentage de la surface totale couverte par la courbe ROC, appel
aussi AUROC ou c-statistic. LAUC mesure le pouvoir discriminant du modle credit
scoring en valuant la surface de la courbe sous la courbe ROC comme la probabilit
quun bon crdit reoit un meilleur score que le mauvais crdit (0,5<AUC<1) (Tasche,
2005) :
(1)
Formule 2.
(1)
Lestimation de cette statistique est fonde sur une hypothse selon laquelle les cots
sont similaires pour tous les cas (bons ou mauvais) cest--dire il n y a pas de
diffrence de cot pour chaque cas individuel. Cependant, dans la pratique, cette
hypothse est souvent viole. Ceci tient au fait que le volume de credit varie souvent
selon le contexte.
P a g e | 28
Conclusion partielle
Lobjectif de ce chapitre tait de discuter des questions fondamentales rencontres
dans la construction dune fiche de notation du risque de crdit. Il sagit de discussion
relative aux avantages et limites de la notation statistique du risque de crdit en
microfinance, sa complmentarit avec lvaluation subjective, au choix des
variables inclure dans le modle, au choix de la meilleure technique de classification
et enfin leur critres dvaluation.
Ainsi, nous pouvons dgager les constats majeurs suivants :
lutilisation de lapproche statistique dvaluation du risque de crdit est
sujette controverses dans le secteur de la microfinance pour plusieurs raisons
videntes : labsence dune base de donnes robuste dans le chef des IMF,
nest pas approprie la mthodologie de crdit de groupe, ne permet pas
toujours de sparer le grain de livraie, est vulnrable au changement du
contexte.
Les pratiques en microfinance permettent de montrer que certains risques lis
des caractristiques quantifies peuvent tre dvalues par la mthode de
scoring statistique ; dautres risques lis des caractristiques qualitatives
peuvent tre values par la mthode dvaluation subjective, do il est
prfrable darticuler les deux approches.
la technique statistique de scoring nest quune voix complmentaire
lvaluation du risque de crdit et, de ce fait, elle est sollicite quaprs
lapprobation provisoire de lagent de crdit.
techniques de notation de crdit prsentent un certain nombre d'avantages
par rapport aux techniques dvaluation subjective, tant pour les prteurs que
les emprunteurs.
Le choix sur les variables inclure dans la fiche de notation varie en fonction du
contexte dans lequel la fiche est construite.
Plusieurs techniques paramtriques et non paramtriques permettent
destimer la probabilit de dfaut et de classer les emprunteurs (risqus ou non
risqus). Cependant, le dbat sur la meilleure technique de classification
utilise nest pas concluant dans la littrature.
P a g e | 29
P a g e | 30
P a g e | 31
P a g e | 32
Pour la variable objet_du_prt, nous prvoyons un signe positif pour le fait que le
crdit destin l'acquisition d'un actif implique un risque suprieur un crdit destin
au fonds de roulement. La variable Ecart_Temps mesure la dure coule entre la
demande de crdit et le dboursement. Nous supposons que plus cette dure est
importante, forte est la probabilit de dfaut. Ceci tient au fait que la priode
dopportunits du client peut ou ne pas correspondre la priode dacquisition du
crdit, le client se trouvant ainsi expos un risque commercial. Pour cette raison, un
corrlat ngatif ou positif est attendu pour cette variable.
La variable Ecart_Mont vrifie lgalit entre la le montant demand et le montant
rellement peru par le client. Moins le montant peru correspond aux attentes du
client, plus la probabilit de dfait est forte. Ceci suggre que souvent les montants
perus par les clients ne correspondent pas leurs besoins en fonds de roulement.
Une corrlation positive est attendue pour cette variable.
Les emprunteurs responsables d'une famille sont, en gnral, supposs avoir un
meilleur comportement de remboursement de leurs dettes que ceux qui sont seuls,
c'est--dire ceux sans obligations familiales (Kleimeier & Dinh,2007). Cependant,
laugmentation de la taille de la famille affecte positivement le risque de dfaut. Pour
cette raison, un effet positif est attendu pour les variables Pers_en_charge et Enfants.
Ces variables reprsentent les postes des charges importants dans le budget de la
micro-entreprise. La prise en compte de ces variables est subtile en microfinance
parce quil est dlicat de sparer le budget du mnage de celui de lactivit (microentreprise). Les deux budgets sont souvent imbriqus. Et donc plus la taille du
mnage augmente et plus le risque de dfaut augmente.
Un corrlat ngatif est attendu pour la variable Exprience de lemprunteur, puisque
les emprunteurs qui ont une certaine exprience et une bonne maitrise du risque et
de la rentabilit dans la gestion de leurs activits ont une plus faible probabilit de
dfaut compars ceux qui sont sans exprience.
En microfinance, la rputation de l'emprunteur est la principale garantie pour lIMF.
Ceci suggre dune part, que le problme de disposition dune garantie importante est
plus pos pour les nouveaux emprunteurs et pour ceux qui ont enregistr dans le
pass de problme des remboursements. Pour cette raison, un corrlat ngatif est
attendu pour la variable Garantie. Cependant, il n'existe aucune preuve empirique sur
la relation entre la variable Type_Ganr et de la probabilit de dfaut et ainsi le signe de
lestimateur de cette variable nest pas dtermin.
D'autre part, il est rcurent de constater dans les pratiques des IMF quun volume
important de crdit est accord seulement aux emprunteurs bons payeurs. Les
montants de crdit levs peuvent tre associs aux anciens clients et bons payeurs,
P a g e | 33
puisque ces clients ont une probabilit plus faible de dfaut de remboursement
compar aux emprunteurs qui ont reu un faible volume de crdit. Par consquent, un
signe ngatif est attendu pour le coefficient de la variable Montant et un signe positif
pour la variable Nomb_cycle.
La variable statut_resid mesure le rgime doccupation du logement cest--dire
montre si lemprunteur est propritaire du logement, locataire ou sil vit avec sa
famille. Aucune relation empirique nest prdite pour cette variable.
La variable Taux_d_intrt est supposer avoir un corrlat positif avec les difficults de
remboursement, car son augmentation accrot la probabilit du risque de dfaut.
Enfin, nous insrons une autre variable importante, quoique totalement subjective. Il
sagit de lopinion de lanalyste de crdit (Opinon_AC) sur la probabilit qu'un client
tombe en impay. Comme pour la variable prcdente, nous nous attendons un
effet positif.
Les tableaux 2.2 et 2.3 ci-dessous dcrivent respectivement nos variables
quantitatives et les frquences des variables qualitatives.
Age
Exprience
Val_gar
Enfant
Montant
Ecart_temps
Nom_cycle
Taux_intret
R1
R2
R3
Per_charg
ROE
ROA
Minimum
Maximum
Moyenne
25
0
0
0
100
7
0
45
1,18
,00
18,00
0
,00
,00
71
26
10110
14
4500
45
8
54
5,21
1,64
85,00
14
1,15
1,00
48,59
9,44
1206,76
4,75
946,53
14,69
2,09
46,24
3,0244
,7839
33,6802
4,38
,2898
,3673
La lecture du tableau 2.1 montre que lge moyen de lchantillon se situe environ 49
ans, il varie entre 25 et 71 ans. Lexprience moyenne des emprunteurs est de 9 ans,
cependant, la description de lchantillon montre que certains emprunteurs sont sans
P a g e | 34
lexprience. Le montant de crdit varie entre 100 et USD 4500 avec une moyenne de
USD 947. La dure moyenne de traitement de dossiers est estime environ 15 jours.
Le nombre de cycle moyen est de 2 ans.
Les ratios financiers sont pour la plupart faibles. Les tendances moyennes de ROA,
ROE, R1, R2 sont relativement faibles et sont chiffres respectivement 0,37 ; 0,28 ;
0,78 ; 3,024. Le taux dintrt moyen annuel est estim 46,24%. La valeur moyenne
de la garantie est de USD 1206,76.
Tableau 7: Statistiques descriptives des variables qualitatives
% de bons emprunteurs
Mari
Clibataire
Veuve/veuf
Divorc
Autres
Aucune
Financire
Physique
Avaliseur
Autres
Propritaire
Locataire
Autres
51,4
0,2
7,2
2,3
1,4
6,3
0
41
11,7
3,6
19,8
42,3
0,5
% de mauvais
emprunteurs
30,6
1,4
2,7
2,3
0,5
5,4
0
23
5,9
3,2
7,2
29,7
0,5
Rat_cred
Oui
Non
43,2
30,6
19,4
6,8
Objet
Stocks
actifs fixes
55,9
31,1
6,8
6,3
Opin_Ac
Avec rserve
Sans rserve
23,00
33,8
39,6
3,6
Etat_civil
Typ_gar
Stat_resi
Concernant les variables qualitatives, la plupart des emprunteurs sont maris, soit une
proportion de 81,4%. La majorit des emprunteurs sont locataires, soit une proportion
42,3% pour les bons emprunteurs et 29,7% pour les mauvais emprunteurs. Les
garanties physiques et les pratiques davaliseur sont les plus rependus pour la
majorit des emprunteurs. Lersultat sur lobjet de prt apparait relativement
satisfaisant, soit 62,7 pour financement de fond de roulement et 37,3% pour le
financement des actifs fixes.
P a g e | 35
De plus, plus de 70% des emprunteurs ont vu leur montant de crdit sollicit tre
diminu la suite des analyses du comit de crdit. Les rsultats montrent galement
que 39,6% des prts approuv avec rserves ont t problmatique contre 23% de
prts approuv sans rserves qui nont pas connu de problme de remboursement.
Ceci laisse supposer que les valuations intuitives des agents de crdit sont parfois
moins rigoureuses.
2.2 Description des mthodes
Comme susmentionn, il ny a pas de consensus autour du choix de la meilleure
mthode de classification des bons et mauvais emprunteurs. De ce fait, la
construction de notre fiche de notation portera sur deux mthodes de classification
dont lune paramtrique (rgression logistique) et lautre non paramtrique (rseaux
de neurones). Sagissant du rseau des neurones, nous utiliserons deux
architectures communment utilises dans la classification des bons et mauvais
emprunteurs (Vellido, Lisboa, & Vaughan, 1999; Zhang, Patuwo, &Hu, 1998) : Perceptron
Multicouches et Fonction Base Radiale (RBF). Le recours ces trois techniques va
permet, la lumire des critres relatifs au pouvoir discriminant et leur facilit de
mise en uvre, de slectionner le modle qui prdit le mieux le risque de crdit.
A. Rgression logistique
La rgression logistique est une technique qui permet de modliser lapproche
rponse binaire. Ainsi il permet d'ajuster la surface des donnes dans le cas dune
variable dpendante dichotomique (J. Desjardins, 2007). Elle correspond une
technique statistique dont l'objet est, partir d'un fichier d'observations, de produire
un modle permettant de prdire les valeurs prises par une variable catgorielle, le
plus souvent binaire, en se basant sur une srie de variables explicatives nominales.
Contrairement la rgression multiple et l'analyse discriminante, la mthode
n'exige pas une distribution normale des prdicateurs ni l'homognit des variances.
Celle-ci peut expliquer en partie son recours dans lapplication de la plupart de science
(mdecine, marketing, science politique, assurance, etc.).
Concernant lobjet de ce mmoire, Il sagit de prvoir laide de p variables
explicatives lappartenance un groupe (mauvais ou bons emprunteurs). Comme il
existe une incertitude, nous la modlisons comme une probabilit que lobservation
soit dans le groupe mauvais emprunteurs sachant nous disposons des observations
x0.
|
P a g e | 36
Toutefois, pour rsoudre ce problme, une contrainte simpose, il faut que la somme
de probabilit relative chaque groupe corresponde 1 :
|
cet effet, un log au rapport de probabilit est calcul pour tenir compte de cette
contrainte. Ainsi nous obtenons une mesure comprise entre 0 et 1 et que nous
pouvons relier la probabilit de dfaut aux variables explicatives via une fonction f
(linaire). Et le modle de la rgression logistique scrit :
|
|
|
P a g e | 37
Les premires recherches remontent aux annes 1940 9, mais il a fallu attendre les
progrs de linformatique et des outils mathmatiques puissants pour renouveler
lintrt pour ces techniques. Grce leur capacit de classification et de
gnralisation, les rseaux de neurones sont gnralement utiliss dans des
problmes de nature statistique, tels que la prvision du risque de crdit, lobjet de
cette tude.
a. Structure du rseau
Un rseau neuronal est lassociation, en un graphe plus ou moins complexe, dobjets
lmentaires, les neurones formels. Les principaux rseaux se distinguent par
lorganisation du graphe (en couches, complets.), cest--dire leur architecture, son
niveau de complexit (le nombre de neurones, prsence ou non de boucles de
rtroaction dans le rseau), par le type des neurones (leurs fonctions de transition ou
dactivation) et enfin par lobjectif vis : apprentissage supervis ou non, optimisation,
systmes dynamiques.
Somme pondre
Fonction dactivation
Activation
Fonction de combinaison
Seuil
De faon trs rductrice, un neurone biologique est une cellule qui se caractrise par
les lments suivant :
des synapses, les points de connexion avec les autres neurones, fibres
nerveuses ou musculaires ;
des dendrites, les entres des neurones ;
laxone, la sortie du neurone vers dautres neurones ou fibres musculaires;
9
Cest en 1943 que Mc Culloch (neurophysiologiste) et Pitts (logicien) ont propos les premires notions de
neurone formel.
P a g e | 38
Par analogie, le neurone formel est un modle qui se caractrise par un tat interne s
S, des signaux dentre
et une fonction dactivation.
(
de leur fonction
stochastiques
avec la probabilit
, 0 sinon (H
intervient comme une temprature dans un algorithme de recuit
simul),
etc.
Les modles linaires et sigmodaux sont bien adapts aux algorithmes
dapprentissage impliquant une rtropropagation du gradient car leur fonction
dactivation est diffrentiable ; ce sont les plus utiliss. Le modle seuil est sans
doute plus conforme la ralit biologique mais pose des problmes
dapprentissage. Enfin le modle stochastique est utilis pour des problmes
doptimisation globale de fonctions perturbes ou encore pour les analogies avec les
systmes de particules. On ne le rencontre pas en data mining.
P a g e | 39
P a g e | 40
Couches
dentre
s
Couches
caches
Couches
de sorties
10
Marvin Minsky reprochait aux modle de rseau de neurone de ne pas pouvoir modliser le phnomne non
linaire plusieurs.
P a g e | 41
La fonction calcule par le neurone est dite base radiale car elle possde une
symtrie radiale autour du point de rfrence : si on ralise une rotation
quelconque autour de ce point, la sortie du neurone reste inchange.
Cette fonction est similaire une fonction de En pratique, il est trs courant d'utiliser
une fonction de Kernel utilis dans la rgression de Kernel (Harle, 1990). La fonction
dactivation peut prendre nimporte quel variet de fonction. Toutefois, il est trs
courant d'utiliser une fonction d'activation gaussienne dfinie :
Le paramtre
peut tre interprt comme l'inverse de la sensibilit du neurone :
plus il est grand, plus il faut que les entres soient proches des valeurs de rfrences
pour que la sortie du neurone soit proche de 1.
Les outputs sont calculs suivant une combinaison linaire de valeur cache avec une
fonction dactivation du type identit.La diffrence entre ces deux courbes peut se
rsumer par la formulation suivant :
P a g e | 42
La rgion proche du centre RBF est appel receptive field de neurone cach. Les
neuronaux base radiale sont aussi appel localized receptive fields, locally tuned
processing units, or potential functions.
L'apprentissage des RFR permet de dterminer les paramtres de ces rseaux qui
sont les centres des fonctions radiales, la matrice de variance et les poids des
connexions entre les neurones de la couche intermdiaire et ceux de la couche de
sortie. On peut classer ces techniques en trois groupes : Techniques supervises,
Techniques heuristiques, Techniques d'apprentissage en deux temps.
En pratique, le problme d'interpolation n'est pas toujours intressant.
Premirement, les donnes sont gnralement bruites et l'interpolation utilisant
toutes les donnes de l'apprentissage peut provoquer un sur-apprentissage et par
consquent, une faible gnralisation. Deuximement, pour garantir une
interpolation correcte, le nombre de fonctions de base est gal au nombre de
vecteurs d'apprentissage. Ceci peut donner une dimension importante au problme
d'apprentissage. Les fonctions radiales peuvent tre adaptes pour un problme
d'approximation de fonction et de gnralisation par apprentissage (Ghosh et al.
1992), (Poggio, 1989).
11
Cette technique consiste diviser les donnes disponibles en trois lots distincts. Le premier lot sert
entraner le rseau de neurone. Le second lot sert la validation du rseau. Lerreur de validation doit
normalement diminuer au cours du processus dapprentissage (la variance diminue). Mais quand le rseau
commence apprendre par coeur (le biais augmente, alors lerreur de validation recommence crotre), on
arrte alors la phase dapprentissage. Le troisime lot sert vrifier que la gnralisation est correcte.
P a g e | 43
Conclusion partielle
Ce chapitre, sinscrivant dans le contexte de Life Vest, a permis de dcrire la base de
donnes et sa mthodologie, et les mthodes destimation de la fiche de notation.
En effet, nous avons recouru dune part aux dossiers de crdit et, dautre part aux
agents de crdit pour vrifier et complter quelques informations afin de constituer
notre base de donnes de 222 dossiers de crdit pour une priode de deux ans et
demi (allant de 2010 mai 2013).
De plus, lanalyse descriptive et exploratoire des variables quantitatives et qualitatives
retenues pour cette tude a permis de commenter les tendances principales des
variables ainsi que de prdire nos attentes quant aux signes de ces variables. En effet,
nous nous attendons un corrlat ngatif ente la probabilit de dfaut et les variables
telles que lge de lemprunteur, montant du prt, nombre de cycle, valeur de la
garantie, ratio fond de roulement, ratio de liquidit, ROE, ROA, exprience. Par
contre, des corrlats positifs sont prdits pour les variables telles que le nombre
denfants, nombre de personnes en charge, lge de stock, linadquation entre
montant requis et dcaiss, dure de traitement du dossier, taux dintrt. Par
ailleurs, les variables tat civil, statut rsidentiel, type de garantie et lobjet du prt
tant difficile cerner, aucun signe nest prdit les concernant.
Afin dvaluer la pertinence de prdiction du modle de prdiction du risque de crdit,
nous avons opt pourla Rgression logistique et les Rseaux de neurones du type
Perceptron Multicouches et Fonction Base Radiale. Ceci en raison de leur
simplicit (RL) et parce quils permettent de prendre compte du phnomne
changeant (rseaux de neurones) (Barney et al, 1999; Novak et LaDue, 1999; Lee et
Jung, 1999).
Lexpos fait dans ce chapitre, coupl avec celui du premier chapitre, pose les jalons
ncessaires lvaluation de la pertinence dune fiche de notation statistique en
microfinance.
P a g e | 44
Rgression logistique
P a g e | 45
Avec
(
Yt prend la valeur de 1 si le client rembourse son prt avec des arrirs de 30 jours
ou plus et au cas contraire Y prend la valeur de 0.
Pi st pro
i it stim u m uv is mpru t ur
Xi est la matrice des 20 variables explicatives
Aprs estimation par la technique de maximum de vraisemblance avec la mthode
dascendance pas pas sous SPSS 19, le rsultat obtenu (cf. annexe 4), aprs cinq
itrations, se prsente comme suit :
(
Ce rsultat fournit une premire tentative de validation des nos hypothses. En effet,
la lecture de la rgression montre des rsultats contrasts relativement aux
prdictions issues de notre deuxime hypothse selon laquelle les caractristiques
socio-conomiques des clients figurent parmi celles qui ont les plus dinfluence sur la
probabilit de dfaut des clients.
De fait, parmi les facteurs socio-conomiques examins, seules les variablesge et
ROA expliquent la variance de la probabilit de dfaut. De mme, la variable opinion
de lagent de crdit apparait significative dans notre modle, ceci laisse supposer que
lvaluation subjective telle que mene par les agents de crdit permet de prvoir les
ventuels problmes de remboursement. Une des explications possibles de ces
constats repose sur la qualit des informations renseignes par les emprunteurs de
linstitution sous examen.
Par ailleurs, ce constat nous conduit encore une fois conclure en faveur de notre
troisime hypothse selon laquelle lopacit des informations financires et non
financires de la plupart des clients des IMF, constitue un obstacle majeur dans la
mise en uvre dune dmarche de scoring statistique. De fait, la plupart des variables
inclues dans notre modle apparaissent non significatives, ce qui laisse prsager que
la plupart des informations, renseignes par les emprunteurs ou estimes par les
P a g e | 46
R-deux de Nagelkerke
200,370a
,328
,448
a. L'estimation a t interrompue au numro d'itration 5 parce
que les estimations de paramtres ont chang de moins de ,001.
Modle
Khi-Chi-deux
ddl
Sig.
86,363
,000
P a g e | 47
Ddl
Sig.
12,957
,113
P a g e | 48
P a g e | 49
Caractristique
Poids pi et poids qi
Fonction de combinaison
Fonction d'activation
Nombre
Tangente Hyperbolique
5
Fonction de combinaison
Fonction d'activation
Nombre
Fonction d'erreur
MaxMou
5
Entropie croise
Couches caches
Couches de sortie
P a g e | 50
Observations
Prvisions
0
Apprentissage
84
15
Pourcentage
correct
84,8%
Test
1
Pourcentage global
0
21
67,3%
29
36
32,7%
8
63,2%
76,9%
78,4%
1
Pourcentage global
Variable dpendante : dfaut
5
55,7%
19
44,3%
79,2%
78,7%
Le taux derreur du type II est fix 21,6, ce qui reprsente le pourcentage des
mauvais emprunteurs classs dans le groupe de bons emprunteurs. Ceci suggre que
lapplication de ce modle expose linstitution un risque de crdit de crdit de 21,6%.
A.3 Importance des variables
Les rsultats, prsents dans la figure 3.2, montrent que parmi les 20 variables
utilises dans ce modle, seules 9 influent les plus sur la probabilit du risque de
crdit. Il sagit des variables ge de stock, ge de lemprunteur, opinion du comit de
crdit, la valeur de la garantie, le statut rsidentiel, ltat civil, types de garantie, cart
du montant et destination du crdit. Dans la pratique, ces rsultats peuvent aider les
analystes de crdit centrer lvaluation sur les variables qui prsentent un fort
corrlat avec la probabilit de dfaut.
Par ailleurs, les rsultats obtenus, contrairement ceux de la rgression logistique,
confortent partiellement les prdictions issues de notre hypothse 2. De fait, neuf sur
vingt variables tant significatives, nous pouvons conclure que les caractristiques lis
des emprunteurs (mnage) et leur activit expliquent effectivement leur
dfaillance.
P a g e | 51
Toutefois, lapplication de ces rsultats reste restrictive du fait que les rseaux
neuronaux sont de nature des boites noires, et de ce fait, ne permettent pas
linterprtation des variables aprs apprentissage.
B. Rseaux de neurone Fonction base radiale
la diffrence de Perceptron Multicouches, le neurone base radiale est construit
partir d'une fonction du mme nom (RBF). Au lieu de raliser une somme pondre
de ses entres, le rseau compare chaque entre une valeur de rfrence et produit
une sortie d'autant plus grande (proche de 1) que les entres sont proches des valeurs
de rfrences.
Larchitecture du rseau se spcifie comme suit :
Le nombre dunit de couche masque optimal est calcul automatiquement sous
SPSS. La fonction dactivation pour les couches caches est du type fonction base
radiale normalise, la fonction de sortie est slectionne automatiquement. La
mthode dchelonnement pour les covariables est du type standardis. Le nombre
de chevauchement des couches caches (units masques) autoriser est calcul
automatiquement sous SPSS.
A.2 Rsultats de la modlisation des rseaux de neurones fonction base radiale
Les caractristiques de la structure neurale base radiale se prsentent, aprs
estimation, comme suit :
P a g e | 52
Caractristique
Standardis
Couches caches
Fonction de combinaison
Fonction d'activation
Nombre
Exponentielle
8
Fonction de combinaison
Fonction d'activation
Nombre
Fonction d'erreur
Identifie
2
Somme des carrs
Couches de sortie
Aprs apprentissage, nous pouvons observer, dans le tableau 3.6, que la performance
globale du modle est relativement faible. En effet, le pourcentage des emprunteurs
correctement classs dans les deux groupes est de 68,4%. De mme, le rsultat de la
matrice de confusion montre que 92,8% des bons emprunteurs sont correctement
classifis dans le groupe de bons emprunteurs. De ce fait, le taux derreur du type
I(risque de rationner le crdit un bon emprunteur) est sensiblement faible, soit 7,2%.
Cependant, le modle affiche une performance faible en ce qui concerne la part des
mauvais emprunteurs correctement classifis dans le groupe des mauvais
emprunteurs. Ceci suggre que lapplication de ce modle par Life Vest, lexpose un
risque de crdit (taux derreur du type II) dordre de 70,5%.
Tableau 14: Matrice de Classification (Confusion matrix)
Echantillon
Observations
0
Apprentissage
Test
0
1
Pourcentage global
0
1
Pourcentage global
90
43
84,2%
37
18
93,2%
Prvisions
1
7
18
15,8%
2
2
6,8%
Pourcentage
correct
92,8%
29,5%
68,4%
94,9%
10,0%
66,1%
P a g e | 53
P a g e | 54
A. Pouvoir discriminant
Pour une ventuelle comparaison de pouvoir discriminant de ces trois modles, la
spcificit, la sensibilit et la statistique AUROC sont analyss dans cette partie.
Nous pouvons observer, dans le tableau 3.8, que les performances sont relatives et
varient selon le critre utilis. En effet, les rseaux de neurones structure
Perceptron Multicouches affichent une performance globale suprieure au rseau
neuronal base radial et la rgression logistique. Concernant le pourcentage des
bons emprunteurs correctement classifis (spcificit), le rseau neuronal base
radial est plus performant cest--dire minimise le taux derreur du type I ou le risque
commercial (risque de rationner le crdit un bon emprunteur).
Sagissant du pourcentage de mauvais emprunteurs correctement classifis
(sensibilit), la rgression logistique affiche une bonne performance (66,7%) compar
aux rseaux de neurones du type MLP et RBF. Ceci suggre que la RL minimise le taux
derreur du type II ou le risque de crdit.
Ce constat nous conduit conclure en faveur de notre premire hypothse selon
laquelle les facteurs pris en compte dans la technique de credit scoring nexpliquent
pas totalement ( 100 %) la variance de la probabilit de dfaut des clients. En effet,
les performances globales de trois modles sont sensiblement faibles (76,9 pour le
MLP, 74,7 pour la RL et 68,4 pour le RBF), ceci suggre que la plupart des facteurs
utiliss dans cette tude contiennent une part de bruit (variations alatoires par
rapport la valeur relle) et des erreurs du fait les informations renseignes par les
emprunteurs et celles servant de base aux estimations des agents de crdit sont
souvent opaques.
Tableau 15: Comparaison des rsultats (en % des groupes correctement classifis et AUROC)
MLP
% de bons
emprunteurs
correct
84,8
% mauvais
emprunteurs
correct
63,2
RBF
92,8
RL
79,4
% global
AUROC
76,9
0,86
29,5
68,4
0,76
66,7
74,7
0,842
Les rsultats issus de la courbe ROC montrent que la statistique AUROC de la structure
MLP (0,86) est relativement suprieure celle de la rgression logistique (0,842). Les
deux statistiques sont comprises dans la limite (0,75 et 0,91) fix par Tasche (2005).
P a g e | 55
Nous pouvons donc conclure dans plusieurs cas, la lumire des travaux antrieurs
(Arminger, Enache, & Bonne, 1997; Desai, Conway, Crook, & Overstreet, 1997; Desai,
Crook, & Overstreet, 1996; Hand & Henley, 1997; Lee & Chen, 2005; Lee, Chiu, Lu, & Chen,
2002; West, 2000), que le modle non paramtrique du type MLP a un pouvoir
discriminant suprieur la rgression logistique.
Toutefois, pour des fins darbitrage entre ces deux mthodes, il importe de tenir
compte des critres dits pratiques.
Perceptron Multicouches
Rgression Logistique
P a g e | 56
B. Critres pratiques
Concernant les critres dits pratiques, les aspects comme la vitesse de classification, la
facilit dinterprtation et la simplicit du modle et la transparence sont analyss.
Les rsultats de trois modles susmentionns, permettent de montrer que la
modlisation par les rseaux neuronaux artificiels ne permet pas linterprtation facile
des variables, aucun signe corrlation nest peru entre les variables indpendantes et
la probabilit de dfaut des emprunteurs. Les rsultats issus de rseaux neuronaux
structure Perceptron Multicouches et base radiale fournissent un tableau ou figure
de classement des variables explicatives par ordre dimportance, mais ces rsultats,
contrairement la rgression logistique, ne permettent pas linterprtation des
variables (difficile destimer les paramtres).
3.3. Choix du modle de scoring
la lumire de la comparaison des pouvoirs discriminants et des critres dits
pratiques, nous optons pour le modle de rgression logistique du fait quil minimise
le taux derreur du type II (probabilit de slectionner un mauvais emprunteur)et est
performant au regard des critres dits pratiques. Il faut noter que le seuil de csure
(cut-off) est fix 0,5 cest--dire nous considrons comme mauvais emprunteur, celui
qui affiche une probabilit de dfaut suprieur 0,5. Cela dit, le modle retenu pour
lestimation du risque de crdit est :
(
P a g e | 57
3.4. Identification des obstacles et bauche des stratgies de mise en uvre dune
fiche de notation
Les rsultats issus de lvaluation de la pertinence du pouvoir prdictif des modles
de credit scoring ont montr que ces modles ne permettent pas de modliser
correctement le risque de crdit quelque soit la dmarche conomtrique utilise. De
ce fait, plusieurs obstacles lutilisation du credit scoring peuvent tre identits :
Les dossiers de crdit ne sont pas formaliss. En effet, les informations
recenses et enregistres diffrent prodigieusement dune priode un autre,
dun dossier un autre, dun agent de crdit lautre, dune agence une
autre.
Le non professionnalisme des agents de crdit dans la collecte et tenue des
informations relatives aux clients et leur activit. En effet, la plupart des
informations enregistres dans les dossiers de crdit sont mal renseignes,
cest--dire contiennent des impurets erreurs et une part de bruit (cart
considrable entre les informations enregistres dans le dossier de crdit et les
informations relles).
Les informations enregistres pouvant servir de base au montage du dossier et
leur valuation sont essentiellement financires, or au regard de la thorie
(Schreiner, 2003) et des pratiques en microfinance, la prise en compte des
informations essentiellement financires et quantitatives ne permettent pas
destimer correctement la probabilit de dfaut de clients.
P a g e | 58
P a g e | 59
un suivi troit assorti de dmonstrations du pouvoir prdictif pour les prts en cours.
De ce point de vue, Life Vest doit envisager de formation. Les objectifs de ces sances
de formation sont :
(i)
(ii)
(iii)
(iv)
De plus, le systme informatique actuel de Life Vest a une capacit insuffisante car il
ne sert gnralement qu suivre les prts. La mise en place du scoring et lutilisation
plus systmatique dune base de donnes lectronique imposent daccorder une plus
grande attention la qualit des donnes do Life Vest se doit dinvestir dans le
systme informatique. Toutefois, elle peut 'utiliser dans un premiers temps un fichier
de tableur pour raliser un publipostage, l'aide d'un logiciel de traitement de
donnes (EXCEL). Linstitution se doit de veiller la mise en test de cette
configuration pendant 3 6 mois, avec une mise jour hebdomadaire des bases de
donnes.
Par ailleurs, tant donn quune fiche de notation nest tablie que pour les
emprunteurs dont les demandes avaient dj t acceptes, les prvisions effectues
pour les emprunteurs non prslectionns ont une prcision inconnue. En effet, la
prise en compte des prvisions des rejets aprs une visite sur le terrain est une
solution alternative.
Pour ce faire, linstitution doit commencer par saisir dans leur systme informatique
les donnes de plusieurs de demandes rejetes. Une fois quelles disposent des
donnes des demandes rejetes et de celles approuves aprs la visite, elles peuvent
tablir des fiches de notation pour prvoir les rejets sur la base des caractristiques
connues avant la visite. (Mme avec les donnes des demandes rejetes, une fiche de
notation du risque de non-remboursement avec visite ne permet pas dapprouver les
demandes sans visite car le comportement de remboursement des emprunteurs non
prslectionns reste inconnu.)
P a g e | 60
Conclusion partielle
Ce chapitre nous a permis dune part d'valuer la validit ainsi que le caractre
prdictif de diffrents modles de credit scoring applique aux donnes de Life Vest
et dautre part, de deceler les obstacles leur utilisation. Les rsultats fournis par ces
diffrents critres retenus nous ont permit de dgager les conclusions suivantes :
Dans lensemble, tous les modles (MLP, RBF, RL) construits prsentent un pouvoir
prdictif faible(76,9% pour le MLP, 74,7% pour la RL et 68,4% pour le RBF), ceci suggre
que la plupart des facteurs utiliss dans cette tude contiennent une part de bruit
(variations alatoires par rapport la valeur relle) et des erreurs du fait les
informations renseignes par les emprunteurs et celles servant de base aux
estimations des agents de crdit sont souvent opaques.
Nanmoins, la comparaison de trois modles montre que les rseaux de neurones du
type Multicouches (MLP) et le modle logit semblent les plus adquats pour valuer le
comportement des emprunteurs en termes de remboursement. De plus, l'utilisation
de la courbe ROC confirme que ces deux modles prsentent les meilleurs
compromis entre sensibilit et spcificit.
Par ailleurs, le modle Logit se distingue comme tant le meilleur modle du point vue
des critres dits pratiques, mais sur lensemble des variables rgresses, seules les
variables ge, opinion des agents de crdit, ROA appraissent significatives.
Ces conclusions confortent dune part les prdictions issues de notre troisime
hypothse selon laquelle lopacit des informations financires et non financires de
la plupart des emprunteurs, constitue un obstacle majeur dans la mise en uvre dune
dmarche de scoring statistique et dautre part, infirment nos prdictions quant la
deuxime hypothse selon laquelle les caractristiques socio-conomiques des
clients figurent parmi celles qui ont le plus dinfluence sur la probabilit de dfaut des
clients.
Le R-deux de Nagelkerke fix 44,8 montre clairement que ce modle de crdit
scoring (RL) nexplique pas pleinement la variance de la probabilit de dfaut des
emprunteurs. Ce constat nous conduit conclure en faveur de notre premire
hypothse selon laquelle la plupart des facteurs pris en compte dans la technique de
credit scoring nexpliquent pas totalement ( 100 %) la variance de la probabilit de
dfaut des clients.
Plusieurs obstacles sont de nature expliquer ces rsultats, notamment labsence
des procdures de collecte et saisie formalises, la plupart des informations
renseignes par les emprunteurs ou estimes par les agents de crdit contiennent une
part de bruit ou des erreurs.
P a g e | 61
Conclusion gnrale
L'objectif de ce mmoire, sinsrant dans le prolongement de travaux de Vigano (1993)
; Schreiner (1999a, 2003), et Dinh et Kleimeier (2007), tait dvaluer la pertinence de
lvaluation statistique du risque de crdit applique au contexte de Life Vest.
Cette rflexion a donn naissance trois questions majeures :
(i)
Quel est le pouvoir dun modle de credit scoring, appliqu aux donnes dune
IMF congolaise, pouvoir modliser correctement le risque de crdit ?
(ii) Quelles sont les lments qui expliquent des emprunteurs dans cette structure?
(iii) Quels seront les obstacles dans la mise en uvre dune dmarche de scoring ?
Comment mettre en place les procdures quil implique ?
Afin de rpondre ces questions, nous sommes parties des considrations selon
lesquelles :
(i)
Dans lensemble, tous les modles (MLP, RBF, RL) construits prsentent un
pouvoir prdictif faible (76,9% pour le MLP, 74,7% pour la RL et 68,4% pour le RBF),
ceci suggre que la plupart des facteurs utiliss dans cette tude contiennent
une part de bruit (variations alatoires par rapport la valeur relle) et des
P a g e | 62
(iii) le modle Logit se distingue comme tant le meilleur modle du point vue des
critres dits pratiques, mais sur lensemble des variables rgresses, seules les
variables ge, opinion des agents de crdit, ROA appraissent significatives ;
(iv) le R-deux de Nagelkerke fix 44,8 montre clairement que ce modle de crdit
scoring (RL) nexplique pas pleinement la variance de la probabilit de dfaut
des emprunteurs. De plus, Le pourcentage des mauvais emprunteurs
correctement classifis (sensibilit) est sensiblement faible (66,7%). Ceci laisse
supposer que le modle construit expose linstitution un risque de 33,3% de
slectionner un mauvais emprunteur. Ce pourcentage apparait relativement
lev et, en cas dutilisation, cela risque dimpacter sensiblement sur la qualit
du portefeuille de linstitution.
Ces conclusions confortent dune part les prdictions issues de notre troisime
hypothse selon laquelle lopacit des informations financires et non financires de
la plupart des emprunteurs, constitue un obstacle majeur dans la mise en uvre dune
dmarche de scoring statistique et dautre part, infirment nos prdictions quant la
deuxime hypothse selon laquelle les caractristiques socio-conomiques des
clients figurent parmi celles qui ont le plus dinfluence sur la probabilit de dfaut des
clients.
De plus, nous avons conclu en faveur de notre premire hypothse selon laquelle la
plupart des facteurs pris en compte dans la technique de credit scoring nexpliquent
pas totalement ( 100 %) la variance de la probabilit de dfaut des clients.
Plusieurs considrations, analyses dans le contexte de lIMF sous examen, peuvent
expliquer les obstacles de la mise en uvre de la dmarche de lvaluation statistique
du risque de crdit. Il sagit essentiellement (i) de la mauvaise tenue des dossiers de
crdit par les agents de crdit ; (ii) labsence dun systme informatique susceptible
denregistrer et stocker une grande base de dossiers de crdit, (iii)labsence des
procdures de collecte et saisie formalises, les tenues des dossiers de crdit diffrent
dune priode lautre, dun agent de crdit lautre, dune agence lautre.
P a g e | 63
lissu de cette tude, il importe de noter que, une des principales insuffisances de la
plupart des modles du crdit scoring est qu'ils sont employs pour valuer la
solvabilit de tous les demandeurs, pourtant ils sont formuls et dresss uniquement
sur la base des demandeurs jugs prcdemment assez bons eu regard de condition
dligibilit. L'efficacit de tels modles dpend des bons demandeurs qui diffrent de
mauvais en ce qui concerne leurs attributs, tels que l'ge ou le revenu, qui sont
dploys par des tels modles pour prvoir le comportement de remboursement.
De plus, nous avons uniquement considr, dans cette tude, un chantillon de 222
dossiers de crdit, une batterie de 20 variables explicatives et trois techniques de
classification (rgression logistique, rseaux de neurones du type Multicouches, rseaux
de neurones fonctions radiales), cependant, lanalyse thorique prsents dans cette
tude montre clairement que le modle pouvoir prdictif dune fiche de notation
dpend du choix judicieux de la taille de lchantillon, des variables inclure et enfin
de la technique de classification adquate.
Ds lors, il est possible denvisager un prolongement de cette tude en direction de
lapprhension de tous les lments susmentionns afin de formaliser un modle plus
complet pouvant expliquer correctement le risque de crdit en microfinance.
P a g e | 64
Bibliographies
1. Amendariz, B and Gollet, C. (1996), Peer grouping in an adverse selection model,Discussion
Paper 96-24 ISSN 1350-6722. University College London, Department of Economics.
2. Arminger, G., Enache, D., & Bonne, T. (1997). Analyzing credit risk data: A comparison of
logistic discriminant classification tree analysis and feedforward networks. Computational
Statistics.
3. Altman, E.I. (1968). Financial Ratios, Discriminant Analysis, and the Prediction of Corporate
Bankruptcy, Journal of Finance, no 4, vol.23, p. 589-609.
4. Altman, E.I., R. Haldeman et P. Narayanan (1977). ZETA Analysis: A New Model to Identify
Bankruptcy Risk of Corporations, Journal of Banking and Finance, vol.1, p. 29-55.
5. Antonio Blanco Rafael Pino-Mejas, Juan Lara Salvador Rayo, Credit scoring models for the
microfinance industry using neural networks: Evidence from Peru, Expert Systems with
Applications, 2012
6.Basel Committee on Banking Supervision (1999). Credit Risk Modelling, Current Practises and
applications , Bank for International Settlements, Basel.
7. Bishop, C. M. (1995). Neural networks for pattern recognition. New York: Oxford University
Press.
8. Chung, H. M., & Gray, P. (1999). Special section: Data mining. Journal of Management
Information Systems, 16, 1116.
9. Boyle, M., J. N. Crook, R. Hamilton, and L. C. Thomas (1992), Methods for credit scoring applied
to slow payers. In; Thomas, L. C., Crook, J. N., Edelman, D. B. (Eds), Credit scoring and credit
control, Oxford University Press, Oxford, Pg 75-90.
10. Armendariz de Aghion B. & Morduch J. (2005), The Economy of Microfinance, Massachusetts
Instituteof Technology, London.
11. Cobbaut R. (2004), thorie financire, 4me edition, Economica.
12. Crook, J. N., Hamilton, R., & Thomas, L. C. (1992). A comparison of discriminations under
alternative definitions of credit default. In L. C. Thomas, J. N. Crook, & D. B.
13. Churchill C.F. & Cester D. (2001), Microfinance Risk Management Hand-book, Pact Publication:
New York.
14. Edelman (Eds.), Credit scoring and credit control (pp. 217245). Oxford: Oxford University
Press.
P a g e | 65
15. Davis, R. H., Edelman, D. B., & Gammerman, A. J. (1992). Machine learning algorithms for
credit-card applications. IMA Journal of Mathematics Applied in Business & Industry, 4(1), p. 43
51.
17. Desai, V. S., Conway, J. N., Crook, J. N., & Overstreet, G. A. (1997). Credit scoring models in the
credit-union environment using neural networks and genetic algorithms. IMA Journal of
Mathematics Applied in Business & Industry, 8(4), 323346.
18. Desai, V. S., Crook, J. N., & Overstreet, G. A. (1996). A comparison of neural networks and
linear scoring models in the credit union environment. European Journal of Operational
Research, p. 2437.
19. Demuth, H., & Beale, M. (1997). Neural network toolbox for use with Matlab.users guide. The
Math Works Inc.
20. Diallo, B. (2006). Un modele de 'credit scoring' pour une institution de microfinance Africaine:
le cas de Nyesigiso au Mali.
21. Dillon, W. R., & Goldstein, M. (1984). Multivariate analysis methods and applications. New York:
Wiley.
22. Dinh, T. H. T., and S. Kleimeier (2007), A credit scoring model for Vietnams retail banking
market, International Review of Financial Analysis.
23. Eisenbeis, R. (1978). Problems in applying discriminant analysis in credit scoring models.
Journal of Banking and Finance, p. 205219.
24. Hand, D. J., & Henley, W. E. (1997). Statistical classification methods in consumer credit
scoring: A review. Journal of the Royal Statistical Society, Series A, p. 523541.
25. Henley, W. E. (1995) Statistical aspects of credit scoring. PhD Thesis. The Open University,
MiltonKeynes.
27. Kim, H. S., & Sohn, S. Y. (2010). Support vector machines for default prediction of SMEs based
on technology credit. European Journal of Operational Research, p. 838846.
28. Kleimeier, S., & Dinh, T. A. (2007). Credit scoring model for Vietnams retail banking market.
International Review of Financial Analysis, p. 471495.
29. Kalala F. (2006), La restructuration de lespace microfinance du Kivu, ULC Press universtit
de Louvain.
29.
Lee, T. S., & Chen, I. F. (2005). A two-stage hybrid credit scoring model using artificial
neural networks and multivariate adaptive regression splines. Expert Systems with Applications,
p. 743752.
30.
Lee, T. S., Chiu, C. C., Lu, C. J., & Chen, I. F. (2002). Credit scoring using the hybrid neural
discriminant technique. Expert Systems with Applications, 23(3), 245254.
P a g e | 66
31. Lee, T. H., and S. C. Jung (1999), Forecasting creditworthiness: logistic vs. artificial neural
net, Journal of Business Forecasting, winter, p. 28-30.
32. Lewis, E. M. (1992), an Introduction to Credit Scoring, (2nd Eds.), Fair, Isaac and Co.
33. Malhotra, R., & Malhotra, D. K. (2002). Differentiating between good credits and bad credits
using neuro-fuzzy systems. European Journal of Operational Research, p. 190211.
34. Mays, E. (2001) Handbook of Credit Scoring. Fitzroy Dearborn.
35. Mester, L. J. (1997), Whats the point of credit scoring? Business Review, Federal Reserve
Bank of Philadelphia.
36. Markham, I. S., & Ragsdale, C. T. (1995). Combining neural networks and statistical predictions
to solve the classification problem in discriminant analysis. Decision Sciences.
37. Morduch, J. (2000). The Micro_nance Schism. World Development,p. 617-629.
38. Neal, R. M. (1996). Bayesian learning for neural networks. New York: Springer. Ohlson, J. A.
(1980). Financial ratios and the probabilistic prediction of bankruptcy. Journal of Accounting
Research.
39. Nguyen, N., & Cripps, A. (2001). Predicting housing value: A comparison of multiple regression
analysis and artificial neural networks. Journal of Real Estate Research, 22, 313-336.
40. Novak, M. P., and E. LaDue (1999), Application of recursive partitioning to agricultural credit
scoring, Journal of Agricultural and Applied Economics, p. 109-122.
41. Paquet P., (1997), Lutilisation des rseaux de neurones artificiels en finance, document de
recherche n 1-1997. Laboratoire Orlanais de Gestion.
42. Patuwo, E., Michael, Y. H., & Ming, S. H. (1993). Two-group classification using neural
networks. Decision Sciences.
43. Rayo, S., Lara, J., & Camino, D. (2010). A credit scoring model for institutions of microfinance
under the Basel II normative. Journal of Economics, Finance & Administrative Science
44. Reichert, A. K., Cho, C. C., & Wagner, G. M. (1983). An examination of the conceptual issues
involved in developing credit-scoring models. Journal of Business and Economic Statistics.
45. Reinke, J. (1998). How to lend like mad and make a profit: A micro-credit paradigm versus the
start-up fund in South Africa. Journal of Development Studies.
46. Rhyne, E., & Christen, R. P. (1999). Microfinance enters the marketplace. USAID
Microenterprise Publications.
47. Rumelhart, D. E., Hinton, D. E., & Williams, R. J. (1986). Learning internal representations by
error propagation in parallel distributed processing. Cambridge, MA: MIT Press.
P a g e | 67
48. Schreiner, M. (1999), A scoring model of the risk of costly arrears at a micro-finance lender in
Bolivia, Center for Social Development, Washington University in St Louis, USA.
49. Schreiner M., (1999c). Aspects of outreach: A framework for the discussion of the social
benefits of microfinance, Center for Social Development Working Paper, 993 (1999c),
Washington University in St. Louis.
50. Schreiner, M. (2000), Credit scoring for microfinance: can it work? Microfinance
RiskManagement, Washington University.
52. Schreiner, M. (2003). The next breakthrough in micro credit? CGAP Occasional Paper No. 7,
http://www.cgap.org.
53. Schreiner, M. (2004). Scoring arrears at a microlender in Bolivia. Journal of Microfinance.
54. Schreiner, M. (2004). Scoring arrears at a micro lender in Bolivia. Journal of Microfinance.
55. Sharma, M., & Zeller, M. (1997). Repayment performance in group-based credit programs in
Bangladesh: An empirical analysis. World Development.
56. Sing, T., Sander, O., Beerenwinkel, N., & Lengauer, T. (2005). ROCR: Visualizing the
performance of scoring classifiers, R package version 1.0-1. http://rocr.bioinf.mpi-sb.mpg.de
57. Srinivasan, V., & Ruparel, B. (1990). CGX: An expert support system for credit granting.
European Journal of Operational Research, 45(23), 293308.
58. Stiglitz, J. E., and A. Weiss (1981). Credit rationing in markets with imperfect competition,
American Economic Review, 71, p. 393-410.
59. Tang, Z., & Fishwick, P. A. (1993). Feedforward neural nets as models for time series
forecasting. ORSA Journal on Computing, 5(4), 374385.
60. Thomas, L. C. (2000). A survey of credit and behavioural scoring: Forecasting financial risk of
lending to consumers. International Journal of Forecasting.
61. Thomas, R. L. (2005). Using Statistics in Economics, McGraw-Hill.
62. Thomas, L. C., D. B. Edelman and L. N. Crook (2002), Credit scoring and its applications,
Philadelphia: Society for industrial and Applied Mathematics.
63. Thomas L. C., J. Banasik, and J. Crook (2001), Recalibrating Scorecards. Journal of the
Operational Research Society, 52, p. 981-988.
64. Tsasa Jean Paul et Togba B. Yves, (2012), valuation du prix dun actif laide du processus
brownien gomtrique : Drivation du Modle de Black Scholes et Application de la Mthode
Monte Carlo , One pager Larq, Vol.4, num. 011, (Dcemndre 2012).
P a g e | 68
65.
Vellido, A., Lisboa, P. J. G., & Vaughan, J. (1999). Neural network in business: A survey of
applications (19921998). Expert Systems with Applications, 17(1), 5170.
66. Venables, W. N., & Ripley, B. D. (2002). Modern applied statistics with S-PLUS. New York:
Springer.
67. Vigan, L. A. (1993). Credit scoring model for development banks: An African case study.
Savings and Development.
68. Vogelgesang, U. (2003). Microfinance in times of crisis: The effects of competition, rising
indebtness, and economic crisis on repayment behaviour. World Development.
69. Wang, J. (2004). The Probability of Chinese Mortgage Loan Default and Credit Scoring,
Beijing Review.
70. West, D. (2000). Neural network credit scoring models. Computers and Operations Research,
27(1112), 11311152.
71. Wong, F. S. (1991). Time series forecasting using backpropagation neural networks.
Neurocomputing.
72. Zeller, M. (1998). Determinants of repayment performance in credit groups: The role of
program design, intra-group risk pooling, and social cohesion. Economic Development and
Cultural Change.
73. Zhang, G. P., Patuwo, B. E., & Hu, M. Y. (1998). Forecasting with artificial neural networks: The
state of the art. International Journal of Forecasting.
P a g e | 69
Annexes
Annexe 1 : Tableau de la rgression
A
ge
-,042
opinion(1)
2,774
ROA
2,485
Constante
-1,335
a. Variable(s) entres l'tape 3 : Age.
E.S.
Wald
ddl
Sig.
Exp(B)
,017
5,872
,015
,959
,434
,734
,911
40,924
11,444
2,148
1
1
1
,000
,001
,143
16,022
11,997
,263
P a g e | 70
Annexe 2 : Description des variables
Variable
Caractristiques du client
age
tat_civil
Stat_resid
Description
signe de l'estimateur
+/+/-
Enfant
Pers_en_charge
Caractristiques de l'activit
Exprience
R1
R2
R3
R4
R5
Objet_du_prt
+
-/+
+
+
+/-
Informations IMF
Mont_du_crdit
Ecart_mont
Ecart_dure
Nombr_cycl
Opin_AC
Typ_gar
Val_gar
Taux_d_intrt
+
+
P a g e | 71
P a g e | 72
Annexe 3.2 : Structure du rseau de neurone base radiale
P a g e | 73
Annexe 4 : Tableau dimportance des variables indpendante de MLP et RBF
,031
,037
26,0%
31,4%
typ_garantie
ecart_montant
,024
,019
20,5%
15,9%
objet
,010
8,2%
opinion
age
,079
,088
66,4%
74,0%
exprience
val_gar
enfant
,058
,050
,017
48,9%
41,9%
14,5%
per_charg
montant
,029
,042
24,1%
35,4%
ecart_temps
,037
31,4%
nom_cycle
taux_intret
,025
,097
20,8%
81,7%
R1
R2
R3
,029
,084
,102
24,5%
70,7%
86,1%
ROE
ROA
,023
,119
19,3%
100,0%
P a g e | 74
Importance
standardise
opinion
objet
,044
,023
62,9%
33,1%
ecart_montant
,018
25,2%
Typ_garantie
,029
40,7%
Stat_resid
Etat_civil
R1
,026
,024
,045
36,6%
34,1%
63,7%
R2
R3
,062
,066
87,7%
93,4%
ROE
ROA
Taux_intret
,065
,066
,060
93,0%
93,8%
85,3%
nom_cycle
ecart_temps
,056
,054
79,8%
77,4%
montant
,054
77,1%
per_charg
enfant
,057
,058
81,9%
83,1%
val_gar
exprience
ge
,062
,070
,061
89,0%
100,0%
87,4%
P a g e | 75
Exprienc
e
-0,017
1
Etat_civi
Stat_resi
Typ_gar
Val_gar
-0,064
-0,119
1
-,221**
-,168*
-0,096
1
,341**
0,007
0,033
0,046
1
Typ_garantie
Val_gar
Enfant
Pers_charg
Montant
Ecart_montant
Ecart_temps
Nombr_cycle
Taux_intret
Objet
Opinion
R1
R2
R3
ROE
ROA
-,158*
,195**
-,138*
-,357**
Enfan
t
,183**
-,373**
-0,083
,165*
per_char
g
0,039
-,184**
0,065
,224**
Montan
t
-0,119
0,014
-,231**
-0,063
Ecart_mon
tant
0,014
0,074
-,176**
-,376**
Ecart_te
mps
-0,033
-0,099
,137*
,149*
nom_c
ycle
,201**
0,129
-,200**
-,280**
Taux_i
n
-0,016
-,236**
,260**
0,081
-0,035
,340**
,349**
-,152*
-0,102
-0,007
-,205**
0,095
1
0,087
,833**
1
,628**
,230**
0,088
1
,240**
-,245**
-,346**
0,093
1
-0,045
-,137*
-0,131
-0,025
-,277**
1
Objet
Opin
R1
R2
R3
ROE
ROA
0,061
0,028
0,042
0,019
0,04
8
0,076
0,127
,164*
0,031
-0,021
0,034
0,026
0,005
0,111
-,147*
-0,07
0,033
-,170*
1
0,039
-0,047
-0,03
0,041
,171*
-0,02
-0,115
-,158*
0,011
,170*
-0,016
-,137*
0,021
0,126
-0,099
-,140*
-,150*
0,025
0,086
0,078
0,078
-0,029
-0,004
-0,121
,139*
,137*
-0,08
-0,09
0,02
-0,035
0,081
-,217**
-,481**
0,05
,564**
-,299**
-0,07
,137*
,167*
-0,096
-,168*
0,096
0,112
,187**
,138*
0,044
-0,018
0,035
0,028
-,196**
-,220**
0,027
,185**
-0,125
0,005
-0,116
-0,129
0,061
,200**
-0,051
0,091
-0,016
0,038
,154*
-0,062
0,063
-0,074
-0,123
-0,118
-0,07
,155*
-,149*
-,292**
0,03
,218**
,211**
-0,104
,195**
**
**
-0,044
0,033
-0,021
-,176**
1
0,037
,357**
1
-0,056
-0,105
0,103
1
-0,048
,276**
,339**
-,135*
1
,174
-,269
0,132
-0,011
0,059
0,066
-0,005
-0,03
-0,01
-0,027
0,078
0,071
-,261**
-0,053
-0,02
-,190**
,332**
1