Credit Scoring

UNIVERSITE PROTESTANTE AU CONGO
Facult dAdministration des affaires et Sciences Economiques

B.P. 4745 Kinshasa/Lingwala
CENTRE CONGOLAIS ALLEMAND DE MICROFINANCE

(CCAM)
Gestion des risques de crdit: notation de risque en microfinance

Construction et valuation dun modle de credit scoring
Par
Yves Togba Boboy
Mmoire dfendu en vue de lobtention du

Diplme de Licence en Microfinance
Option : Microfinance
Directeur du mmoire :
Professeur Frderic Kalala Tshimpaka
Juillet 2013
Page |i
A mes chers parents Masaba ma Boboy et Molingo Germaine et

A tous mes freres et mes surs.
P a g e | ii
EPIGRAPHE
One machine can do the work of 50 ordinary men. No machine can do the work of extraordinary
man.
Albert Hubban.
P a g e | iii
Remerciements
Au terme de ce travail, je tiens adresser mes remerciements au professeur Kalala
Frderic pour avoir accept dassurer la direction de ce prsent mmoire. Ses
remarques et commentaires, sa rigueur et pertinence danalyse ont prodigieusement
contribu au contenu et forme de cette tude. Il a t une rfrence pour moi
pendant ces annes passes au CCAM.
Merci galement mes parents, je noublierai jamais votre amour et les nombreux
sacrifices consentis pour ma russite tout au long de mon parcours universitaire.
Mes remerciements sadressent aussi au chef de travaux Nshue M. Mokime et au
professeur Bakengela.
Depuis linitiative de ce mmoire, de nombreuses personnes ont contribu son
dveloppement. Leurs conseils, remarques et corrections ont contribu de faon
majeure la forme et au contenu de ce prsent mmoire. Nous remercions
spcialement Dede idi Nassor, Nelson Ifeka, Albert Monzongo, Anastasie Manzanga,
patrick Dedi.
Nous souhaitons prsenter nos remerciement aux personnes suivantes, qui ont relu le
manuscrit en partie ou en en entiret : Igor Ileka, Jean-Paul Tsasa, Bachunge Samuel,
Daniella Mboni, Nelson Ifeka, Olga Mbuyi, Micheal ange Lokota, Michel Lenda, Bobo
boboy, Guya Togba, Aime masaba.
Nous remercions galement Jean-Paul Tsasa pour nous avoir fourni les ouvrages et
articles scientifiques qui ont contribu au contenu de cette tude.
Durant la rdaction de ce mmoire, nous avons immensment profit des
commentaires des agents de crdit de Life Vest et de nos collgues chercheurs
auLarq. Ces commentaires ont t essentiellement collects pendant une tude par
questionnaire et, lors de discussion informelle. Nous remercions vivement toutes ces
personnes pour avoir partag leurs points de vue et nous avoir consacr du temps.
P a g e | iv
Table des matires

Introduction gnrale ............................................................................................................................ 1
1.
Mise en contexte ........................................................................................................................ 1
2.
Problmatique ............................................................................................................................ 3
3.
Hypothses de recherche .......................................................................................................... 4
4.
Intrt du travail ......................................................................................................................... 5
5.
Dlimitation du travail ................................................................................................................ 5
Chapitre I : Analyse thorique du credit scoring .................................................................................. 6

1.1 Historique du credit scoring .......................................................................................................... 6
1.2. Analyse du dfaut de paiement : Evaluation subjective versus valuation statistique............ 7
1.2.1 Lvaluation subjective ............................................................................................................ 8
1.2.2. Evaluation statistique ............................................................................................................ 9
1.2.3. Complmentarit de lvaluation subjective et valuation statistique ............................ 11
1.3. Les avantages du credit scoring ................................................................................................ 14
1.4. Variables couramment utilises dans les modles de notation de crdit............................... 16
1.5Credit scoring et ses techniques de modlisation ..................................................................... 21
1.6. Evaluation de la performance ................................................................................................... 24
1.7. Receiver operating curve (ROC) ............................................................................................ 26
Conclusion partielle .............................................................................................................................. 28
Chapitre II : Description des donnes et mthodes de discrimination............................................. 29
2.1 Description des donnes ................................................................................................................ 29
2.2.1 Mthodologie de collecte des donnes .............................................................................. 29
2.2.2 Description des variables ..................................................................................................... 30
2.2 Description des mthodes ......................................................................................................... 35
A.
Rgression logistique ........................................................................................................... 35
B.
Rseaux de neurones ........................................................................................................... 36
Chapitre III : Construction et valuation des fiches de notation statistique ..................................... 44

3.1
3.1.1
Analyse discriminante .......................................................................................................... 44

Rgression logistique ....................................................................................................... 44
3.1.2. Modlisation par les rseaux de neurones ........................................................................ 48

3.2 Comparaison des trois modles discriminants ......................................................................... 53
Page |v
A.
Pouvoir discriminant ............................................................................................................ 54
B.
Critres pratiques ................................................................................................................. 56
3.3. Choix du modle de scoring ...................................................................................................... 56

3.4. Identification des obstacles et bauche des stratgies de mise en uvre dune fiche de
notation ............................................................................................................................................ 57
Conclusion partielle .......................................................................................................................... 60
Conclusion gnrale ............................................................................................................................. 61
Bibliographies ....................................................................................................................................... 64
Annexes ................................................................................................................................................ 69
Annexe 1 : Structure des rseaux neuronaux ................................................................................. 71
Annexe 2 : Tableau dimportance des variables indpendante de MLP et RBF............................ 73
P a g e | vi
Liste des figures

Figure 1:Dmarche dutilisation de la fiche de notation ---------------------------------------------------------- 13
Figure 2: Receiver operating curve (ROC)----------------------------------------------------------------------------- 26
Figure 3: Structure du rseau de neurones formel ----------------------------------------------------------------- 37
Figure 4:Structure du rseau du type Multilayer Perceptron ---------------------------------------------------- 40
Figure 5: Importance des variables ------------------------------------------------------------------------------------- 51
Figure 6: Importance des variables ------------------------------------------------------------------------------------- 53
Figure 7: Courbe ROC ------------------------------------------------------------------------------------------------------ 55
Liste des tableaux

Tableau 1:Comparaison des rsultats (en % des groupes correctement classifis) ............................. 22
Tableau 2:Comparaison des rsultats des recherches empiriques ....................................................... 22
Tableau 3:Techniques de classification ................................................................................................. 23
Tableau 4:Publication sur les modles de credit scoring appliqus aux pays en dveloppement ....... 24
Tableau 5:Matrice de confusion ............................................................................................................ 25
Tableau 6:Statistiques descriptives des variables quantitatives ........................................................... 33
Tableau 7: Statistiques descriptives des variables qualitatives ............................................................ 34
Tableau 8: Rcapitulatif des modles ................................................................................................... 46
Tableau 9: Tests de spcification du modle ........................................................................................ 46
Tableau 10: Test de Hosmer-Lemeshow ............................................................................................... 47
Tableau 11: Caractristique du rseau Perceptron Multicouches (MLP) ............................................. 49
Tableau 12: Matrice de Classification (Confusion matrix) .................................................................... 50
Tableau 13: Caractristique du rseau fonction base radiale (RBF)................................................ 52
Tableau 14: Matrice de Classification (Confusion matrix) .................................................................... 52
Tableau 15: Comparaison des rsultats (en % des groupes correctement classifis et AUROC) ......... 54
Page |1
Introduction gnrale
1. Mise en contexte
Le taux dintrt sur le march de crdit diffre du rendement que linstitution
financire espre raliser sur le prt. Ce taux correspond au produit du taux dintrt
contractuel et la probabilit (p) que lemprunteur remboursera effectivement le prt.
A cause de linformation imparfaite et asymtrique entre les institutions de
microfinance et les emprunteurs,cette probabilit estparfois infrieure lunit.
Afin de sassurer que cette probabilit se rapproche de lunit (viter le risque de

slection adverse), les IMF doivent disposer dun outil fiable permettant de
slectionner de bons clients. La pratique de cette slection exige de disposer dune
bonne qualit dinformation sur les clients.
Toutefois, dans ce contexte dincertitude et dasymtrie dinformation, le processus

danalyse et doctroi des crdits individuels, contrairement aux crdits de groupe
(Stiglitz et weiss 1981 ;Varian 1990 ;Conning, 1997, 1999) se rvle relativement plus
dlicat et coteux pour les IMF. De ce fait, un des moyens de rduire le risque de
slection adverse est dutiliser, en plus du jugement du comit de crdit, les
techniques statistiques de notation de risque (credit scoring) permettant de retracer
le profil de bons et mauvais clients travers leur pass pour prdire le risque de
dfaut dun nouveau client.
De nombreuses tudes empiriques en microfinance, dune part, confirment que la
notation de crdit amliore non seulement la gestion du risque mais aussi les profits
et le nombre de clients, et dautre part, mettent en vidence une batterie des
facteurs susceptibles dexpliquer la probabilit de dfaut des clients (FishelsonHolstine 2004 ; Berger, Frame et Miller 2002 ; Gates, Perry et Zorn 2002 ; Longhofer 2002 ;
Frame, Padhi et Woosley 2001 ; Frame, Srinivasan et Woosley 2001 ; Martel et al. 1999,
Schreiner 2002a ; McCorkell 1999 ; Lewis 1990 ; Ramage, 2001).
Page |2
Et pourtant, trs peu dtudes ont t menes sur le credit scoring, tant du cot de la
finance classique que de lindustrie de la microfinance, dans les pays en
dveloppement (Scheiner 2004). La plupart des tudes publies en microfinance sont
focalises sur lAmrique latine, cependant leur application et implmentation dans
les IMF reste encore trsquestionner (Vogelgesang, 2003 et Kleimeier, 2007). Ceci
sexplique en partie, la ncessit de disposer dune bonne qualit et quantit des
statistiques relatives aux historiques de crdit.
En R.D.Congo, aucune tude na t mene en ce sens et cette mthode reste encore
marginalise malgr les nombreux avantages quelle peut prsenter.
Ce constat suscite des interrogations, tant du point de vue thorique quempirique,
sur la capacit du modle de credit scoring de prdire de faon fiable le risque de
dfaut dun nouveau client dans les pays en dveloppement.
Ce mmoire se propose donc dvaluer la pertinence de lapproche credit scoring
partir des donnes empiriques primaires dune IMF congolaise.
Page |3
2. Problmatique
Lanalyse du march de crdit, contrairement la vision classique selon laquelle le
mcanisme des prix conduit un ajustement (Pareto efficace) entre loffre et la
demande, montre que la prise en compte de linformation imparfaite et asymtrique
sur le march financier permet de montrer quil peut exister une situation dquilibre
caractrise par un rationnement de crdit et ainsi le taux dintrt sert dinstrument
de slection. Une augmentation du taux dintrt entrane deux types deffets : effet
de slection adverse et leffet ala moral (Stiglitz & Weiss, 1981).
Face ce problme dimperfection du march de crdit, la gestion du risque de crdit
est indispensable. Ceci tient au fait que le plus grand risque pour un intermdiaire
financier est doctroyer un crdit et ne pas se le faire rembourser (C. Churchill et D.
Coster, 2001 ; Microfinance banana Skins, 2011 ; Kalala, 2006). Ce risque de crdit
samplifie au sein des IMF dans la mesure o la plupart des crdits accords ne sont
soumis aucune garantie formelle (conventionnelle ou classique).
La pratique de la gestion ex ante1 du risque de crdit ncessite que les institutions de
microfinance disposent de linformation sur les clients et dune technique objective de
slection.
De manire pratique en R.D. Congo, les ISFD (IMF et COOPEC) recourent deux types
danalyses, lune base sur le cash flow dite non conventionnelle, et lautre dite
conventionnelle. Ces deux approches, fondes sur le jugement et le bon sens du
comit de crdit, ne permettent pas, dans une certaine mesure, de dceler
prodigieusement les clients susceptibles de ne pas rembourser lchance.
Toutefois, une approche complmentaire pour ltude des dossiers (celle fonde sur
la mise sur pied dun modle statistique dvaluation de risque de non
La gestion du risque de crdit se prsente sous deux aspects (C. Churchill et D. Coster, 2001) : la gestion ex ante
(les mesures prventives que les prteurs prennent avant loctroi du crdit) et la gestion ex post (les mesures
dincitation aprs le dboursement).
Page |4
remboursement) peut rduire les taux dimpays, du fait que ce modle permet de
quantifier le risque partir de sa probabilit et suppose quune bonne partie des
risques est lie aux caractristiques quantifies dans la base de donnes (Thomas,
2000).
Dans cette optique, les tudes, tant du point de vue thorique quempirique,
montrent dune part que le modle de credit scoring permet de modliser le risque de
crdit et dautre part les dterminants du dfaut de crdit diffrent selon quon mne
lanalyse du cot des IMF ou des banques classiques.
Ce mmoire sinsrant dans le prolongement de travaux de Vigano (1993);

Schreiner(1999a), et Dinh et Kleimeier (2007)sur lvaluation statistique du risque de
crdit en microfinance, cherche construire le modle de credit scoring et de
lappliquer aux donnes dune IMF de Kinshasa en vue, dune part dvaluer la
pertinence de celui-ci dans la prdiction du risque de crdit et dautre part de dceler
les facteurs justifiant ce risque.
De manire concrte, nos investigations se dclinent en trois questions majeures :

Quel est le pouvoir de prdiction du risque de crdit par la technique de credit
scoring, applique aux donnes de Life vest ?
Quels sont les lments qui expliquentla dfaillance des emprunteurs dans
cette structure?
Quels seront les obstacles dans la mise en uvre dune dmarche de scoring ?
Comment mettre en place les procdures que cela implique ?
3. Hypothses de recherche
En considrant les travaux antrieurs sur le credit scoring, nous postulons que la
plupart des facteurs pris en compte dans la technique de credit scoring nexpliquent
pas totalement ( 100 %) la variance de la probabilit de dfaut des clients. Ceci
Page |5
suggre que la plupart des facteurs susceptibles dinfluencer le risque de crdit sont
difficilement perus par les IMF du fait de lopacit des informations de leurs clients.
Les caractristiques socio-conomiques des clients figurent parmi celles qui ont les
plus dinfluence sur la probabilit de dfaut des clients.
la lumire des travaux de Schreiner (1999a, 2003, 2004), nous considrons lide
selon laquelle lopacit des informations financires et non financires de la plupart
des clients des IMF, constitue un obstacle majeur dans la mise en uvre dune
dmarche de scoring statistique. Pour y remdier, il convient de refonder le systme
dinformation de gestion des IMF ainsi que leurs techniques de collecte dinformation.
4. Intrt du travail
Cette recherche vise appliquer la technique de credit scoring aux donnes des
institutions financires congolaises et dbouche sur trois apports majeurs:
Formuler les recommandations concrtes susceptibles de faciliter lintgration
du modle de credit scoring au SIG des institutions financires.
Identifier les caractristiques des clients et de leur activit pouvant justifier le
drapage en termes de remboursement.
Identifier les obstacles de la mise en uvre du credit scoring dans le chef des
IMF kinoises.
5. Dlimitation du travail
Nos investigations portent porte sur lIMF Life Vest. Il sagit spcifiquement des
agences de Gombe et de Pigeon. Ceci en raison dela facilit daccs un chantillon
plus reprsentatif des dossiers de crdit, une pratique trs dlicat pour la plupart des
ISFD congolais en raison des rgles strictes de confidentialit des renseignements de
clients ainsi que les rgles de secret bancaire. Nous considrons une priode de trois
ans et demi, allant de 2010 fin mai 2013 pour lanalyse empirique.
Page |6
Chapitre I: Analyse thorique du credit scoring

Ce chapitre prsente une revue de littrature thorique et empirique sur le credit
scoring. Il discute des questions fondamentales rencontres dans la construction
dune fiche de notation du risque de crdit. En effet, plusieurs questions controverses
sont souleves dans lapplication de cette technique pour modliser correctement le
risque de crdit.
Ainsi la premiresection du chapitre discute de lvolution du credit scoring ; la
deuxime, en prsentant les avantages et inconvnients de deux types de scoring,
dmontre les limites du credit scoring et la ncessit de sa complmentarit avec
lvaluation subjective en microfinance ; la troisime section analyse les avantages du
crdit scoring en microfinance ; la quatrimeporte sur les variables communment
utilises dans la construction des fiches de notation en microfinance et enfin la
cinquime et dernire section prsente les techniques de classification ainsi que leur
mthodes dvaluation.
1.1 Historique du credit scoring
Pendant que l'histoire de crdit date de 5000 ans, l'histoire ducrdit scoring
remonteseulement environ 50 ans. Le credit scoring est essentiellement une
technique de classification des groupes selon une et plusieurs caractristiques. La
premire approche, lanalyse discriminante, mise en vidence pour rsoudre ce
problme de classification des groupes dans une population, a t introduite pour la
premire fois par les travaux smantiques de Fisher (1936). Lauteur cherchait
diffrencier deux varits d'iris en mesurant la taille physique des plantes et en
diffrenciant leurs origines. Les travaux de Durand (1941), pour le compte du Bureau
National de Recherche Economique des USA, sont le premier reconnatre l'utilisation
de cette technique pour discriminer les bons et mauvais emprunteurs.
Pendant la dcennie 30, certains finance house avaient introduit le systme de
notation statistique pour essayer de surmonter les problmes rencontrs dans
l'analyse du risque de crdit auxquelles taient confronts les analystes de crdit
(Weingartner, 1966; Smalley et Sturdivant 1973). Avec le dbut de la deuxime Guerre
Mondiale, toutes les finances house et mail- order companies prouvaient des
difficults dans leur gestion de crdit. Les analystes de crdit taient appels au
service militaire, et il y avait une pnurie svre des experts dans ce domaine.
Il a fallu attendre la fin de la guerre pour que les questions relatives l'automatisation
de dcision de crdit, au dveloppement des techniques statistiques de classification
Page |7
et de leurs bnfices dans la prise de dcision, soient poses (Wonderlic 1952). En

1950, le premier cabinet fut cr, cet effet, San Francisco par Bill Fair et Earl Isaac.
Pendant les annes 80, le succs du scoring dans le domaine des cartes de credit
avait conduit les banques commerciales largir leur champ dapplication des fiches
de notation. Le systme de notation statistique fut aussi utilis dans dautres
domaines tels quen marketing pour accrotrele taux des rponses pendant les
campagnes publicitaires (Lewis, 1992).
Le progrs en informatique a prodigieusement contribu au dveloppement des
techniques de classification. Vers les annes 1980, la rgression logistique et la
programmation linaire, lune des approches les plus utilises, furent introduites. Plus
rcemment, les techniques dintelligence artificielle, comme le systme dexpert, le
rseau des neurones ont t appliques.
Pendant que plusieurs tudes tentent dvaluer la pertinence du systme de notation
statistiqueen finance classique, peu dtudes seulement se sont focalises sur
lapplicabilit de cette technique en microfinance. Divergentes opinions sur cette
question peuvent tre identifies. Quelques auteurs soulignent les avantagescomme
la rduction des pertes, la segmentation des marchs et la rduction du temps
consacr par lagent de crdit lanalyser du dossier individuel (Dennis, 1995;
Schreiner, 2003; Kulkosky, 1996).Les autres auteursnotent que le crdit scoring est
vulnrable plusieurs problmes statistiques et de ce fait, ne permet pas de
modliser le risquecomme labsence de volont de remboursement et les
vulnrabilits dues aux catastrophes naturelles (Capon2, 1982; Schreiner, 2003;
Freytag, 2008).
1.2. Analyse du dfaut de paiement : Evaluation subjective versus valuation
statistique
Cette section prsente les concepts fondamentaux de lvaluation par score (credit
scoring), quelle soit subjective ou statistique, et explique la ncessit darticuler de
les deux approches.
Le risque de crdit est le risque dun ventuel changement de la qualit de signature
de lemprunter au fil du temps. Par consquent, une analyse objective doit tre
mene afin de dterminer la capacit de remboursement de lemprunteur, (ii)
The arrival of credit cards in the late 1960s made the banks and other credit card issuers realize thesefulness
of credit scoring.The only opposition came from those like Capon (1982), who argued that "the brute force
empiricism of creditscoring offends against the traditions of our society."He believed that there should be more
dependence on credit history and it should be possible to explain why certain characteristicsare needed in a
scoring system and others are not.
Page |8
destimer la probabilit du dfaut de remboursement et (iii) rduire ce risque un

niveau acceptable.
Il y a deux problmes majeurs dans lanalyse du risque de crdit : dune part, il faudrait
faire lvaluation simultane de tous les facteurs importants de lemprunteur et
dautre part, lvaluation objective de tous les emprunteurs (Sinkey, 2002; Plata and
Nartea, 1998).
La littrature examine identifie trois types3 dvaluation du risque de crdit (Thomas,
2000): (i) valuation statistique, (ii) valuation subjective 4, (iii) valuation non
statistique et non subjective. Pour notre part, nous insrons lvaluation non
statistique et non subjective dans le deuxime type, du fait que ces mthodes
(Rseaux de neurones artificiels, systme dexpert, etc.) recourent souvent aux
principes mathmatiques et statistiques.
1.2.1 Lvaluation subjective
Lvaluation subjective, en tant que technique qui prdit le risque futur partir des
caractristiques actuelles en utilisant des connaissances disponibles sur les liens
historiques entre les caractristiques et le risque, relve du scoring (Schreiner, 2004).
La spcificit de cette technique scoring est quelle repose essentiellement sur
lopinion personnelle de lagent de crdit lgard du client. Il s'agit ici d'une
valuation plus ou moins intuitive des liens entre le pass et le futur. L'essence de
cette mthodologie est une simple lecture pratique de l'exprience (Sullivan, 1981 ;
Bailey, 2004).
La technique apparait plus dlicate en microfinance du fait quelle repose sur
linformation soft, par consquent, la non vrifiabilit de cette dernire prsente
linconvnient dtre facilement manipulable par lagent responsable de son
traitement et de sa production. Bien que base principalement sur lintuition,
lvaluation subjective produit un jugement qualitatif : pas trs risqu, dcaisser , ou
trop risqu, refuser .
Dans la pratique, Les institutions de microfinance recourent habituellement
lvaluation subjective, mais lvaluation statistique reste encore marginalise dans
lindustrie (Schreiner, 1999a, 2004). Elle est base les 5c(caractre, capacit, capital,
cautionnement, conditions)(Rose, 1993). Si lun de ces lments est mal analys, le
La classification de ces techniques varie selon les auteurs. Crook(1996) suggre deux techniques dvaluation
du risque de crdit (valuation subjective et statistique) contrairement notre terminologie. La terminologie
valuation subjective est utilis pour littrature
4
La terminologie valuation subjective est utilis dans littrature pour dcrire une valuation non
statistique du risque de crdit.
Page |9
risque de crdit augmente. Pour limiter ce risque, les institutions dveloppent des
politiques et procdures pour analyser chaque lment.
Le poids accord chaque lment varie selon la mthodologie (groupe de solidarit,
banque villageoise ou prt individuel), les attributs du crdit et lanciennet du client
(C. Churchill et D. Coster, 2001).
Lvaluation subjective continue faire ses preuves en microfinance en raison de
lexpansion considrable du microcrdit travers le monde. Les tudes empiriques en
microfinance permettent de relayer ces conclusions (Schreiner, 2004). Toutefois, en
dpit des avantages quelle prsente, sa valeur prdictive du risque de crdit varie
selon lagent de crdit et selon son humeur du jour. De ce fait, elle nexclut pas la
discrimination ou la slection dun nombre insuffisant de caractristiques (ou de
caractristiques inappropries).
1.2.2. Evaluation statistique
Comme susmentionn, lvaluation subjective permet d'apprhender certaines
caractristiques non quantifiables lies au profil du client de l'institution de
microfinance, notamment celles qui se rapportent sa psychologie (caractre). Cette
approche reste, cependant, imprcise et subjective. Elle est peu fiable et parfois
discriminatoire, construite sur la base des prjugs ou de mauvaises interprtations
de la ralit.
Lutilisation dun modle de notation statistique doctroi de crdit par le scoring
(credit scoring) est dune grande importance en ce sens que sa capacit de
pronostiquer, facilite lvaluation des risques des clients. Le credit scoring est objectif,
cohrent et explicite.Il permet de quantifier le risque comme probabilit de non
remboursement et suppose quune bonne partie des risques est lie aux
caractristiques quantifies dans la base de donnes.
Le lien entre le risque et les caractristiques est exprim par un ensemble de rgles ou
de formules mathmatiques qui prdisent clairement le risque sous la forme dune
probabilit (Schreiner, 2004). La mthode suppose que la performance des futurs
prts avec un ensemble donn des caractristiques sera similaire la performance des
prts passs avec des caractristiques semblables.
La somme des caractristiques pondres dfinit la probabilit que le prt, une fois
dbours, va tre mauvais ou bon, o le critre mauvais et bon sont dfinis par le
prteur. Les poids de chaque caractristique dans la fiche d'valuation (scorecard)
sont bass sur une analyse statistique du rapport entre la caractristique et le
remboursement dans la base de donnes historique du prteur.
P a g e | 10
Une fois la fiche notation est acheve, linstitution peut sen servir dans son travail
quotidien. Il peut adopter un systme de cotation quatre niveaux sr, normal,
risqu, et trs risqu. Les emprunteurs dont les risques estims par la fiche de
notation indiquent qu'ils sont srs, sont rapidement accepts et mme peuvent tre
qualifis pour des lignes de crdit ou d'autres rcompenses avantageuses. Les
candidats dont les risques estims normaux sont agrs comme d'habitude et
comme si les IMF n'avaient pas utilis aucune fiche d'valuation statistique. Pour
contrler le risque des candidats risqus, le comit du crdit devra examiner
attentivement ces candidatures, ventuellement rajuster les montants demands.
Enfin, les candidats qualifis trs risqus seront automatiquement rejets.
Par ailleurs, lutilisation de cette approche est sujet controverses dans le secteur de
la microfinance pour plusieurs raisons videntes :
(i)
ellencessite une base de donnes robustes, qui enregistre les antcdents

de remboursement pour un grand nombre de prts antrieurs ainsi que les
caractristiques du client et du contrat de prt (Boyes, 1989 ; Mester, 1997 ;
Thomas, 2002 ; Sullivan, 1981; Bailey, 2004) ;
(ii)
la technique apparait plus approprie pour les crdits individuels que pour
les crdits de groupe ou les banques villageoises. Ceci tient au fait que, de
part le principe de co-responsabilit, il existe une corrlation beaucoup
moins troite entre le risque li au groupe et les caractristiques du groupe
(sexe ou ge moyen des membres du groupe) quentre le risque et les
caractristiques individuelles (Schreiner, 2003).
Cette corrlation sannule par le fait que la responsabilit conjointe au sein
du groupe autorise une surveillance mutuelle et une pression des pairs pour
que les membres respectent leur contrat (Stiglitz, 1990 ; Besley et Coate,
1995 ; Diagne, 1998 ; Bassole, 2004). cet effet, le groupe peut accrotre la
volont de payer dun individu ( cause du besoin de faire comme les autres
et des sanctions sociales) et il peut galement accrotre la capacit dun
individu de payer (mentorat des pairs et assurance informelle).
Inversement, le groupe par leffet dentranement peut anantir la
volont de payer dun individu.
(iii)
lutilisation de connaissances quantitatives dans une base de donnes pour

valuer le risque va lencontre des deux grandes innovations (groupes de
caution solidaire et relations personnelles avec lagent de crdit) qui
dfinissent le microcrdit, lesquelles tirent parti des connaissances
P a g e | 11
subjectives de lagent de crdit sur la solvabilit dun client (Schreiner,

2003).
(iv)
certains prts sont jugs trs problmatiques et rejets, alors que ces
clients auraient t de bons payeurs, tout comme certains cas limites
auraient t acceptables sans modification. Cest pourquoi il est
pratiquement impossible pour certaines institutions daccepter lvaluation
statistique.
Certes, lvaluation subjective traditionnelle conduit galement modifier
inutilement certains prts et rejeter tort certaines demandes.
Autrement dit, lvaluation subjective ne spare pas non plus toujours le
bon grain de livraie. Mais avec lvaluation statistique, le test historique
quantifie lerreur de prvision et amliore donc le choix entre souplesse et
fermet. Avec lvaluation subjective, lerreur de prvision est inconnue et
les choix sont sous-optimaux.
(v)
la technique perd son pouvoir prdictif en cas dun changement brusque

opr dans lenvironnement du fait quelle suppose que le risque futur
associ une demande prsentant certaines caractristiques, sera
identique au risque historique associ aux demandes passes prsentant
les mmes caractristiques (Shreiner, 2003 ; Meller, 1997). Ceci suggre que
lorsque le contexte change, la fiche de notation perd sa prcision absolue5
mais conserve sa prcision relative.
1.2.3. Complmentarit de lvaluation subjective et valuation statistique

Lanalyse susmentionne montre dune part que lvaluation subjective sappuie sur
lexprience dindividus capables didentifier des tendances, de combiner des
connaissances dorigines diverses (5C), de ragir avec rapidit et souplesse en cas de
rupture de tendance (changement de lenvironnement) et,dautre part, que
lvaluation statistique est plus cohrente et permet de dtecter des tendances plus
nombreuses (et plus subtiles), mais elle ne peut prdire que ce qui sest dj produit
maintes reprises.
Certains risques sont lis des caractristiques quantifies, telles que lendettement,
la capacit de remboursement et les arrirs prcdents. Cependant, toutes les
caractristiques ne sont pas quantifiables, et mme les caractristiques quantifiables
5 La prcision absolue indique lcart entre le risque prvu et le risque ralis et la prcision relative indique dans quelle mesure le
risque ralis diminue ou augmente dans les mmes proportions que le risque prvu. Ainsi une fiche de notation peut avoir une
prcision relative sans pour autant conserver sa prcision absolue en cas dun changement dans les conditions du march ou dans
lenvironnement macroconomique.
P a g e | 12
ne sont pas toujours quantifies. Le fait le plus intressant pour la microfinance est
quune partie (inconnue) du risque dpend des caractristiques personnelles, qui ne
peuvent tre apprcies que si lon connat bien le client.
cet gard, lexamen des avantages lis lvaluation statistique permet de se poser
deux questions : (i) Quelle est la part de risque lie aux caractristiques quantifies ?
Et (ii) est-ce que la mthode de scoring statistique peut-elle remplacer lvaluation
subjective ? (Al Amari 2002, p. 41 ; Shreiner, 2003).
Les pratiques en microfinance permettent de montrer que certains risques sont lis
des caractristiques quantifies ; do il est prfrable dvaluer par la mthode de
scoring statistique ; dautres risques sont lis des caractristiques qualitatives quil
est prfrable dvaluer par la mthode dvaluation subjective.
Or nous pouvons constater que dans le secteur de microfinance, la part des
caractristiques qualitatives6 est trop importante pour que lvaluation statistique
puisse remplacer les agents de crdit et leur valuation subjective. Par exemple, cette
mthode ne permet pas de dterminer si un emprunteur gre bien son affaire (la
capacit managriale et entrepreneuriale du client) ou sil va gaspiller largent du prt
(fongibilit du crdit).
Eu gard aux limites lies au deux types de scoring, il importe de combiner les deux
approches. Ceci tient au fait que lvaluation subjective peut tenir compte dlments
que lvaluation statistique ignore, et lvaluation statistique permet danalyser des
relations trop nombreuses, trop complexes ou trop subtiles pour lvaluation
subjective.
Face aux considrations susmentionnes, il est important de noter que la technique
statistique de scoring nest quune voix complmentaire lvaluation du risque de
crdit et, de ce fait, elle ne doit tre sollicite quaprs lapprobation provisoire de
lagent de crdit (Schreiner, 2003, Wang, 2010). Ceci tient au fait que la technique
ignore les caractristiques qualitatives et ne tient compte que de caractristiques
quantifies, or la part de risque omise dans le scoring mais prise en compte dans
lvaluation subjective est importante en microfinance.
Par exemple, si le scoring intervient avant lapprobation et prdit un faible risque, le
comit de crdit pourrait tre tent de se passer de lvaluation subjective, qui est
plus coteuse. Cela pourrait avoir un effet dsastreux car les crdits qui semblent peu
risqus sur la base des facteurs quantitatifs pourraient savrer trs risqus au regard
des facteurs qualitatifs. Cest pourquoi les institutions de microfinance ne devraient
Lvaluation du risque crdit repose sur linformation soft qui est trs dlicat analyser.
P a g e | 13
utiliser le scoring que pour les demandes de prt provisoirement approuves lissue
dune valuation subjective (Schreiner, 1999a ; 2004).
La figure ci-dessous dcrit la dmarche type suivie par une institution de microfinance
qui utilise le scoring (Schreiner, 2004).
Le client soumet une demande
Rejet
Lagent de crdit vrifie la demande
par rapport aux critresde base
Rejet
Approbation
Donnes acceptes
Lagent de crdit procde une valuation

traditionnelle
Rejet
Saisie des donnes et calcul du
risque prvu
Rejet
Le comit de crdit
procde une valuation
Approbation provisoire
Risque prvu accept
Aprs lapprobation provisoire, le comit de crdit applique la politique du scoring sur base de risque prvu
Excellent
Normal
Limit
Trs problmatique
0 % du risque
100%
Excellent
Approuv
Normal : Approuv
tel que
Limite Examin et
modifi
Source : Schreiner (2003).
Figure 1:Dmarche dutilisation de la fiche de notation
Trs problmatique
Rejet
P a g e | 14
1.3. Les avantages du credit scoring

La comparaison entre les techniques de credit scoring et lvaluation subjective n'a
pas t suffisamment tudie de manire critique, et seuls quelques chercheurs,
identifis dans la littrature, ont compar ces outils, tels que Chandler et Coffman
(1979) qui sont les pionniers dans cette ligne ; etCrook (1996) rsume la plupart de
leurs arguments et discute des avantages de chacune des mthodes.
Les techniques de notation de crdit prsentent un certain nombre d'avantages par
rapport aux techniques dvaluation subjective, tant pour les prteurs que les
emprunteurs. Plusieurs avantages et limites, relatifs la notation statistique du risque,
peuvent tre identifies dans la littrature (Mester, 1997; Glassman et Wilkins, 1997;
Crook, 1996; McAllister et Mingo, 1994; Lewis, 1992; Chandler et Coffman, 1979 ; Thomas,
2002).
L'organisation du processus du crdit
Le recours au crdit scoring permet d'augmenter la robustesse du processus
d'valuation, par une meilleure valuation du risque prvu pour les diffrentes classes
de risque des emprunteurs.
La rduction du biais humain
Le principal inconvnient du jugement personnel tant le biais humain d'valuation.
Que ce soit de bonne ou de mauvaise fois, le dcideur de crdit peut ne pas prendre la
bonne dcision, le credit scoring vient donc pour remdier ce biais, en privilgiant
l'valuation objective.
L'amlioration de la productivit des analyses des demandes de crdit
Les demandes risque extrme (trop risques ou bien trs faiblement risques) sont
dtectes rapidement, les rponses soit d'accord ou de refus de ces types de
demandes sont automatiques ; le temps gagn sur leur tude peut tre utilis pour se
concentrer d'avantage l'exploitation des dossiers score moyen, ce qui se traduit
par une amlioration de l'efficience des agents de crdit.
La rduction des impays et du temps consacr au recouvrement
Le scoring permet de dtecter les prts trs problmatiques. Le rejet automatique de
ce type de prt se traduit par un gain en termes de cot et de temps, par moins
d'arrirs de crdit recouvrir par l'agent de crdit, Quand on sait combien
l'opration de recouvrement des impays est onreuse et combien de temps et
d'efforts elle demande, on ralise l'importance des gains qui pourraient tre rinvestis
dans la prospection et l'valuation des autres demandes.
P a g e | 15
La dlgation de la dcision de crdit

Ce type d'valuation entrane la standardisation de la procdure d'octroi de crdit ;
elle permet de placer objectivement chaque client suivant son risque de
remboursement, par rapport un seuil que la direction dtermin ; l'objectivit de la
procdure permet la direction de dlguer la dcision d'octroi de crdit ses agents
et peut y impliquer mmes ceux qui ne sont pas trop expriments.
L'homognit des dcisions et le sentiment de scurit des agents de crdit
Guid dans leurs prises de dcisions par un manuel de fonctionnement, des rgles de
dcisions prtablies et par une valuation objective, les dcisions des diffrents
agents et diffrentes antennes ne peuvent tre qu'homognes et comparables ce qui
est de nature scuriser le dcideur. Il ne se culpabilisera pas d'avoir jug injustement
un client, ni d'avoir pris beaucoup de risque que l'institution peut ne pas tolrer. Cette
homognit des dcisions apparat comme un gage et une preuve de l'objectivit et
de la crdibilit de l'institution et de ses agents.
Possibilit d'adapter la tarification au risque encouru(Risk pricing)
Une politique de prix fonde sur le niveau de risque peut tre envisage ; ainsi les
demandes ayant un risque infrieur au seuil le plus faible peuvent tre fidlises par
exemple par une rduction de la commission de prt, tandis que pour ceux de la
classe de risque limite, l'institution peut augmenter la valeur de la commission, du
taux d'intrt, ou bien exiger une garantie supplmentaire.Toutefois, cet avantage est
aussi envisageable sous loptique de lvaluation subjective ou de lutilisation de deux
mthodes la fois (subjective et objective).
Meilleure allocation des fonds
Le classement des clients, permet l'institution d'optimiser ses choix quant
l'allocation de ses fonds, par la slection des clients les plus crdibles.
Ajustement de la politique de l'institution en dplaant le seuil d'acceptation
La direction de l'institution peut tout moment changer le seuil d'acceptation de
crdit pour une raison ou une autre ; par exemple si elle veut prendre moins de risque
que d'habitude parce qu'il s'est avr qu'elle a beaucoup d'arrirs pour l'exercice
prcdent, il suffit qu'elle fixe le nouveau niveau de risque tolrable et de le
communiquer aux agents de crdit.
Le crdit scoring tient compte de beaucoup de facteurs de risques
P a g e | 16
L'valuation statistique par la mthode du crdit scoring prend en considration une

multitude de facteurs de risques ; elle permet par une simple procdure d'exploiter
beaucoup de variables dterminantes du comportement de remboursement du client
pour prdire et estimer son niveau de risque de dfaut de remboursement.
La surveillance des risques
Dans les cas o linstitution utilise un modle de notation, les institutions sont tenues
d'examiner la solvabilit des emprunteurs priodiquement. Ce processus d'examen de
crdit est utilis pour surveiller le profil de risque de l'emprunteur individuel et ajuster
le total des rserves pour pertes sur prts.
Bien que la notation de crdit peut rduire les cots et accrotre la cohrence des
procdures d'octroi des prts, la faiblesse de la notation de crdit ne doit pas tre
ignore.
Ds lors, en microfinance, les avantages tels que le gain de temps, le rejet
automatique de demand avr risqu et la rduction de cot, peuvent apparaitre
restrictif en considrant les raisons susmentionnes relatives la complmentarit
entre lapproche subjective et statistique et, du fait que lvaluation statistique
intervient essentiellement, la diffrence des pratiques classiques, la suite de
lapprobation provisoire de lagent de crdit.
1.4. Variables couramment utilises dans les modles de notation de crdit
Les pratiques du crdit scoring impliquent que toutes les caractristiques de
l'emprunteur qui semblent avoir des liens vidents avec le risque de dfaut soient
incluses dans le systme de notation (Lewis, 1992). Concernant le nombre des
variables appliquer dans un modle de credit scoring, la littrature nest pas
concluante. Nous retrouvons des modles qui commencent avec plus de 50 variables
comme celui de Mester (1997) et Vigan (1993)7. Ainsi les variables sont
successivement ajoutes ou supprimes pour maximiser la prcision prdictive du
modle (Henley et Hand, 1997).
Il existe deux normes importantes pour la slection de variables, dune part, les
variables doivent avoir des coefficients significatifs et contribuer l'explication de la
variance de la variable dpendante et, dautre part les variables doivent avoir une
corrlation troite entre elles (Dinh et Kleimeier, 2007). Il n'est pas ncessaire de
justifier limportance de toutes les variables avant de lappliquer dans le modle
Le modle de Vigano est le modle pionnier construit pour un pays en voie de dveloppement. Ce modle a t appliqu
la Caisse Nationale de Crdit Agricole du Burkina Faso.
P a g e | 17
(Lewis, 1992). La variable est aussitt utilise ds lors quelle permet daccroitre le
pouvoir prdictif (Lewis, 1992).
Toutefois, les principaux facteurs couramment utiliss dans les modles de notation
de crdit comprennent les revenus, l'ge, le sexe de l'emprunteur, l'ducation, la
profession, le type d'employeur, la rgion, le temps l'adresse actuelle, le statut de
rsidence, l'tat matrimonial, tlphone, la valeur des garanties, la dure du prt,
anciennet de lemprunteur, le nombre de cycle de prt etc. (Dinh et Kleimeier, 2007;
Roszbach, 2004; Jacobson et Roszbach, 2003; Martinelli, 1997; Crook, Hamilton et
Thomas, 1992; Boyes, Hoffman et Low, 1989; Capon, 1982 ; Thomas, 2002).
Le revenu est souvent utilis comme indicateur proxy de la sant financire de
l'emprunteur et de son/sa capacit rembourser (Dinh et Kleimeier, 2007). Il existe
une relation ngative entre le revenu et le taux de dfaut des emprunteurs; le revenu
lev est associ un faible risque de dfaut (Jacobson et Roszbach, 2003).
L'occupation est une variable communment utilise dans le modle de notation de
crdit et est fortement corrle avec le niveau de revenu des emprunteurs.
Le revenu stable (salaire, pension) est souvent associ aux faibles risques de dfaut.
Le risque d'insolvabilit diminue lorsque l'emprunteur possde un revenu permanent
(salaire, pension). Ce revenu stable constitue une alternative exploiter en cas de
survenance des problmes de remboursement.
La significativit de la variable ducation nest pas concluante dans la littrature,
dune part certaines tudes appuient que lducation renforce la capacit des
emprunteurs rembourser. Les emprunteurs instruits sont rputs plus stables, avec
les salaires plus au moins levs et donc un faible taux de dfaut (Dinh et Kleimeier,
2007)et, dautres tudes montrent que les pauvres, faiblement instruits, remboursent
mieux que les riches (M. Nowak, 2005).
Les emprunteurs plus gs sont plus rfractaires au risque, et par consquent moins
susceptibles de faire dfaut(Thomas, 2000 et Boyle et al. 1992). Ainsi, les banques sont
plus rticentes prter aux emprunteurs plus jeunes, considrs moins averses au
risque.
Le sexe est une discrimination vidente (les statistiques montrent les femmes sont
moins vulnrables au dfaut que les hommes). Il existe de nombreuses preuves que
les femmes tombent souvent moins en situation dimpays compar aux hommes du
fait quelle sont plus rfractaires au risque (Coval et al., 2000). Toutefois, il faut noter
quen microfinance, les pratiques neutralisent la pertinence de cette variable.
La variable rgion dsigne la rgion du pays habite par l'emprunteur. Comme les
gens de richesse similaire ont tendance vivre dans le mme milieu, le critre
P a g e | 18
gographique peut indiquer le niveau la sant financire de lemprunteur. La variable

donne une ide sur la valeur de la garantie et donc une prsomption de la probabilit
de dfaut.
La variable statut rsidentiel mesure le rgime doccupation du logement cest--dire
montre si lemprunteur est propritaire du logement, locataire ou sil vit avec sa
famille. Cela pourrait indiquer la sant financire des emprunteurs dans le cas o il se
trouve propritaire. Le statut rsidentiel indique galement la contrainte financire
sur son revenu du fait des charges locatives. Les emprunteurs qui vivent avec leurs
familles sont moins susceptibles de faire dfaut(Crook et Thomas, 1992).
La variable tat civil affecte le niveau de responsabilit, de fiabilit ou de la maturit
de l'emprunteur. La probabilit de dfaillance est plus leve pour les couples maris
que les emprunteurs individuels. Le statut matrimonial est gnralement li au
nombre de personnes charge qui influe son tour sur la pression financire et la
capacit de remboursement de l'emprunteur(Dinh et Kleimeier, 2007).
Le Collatral est un mcanisme de scurit du prt et dincitation au
remboursement du prt. Cette variable figure parmi celles qui ont le plus grand
pouvoir prdictif du risque de dfaut. Plus la valeur de la garantie est leve, plus
lincitation rembourser le crdit est grande. Ce mcanisme est le plus utilis par les
institutions financires du fait quil constitue une scurit en cas de dfaillance de
lemprunteur (Gup et Kolari, 2005). La valeur de la garantie peut galement tre
considre comme un proxy pour mesurer la sant financire de lemprunteur, car il
affiche un corrlat troit avec les revenus des emprunteurs (Dinh et Kleimeier, 2007).
La dure du prt indique la maturit des prts en termes de mois. La dure du prt
reflte la volont de l'emprunteur, l'aversion au risque, ou l'auto-valuation de sa
capacit de remboursement.
Lanciennet fait rfrence la relation de longue dure entre linstitution et
lemprunteur. On peut supposer que plus la relation entre lemprunteur et linstitution
perdure, plus linstitution en sait sur cet emprunteur, et plus la probabilit de dfaut
se trouve rduite. Mais il importe de noter que cette variable doit tre mise jour
rgulirement en intgrant des changements dfavorables et inattendus oprs dans
la situation de lemprunteur.
Le nombre de prts mesure le nombre de cyclede crdit dont lemprunteur a dj
bnfici. Aujourd'hui, il est rcurrent de voir des emprunteurs ayant plus d'un prt
dans une mme institution. Cette variable reflte la difficult pour un emprunteur en
dfaut de recevoir de nouveaux prts de la mme banque.
P a g e | 19
Les nouveaux projets sont plus exposs au risque que les anciens. Ceci tient au fait
que le degr de risque associ avec les nouveaux projets peut tre attribu au
manque d'exprience de nouveaux entrepreneurs ainsi qu'aux probabilits limites
de prise de risque.
Malgr labondance des caractristiques utilises dans la littrature sur le scoring, il
existe, aucun consensus sur les variables utiliser dans la construction dune fiche de
notation. Le choix des variables dpend de plusieurs facteurs. Ainsi il convient pour
une institution dutiliser une ventilation plus pousse des donnes, de manire
slectionner, les seules variables qui sont susceptibles dinfluencer la probabilit de
dfaut (Schreiner, 2004).
Le tableau 2.1 rcence les variables utilises dans les travaux de Vigan (1993) et de
Schreiner (1999) considrs comme les modles pionniers adapts aux pays en voie
de dveloppement. Les travaux de Schreiner sont les premiers en microfinance.
Vigan (1993) a identifie cinq grands dterminants du risque de dfaut de
remboursement:
La capacit de remboursement de l'emprunteur ;
La volont de remboursement de l'emprunteur ;
La prsence des conditions externes favorables (conomiques et
environnementales) ;
La qualit de l'information qui sert de base de dcision pour l'octroi de
crdit ;
La capacit du prteur s'assurer de la bonne volont du l'emprunteur via
un contrat optimal dincitation.
Bien que les modles de Vigan (1993) et de Schreiner (1999) prsentent certaines
similarits avec les modles des banques classiques, ils restent, cependant, limiter par
lopacit des informations mis la disposition des structures dcentralises qui rend
dlicat lvaluation du risque de crdit (Allen et al., 2004). De ce point de vue, les
modles, appliques aux donnes des ISFD, recourent aux caractristiques proxies
lies lindividu afin dvaluer indirectement la capacit de remboursement.
P a g e | 20
Variables communment utiliss dans

les pays industrialiss
code postale
Variables inclues dans les fiches de notation

Croock et al. (1992) UK
Schreiner (1999a)-Bolivie
code postale
Date du dboursement
Age
Activit professionnelle
Montant accord
Nombre d'enfant
Anciennet
Type de garantie
Membre de la famille en charge

revenu
compte courant
Revenu
Domaine d'activit
Agent de crdit8
empoyement statut
Statut rsidentiel
Genre
statut rsidentiel
Tlphone
Secteur
le temps dans la nouvelle maison
Temps pass dans

le nouvel emploi
Nombre d'arrirs
valeur de la maison
volume de crdit hypothcaire
anciennet
compte courant
compte pargne
carte de crdit
major credit card
change card
statut residentiel
store card
compte pargne
valeur de la maison
Outgoing
Nombre d'enfant
Volume de crdit
change card
Vigano (1993)-Burkina Faso

Caractristiques du client
(sexe, ge, religion, tat civil, ducation etc.)
Donnes sur l'entreprise
(type, comptence des employs, nombre d'employs,
productivit et profitabilit)
Rentabilit (Revenu primaire, secondaire, stabilit du
revenu etc.)
Total actif
Situation financire
Plan d'investissement (autres sources de financement,
existence d'un plan d'investissement)
Relation de l'emprunteur avec la banque (Historique de
crdit, disposition d'un compte pargne)
Caractristique de l'institution (l'objet du prt, modalit de
remboursement, plafond de crdit, garantie, condition
etc.)
Source: Dinh & Kleimeier (2006).

8
La variable Agent de crdit mesure lexprience de lagent de crdit en supposant quelle influe significativement sur la probabilit de dfaut de lemprunteur.
P a g e | 21
1.5 Credit scoring et ses techniques de modlisation

Lanalyse discriminante linaire (LDA), mise en vidence par Fisher (1936), figure
parmi les premires mthodes declassification. Lapplication de cette technique reste
ces jours questionne cause de la nature des donnes relatives aux historiques de
crdit et par le fait que lgalit entre les matrices de covariance de deux classes
(emprunteurs dfaillant et non dfaillants) nest pas toujours garantie. En plus, Les
donnes relatives au crdit ne sont pas toujours normalement distribues.
Pour remdier aux hypothses restrictives auxquelles postulent cette approche, cest-dire accroitre son pouvoir discriminant, dautres modles statistiques ont t
appliqus tels que la rgression logistique et le modle Probit. Plus rcemment,
dautres techniques non paramtriques ont t utilises pour modliser le risque de
crdit. Il sagit de k-nearest neighbor (Hesley, 1996), larbre de classification
(classification trees) et rseaux de neurones (ANN), systme dexpert, lalgorithme
gntique Markov chain models, mathematical programming, recursive partitioning
(Crock, 1997 ; Thomas, 2002).
L'approche logistique est un outil statistique plus appropri que la rgression linaire,
quand il ya deux classes distinctes (bons et mauvais risques) dfinies dans le modle
(Main et Henley, 1997). Cette technique donne un taux de classification lev et un
rsultat final compris entre 0 et 1. Le modle probit est trs similaire au modle Logit.
Mais le modle Logit est gnralement prfrable au modle probit en raison de sa
simplicit (Barney et al, 1999; Novak et LaDue, 1999; Lee et Jung, 1999).
Parmi les techniques statistiques susmentionnes, la rgression logistique est
couramment utilise pour modliser le risque de crdit (Clarke, 2005). Ce modle
logistique permet daugmenter le pouvoir de prdiction du modle, et de rduire
considrablement le taux d'erreur de classification (Collins et Green, 1982). La
rgression logistique donne galement un taux de classification des erreurs suprieur,
compar l'analyse discriminante (Wiginto, 1980).
Selon la littrature, il n y a pas un consensus autour des modles statistiques utiliser
dans la construction dune fiche de notation (Thomas, 2000). La recherche sur la
meilleure technique destimation du dfaut nest pas concluante. Par exemple, parmi
les tudes identifies dans la littrature, certains soulignent que les rseaux de
neurones sont plus prdictifs que les modles statistiques classiques lanalyse
discriminante et la rgression logistique (Desai et al. 1996) alors que dautres auteurs
soulignent linverse (Yobas et al. 2000). Les tableaux1.2 et 1.3 prsents ci-aprs,
fournissent un rsum des tudes empiriques, en indiquant la similarit entre les
techniques statistiques appliques (Thomas et al. 2002 ; Wang, 2010).
P a g e | 22
Tableau 1:Comparaison des rsultats (en % des groupes correctement classifis)

Auteurs
Henley (1995)
Boyele et al.
(1992)
Srinivisan et
Chakrin (1987)
Yobas et al.
(1997)
Dessai et al.
(1997)
Rgression Logistique RPA Programmation Rseau

linaire
linaire
des
neurones
artificiel
43,4
43,3
43
77,5
75
74,7
87,5
68,4
89,3
66,5
67,3
93,2
62,3
Algorithme
gntique
86
62
64,5
66,4
Sources : Thomas (2002)
La lecture du tableau 2.2 montre que les techniques associes aux fortes
performances (en pourcentage des groupes correctement classifis) varient dune
tude lautre. Ceci illustre clairement les controverses autour de la meilleure
technique de construction de la fiche de notation.
Tableau 2:Comparaison des rsultats des recherches empiriques
Analyse
discriminante
Rgression
logistique
Arbre de dcision
Programmation
math.
Rseau des
neurones
Algorithme
gntique
K-nearest
neighbours
Support vestor
machine
Boyles
et al.
(1992)
77,6
Desai et
al. (1997)
West
(2000)
66,5
79,3
Lee et
al
(2002)
71,4
67,3
81,8
73,5
75
74,7
Source : Crook et al (2007, p.1457)
Malholtra Beesens
(2002)
(2003)
69,3
79,3
77,0
66,4
82,6
73,7
79,3
72
77
78,4
79,4
81,7
77,0
76,7
Ong et
al.
(2005)
80,8
82,8
78,2
79,7
P a g e | 23
De ce point de vue, lvaluation du pouvoir de prdiction est le seul moyen susceptible

d'identifier la meilleure technique et cela selon le contexte (Thomas, 2002). D'autres
auteurs incluent la vitesse de classification, la rapidit de rvision de la fiche de
notation, la facilit de comprhension de la mthode de classification, et enfin
lobjectif de la fiche de notation.Ainsi la performance dune technique dpend du
contexte dans lequel elle est construite : la structure des donnes, les caractristiques
utilises, la mesure dans laquelle il est possible de sparer les classes en utilisant les
caractristiques et l'objectif de classification (taux d'erreur de classification globale et
la fonction de cot, le taux de risque parmi ceux qui sont accepts, quelque mesure
de rentabilit, etc.).
Toutefois, les modles logistiques et des rseaux neuronaux (connus par leur
capacit modliser les relations non linaires dans un systme) sont les mthodes
les plus appliques dans les recherches antrieures (Tableau 1.4).
Tableau 3:Techniques de classification
Dunn et Frey (1976)

Lufburrow et al. (1984)
Mortensen et al. (1988)
Turvey et al. Brown (1990)
Jesen (1992)
Altman et al. (1994)
Novak et LaDue (1999)
Barney et al. (1999)
Wu et Wang (2000)
Jacobson et Roszbach (2003)
AD
LMP Logit
RPA
Probit
RNA
AD=analyse discriminante; Logit= rgression logistique; Probit=modle probit; RPA= Recurcive Partitionning
Algorithmes RNA= Rseau des neurones artificiel.
Le problme du choix de la meilleure technique destimation des scores reste aussi

pos dans la recherche en microfinance. Les quelques tudes identifies dans la
littrature, prsentes dans le tableau 2.5ci-dessous, permettent de souligner trois
points importants dans la recherche sur credit scoring dans les pays en voie de
dveloppement (Joris Van Gool, et al.) :
Primo, la majorit des tudes recenses sur le credit scoring dans les pays en
dveloppement sont focalises dans les pays de lAmrique latine et lAfrique du
Sud et leur implmentation reste encore trs limite(Vogelgesang, 2003 ; Kleimeier
2007);
Secundo, le pouvoir prdictif des modles de Reinke (1998), Zeller (1998) et Sharma
and Zeller (1997) nest pas statistiquement valide(Shreiner, 2004). De plus, les modles
P a g e | 24
de Zeller (1998) et celui de Sharma et Zeller (1997) sont construits sur base des
historiques de credit de groupe ce qui, pour des raisons susmentionnes, sont
inappropris.
Tirso les techniques de construction des fiches de notation varient selon les tudes, ce
qui montre les disparits des points de vue des auteurs dans le choix de la meilleure
technique.
Tableau 4:Publication sur les modles de credit scoring appliqus aux pays en dveloppement
Auteurs (Date, Pays)
Type
d'institution
chantillon
Nombre
des
inputs
Techniques
Performance
Metrics
Vigano (1993, Burkinan

faso)
Sharma et Zeller (1997,
Madagascar)
Zeller (1908, Madagascar)
IMF
100
53 (13)
Analyse discriminante
PCC, R
IMF
868
18(5)
N/A
IMF
168
19(7)
Reinke (1998, South frica)
IMF
1641
8(8)
Tobit Maximun Likelihood

Estimation
Tobit Maximun Likelihood
Estimation
Rgression probit
Schreiner (2001, Bolivie)
IMF
29956
9(9)
Rgression logistique
PCC, Pseudo-R
Vogelgsang (2001, Bolivie)
IMF
8002
28(12)
Random Utility Modle
PCC, Pseudo-R
Vogelgesang (2001,
Bolivie)
Diallo (2006, Mali)
IMF
5956
30(13)
Random Utility Modle
PCC, Pseudo-R
IMF
269
17(5)
Rgression logistique,
analyse discriminante
PCC, R
Kleimeier et al. (2006,

Vietman)
Banque de
dtail
56037
22(17)
N/A
N/A
PCC, SENS, SPEC
Pendant que beaucoup dtudes en finance classique recourent aux mthodes non
paramtriques dans lvaluation du risque de credit, cause des hypothses
auxquelles postulent les techniques paramtriques, trs peu dtudes en microfinance
portent sur ces modles. De ce point de vue, pour modliser le risque de crdit, cette
tude sintresse une mthode non paramtrique les rseaux de neurones (NN)
avec larchitecture Multi-layer Perceptron (MLP) et la Fonction Base radiale (RBF).
cet effet, les rsultats issus de cette mthode seront confronts une mthode
classique (rgression logistique).
1.6. Evaluation de la performance
Deux groupes de critres peuvent tre identifis pour valuer le pouvoir discriminant
dun modle. Il sagit des critres relatifs au pouvoir de prdiction (accurate
classification) et les critres dits pratiques (Thomas, 2002).
Le pouvoir de prdiction du modle regroupe lensemble des critres importants
susceptibles dvaluation le pouvoir discriminant dun modle. Ces critres sont
P a g e | 25
valides lorsque lvaluation du modle sintresse essentiellement au choix du

meilleur modle. Cependant, la construction dun modle de crdit scoring nest pas
utilise de manire isole mais doit guider les dcideurs dans leur prise de dcision.
cet effet, dautres critres peuvent tre envisags. Il sagit des critres relatives: la
vitesse de classification (prdiction), la transparence, la facilit dinterprtation du
modle et enfin la simplicit du modle.
Toutefois, limportance de chaque critre varie selon le contexte dans lequel la fiche
de notation est construite. Par exemple, lorsquune institution cherche rduire le
temps de traitement de dossiers de crdit, elle sintressera plus au critre relatif la
vitesse de classification pour viter le risque commercial.
Parmi les critres relatifs au pouvoir de prdiction du modle, les plus utiliss sont : la
matrice de confusion (confusion matrix), reciever operating curve ROC, cot de
classification, AUROC, (Paliwal et Kumar 2009, p. 14).
1.6.1 La matrice de confusion
Dans le domaine du credit scoring, deux classes sont gnralement utiliss pour
classer les bons et mauvais clients (clients dfaillants et non dfaillants). cet effet, la
matrice de confusion, permet de comparer les frquences des classes actuelles aux
frquences de classes prdites. Le format de cette matrice se prsente comme suit:
Tableau 5:Matrice de confusion
Classe prdite
Mauvais
Bon
Nombre
Mauvais
Bon
a
c
b
Classe actuelle
Pourcentage
Mauvais
Bon
=c/ (a+c)
=b/ (b+d)
B+c / (a+b+c+d)
Le taux derreur qui rsume lensemble de performances du modle correspond :
P a g e | 26
En plus, dans le domaine du credit scoring, deux types derreur sont considrs
(Thomas, 2002). Il sagit du taux derreur de la premire espce mesur par et le
taux derreur de la deuxime espce mesur par .
Le taux derreur du type I est aussi appel taux du risque de crdit par le fait quil
mesure le pourcentage des emprunteurs dfaillants considrs comme non
dfaillants. Si une institution a ce taux lev, cela suppose que la pratique de la
politique de crdit est trs gnreuse et de ce fait, linstitution se trouve expose au
risque de crdit. Par contre, le taux derreur du type II, appel autrement risque
commercial, reprsente le pourcentage des bons emprunteurs classs comme
dfaillants. Une institution qui a ce taux lev supporte un cot dopportunit
important par le fait quelle refuse les crdits aux bons emprunteurs. Dans un march
concurrentiel, celle-ci peut perdre la part du march.
1.7. Receiver operating curve (ROC)
Le ROC est une courbe paramtre ayant en abscisse lerreur de la deuxime espce
et en ordonne lerreur de la premire espce. Elle permet de synthtiser de manire
plus simple lvolution des erreurs en fonction du seuil. Sa prsentation sous forme
dune densit permet de montrer les dispersions potentielles des scoring sous les
deux types derreur. Pour un seuil donn, plus lerreur du type I est faible et plus
lerreur du type II est fort, meilleur est le scoring.
La ROC se visualise en fonction du seuil, gauche du seuil le scoring est parfait et
droite scoring contientdes erreurs de classement (Mays, 2004).
Source: Thomas (2002).
Figure 2: Receiver operating curve (ROC)
P a g e | 27
Il y a une statistique gnrale, plus riche que le coefficient de Gini, qui permet de
dterminer le pourcentage de la surface totale couverte par la courbe ROC, appel
aussi AUROC ou c-statistic. LAUC mesure le pouvoir discriminant du modle credit
scoring en valuant la surface de la courbe sous la courbe ROC comme la probabilit
quun bon crdit reoit un meilleur score que le mauvais crdit (0,5<AUC<1) (Tasche,
2005) :
(1)
1.6.3 La fonction de cot

Un modle optimal est celui qui minimise les pertes anticipes quand il est utilis pour
classifier les clients dfaillants et clients non dfaillants. Dans les deux groupes,
lestimation du cot de la perte ventuelle dpend de la part des erreurs de
classification dans chaque groupe (taux derreur du type I et du type II). cet effet, la
fonction de cot permet destimer le cot des erreurs de classification dun modle.
Elle se prsente:
Formule 2.
(1)
Lestimation de cette statistique est fonde sur une hypothse selon laquelle les cots
sont similaires pour tous les cas (bons ou mauvais) cest--dire il n y a pas de
diffrence de cot pour chaque cas individuel. Cependant, dans la pratique, cette
hypothse est souvent viole. Ceci tient au fait que le volume de credit varie souvent
selon le contexte.
P a g e | 28
Conclusion partielle
Lobjectif de ce chapitre tait de discuter des questions fondamentales rencontres
dans la construction dune fiche de notation du risque de crdit. Il sagit de discussion
relative aux avantages et limites de la notation statistique du risque de crdit en
microfinance, sa complmentarit avec lvaluation subjective, au choix des
variables inclure dans le modle, au choix de la meilleure technique de classification
et enfin leur critres dvaluation.
Ainsi, nous pouvons dgager les constats majeurs suivants :
lutilisation de lapproche statistique dvaluation du risque de crdit est
sujette controverses dans le secteur de la microfinance pour plusieurs raisons
videntes : labsence dune base de donnes robuste dans le chef des IMF,
nest pas approprie la mthodologie de crdit de groupe, ne permet pas
toujours de sparer le grain de livraie, est vulnrable au changement du
contexte.
Les pratiques en microfinance permettent de montrer que certains risques lis
des caractristiques quantifies peuvent tre dvalues par la mthode de
scoring statistique ; dautres risques lis des caractristiques qualitatives
peuvent tre values par la mthode dvaluation subjective, do il est
prfrable darticuler les deux approches.
la technique statistique de scoring nest quune voix complmentaire
lvaluation du risque de crdit et, de ce fait, elle est sollicite quaprs
lapprobation provisoire de lagent de crdit.
techniques de notation de crdit prsentent un certain nombre d'avantages
par rapport aux techniques dvaluation subjective, tant pour les prteurs que
les emprunteurs.
Le choix sur les variables inclure dans la fiche de notation varie en fonction du
contexte dans lequel la fiche est construite.
Plusieurs techniques paramtriques et non paramtriques permettent
destimer la probabilit de dfaut et de classer les emprunteurs (risqus ou non
risqus). Cependant, le dbat sur la meilleure technique de classification
utilise nest pas concluant dans la littrature.
P a g e | 29
Chapitre II : Description des donnes et mthodes de discrimination

La construction dune fiche de notation fait appel la modlisation prdictive, et de
ce fait, ncessite une large base dinformation relative aux caractristiques des clients
et linstitution, et une mthode de classification qui minimise les erreurs de
classification.
Dans cette optique, ce chapitre dcrit, dune part, la base des donnes utilises pour
construire la fiche de notation, et dautre part, les mthodes du credit scoring
utilises pour la modlisation du risque de crdit partir de ltude de Data Mining.
Cependant, il existe plusieurs mthodes statistiques de construction dun scoring
dont les plus reconnues sont : lanalyse discriminante (linaire, quadratique de Fisher),
la rgression logistique discriminante, les arbres de classification, mthode k-nn, les
rseaux de neurones, les Sparateurs Vaste Marge (SVM), systme dexpert, etc
(Thomas, 2002).
Dans le cadre de notre tude, le modle sera construit base dun modle
paramtrique et de deux modles non paramtriques savoir la rgression logistique
discriminante cause de sa grande robustesse et sa facilit dinterprtation, et les
rseau de neurones artificiel (RNA) pour leur capacit modliser les phnomnes
complexes et changeant. En effet, il sera question, dans le but didentifier les
clignotants du risque de crdit permettant de prvoir les dfaillances, de construire
pour chacune de ces mthodes un modle et finalement mettre en perspective les
trois modles pour en retenir celui qui sajustera le mieux selon les critres de pouvoir
de prdictif et les critres dits pratiques.
2.1 Description des donnes
Nous prsentons, dans cette section, la mthodologie de collecte des donnes. La
description des variables sera traite sous SPSS. Cela nous permettra galement
dillustrer les premires tapes exploratoires raliser sur notre jeu de donnes.
2.2.1 Mthodologie de collecte des donnes
Nos investigations portent sur Life Vest, une institution spcialise dans le
financement de petits projets entrepris par les personnes faible revenu par le biais
de ses trois agences (UPN, GOMBE). Pour avoir un chantillon reprsentatif et collecter
les informations ncessaires la construction du modle, deux agences de Life vest
ont t retenues.
En dpit des autres considrations non souleves dans cette criture, la constitution
dun chantillon pour notre tude savre trs dlicate en raison des rgles strictes de
P a g e | 30
secret bancaire et de protection des consommateurs auxquelles sont tenues les

institutions financires.
Les informations sur les performances des crdits des emprunteurs sont rassembles
travers les dossiers de crdit. Nous avons galement eu recours aux agents de crdit
pour vrifier et complter quelques informations.
Afin de constituer notre base de donnes, nous avons examin les dossiers de crdits
accords durant les annes 2010 et fin mai 2013 ainsi qu'un recours aux agents de
crdit pour collecter quelques informations. Cela a permis de crer une liste de bons
et des mauvais emprunteurs. De plus, nous avons retenu un chantillon de 222 prts
qui constituent en fait une partie d'un chantillon global de 836. Ceci tient au fait que
parmi lchantillon de 836, nous avons retenu que les dossiers de crdit correctement
renseigns. Comme il faut s'assurer d'avoir un nombre suffisamment reprsentatif
d'observations dans chacun de deux groupes (bons et mauvais emprunteurs), on a
procd une comparaison de la moyenne de lencours de crdit de lchantillon la
moyenne de lencours de crdit de la population.
Un autre problme soulev dans la constitution de notre chantillon est celui de sa
rpartition. Une ide naturelle constituerait prlever n1 (bons emprunteurs) et n2
(mauvais emprunteurs) en respectant les proportions des bons et mauvais dossiers,
d'autant plus que l'on sait que le sondage stratifi rpartition proportionnelle est
toujours meilleur que l'chantillonnage simple sans stratification. Cette mthode nest
pas, cependant, prise en compte ici car les deux groupes ont des proportions trs
diffrentes: le groupe risque (les mauvais emprunteurs) qu'il faut dtecter est trs
minoritaire et mal reprsent. Il est dmontr, sous certaines hypothses, qu'une
rpartition quilibre (nombre de bons emprunteurs=nombre de mauvais
emprunteurs), est bien meilleure, sinon optimale (Mester, 1997).
Du fait de lopacit des informations financires et comptables relatives des
emprunteurs de Life vest, les informations non financires, dordre personnel aux
emprunteurs, sont prises en compte dans cette tude. Les variables, utilises dans
cette tude, sont largement dcrites dans la section suivante.
2.2.2 Description des variables
La batterie de critres retenus dans ce travail comporte 20 variables explicatives et
une variable qualitative Y expliquer dont les slections sont faites selon les thmes
dcrits dans le tableau 2.1 (indiqu en annexe) (prvision de leur sens et signe de
corrlation avec la variable explique dfaut de remboursement ). Seules 12 variables
sont quantitatives. Ceci tient au fait que la part des facteurs quantitatifs, susceptibles
P a g e | 31
dexpliquer le dfaut de remboursement dun emprunteur, est restrictive en

microfinance (Schreiner, 2004).
Eu gard l'objectif de cette tude, nous avons jug ncessaire de prciser la
distinction entre ce que nous considrons comme bons et mauvais emprunteurs.
Ainsi, suite aux discussions labores avec les agents de crdit et l'quipe du service
de crdit des agences Life vest, un emprunteur est considr comme bon s'il a
rembours son prt avec un retard de remboursement infrieur 30 jours. Par contre,
un mauvais emprunteur est celui qui a connu au moins une fois un retard de
remboursement de son prt de 30 jours ou plus.
De ce point de vue, la variable Y est une variable qualitative binaire prdire dont les
modalits sont : 0 = bon emprunteur ou non risqu ; et 1 = mauvais emprunteur
ou client risqu.
En ce qui concerne la variable indpendante, de nombreuses variables sont
considres (tableau 2.1cf. annexe). Toutefois, hormis les variables communment
utilises en microfinance, nous insrons cinq (5)ratios financiers. Nous tentons aussi
de justifier la pertinence des informations financires et comptables dans la prvision
du risque crdit en microfinance.
Le premier ratio R1 indique la part du chiffre daffaires dans lactif total de
lemprunteur. Par consquent, nous estimons que le ratio R1 est inversement corrl
la probabilit de dfaut. Le deuxime ratio financier R2 mesure sa liquidit. En raison
de la conception de ce ratio, plus sa valeur est suprieure 1, plus lemprunteur est
capable de faire face ses engagements court terme, partant la probabilit de
dfaut est faible. Par consquent, un signe ngatif est attendu pour cet indicateur.
Le troisime ratio financier R3 indique lge des stocks. Dans ce cas, plus la dure est
forte, plus forte est la probabilit de dfaut.Par consquent, le signe attendu pour son
coefficient est positif. Le quatrime ratio financier R4 mesure le rapport entre le
montant de la dette et les fonds propres. Nous estimons quun niveau lev du ratio
de la dette augmente la probabilit de dfaut de lemprunteur. Ainsi, un signe positif
est attendu pour ce ratio. Le cinquime ratio financier R5 mesure la rentabilit des
actifs ROA. Un rendement dactifs important rduit la probabilit que lemprunteur
tombe en impay. Un signe ngatif cette variable est donc prvu.
La variable IMF_Client mesure la dure de la relation IMF-client et montre que plus
cette dure est importante, mieux linstitution connait le comportement de
remboursement de lemprunteur, et pour cette raison, ladite relation est suppose
tre inversement corrle la probabilit de dfaut (Crook, Hamilton et Thomas,
1992).
P a g e | 32
Pour la variable objet_du_prt, nous prvoyons un signe positif pour le fait que le
crdit destin l'acquisition d'un actif implique un risque suprieur un crdit destin
au fonds de roulement. La variable Ecart_Temps mesure la dure coule entre la
demande de crdit et le dboursement. Nous supposons que plus cette dure est
importante, forte est la probabilit de dfaut. Ceci tient au fait que la priode
dopportunits du client peut ou ne pas correspondre la priode dacquisition du
crdit, le client se trouvant ainsi expos un risque commercial. Pour cette raison, un
corrlat ngatif ou positif est attendu pour cette variable.
La variable Ecart_Mont vrifie lgalit entre la le montant demand et le montant
rellement peru par le client. Moins le montant peru correspond aux attentes du
client, plus la probabilit de dfait est forte. Ceci suggre que souvent les montants
perus par les clients ne correspondent pas leurs besoins en fonds de roulement.
Une corrlation positive est attendue pour cette variable.
Les emprunteurs responsables d'une famille sont, en gnral, supposs avoir un
meilleur comportement de remboursement de leurs dettes que ceux qui sont seuls,
c'est--dire ceux sans obligations familiales (Kleimeier & Dinh,2007). Cependant,
laugmentation de la taille de la famille affecte positivement le risque de dfaut. Pour
cette raison, un effet positif est attendu pour les variables Pers_en_charge et Enfants.
Ces variables reprsentent les postes des charges importants dans le budget de la
micro-entreprise. La prise en compte de ces variables est subtile en microfinance
parce quil est dlicat de sparer le budget du mnage de celui de lactivit (microentreprise). Les deux budgets sont souvent imbriqus. Et donc plus la taille du
mnage augmente et plus le risque de dfaut augmente.
Un corrlat ngatif est attendu pour la variable Exprience de lemprunteur, puisque
les emprunteurs qui ont une certaine exprience et une bonne maitrise du risque et
de la rentabilit dans la gestion de leurs activits ont une plus faible probabilit de
dfaut compars ceux qui sont sans exprience.
En microfinance, la rputation de l'emprunteur est la principale garantie pour lIMF.
Ceci suggre dune part, que le problme de disposition dune garantie importante est
plus pos pour les nouveaux emprunteurs et pour ceux qui ont enregistr dans le
pass de problme des remboursements. Pour cette raison, un corrlat ngatif est
attendu pour la variable Garantie. Cependant, il n'existe aucune preuve empirique sur
la relation entre la variable Type_Ganr et de la probabilit de dfaut et ainsi le signe de
lestimateur de cette variable nest pas dtermin.
D'autre part, il est rcurent de constater dans les pratiques des IMF quun volume
important de crdit est accord seulement aux emprunteurs bons payeurs. Les
montants de crdit levs peuvent tre associs aux anciens clients et bons payeurs,
P a g e | 33
puisque ces clients ont une probabilit plus faible de dfaut de remboursement
compar aux emprunteurs qui ont reu un faible volume de crdit. Par consquent, un
signe ngatif est attendu pour le coefficient de la variable Montant et un signe positif
pour la variable Nomb_cycle.
La variable statut_resid mesure le rgime doccupation du logement cest--dire
montre si lemprunteur est propritaire du logement, locataire ou sil vit avec sa
famille. Aucune relation empirique nest prdite pour cette variable.
La variable Taux_d_intrt est supposer avoir un corrlat positif avec les difficults de
remboursement, car son augmentation accrot la probabilit du risque de dfaut.
Enfin, nous insrons une autre variable importante, quoique totalement subjective. Il
sagit de lopinion de lanalyste de crdit (Opinon_AC) sur la probabilit qu'un client
tombe en impay. Comme pour la variable prcdente, nous nous attendons un
effet positif.
Les tableaux 2.2 et 2.3 ci-dessous dcrivent respectivement nos variables
quantitatives et les frquences des variables qualitatives.
Tableau 6:Statistiques descriptives des variables quantitatives
Age
Exprience
Val_gar
Enfant
Montant
Ecart_temps
Nom_cycle
Taux_intret
R1
R2
R3
Per_charg
ROE
ROA
Minimum
Maximum
Moyenne
25
0
0
0
100
7
0
45
1,18
,00
18,00
0
,00
,00
71
26
10110
14
4500
45
8
54
5,21
1,64
85,00
14
1,15
1,00
48,59
9,44
1206,76
4,75
946,53
14,69
2,09
46,24
3,0244
,7839
33,6802
4,38
,2898
,3673
La lecture du tableau 2.1 montre que lge moyen de lchantillon se situe environ 49
ans, il varie entre 25 et 71 ans. Lexprience moyenne des emprunteurs est de 9 ans,
cependant, la description de lchantillon montre que certains emprunteurs sont sans
P a g e | 34
lexprience. Le montant de crdit varie entre 100 et USD 4500 avec une moyenne de
USD 947. La dure moyenne de traitement de dossiers est estime environ 15 jours.
Le nombre de cycle moyen est de 2 ans.
Les ratios financiers sont pour la plupart faibles. Les tendances moyennes de ROA,
ROE, R1, R2 sont relativement faibles et sont chiffres respectivement 0,37 ; 0,28 ;
0,78 ; 3,024. Le taux dintrt moyen annuel est estim 46,24%. La valeur moyenne
de la garantie est de USD 1206,76.
Tableau 7: Statistiques descriptives des variables qualitatives
% de bons emprunteurs
Mari
Clibataire
Veuve/veuf
Divorc
Autres
Aucune
Financire
Physique
Avaliseur
Autres
Propritaire
Locataire
Autres
51,4
0,2
7,2
2,3
1,4
6,3
0
41
11,7
3,6
19,8
42,3
0,5
% de mauvais
emprunteurs
30,6
1,4
2,7
2,3
0,5
5,4
0
23
5,9
3,2
7,2
29,7
0,5
Rat_cred
Oui
Non
43,2
30,6
19,4
6,8
Objet
Stocks
actifs fixes
55,9
31,1
6,8
6,3
Opin_Ac
Avec rserve
Sans rserve
23,00
33,8
39,6
3,6
Etat_civil
Typ_gar
Stat_resi
Concernant les variables qualitatives, la plupart des emprunteurs sont maris, soit une
proportion de 81,4%. La majorit des emprunteurs sont locataires, soit une proportion
42,3% pour les bons emprunteurs et 29,7% pour les mauvais emprunteurs. Les
garanties physiques et les pratiques davaliseur sont les plus rependus pour la
majorit des emprunteurs. Lersultat sur lobjet de prt apparait relativement
satisfaisant, soit 62,7 pour financement de fond de roulement et 37,3% pour le
financement des actifs fixes.
P a g e | 35
De plus, plus de 70% des emprunteurs ont vu leur montant de crdit sollicit tre
diminu la suite des analyses du comit de crdit. Les rsultats montrent galement
que 39,6% des prts approuv avec rserves ont t problmatique contre 23% de
prts approuv sans rserves qui nont pas connu de problme de remboursement.
Ceci laisse supposer que les valuations intuitives des agents de crdit sont parfois
moins rigoureuses.
2.2 Description des mthodes
Comme susmentionn, il ny a pas de consensus autour du choix de la meilleure
mthode de classification des bons et mauvais emprunteurs. De ce fait, la
construction de notre fiche de notation portera sur deux mthodes de classification
dont lune paramtrique (rgression logistique) et lautre non paramtrique (rseaux
de neurones). Sagissant du rseau des neurones, nous utiliserons deux
architectures communment utilises dans la classification des bons et mauvais
emprunteurs (Vellido, Lisboa, & Vaughan, 1999; Zhang, Patuwo, &Hu, 1998) : Perceptron
Multicouches et Fonction Base Radiale (RBF). Le recours ces trois techniques va
permet, la lumire des critres relatifs au pouvoir discriminant et leur facilit de
mise en uvre, de slectionner le modle qui prdit le mieux le risque de crdit.
A. Rgression logistique
La rgression logistique est une technique qui permet de modliser lapproche
rponse binaire. Ainsi il permet d'ajuster la surface des donnes dans le cas dune
variable dpendante dichotomique (J. Desjardins, 2007). Elle correspond une
technique statistique dont l'objet est, partir d'un fichier d'observations, de produire
un modle permettant de prdire les valeurs prises par une variable catgorielle, le
plus souvent binaire, en se basant sur une srie de variables explicatives nominales.
Contrairement la rgression multiple et l'analyse discriminante, la mthode
n'exige pas une distribution normale des prdicateurs ni l'homognit des variances.
Celle-ci peut expliquer en partie son recours dans lapplication de la plupart de science
(mdecine, marketing, science politique, assurance, etc.).
Concernant lobjet de ce mmoire, Il sagit de prvoir laide de p variables
explicatives lappartenance un groupe (mauvais ou bons emprunteurs). Comme il
existe une incertitude, nous la modlisons comme une probabilit que lobservation
soit dans le groupe mauvais emprunteurs sachant nous disposons des observations
x0.
|
P a g e | 36
Toutefois, pour rsoudre ce problme, une contrainte simpose, il faut que la somme
de probabilit relative chaque groupe corresponde 1 :
|
cet effet, un log au rapport de probabilit est calcul pour tenir compte de cette
contrainte. Ainsi nous obtenons une mesure comprise entre 0 et 1 et que nous
pouvons relier la probabilit de dfaut aux variables explicatives via une fonction f
(linaire). Et le modle de la rgression logistique scrit :
|
|
|
Lquation peut galement scrire comme suit :

|
Lestimation des paramtres du modle de rgression logistique se fait par maximum

de vraisemblance. Cette maximisation fait appel des procdures itratives de
minimisations classiques comme la mthode de Newton. Dans le cas de la rgression
logistique (binaire), il existe une procdure spcifique dite IRLS (Iterative Reweighted
Least Squares). Plusieurs statistiques telles que LR ratio, R carr de McFadden, Test de
Hosmer-Lemeshow, permettent de vrifier ladquation dun modle.
B. Rseaux de neurones
Un rseau de neurones artificiels est un modle de calcul dont la conception est trs
schmatiquement inspire du fonctionnement des neurones biologiques. Cette
mthode permet de modliser des phnomnes linaires et non linaires partir d'un
jeu de donnes exemple et de variables explicatives.
Certains rseaux de neurones sont des modles de rseaux biologiques, mais dautres
ne le sont pas. Historiquement linspiration pour les rseaux de neurones provient
cependant de la volont de crer des systmes artificiels sophistiqus, voire
intelligents, capables deffectuer des oprations semblables celles que le cerveau
humain effectue de manire routinire, et dessayer par l damliorer la
comprhension du cerveau.
P a g e | 37
Les premires recherches remontent aux annes 1940 9, mais il a fallu attendre les
progrs de linformatique et des outils mathmatiques puissants pour renouveler
lintrt pour ces techniques. Grce leur capacit de classification et de
gnralisation, les rseaux de neurones sont gnralement utiliss dans des
problmes de nature statistique, tels que la prvision du risque de crdit, lobjet de
cette tude.
a. Structure du rseau
Un rseau neuronal est lassociation, en un graphe plus ou moins complexe, dobjets
lmentaires, les neurones formels. Les principaux rseaux se distinguent par
lorganisation du graphe (en couches, complets.), cest--dire leur architecture, son
niveau de complexit (le nombre de neurones, prsence ou non de boucles de
rtroaction dans le rseau), par le type des neurones (leurs fonctions de transition ou
dactivation) et enfin par lobjectif vis : apprentissage supervis ou non, optimisation,
systmes dynamiques.
Somme pondre
Fonction dactivation
Activation
Fonction de combinaison
Seuil
Figure 3: Structure du rseau de neurones formel
De faon trs rductrice, un neurone biologique est une cellule qui se caractrise par
les lments suivant :
des synapses, les points de connexion avec les autres neurones, fibres
nerveuses ou musculaires ;
des dendrites, les entres des neurones ;
laxone, la sortie du neurone vers dautres neurones ou fibres musculaires;
9
Cest en 1943 que Mc Culloch (neurophysiologiste) et Pitts (logicien) ont propos les premires notions de
neurone formel.
P a g e | 38
le noyau qui active la sortie en fonction des stimulations en entre.
Par analogie, le neurone formel est un modle qui se caractrise par un tat interne s
S, des signaux dentre
et une fonction dactivation.
(
La fonction dactivation opre une transformation dune combinaison affine des

signaux dentre,
tant appel le biais du neurone. Cette combinaison affine est
] associ chaque neurone et dont
dtermine par un vecteur de poids [
les valeurs sont estimes dans la phase dapprentissage. Ils constituent la mmoire
ou connaissance rpartie du rseau.
En effet, Il s'agit d'un outil d'optimisation non-linaire compos d'un ensemble
d'units lmentaires, appeles neurones. Chaque neurone reoit en entre la
) appeles signaux. Ensuite, il effectue une
description d'une observation j, (
somme pondre sur ces entres dont le rsultat est soumis une transformation
appele fonction d'activation note f.
Les diffrents types de neurones se distinguent par la nature
dactivation. Les principaux types sont :
de leur fonction
linaire f est la fonction identit,

sigmode
seuil
[
[
radiale
stochastiques
avec la probabilit
, 0 sinon (H
intervient comme une temprature dans un algorithme de recuit
simul),
etc.
Les modles linaires et sigmodaux sont bien adapts aux algorithmes
dapprentissage impliquant une rtropropagation du gradient car leur fonction
dactivation est diffrentiable ; ce sont les plus utiliss. Le modle seuil est sans
doute plus conforme la ralit biologique mais pose des problmes
dapprentissage. Enfin le modle stochastique est utilis pour des problmes
doptimisation globale de fonctions perturbes ou encore pour les analogies avec les
systmes de particules. On ne le rencontre pas en data mining.
P a g e | 39
b. Apprentissage du rseau neuronal

Afin que le rseau dcouvre une ventuelle forme de la relation entre les variables, il
suit, en gnral, deux types dapprentissage. Le premier, dit supervis consiste en
lexistence dun chantillon sur lequel le rseau apprend (sentrane) reconnatre les
formes. Lapprentissage non supervis, qui est le second type, est utilis lorsquon
nest en mesure de prsenter au systme un chantillon mettant en regard une
quantit dinformation, et la forme quelle est cense reprsenter (Paquet, 1997). De
ce fait, le rseau sauto organise, comme cest le cas pour lalgorithme de Kohonen,
en vue dtre capable de dcouvrir la forme partir des donnes fournies et sans aide
extrieure.
Les donnes disponibles doivent tre rparties en trois sous-ensembles
(apprentissage, validation et test) raison de 60%, 30% et 10% respectivement.
A partir de lchantillon dapprentissage, le rseau de neurones se paramtre.
Autrement dit, lalgorithme dapprentissage ajuste les poids synaptiques tout en
minimisant une fonction de cot. Cette dernire nest, en fait, que la somme des
carrs des erreurs produits par le rseau eu gard le rsultat souhait. La rtro
propagation des erreurs se fait continuellement jusqu ce que la fonction de cot soit
minimise, ou jusqu ce que le concepteur intervienne pour y mettre fin.
Pour viter le overfitting, une procdure dearly stopping devrait tre excute. Elle
consiste en lintroduction de lchantillon de validation. Le point o cet chantillon
ralise le minimum derreur reflte la meilleure performance.
c. Types de rseaux de neurones
La littrature identifies plusieurs types de rseaux de neurones (Thomas, 2002), tels
que perceptron simple, perceptron multicouches, Les rseaux de neurones fonctions
radiales de base (Radial Basis Network), les rseaux de neurones comptitifs ou cartes
auto organisatrices, Les rseaux rcurrents (rseaux de Elman, rseaux de Hopfieldn).
Cependant, nous ne nous intresserons dans cette tude quaux structures
Multicouches Perceptron et Fonctions radiales. La diffrence de ces deux structures
rside au niveau de leur fonction de combinaison.
En effet, les rseaux de type MLP (Multi-Layer Perceptron) calculent une combinaison
linaire des entres, cest--dire que la fonction de combinaison renvoie le produit
scalaire entre le vecteur des entres et le vecteur des poids synaptiques. Par contre,
les rseaux fonction base radiale (Radial Basis Function) calculent la distance entre
les entres, cest--dire que la fonction de combinaison renvoie la norme euclidienne
du vecteur issu de la diffrence vectorielle entre les vecteurs dentres.
P a g e | 40
B.1 Perceptron multicouche (PMC)

Depuis les annes 40, plusieurs tentatives de rseaux furent proposs (modle de
Hopfield (1982), Adaline)mais il a fallu attendre en 1986, la suite des travaux
smantiques de Rumelhart et Yann LeCun, une nouvelle gnration de rseaux de
neurones, capables de traiter avec succs des phnomnes non-linaires et ne
possdant pas des dfauts mis en vidence par Marvin Minsky10. (1969): le perceptron
multicouche.
Variable (s) dpendante(s)
Variable (s) indpendante(s)
Le perceptron multicouche (PMC) est un rseau compos de couches successives.

Une couche est un ensemble de neurones nayant pas de connexion entre eux. Une
couche dentre lit les signaux entrant, un neurone par entre
, une couche en
sortie fournit la rponse du systme. La couche dentre qui nintroduit aucune
modification nest pas comptabilise. Une ou plusieurs couches caches participent
au transfert. Un neurone dune couche cache est connect en entre chacun des
neurones de la couche prcdente et en sortie chaque neurone de la couche
suivante.
Couches
dentre
s
Couches
caches
Couches
de sorties
Figure 4:Structure du rseau du type Multilayer Perceptron
Les PMC utilisent, pour modifier leurs poids, un algorithme de rtropropagation du

gradient qui est une gnralisation de la rgle de Widrow-Hoff. Il sagit toujours de
minimiser lerreur quadratique. Il propage la modification des poids de la couche de
sortie jusqu la couche dentre. Les PMC agissent comme un sparateur non linaire
et peuvent tre utiliss pour la classification (classification des emprunteurs
dfaillants et non dfaillants), le traitement de limage ou laide la dcision.
10
Marvin Minsky reprochait aux modle de rseau de neurone de ne pas pouvoir modliser le phnomne non
linaire plusieurs.
P a g e | 41
B.2. Rseaux de neurones Fonctions radiales (RBF)

Dans le MLP, les couches cache sont des combinaisons linaires des entres telles
que spcifies par les poids. Par contre dans rseau neuronal fonction base radiale
(RBF) (Wassermann, 1993), indiqu dans la figure 13, les neurones cachs sont calculs
partir d'une fonction du mme nom. Au lieu de raliser une somme pondre de ses
entres comme le rseau neuronal du type MLP, le BRF compare chaque entre une
valeur de rfrence et produit une sortie d'autant plus grande (proche de 1) que les
entres sont proches des valeurs de rfrences.
Chaque entre
est donc associe une valeur . La comparaison entre les deux
jeux de valeurs se fait gnralement au sens de la norme euclidienne. Plus
prcisment, le neurone commence par calculer la grandeur suivante :
Le neurone transforme ensuite la valeur obtenue grce une fonction d'activation. Sa

sortie est donc finalement donne par :
La fonction calcule par le neurone est dite base radiale car elle possde une
symtrie radiale autour du point de rfrence : si on ralise une rotation
quelconque autour de ce point, la sortie du neurone reste inchange.
Cette fonction est similaire une fonction de En pratique, il est trs courant d'utiliser
une fonction de Kernel utilis dans la rgression de Kernel (Harle, 1990). La fonction
dactivation peut prendre nimporte quel variet de fonction. Toutefois, il est trs
courant d'utiliser une fonction d'activation gaussienne dfinie :
Le paramtre
peut tre interprt comme l'inverse de la sensibilit du neurone :
plus il est grand, plus il faut que les entres soient proches des valeurs de rfrences
pour que la sortie du neurone soit proche de 1.
Les outputs sont calculs suivant une combinaison linaire de valeur cache avec une
fonction dactivation du type identit.La diffrence entre ces deux courbes peut se
rsumer par la formulation suivant :
P a g e | 42
La rgion proche du centre RBF est appel receptive field de neurone cach. Les
neuronaux base radiale sont aussi appel localized receptive fields, locally tuned
processing units, or potential functions.
L'apprentissage des RFR permet de dterminer les paramtres de ces rseaux qui
sont les centres des fonctions radiales, la matrice de variance et les poids des
connexions entre les neurones de la couche intermdiaire et ceux de la couche de
sortie. On peut classer ces techniques en trois groupes : Techniques supervises,
Techniques heuristiques, Techniques d'apprentissage en deux temps.
En pratique, le problme d'interpolation n'est pas toujours intressant.
Premirement, les donnes sont gnralement bruites et l'interpolation utilisant
toutes les donnes de l'apprentissage peut provoquer un sur-apprentissage et par
consquent, une faible gnralisation. Deuximement, pour garantir une
interpolation correcte, le nombre de fonctions de base est gal au nombre de
vecteurs d'apprentissage. Ceci peut donner une dimension importante au problme
d'apprentissage. Les fonctions radiales peuvent tre adaptes pour un problme
d'approximation de fonction et de gnralisation par apprentissage (Ghosh et al.
1992), (Poggio, 1989).
Somme toute, la question cruciale dans le dveloppement d'un rseau de neurones

est la gnralisation: un problme qui apparat lors dun apprentissage est le
problme du sur apprentissage (dilemme biais/variance). Si le rseau de neurone
apprend par cur, il donnera de mauvais rsultats quand on lui prsentera des
donnes un peu diffrentes. Des mthodes existent pour optimiser la phase
dapprentissage afin que le phnomne de sur ou sous apprentissage disparaisse,
dont la technique de Early stopping11 et de la rgularisation.
11
Cette technique consiste diviser les donnes disponibles en trois lots distincts. Le premier lot sert
entraner le rseau de neurone. Le second lot sert la validation du rseau. Lerreur de validation doit
normalement diminuer au cours du processus dapprentissage (la variance diminue). Mais quand le rseau
commence apprendre par coeur (le biais augmente, alors lerreur de validation recommence crotre), on
arrte alors la phase dapprentissage. Le troisime lot sert vrifier que la gnralisation est correcte.
P a g e | 43
Ce chapitre, sinscrivant dans le contexte de Life Vest, a permis de dcrire la base de
donnes et sa mthodologie, et les mthodes destimation de la fiche de notation.
En effet, nous avons recouru dune part aux dossiers de crdit et, dautre part aux
agents de crdit pour vrifier et complter quelques informations afin de constituer
notre base de donnes de 222 dossiers de crdit pour une priode de deux ans et
demi (allant de 2010 mai 2013).
De plus, lanalyse descriptive et exploratoire des variables quantitatives et qualitatives
retenues pour cette tude a permis de commenter les tendances principales des
variables ainsi que de prdire nos attentes quant aux signes de ces variables. En effet,
nous nous attendons un corrlat ngatif ente la probabilit de dfaut et les variables
telles que lge de lemprunteur, montant du prt, nombre de cycle, valeur de la
garantie, ratio fond de roulement, ratio de liquidit, ROE, ROA, exprience. Par
contre, des corrlats positifs sont prdits pour les variables telles que le nombre
denfants, nombre de personnes en charge, lge de stock, linadquation entre
montant requis et dcaiss, dure de traitement du dossier, taux dintrt. Par
ailleurs, les variables tat civil, statut rsidentiel, type de garantie et lobjet du prt
tant difficile cerner, aucun signe nest prdit les concernant.
Afin dvaluer la pertinence de prdiction du modle de prdiction du risque de crdit,
nous avons opt pourla Rgression logistique et les Rseaux de neurones du type
Perceptron Multicouches et Fonction Base Radiale. Ceci en raison de leur
simplicit (RL) et parce quils permettent de prendre compte du phnomne
changeant (rseaux de neurones) (Barney et al, 1999; Novak et LaDue, 1999; Lee et
Jung, 1999).
Lexpos fait dans ce chapitre, coupl avec celui du premier chapitre, pose les jalons
ncessaires lvaluation de la pertinence dune fiche de notation statistique en
microfinance.
P a g e | 44
Chapitre III : Construction et valuation des fiches de notation statistique

Ce chapitre se propose dvaluer la pertinence de prdiction dune fiche de notation
statistique du risque de crdit applique aux donnes de lIDSF sous examen. cet
effet, nous proposonsune tentative de construction dun modle de crdit
scoring(modle de classification des bons et mauvais emprunteurs)et enfin valuons
son pouvoir prvisionnel afin de juger de sa pertinence.
La premire section de ce chapitre prsente les rsultats des estimations de trois
modles retenus, la deuxime porte sur lvaluation des techniques de classification,
la troisime discute des facteurs susceptibles dexpliquer la variance de la probabilit
du risque de crdit et enfin la quatrime prsente, sur base des obstacles identifis,
une bauche des lments susceptibles de faciliter limplmentation de lvaluation
statistique du risque de crdit et de refonder les pratiques de collecte dinformation
des IMF.
3.1 Analyse discriminante
Comme susmentionn, nous estimons dans cette section trois techniques de
classification (LR, MLP, RBF). lissu de ces estimations, une mthode sera choisie
selon quelle minimise le taux derreur du type I et II et, satisfait aux critres dits
pratiques (facilit dinterprtation, vitesse destimation, transparence).
3.1.1
Lestimation empirique de la rgression logistique est faite par la technique de

Maximum de Vraisemblance avec la mthode dite ascendante pas pas (Forward
Stepwise). La LR permet dviter les proprits restrictives associes la mthode de
moindres carrs ordinaires (MCO)(Judge, Hill, Griffiths, Lutkepohl, and Lee, 1982). Etant
donn que la LR sapplique uniquement des chantillons de grande taille, la
vrification dun ventuel problme de multicolinarit savre fondamentale(J.
Desjardins, 2005). De ce fait, la matrice des corrlations de Pearson (cf. annexe 5)
montre que tous les coefficients sont sensiblement infrieurs 0,8. Ce seuil
correspond la limite de Kennedy (1985) partir duquel le problme de
multicolinarit commence tre pos.
Ainsi le modle destimation du risque de crdit se spcifie comme suit (Gujarati,

1995) :
P a g e | 45
Avec
(
Yt prend la valeur de 1 si le client rembourse son prt avec des arrirs de 30 jours
ou plus et au cas contraire Y prend la valeur de 0.
Pi st pro
i it stim u m uv is mpru t ur
Xi est la matrice des 20 variables explicatives
Aprs estimation par la technique de maximum de vraisemblance avec la mthode
dascendance pas pas sous SPSS 19, le rsultat obtenu (cf. annexe 4), aprs cinq
itrations, se prsente comme suit :
(
Ce rsultat fournit une premire tentative de validation des nos hypothses. En effet,
la lecture de la rgression montre des rsultats contrasts relativement aux
prdictions issues de notre deuxime hypothse selon laquelle les caractristiques
socio-conomiques des clients figurent parmi celles qui ont les plus dinfluence sur la
probabilit de dfaut des clients.
De fait, parmi les facteurs socio-conomiques examins, seules les variablesge et
ROA expliquent la variance de la probabilit de dfaut. De mme, la variable opinion
de lagent de crdit apparait significative dans notre modle, ceci laisse supposer que
lvaluation subjective telle que mene par les agents de crdit permet de prvoir les
ventuels problmes de remboursement. Une des explications possibles de ces
constats repose sur la qualit des informations renseignes par les emprunteurs de
linstitution sous examen.
Par ailleurs, ce constat nous conduit encore une fois conclure en faveur de notre
troisime hypothse selon laquelle lopacit des informations financires et non
financires de la plupart des clients des IMF, constitue un obstacle majeur dans la
mise en uvre dune dmarche de scoring statistique. De fait, la plupart des variables
inclues dans notre modle apparaissent non significatives, ce qui laisse prsager que
la plupart des informations, renseignes par les emprunteurs ou estimes par les
P a g e | 46
agents de crdit, contiennent des impurets (erreurs) et une part de bruit

(variations alatoires par rapport la valeur relle).
a. Evaluation de la rgression
Le tableau ci-dessous montre que le R de Nagelkerke est de 0.448. Ceci suggre que
la variance du modle explique 44,8% la variance de la variable dpendante (retard
de plus ou moins de 30 jours). Ce taux apparait faible, cependant, il peut expliquer le
caractre relativement exploratoire de cette criture et le fait quen microfinance la
plupart des caractristiques relatives aux clients ne sont pas directement perues par
les IMF et biens renseignes par les emprunteurs. De plus, ceci peut tre attribu la
diversit des variables non prises en compte dans cette tude et au manque de
conformit des dossiers de crdit.
Tableau 8: Rcapitulatif des modles
-2logvraisemblance
R-deux de Cox &

Snell
R-deux de Nagelkerke
200,370a
,328
,448
a. L'estimation a t interrompue au numro d'itration 5 parce
que les estimations de paramtres ont chang de moins de ,001.
Le test de Khi-deux indique la significativit globale du modle. Le rsultat prsent

dans le tableau 3.2 affiche un Khi-deux de 86,33 pour 3 degr de libert. Cette valeur
est significative 5%. Ceci permet de montrer que le modle est significatif dans sont
ensemble et adquat.
Tableau 9: Tests de spcification du modle
Modle
Khi-Chi-deux
ddl
Sig.
86,363
,000
Le test de Hosmer-Lemeshow (indiqu ci-aprs) montre que la probabilit critique du

test (0,113) est suprieure au risque choisi (0,05), et de ce fait, le modle issu de la
rgression logistique affiche une bonne qualit dajustement et est accept.
P a g e | 47
Tableau 10: Test de Hosmer-Lemeshow

Khi-Chi-deux
Ddl
Sig.
12,957
,113
b. Interprtation des variables

Les rsultats de la rgression montrent que la variable ge a un corrlat ngatif avec
le risque de dfaut. Leffet dtre g apparait comme un symptme de stabilit et de
responsabilit (Vigan, 1993). Nos rsultats indiquent que les emprunteurs gs ont
0,959 moins de chance de faire partie des mauvais emprunteurs. Le coefficient
associ avec cette variable est significatif (0,015). Ceci peut tre attribu au niveau de
responsabilit quont gnralement les personnes ges, par consquent, elles sont
plus adverses au risque que les emprunteurs moins gs.
En outre, les rsultats permettent galement de mettre en perspective les opinions
mises par le comit de crdit et leur corrlation positive avec le risque de dfaut.
Ceci peut sexpliquer par la faible capacit des agents de crdit pouvoir
diagnostiquer clairement le risque de crdit. De mme, la non prise en compte des
certaines informations et la prsence de certains dossiers incomplets et incohrents
peut expliquer les mauvais diagnostics tenus par les agents de linstitution, et par
consquent, leur corrlat positif avec la probabilit de dfaut.
Enfin, ltude indique galement que la variable ROA affiche un corrlat positif avec le
risque de dfaut. Ce rsultat apparait un peu surprenant au regard de la thorie
conomique (Cobbaut R, 2005, R. Merton et Bodie, 1999). En effet, la probabilit de
dfaut augmente avec la rentabilit conomique de capitaux conomiques investis
dans les activits des micro-entrepreneurs. Ce rsultat montre que les emprunteurs
qui ralisent des fortes rentabilits sont plus exposs au risque de crdit. Ceci peut
sexpliquer, dune part, par leur faible aversion au risque et, dautre part par lopacit
des informations financires tenues par les micro-entrepreneurs qui rend difficile
lapprhension de la sant financire relle de leur activits.
Ce constat majeur, conduit certains auteurs douter de lapplication du crdit scoring
en microfinance.
P a g e | 48
3.1.2. Modlisation par les rseaux de neurones

Pour modliser le risque de crdit partir des rseaux de neurones, deux types de
rseaux sont estims : la structure neuronale du type Multilayer Perceptron et la
structure fonction base radiale.
Le choix de la modlisation par les rseaux de neurones rside du fait quen tant que
systme capable d'apprendre, les RNA mettent en uvre le principe de l'induction,
cest--dire l'apprentissage par l'exprience. Par confrontation avec des situations
ponctuelles, ils infrent un systme de dcision intgr dont le caractre gnrique
est fonction du nombre de cas d'apprentissages rencontrs et de leur complexit par
rapport la complexit du problme rsoudre (IBM SPSS Neural Networks, 2010). De
ce fait, ils sont compatibles avec un petit chantillon, nimpose pas une forme
fonctionnelle aux donnes, et sont adapts au changement du contexte lorsque la
base des donnes contient des donnes chelonnes sur plusieurs annes.
A. Perceptron Multicouches
Le rseau se spcifie comme suit : les fonctions dactivation (transfert) utilises dans
les premires et deuximes couches sont slectionnes automatiquement par logiciel
SPPS. Le logiciel propose 4 types de fonctions dactivation de lapprentissage
(Identit, Softmax, Tangente hyperbolique et ogive de Galton), et de ce fait, pendant
lapprentissage, le logiciel se charge de choisir la fonction dactivation compatible.
Les donnes dentres correspondent aux 20 variables explicatives avec 222 individus.
Les donnes de sorties sont soit la modalit 1 pour les emprunteurs qui ont connu
des arrirs dau moins 30 jours et la modalit 0 pour le cas contraire.
A.1. Fixation des paramtres
Pour estimer le modle, lapprentissage a t ralis par lalgorithme de
rtropropagation de lerreur (Gradient conjugu chelonn). En supplment de la
couche dentre et de sortie, les couches caches sont choisies automatiquement par
le logiciel SPSS. Toutefois, le logiciel laisse la possibilit au modlisateur de proposer
le nombre minimum et maximum des couches caches partir duquel le logiciel va
slectionner le nombre de couche cach optimal. cet effet, nous avons fix,
respectivement, le nombre minimum et maximum de couches cachs 2 et 50.
Le paramtre dapprentissage se prsente comme suit :
Lambda initial : 0,0000005
Sigma initial : 0,00005
Dcalage dintervalle : 0,05
P a g e | 49
A.2 Rsultats de la modlisation par Perceptron Multicouches (MLP)

Le choix de nombre de couches cachs et les fonctions dactivations de sortie ou
dentre sont slectionns automatiquement. Ainsi, il convient, avant de prsenter le
rsultat, de rsumer les caractristiques de la structure utilise. Le tableau 3.1
prsente les paramtres du rseau Perceptron Multicouches (MLP).
Tableau 11: Caractristique du rseau Perceptron Multicouches (MLP)
Libells
Poids
Caractristique
Poids pi et poids qi
Produit scalaire (Identit)
Fonction d'activation
Nombre
Tangente Hyperbolique
5
Produit scalaire (identit)
Nombre
Fonction d'erreur
MaxMou
5
Entropie croise
Couches caches
Couches de sortie
La lecture de ces paramtres montre que la fonction dactivation de la couche de

sortie est une fonction du type sigmode (MaxMou). Ceci est compatible avec lobjet
de ltude du fait que cette fonction donne de valeur incluse dans lintervalle [ ], ce
qui permet d'interprter la sortie du neurone comme une probabilit. De plus, elle est
aussi lie au modle de rgression logistique.
La modlisation du risque de crdit par rtropropagation de gradient conjugu
chelonn de lerreur, sur rseaux neuraux, nous fournit les rsultats prsents dans
la matrice de confusion indique ci-aprs (matrice de classification).
La matrice de confusion montre que les performances prdictives du modle sont
relativement faibles et mitiges. En effet, le pourcentage global des cas correctement
classifis est de 78%, ce qui correspond un taux derreur global de 21,3%. De plus, le
taux derreur du type I slve 21,2%, ce qui suggre que lapplication des rsultats
issus de ce modle exposera Life Vest un risque commercial cest--dire le risque de
refuser le crdit un bon emprunteur. Il apparait que ce taux est sensiblement lev,
nanmoins, il peut tre considr comme faible en microfinance du fait de la
complmentarit de lvaluation subjective et statistique. Lvaluation subjective
permet de saisir les facteurs auxquels chappe le modle de crdit scoring.
P a g e | 50
Tableau 12: Matrice de Classification (Confusion matrix)

Echantillon
Observations
Prvisions
0
Apprentissage
84
15
Pourcentage
correct
84,8%
Test
1
Pourcentage global
0
21
67,3%
29
36
32,7%
8
63,2%
76,9%
78,4%
1
Pourcentage global
Variable dpendante : dfaut
5
55,7%
19
44,3%
79,2%
78,7%
Le taux derreur du type II est fix 21,6, ce qui reprsente le pourcentage des
mauvais emprunteurs classs dans le groupe de bons emprunteurs. Ceci suggre que
lapplication de ce modle expose linstitution un risque de crdit de crdit de 21,6%.
A.3 Importance des variables
Les rsultats, prsents dans la figure 3.2, montrent que parmi les 20 variables
utilises dans ce modle, seules 9 influent les plus sur la probabilit du risque de
crdit. Il sagit des variables ge de stock, ge de lemprunteur, opinion du comit de
crdit, la valeur de la garantie, le statut rsidentiel, ltat civil, types de garantie, cart
du montant et destination du crdit. Dans la pratique, ces rsultats peuvent aider les
analystes de crdit centrer lvaluation sur les variables qui prsentent un fort
corrlat avec la probabilit de dfaut.
Par ailleurs, les rsultats obtenus, contrairement ceux de la rgression logistique,
confortent partiellement les prdictions issues de notre hypothse 2. De fait, neuf sur
vingt variables tant significatives, nous pouvons conclure que les caractristiques lis
des emprunteurs (mnage) et leur activit expliquent effectivement leur
dfaillance.
P a g e | 51
Figure 5: Importance des variables
Toutefois, lapplication de ces rsultats reste restrictive du fait que les rseaux
neuronaux sont de nature des boites noires, et de ce fait, ne permettent pas
linterprtation des variables aprs apprentissage.
B. Rseaux de neurone Fonction base radiale
la diffrence de Perceptron Multicouches, le neurone base radiale est construit
partir d'une fonction du mme nom (RBF). Au lieu de raliser une somme pondre
de ses entres, le rseau compare chaque entre une valeur de rfrence et produit
une sortie d'autant plus grande (proche de 1) que les entres sont proches des valeurs
de rfrences.
Larchitecture du rseau se spcifie comme suit :
Le nombre dunit de couche masque optimal est calcul automatiquement sous
SPSS. La fonction dactivation pour les couches caches est du type fonction base
radiale normalise, la fonction de sortie est slectionne automatiquement. La
mthode dchelonnement pour les covariables est du type standardis. Le nombre
de chevauchement des couches caches (units masques) autoriser est calcul
automatiquement sous SPSS.
A.2 Rsultats de la modlisation des rseaux de neurones fonction base radiale
Les caractristiques de la structure neurale base radiale se prsentent, aprs
estimation, comme suit :
P a g e | 52
Tableau 13: Caractristique du rseau fonction base radiale (RBF)

libells
Caractristique
Mthode de rchelonnement des

covariables
Standardis
Couches caches
Nombre
Exponentielle
8
Produit scalaire (identit)
Nombre
Fonction d'erreur
Identifie
2
Somme des carrs
Couches de sortie
Aprs apprentissage, nous pouvons observer, dans le tableau 3.6, que la performance
globale du modle est relativement faible. En effet, le pourcentage des emprunteurs
correctement classs dans les deux groupes est de 68,4%. De mme, le rsultat de la
matrice de confusion montre que 92,8% des bons emprunteurs sont correctement
classifis dans le groupe de bons emprunteurs. De ce fait, le taux derreur du type
I(risque de rationner le crdit un bon emprunteur) est sensiblement faible, soit 7,2%.
Cependant, le modle affiche une performance faible en ce qui concerne la part des
mauvais emprunteurs correctement classifis dans le groupe des mauvais
emprunteurs. Ceci suggre que lapplication de ce modle par Life Vest, lexpose un
risque de crdit (taux derreur du type II) dordre de 70,5%.
Tableau 14: Matrice de Classification (Confusion matrix)
Echantillon
Observations
0
Apprentissage
Test
0
1
Pourcentage global
0
1
Pourcentage global
Variable dpendante : dfaut
90
43
84,2%
37
18
93,2%
Prvisions
1
7
18
15,8%
2
2
6,8%
Pourcentage
correct
92,8%
29,5%
68,4%
94,9%
10,0%
66,1%
P a g e | 53
B.2 Importance des variables

Le tableau dimportance des variables et son diagramme (cf. annexe) montrent que
parmi les variables explicatives, lexprience (100%), le Return on assets (93,8), Return
on equity (93,0), la valeur de la garantie (89,0), lge de stock (87,7), le, le ratio de
fonds de roulement (87,7), lge de lemprunter(87,4), le taux dintrt (85,3), le
nombre denfant (83,1) et le nombre de personne en charge (8 3,9) font partie des 10
premires variables qui influent les plus sur la probabilit du risque de crdit. Nous
pouvons observer galement que la plupart des variables sont quantitatives.
Dans la pratique, ces rsultats permettent aux analystes de crdit de connaitre les
variables qui prsentent un fort corrlat avec la probabilit de dfaut, et de ce fait,
focalisent leur analyse sue ces variables.
Toutefois, linterprtation de ces variables reste mal perue du fait quaucun signe des
variables voire aucun paramtre est directement renseign.
Figure 6: Importance des variables
3.2 Comparaison des trois modles discriminants

Dans cette section, les performances des modles de classification sont discutes et
mises en perspective. Au final, un modle sera slectionn au regard des critres de
pouvoir discriminant et aux critres dits pratiques.
P a g e | 54
A. Pouvoir discriminant
Pour une ventuelle comparaison de pouvoir discriminant de ces trois modles, la
spcificit, la sensibilit et la statistique AUROC sont analyss dans cette partie.
Nous pouvons observer, dans le tableau 3.8, que les performances sont relatives et
varient selon le critre utilis. En effet, les rseaux de neurones structure
Perceptron Multicouches affichent une performance globale suprieure au rseau
neuronal base radial et la rgression logistique. Concernant le pourcentage des
bons emprunteurs correctement classifis (spcificit), le rseau neuronal base
radial est plus performant cest--dire minimise le taux derreur du type I ou le risque
commercial (risque de rationner le crdit un bon emprunteur).
Sagissant du pourcentage de mauvais emprunteurs correctement classifis
(sensibilit), la rgression logistique affiche une bonne performance (66,7%) compar
aux rseaux de neurones du type MLP et RBF. Ceci suggre que la RL minimise le taux
derreur du type II ou le risque de crdit.
Ce constat nous conduit conclure en faveur de notre premire hypothse selon
laquelle les facteurs pris en compte dans la technique de credit scoring nexpliquent
pas totalement ( 100 %) la variance de la probabilit de dfaut des clients. En effet,
les performances globales de trois modles sont sensiblement faibles (76,9 pour le
MLP, 74,7 pour la RL et 68,4 pour le RBF), ceci suggre que la plupart des facteurs
utiliss dans cette tude contiennent une part de bruit (variations alatoires par
rapport la valeur relle) et des erreurs du fait les informations renseignes par les
emprunteurs et celles servant de base aux estimations des agents de crdit sont
souvent opaques.
Tableau 15: Comparaison des rsultats (en % des groupes correctement classifis et AUROC)
MLP
% de bons
emprunteurs
correct
84,8
% mauvais
emprunteurs
correct
63,2
RBF
92,8
RL
79,4
% global
AUROC
76,9
0,86
29,5
68,4
0,76
66,7
74,7
0,842
Les rsultats issus de la courbe ROC montrent que la statistique AUROC de la structure
MLP (0,86) est relativement suprieure celle de la rgression logistique (0,842). Les
deux statistiques sont comprises dans la limite (0,75 et 0,91) fix par Tasche (2005).
P a g e | 55
Nous pouvons donc conclure dans plusieurs cas, la lumire des travaux antrieurs
(Arminger, Enache, & Bonne, 1997; Desai, Conway, Crook, & Overstreet, 1997; Desai,
Crook, & Overstreet, 1996; Hand & Henley, 1997; Lee & Chen, 2005; Lee, Chiu, Lu, & Chen,
2002; West, 2000), que le modle non paramtrique du type MLP a un pouvoir
discriminant suprieur la rgression logistique.
Toutefois, pour des fins darbitrage entre ces deux mthodes, il importe de tenir
compte des critres dits pratiques.
Perceptron Multicouches
Fonction Base Radiale
Rgression Logistique
Figure 7: Courbe ROC
P a g e | 56
B. Critres pratiques
Concernant les critres dits pratiques, les aspects comme la vitesse de classification, la
facilit dinterprtation et la simplicit du modle et la transparence sont analyss.
Les rsultats de trois modles susmentionns, permettent de montrer que la
modlisation par les rseaux neuronaux artificiels ne permet pas linterprtation facile
des variables, aucun signe corrlation nest peru entre les variables indpendantes et
la probabilit de dfaut des emprunteurs. Les rsultats issus de rseaux neuronaux
structure Perceptron Multicouches et base radiale fournissent un tableau ou figure
de classement des variables explicatives par ordre dimportance, mais ces rsultats,
contrairement la rgression logistique, ne permettent pas linterprtation des
variables (difficile destimer les paramtres).
3.3. Choix du modle de scoring
la lumire de la comparaison des pouvoirs discriminants et des critres dits
pratiques, nous optons pour le modle de rgression logistique du fait quil minimise
le taux derreur du type II (probabilit de slectionner un mauvais emprunteur)et est
performant au regard des critres dits pratiques. Il faut noter que le seuil de csure
(cut-off) est fix 0,5 cest--dire nous considrons comme mauvais emprunteur, celui
qui affiche une probabilit de dfaut suprieur 0,5. Cela dit, le modle retenu pour
lestimation du risque de crdit est :
(
Toutefois, au regard de la littrature sur le credit scoring en microfinance (Schreiner,

2004, 1999), ce modle statistique ne peut remplacer lvaluation subjective de lagent
de crdit. Ceci tient au fait que la plupart des caractristique qualitatives ou
quantitatives, utiliss dans la pratique par les agents de crdit de Life Vest,
susceptibles dexpliquer la probabilit du risque de crdit ne sont pas prises en
compte par ce modle.
Ces rsultats confortent dune part les prdictions issues de notre troisime
hypothse selon laquelle lopacit des informations financires et non financires de
la plupart des emprunteurs, constitue un obstacle majeur dans la mise en uvre dune
dmarche de scoring statistique et dautre part, infirment nos prdictions quant la
deuxime hypothse selon laquelle les caractristiques socio-conomiques des
clients figurent parmi celles qui ont les plus dinfluence sur la probabilit de dfaut des
clients.
P a g e | 57
Le R-deux de Nagelkerke fix 44,8 montre clairement que ce modle de crdit

scoring nexplique pas pleinement la variance de la probabilit de dfaut des
emprunteurs. Ainsi, pour que lvaluation statistique soit un succs pour Life Vest, il
faut que certaines mesures en termes de systme dinformation de gestion (SIG)
soient implmentes dans lIMF. lheure actuelle, le SIG de Life Vest noffre pas de
donnes fiables susceptibles de faible lobjet de construction dune fiche de notation.
Ce constat nous conduit encore une fois conclure en faveur de notre premire
hypothse selon laquelle la plupart des facteurs pris en compte dans la technique de
credit scoring nexpliquent pas totalement ( 100 %) la variance de la probabilit de
dfaut des clients.
cet effet, la section suivante se propose dbaucher les facteurs susceptibles de
contribuer la russite du modle de crdit scoring dans linstitution sous examen.
3.4. Identification des obstacles et bauche des stratgies de mise en uvre dune
fiche de notation
Les rsultats issus de lvaluation de la pertinence du pouvoir prdictif des modles
de credit scoring ont montr que ces modles ne permettent pas de modliser
correctement le risque de crdit quelque soit la dmarche conomtrique utilise. De
ce fait, plusieurs obstacles lutilisation du credit scoring peuvent tre identits :
Les dossiers de crdit ne sont pas formaliss. En effet, les informations
recenses et enregistres diffrent prodigieusement dune priode un autre,
dun dossier un autre, dun agent de crdit lautre, dune agence une
autre.
Le non professionnalisme des agents de crdit dans la collecte et tenue des
informations relatives aux clients et leur activit. En effet, la plupart des
informations enregistres dans les dossiers de crdit sont mal renseignes,
cest--dire contiennent des impurets erreurs et une part de bruit (cart
considrable entre les informations enregistres dans le dossier de crdit et les
informations relles).
Les informations enregistres pouvant servir de base au montage du dossier et
leur valuation sont essentiellement financires, or au regard de la thorie
(Schreiner, 2003) et des pratiques en microfinance, la prise en compte des
informations essentiellement financires et quantitatives ne permettent pas
destimer correctement la probabilit de dfaut de clients.
P a g e | 58
Labsence dun systme informatique susceptible denregistrer et stocker une

grande base de dossiers de crdit. Certains dossiers valids sont incomplets
cest--dire plus de 50% des informations lies ne sont pas renseignes.
Certes que les micro-entrepreneurs ne disposent pas, pour la plupart, des
informations financires formalises, mais les pratiques de Life Vest montrent
que la tenue des tats financiers de clients reste encore problmatique dans le
chef des agents de crdit.
La politique de crdit prvoit des visites terrain afin de rapprocher et vrifier
certaines informations livres par les emprunteurs potentiels, ces visites aident
les agents de crdit dcouvrir certaines informations lies au facteur
caractre (5c) des emprunteurs potentiels.
Toutefois, nos investigations menes auprs de Life Vest montre qu lissu de
ces visites, le systme dinformation de gestion de linstitution nenregistre pas
les informations lies au facteur caractre des emprunteurs potentiels. Or
labsence de ces informations constitue un obstacle majeur limplmentation
de la technique de credit scoring en microfinance vu quune grande partie du
risque de non remboursement est concentr dans ce facteur (C. Churchill et D.
Coster, 2001).
Pour contourner ces obstacles et de ce fait, faciliter lutilisation cette technique, il
importe de noter que la russite de lvaluation statistique du risque de crdit ne
dpend pas seulement des considrations statistiques mais aussi de changement de la
culture organisationnelle mesure que les responsables essaient damliorer le
volume et la prcision des informations quils utilisent pour examiner diffrents choix
possibles et leurs consquences. Ceci implique que Life Vest doit investir dans une
base de donnes exacte et complte cest--dire investir dans la formalisation des
procdures de tenue et collecte de donnes lies aux caractristiques de
lemprunteur (dmographique), de son activit, son mnage, sa personnalit
(caractre). Une attention particulire doit tre dploy dans la collecte et saisie des
informations lies au facteur Caractre (5c).
De plus, vu que la base de donnes actuelle ne permet pas lusage de la technique de
notation statistique de risque, Life Vest se doit de reconstituer une nouvelle base de
donnes en tenant compte des lments susmentionns.
Actuellement, le principal souci des institutions de microfinance est de convaincre ses
administrateurs, ses dirigeants et ses agents de crdit daccepter le scoring. Ds lors,
celle-ci ncessite une formation rgulire des parties prenantes tous les niveaux et
P a g e | 59
un suivi troit assorti de dmonstrations du pouvoir prdictif pour les prts en cours.
De ce point de vue, Life Vest doit envisager de formation. Les objectifs de ces sances
de formation sont :
(i)
Prsenter le but recherch par le scoring et y adhrer ;
(ii)
Prsenter les principes de l'outil grille de score et son fonctionnement ;
(iii)
Prsenter les limites de la grille de score ;
(iv)
Prsenter les apports de la grille de score dans la mission de l'analyste

crdit (oprationnel et organisationnel).
De plus, le systme informatique actuel de Life Vest a une capacit insuffisante car il
ne sert gnralement qu suivre les prts. La mise en place du scoring et lutilisation
plus systmatique dune base de donnes lectronique imposent daccorder une plus
grande attention la qualit des donnes do Life Vest se doit dinvestir dans le
systme informatique. Toutefois, elle peut 'utiliser dans un premiers temps un fichier
de tableur pour raliser un publipostage, l'aide d'un logiciel de traitement de
donnes (EXCEL). Linstitution se doit de veiller la mise en test de cette
configuration pendant 3 6 mois, avec une mise jour hebdomadaire des bases de
donnes.
Par ailleurs, tant donn quune fiche de notation nest tablie que pour les
emprunteurs dont les demandes avaient dj t acceptes, les prvisions effectues
pour les emprunteurs non prslectionns ont une prcision inconnue. En effet, la
prise en compte des prvisions des rejets aprs une visite sur le terrain est une
solution alternative.
Pour ce faire, linstitution doit commencer par saisir dans leur systme informatique
les donnes de plusieurs de demandes rejetes. Une fois quelles disposent des
donnes des demandes rejetes et de celles approuves aprs la visite, elles peuvent
tablir des fiches de notation pour prvoir les rejets sur la base des caractristiques
connues avant la visite. (Mme avec les donnes des demandes rejetes, une fiche de
notation du risque de non-remboursement avec visite ne permet pas dapprouver les
demandes sans visite car le comportement de remboursement des emprunteurs non
prslectionns reste inconnu.)
P a g e | 60
Ce chapitre nous a permis dune part d'valuer la validit ainsi que le caractre
prdictif de diffrents modles de credit scoring applique aux donnes de Life Vest
et dautre part, de deceler les obstacles leur utilisation. Les rsultats fournis par ces
diffrents critres retenus nous ont permit de dgager les conclusions suivantes :
Dans lensemble, tous les modles (MLP, RBF, RL) construits prsentent un pouvoir
prdictif faible(76,9% pour le MLP, 74,7% pour la RL et 68,4% pour le RBF), ceci suggre
que la plupart des facteurs utiliss dans cette tude contiennent une part de bruit
(variations alatoires par rapport la valeur relle) et des erreurs du fait les
informations renseignes par les emprunteurs et celles servant de base aux
estimations des agents de crdit sont souvent opaques.
Nanmoins, la comparaison de trois modles montre que les rseaux de neurones du
type Multicouches (MLP) et le modle logit semblent les plus adquats pour valuer le
comportement des emprunteurs en termes de remboursement. De plus, l'utilisation
de la courbe ROC confirme que ces deux modles prsentent les meilleurs
compromis entre sensibilit et spcificit.
Par ailleurs, le modle Logit se distingue comme tant le meilleur modle du point vue
des critres dits pratiques, mais sur lensemble des variables rgresses, seules les
variables ge, opinion des agents de crdit, ROA appraissent significatives.
Ces conclusions confortent dune part les prdictions issues de notre troisime
clients figurent parmi celles qui ont le plus dinfluence sur la probabilit de dfaut des
clients.
Le R-deux de Nagelkerke fix 44,8 montre clairement que ce modle de crdit
scoring (RL) nexplique pas pleinement la variance de la probabilit de dfaut des
emprunteurs. Ce constat nous conduit conclure en faveur de notre premire
hypothse selon laquelle la plupart des facteurs pris en compte dans la technique de
credit scoring nexpliquent pas totalement ( 100 %) la variance de la probabilit de
dfaut des clients.
Plusieurs obstacles sont de nature expliquer ces rsultats, notamment labsence
des procdures de collecte et saisie formalises, la plupart des informations
renseignes par les emprunteurs ou estimes par les agents de crdit contiennent une
part de bruit ou des erreurs.
P a g e | 61
Conclusion gnrale
L'objectif de ce mmoire, sinsrant dans le prolongement de travaux de Vigano (1993)
; Schreiner (1999a, 2003), et Dinh et Kleimeier (2007), tait dvaluer la pertinence de
lvaluation statistique du risque de crdit applique au contexte de Life Vest.
Cette rflexion a donn naissance trois questions majeures :
(i)
Quel est le pouvoir dun modle de credit scoring, appliqu aux donnes dune
IMF congolaise, pouvoir modliser correctement le risque de crdit ?
(ii) Quelles sont les lments qui expliquent des emprunteurs dans cette structure?
(iii) Quels seront les obstacles dans la mise en uvre dune dmarche de scoring ?
Comment mettre en place les procdures quil implique ?
Afin de rpondre ces questions, nous sommes parties des considrations selon
lesquelles :
(i)
la plupart des facteurs pris en compte dans la technique de credit scoring

nexpliquent pas totalement ( 100 %) la variance de la probabilit de dfaut des
clients. Ceci suggre que la plupart des facteurs susceptibles dinfluencer le
risque de crdit sont difficilement perus par les IMF du fait de lopacit des
informations de leurs clients.
(ii) les caractristiques socio-conomiques des clients figurent parmi celles qui ont
les plus dinfluence sur la probabilit de dfaut des clients.
(iii) la lumire des travaux de Schreiner (1999a, 2003, 2004), lide selon laquelle
lopacit des informations financires et non financires de la plupart des clients
des IMF, constitue un obstacle majeur dans la mise en uvre dune dmarche de
scoring statistique. Pour y remdier, il convient de refonder le systme
dinformation de gestion des IMF ainsi que leurs techniques de collecte
dinformation.
Nous avons considr un chantillon de 222 dossiers de crdit et trois techniques de

modlisation pour construire notre fiche de notation dans le but de valider nos
hypothses. Lobjectif tant de confronter ces trois techniques de classification afin
de choisir lissu des estimations ou gnralisation, celui qui rpond au mieux aux
critres relatifs au pouvoir discriminant et aux critres dits pratiques.
A lissue de nos investigations, nous notons les rsultats essentiels suivants :
(i)
Dans lensemble, tous les modles (MLP, RBF, RL) construits prsentent un
pouvoir prdictif faible (76,9% pour le MLP, 74,7% pour la RL et 68,4% pour le RBF),
ceci suggre que la plupart des facteurs utiliss dans cette tude contiennent
une part de bruit (variations alatoires par rapport la valeur relle) et des
P a g e | 62
erreurs du fait les informations renseignes par les emprunteurs et celles

servant de base aux estimations des agents de crdit sont souvent opaques ;
(ii)
la comparaison de trois modles montre que les rseaux de neurones du type

Multicouches (MLP) et le modle logit semblent les plus adquats pour valuer le
comportement des emprunteurs en termes de remboursement. De plus,
l'utilisation de la courbe ROC confirme que ces deux modles prsentent les
meilleurs compromis entre sensibilit et spcificit ;
(iii) le modle Logit se distingue comme tant le meilleur modle du point vue des
critres dits pratiques, mais sur lensemble des variables rgresses, seules les
variables ge, opinion des agents de crdit, ROA appraissent significatives ;
(iv) le R-deux de Nagelkerke fix 44,8 montre clairement que ce modle de crdit
scoring (RL) nexplique pas pleinement la variance de la probabilit de dfaut
des emprunteurs. De plus, Le pourcentage des mauvais emprunteurs
correctement classifis (sensibilit) est sensiblement faible (66,7%). Ceci laisse
supposer que le modle construit expose linstitution un risque de 33,3% de
slectionner un mauvais emprunteur. Ce pourcentage apparait relativement
lev et, en cas dutilisation, cela risque dimpacter sensiblement sur la qualit
du portefeuille de linstitution.
Ces conclusions confortent dune part les prdictions issues de notre troisime
clients figurent parmi celles qui ont le plus dinfluence sur la probabilit de dfaut des
clients.
De plus, nous avons conclu en faveur de notre premire hypothse selon laquelle la
plupart des facteurs pris en compte dans la technique de credit scoring nexpliquent
pas totalement ( 100 %) la variance de la probabilit de dfaut des clients.
Plusieurs considrations, analyses dans le contexte de lIMF sous examen, peuvent
expliquer les obstacles de la mise en uvre de la dmarche de lvaluation statistique
du risque de crdit. Il sagit essentiellement (i) de la mauvaise tenue des dossiers de
crdit par les agents de crdit ; (ii) labsence dun systme informatique susceptible
denregistrer et stocker une grande base de dossiers de crdit, (iii)labsence des
procdures de collecte et saisie formalises, les tenues des dossiers de crdit diffrent
dune priode lautre, dun agent de crdit lautre, dune agence lautre.
P a g e | 63
lissu de cette tude, il importe de noter que, une des principales insuffisances de la
plupart des modles du crdit scoring est qu'ils sont employs pour valuer la
solvabilit de tous les demandeurs, pourtant ils sont formuls et dresss uniquement
sur la base des demandeurs jugs prcdemment assez bons eu regard de condition
dligibilit. L'efficacit de tels modles dpend des bons demandeurs qui diffrent de
mauvais en ce qui concerne leurs attributs, tels que l'ge ou le revenu, qui sont
dploys par des tels modles pour prvoir le comportement de remboursement.
De plus, nous avons uniquement considr, dans cette tude, un chantillon de 222
dossiers de crdit, une batterie de 20 variables explicatives et trois techniques de
classification (rgression logistique, rseaux de neurones du type Multicouches, rseaux
de neurones fonctions radiales), cependant, lanalyse thorique prsents dans cette
tude montre clairement que le modle pouvoir prdictif dune fiche de notation
dpend du choix judicieux de la taille de lchantillon, des variables inclure et enfin
de la technique de classification adquate.
Ds lors, il est possible denvisager un prolongement de cette tude en direction de
lapprhension de tous les lments susmentionns afin de formaliser un modle plus
complet pouvant expliquer correctement le risque de crdit en microfinance.
P a g e | 64
Bibliographies
1. Amendariz, B and Gollet, C. (1996), Peer grouping in an adverse selection model,Discussion
Paper 96-24 ISSN 1350-6722. University College London, Department of Economics.
2. Arminger, G., Enache, D., & Bonne, T. (1997). Analyzing credit risk data: A comparison of
logistic discriminant classification tree analysis and feedforward networks. Computational
Statistics.
3. Altman, E.I. (1968). Financial Ratios, Discriminant Analysis, and the Prediction of Corporate
Bankruptcy, Journal of Finance, no 4, vol.23, p. 589-609.
4. Altman, E.I., R. Haldeman et P. Narayanan (1977). ZETA Analysis: A New Model to Identify
Bankruptcy Risk of Corporations, Journal of Banking and Finance, vol.1, p. 29-55.
5. Antonio Blanco Rafael Pino-Mejas, Juan Lara Salvador Rayo, Credit scoring models for the
microfinance industry using neural networks: Evidence from Peru, Expert Systems with
Applications, 2012
6.Basel Committee on Banking Supervision (1999). Credit Risk Modelling, Current Practises and
applications , Bank for International Settlements, Basel.
7. Bishop, C. M. (1995). Neural networks for pattern recognition. New York: Oxford University
Press.
8. Chung, H. M., & Gray, P. (1999). Special section: Data mining. Journal of Management
Information Systems, 16, 1116.
9. Boyle, M., J. N. Crook, R. Hamilton, and L. C. Thomas (1992), Methods for credit scoring applied
to slow payers. In; Thomas, L. C., Crook, J. N., Edelman, D. B. (Eds), Credit scoring and credit
control, Oxford University Press, Oxford, Pg 75-90.
10. Armendariz de Aghion B. & Morduch J. (2005), The Economy of Microfinance, Massachusetts
Instituteof Technology, London.
11. Cobbaut R. (2004), thorie financire, 4me edition, Economica.
12. Crook, J. N., Hamilton, R., & Thomas, L. C. (1992). A comparison of discriminations under
alternative definitions of credit default. In L. C. Thomas, J. N. Crook, & D. B.
13. Churchill C.F. & Cester D. (2001), Microfinance Risk Management Hand-book, Pact Publication:
New York.
14. Edelman (Eds.), Credit scoring and credit control (pp. 217245). Oxford: Oxford University
Press.
P a g e | 65
15. Davis, R. H., Edelman, D. B., & Gammerman, A. J. (1992). Machine learning algorithms for
credit-card applications. IMA Journal of Mathematics Applied in Business & Industry, 4(1), p. 43
51.
17. Desai, V. S., Conway, J. N., Crook, J. N., & Overstreet, G. A. (1997). Credit scoring models in the
credit-union environment using neural networks and genetic algorithms. IMA Journal of
Mathematics Applied in Business & Industry, 8(4), 323346.
18. Desai, V. S., Crook, J. N., & Overstreet, G. A. (1996). A comparison of neural networks and
linear scoring models in the credit union environment. European Journal of Operational
Research, p. 2437.
19. Demuth, H., & Beale, M. (1997). Neural network toolbox for use with Matlab.users guide. The
Math Works Inc.
20. Diallo, B. (2006). Un modele de 'credit scoring' pour une institution de microfinance Africaine:
le cas de Nyesigiso au Mali.
21. Dillon, W. R., & Goldstein, M. (1984). Multivariate analysis methods and applications. New York:
Wiley.
22. Dinh, T. H. T., and S. Kleimeier (2007), A credit scoring model for Vietnams retail banking
market, International Review of Financial Analysis.
23. Eisenbeis, R. (1978). Problems in applying discriminant analysis in credit scoring models.
Journal of Banking and Finance, p. 205219.
24. Hand, D. J., & Henley, W. E. (1997). Statistical classification methods in consumer credit
scoring: A review. Journal of the Royal Statistical Society, Series A, p. 523541.
25. Henley, W. E. (1995) Statistical aspects of credit scoring. PhD Thesis. The Open University,
MiltonKeynes.
27. Kim, H. S., & Sohn, S. Y. (2010). Support vector machines for default prediction of SMEs based
on technology credit. European Journal of Operational Research, p. 838846.
28. Kleimeier, S., & Dinh, T. A. (2007). Credit scoring model for Vietnams retail banking market.
International Review of Financial Analysis, p. 471495.
29. Kalala F. (2006), La restructuration de lespace microfinance du Kivu, ULC Press universtit
de Louvain.
29.
Lee, T. S., & Chen, I. F. (2005). A two-stage hybrid credit scoring model using artificial
neural networks and multivariate adaptive regression splines. Expert Systems with Applications,
p. 743752.
30.
Lee, T. S., Chiu, C. C., Lu, C. J., & Chen, I. F. (2002). Credit scoring using the hybrid neural
discriminant technique. Expert Systems with Applications, 23(3), 245254.
P a g e | 66
31. Lee, T. H., and S. C. Jung (1999), Forecasting creditworthiness: logistic vs. artificial neural
net, Journal of Business Forecasting, winter, p. 28-30.
32. Lewis, E. M. (1992), an Introduction to Credit Scoring, (2nd Eds.), Fair, Isaac and Co.
33. Malhotra, R., & Malhotra, D. K. (2002). Differentiating between good credits and bad credits
using neuro-fuzzy systems. European Journal of Operational Research, p. 190211.
34. Mays, E. (2001) Handbook of Credit Scoring. Fitzroy Dearborn.
35. Mester, L. J. (1997), Whats the point of credit scoring? Business Review, Federal Reserve
Bank of Philadelphia.
36. Markham, I. S., & Ragsdale, C. T. (1995). Combining neural networks and statistical predictions
to solve the classification problem in discriminant analysis. Decision Sciences.
37. Morduch, J. (2000). The Micro_nance Schism. World Development,p. 617-629.
38. Neal, R. M. (1996). Bayesian learning for neural networks. New York: Springer. Ohlson, J. A.
(1980). Financial ratios and the probabilistic prediction of bankruptcy. Journal of Accounting
Research.
39. Nguyen, N., & Cripps, A. (2001). Predicting housing value: A comparison of multiple regression
analysis and artificial neural networks. Journal of Real Estate Research, 22, 313-336.
40. Novak, M. P., and E. LaDue (1999), Application of recursive partitioning to agricultural credit
scoring, Journal of Agricultural and Applied Economics, p. 109-122.
41. Paquet P., (1997), Lutilisation des rseaux de neurones artificiels en finance, document de
recherche n 1-1997. Laboratoire Orlanais de Gestion.
42. Patuwo, E., Michael, Y. H., & Ming, S. H. (1993). Two-group classification using neural
networks. Decision Sciences.
43. Rayo, S., Lara, J., & Camino, D. (2010). A credit scoring model for institutions of microfinance
under the Basel II normative. Journal of Economics, Finance & Administrative Science
44. Reichert, A. K., Cho, C. C., & Wagner, G. M. (1983). An examination of the conceptual issues
involved in developing credit-scoring models. Journal of Business and Economic Statistics.
45. Reinke, J. (1998). How to lend like mad and make a profit: A micro-credit paradigm versus the
start-up fund in South Africa. Journal of Development Studies.
46. Rhyne, E., & Christen, R. P. (1999). Microfinance enters the marketplace. USAID
Microenterprise Publications.
47. Rumelhart, D. E., Hinton, D. E., & Williams, R. J. (1986). Learning internal representations by
error propagation in parallel distributed processing. Cambridge, MA: MIT Press.
P a g e | 67
48. Schreiner, M. (1999), A scoring model of the risk of costly arrears at a micro-finance lender in
Bolivia, Center for Social Development, Washington University in St Louis, USA.
49. Schreiner M., (1999c). Aspects of outreach: A framework for the discussion of the social
benefits of microfinance, Center for Social Development Working Paper, 993 (1999c),
Washington University in St. Louis.
50. Schreiner, M. (2000), Credit scoring for microfinance: can it work? Microfinance
RiskManagement, Washington University.
52. Schreiner, M. (2003). The next breakthrough in micro credit? CGAP Occasional Paper No. 7,
http://www.cgap.org.
53. Schreiner, M. (2004). Scoring arrears at a microlender in Bolivia. Journal of Microfinance.
54. Schreiner, M. (2004). Scoring arrears at a micro lender in Bolivia. Journal of Microfinance.
55. Sharma, M., & Zeller, M. (1997). Repayment performance in group-based credit programs in
Bangladesh: An empirical analysis. World Development.
56. Sing, T., Sander, O., Beerenwinkel, N., & Lengauer, T. (2005). ROCR: Visualizing the
performance of scoring classifiers, R package version 1.0-1. http://rocr.bioinf.mpi-sb.mpg.de
57. Srinivasan, V., & Ruparel, B. (1990). CGX: An expert support system for credit granting.
European Journal of Operational Research, 45(23), 293308.
58. Stiglitz, J. E., and A. Weiss (1981). Credit rationing in markets with imperfect competition,
American Economic Review, 71, p. 393-410.
59. Tang, Z., & Fishwick, P. A. (1993). Feedforward neural nets as models for time series
forecasting. ORSA Journal on Computing, 5(4), 374385.
60. Thomas, L. C. (2000). A survey of credit and behavioural scoring: Forecasting financial risk of
lending to consumers. International Journal of Forecasting.
61. Thomas, R. L. (2005). Using Statistics in Economics, McGraw-Hill.
62. Thomas, L. C., D. B. Edelman and L. N. Crook (2002), Credit scoring and its applications,
Philadelphia: Society for industrial and Applied Mathematics.
63. Thomas L. C., J. Banasik, and J. Crook (2001), Recalibrating Scorecards. Journal of the
Operational Research Society, 52, p. 981-988.
64. Tsasa Jean Paul et Togba B. Yves, (2012), valuation du prix dun actif laide du processus
brownien gomtrique : Drivation du Modle de Black Scholes et Application de la Mthode
Monte Carlo , One pager Larq, Vol.4, num. 011, (Dcemndre 2012).
P a g e | 68
65.
Vellido, A., Lisboa, P. J. G., & Vaughan, J. (1999). Neural network in business: A survey of
applications (19921998). Expert Systems with Applications, 17(1), 5170.
66. Venables, W. N., & Ripley, B. D. (2002). Modern applied statistics with S-PLUS. New York:
Springer.
67. Vigan, L. A. (1993). Credit scoring model for development banks: An African case study.
Savings and Development.
68. Vogelgesang, U. (2003). Microfinance in times of crisis: The effects of competition, rising
indebtness, and economic crisis on repayment behaviour. World Development.
69. Wang, J. (2004). The Probability of Chinese Mortgage Loan Default and Credit Scoring,
Beijing Review.
70. West, D. (2000). Neural network credit scoring models. Computers and Operations Research,
27(1112), 11311152.
71. Wong, F. S. (1991). Time series forecasting using backpropagation neural networks.
Neurocomputing.
72. Zeller, M. (1998). Determinants of repayment performance in credit groups: The role of
program design, intra-group risk pooling, and social cohesion. Economic Development and
Cultural Change.
73. Zhang, G. P., Patuwo, B. E., & Hu, M. Y. (1998). Forecasting with artificial neural networks: The
state of the art. International Journal of Forecasting.
P a g e | 69
Annexes
Annexe 1 : Tableau de la rgression
A
ge
-,042
opinion(1)
2,774
ROA
2,485
Constante
-1,335
a. Variable(s) entres l'tape 3 : Age.
E.S.
Wald
ddl
Sig.
Exp(B)
,017
5,872
,015
,959
,434
,734
,911
40,924
11,444
2,148
1
1
1
,000
,001
,143
16,022
11,997
,263
P a g e | 70
Annexe 2 : Description des variables
Variable
Caractristiques du client
age
tat_civil
Stat_resid
Description
signe de l'estimateur
+/+/-
Enfant
Pers_en_charge
Age de l'emprunteur: variable numrique

Statut social de l'emprunteur: Variable nominale: 1. Mari 2. Clibataire 3.veuf/veuve
Rgime d'occupation du logement: Variable nominale. 1. Propritaire 2. Locataire 3.
Autres
Nombre d'enfant de l'emprunteur: Variable numrique
Nombre des personnes en charge: Variable numrique
Caractristiques de l'activit
Exprience
R1
R2
R3
R4
R5
Objet_du_prt
Nombre d'anne d'exercice de l'activit: Variable numrique

ratio fonds de roulement: Variable numrique
ratio liquidit: Variable numrique
l'ge de stock: Variable numrique
ROE: variable numrique
ROA: variable numrique
Destination du prt: Variable nominale: 0.Acquisition de l'actif fixe 1.Renforcement stock
+
-/+
Montant du prt: Variable numrique

rationnement du crdit: variable numrique. 0. oui 1. Non
Ecart entre jour de demande et jour d'acquisition: Variable numrique
Nombre de cycle: Variable numrique
Opinion de l'agent de crdit: Variable nominale. 0. Avec rserve 1. Sans rserve
Type de garantie: Variable nominale. 1. Aucune 2. Financire 3. Physique 4.Avaliseur 5.
Autres
Valeur de la garantie en USD : Variable numrique
Taux d'intrt du crdit: Variable numrique
+
+
+/-
Informations IMF
Mont_du_crdit
Ecart_mont
Ecart_dure
Nombr_cycl
Opin_AC
Typ_gar
Val_gar
Taux_d_intrt
+
+
P a g e | 71
Annexe 3 : Structure des rseaux neuronaux

Figure 3.1 : Structure du rseau de neurone du type Perceptron Multicouches
P a g e | 72
Annexe 3.2 : Structure du rseau de neurone base radiale
P a g e | 73
Annexe 4 : Tableau dimportance des variables indpendante de MLP et RBF
Importance des variables indpendantes MLP

Importance
Importance
standardise
etat_civil
stat_resid
,031
,037
26,0%
31,4%
typ_garantie
ecart_montant
,024
,019
20,5%
15,9%
objet
,010
8,2%
opinion
age
,079
,088
66,4%
74,0%
exprience
val_gar
enfant
,058
,050
,017
48,9%
41,9%
14,5%
per_charg
montant
,029
,042
24,1%
35,4%
ecart_temps
,037
31,4%
nom_cycle
taux_intret
,025
,097
20,8%
81,7%
R1
R2
R3
,029
,084
,102
24,5%
70,7%
86,1%
ROE
ROA
,023
,119
19,3%
100,0%
P a g e | 74
Importance des variables indpendantes RBF

Importance
Importance
standardise
opinion
objet
,044
,023
62,9%
33,1%
ecart_montant
,018
25,2%
Typ_garantie
,029
40,7%
Stat_resid
Etat_civil
R1
,026
,024
,045
36,6%
34,1%
63,7%
R2
R3
,062
,066
87,7%
93,4%
ROE
ROA
Taux_intret
,065
,066
,060
93,0%
93,8%
85,3%
nom_cycle
ecart_temps
,056
,054
79,8%
77,4%
montant
,054
77,1%
per_charg
enfant
,057
,058
81,9%
83,1%
val_gar
exprience
ge
,062
,070
,061
89,0%
100,0%
87,4%
P a g e | 75
Annexe 5 : Tableau des Corrlations de Pearson

Age
Age
Exprience
Etat_civil
Stat_resid
Exprienc
e
-0,017
1
Etat_civi
Stat_resi
Typ_gar
Val_gar
-0,064
-0,119
1
-,221**
-,168*
-0,096
1
,341**
0,007
0,033
0,046
1
Typ_garantie
Val_gar
Enfant
Pers_charg
Montant
Ecart_montant
Ecart_temps
Nombr_cycle
Taux_intret
Objet
Opinion
R1
R2
R3
ROE
ROA
*. La corrlation est significative au niveau 0.05 (bilatral).

**. La corrlation est significative au niveau 0.01 (bilatral).
-,158*
,195**
-,138*
-,357**
Enfan
t
,183**
-,373**
-0,083
,165*
per_char
g
0,039
-,184**
0,065
,224**
Montan
t
-0,119
0,014
-,231**
-0,063
Ecart_mon
tant
0,014
0,074
-,176**
-,376**
Ecart_te
mps
-0,033
-0,099
,137*
,149*
nom_c
ycle
,201**
0,129
-,200**
-,280**
Taux_i
n
-0,016
-,236**
,260**
0,081
-0,035
,340**
,349**
-,152*
-0,102
-0,007
-,205**
0,095
1
0,087
,833**
1
,628**
,230**
0,088
1
,240**
-,245**
-,346**
0,093
1
-0,045
-,137*
-0,131
-0,025
-,277**
1
Objet
Opin
R1
R2
R3
ROE
ROA
0,061
0,028
0,042
0,019
0,04
8
0,076
0,127
,164*
0,031
-0,021
0,034
0,026
0,005
0,111
-,147*
-0,07
0,033
-,170*
1
0,039
-0,047
-0,03
0,041
,171*
-0,02
-0,115
-,158*
0,011
,170*
-0,016
-,137*
0,021
0,126
-0,099
-,140*
-,150*
0,025
0,086
0,078
0,078
-0,029
-0,004
-0,121
,139*
,137*
-0,08
-0,09
0,02
-0,035
0,081
-,217**
-,481**
0,05
,564**
-,299**
-0,07
,137*
,167*
-0,096
-,168*
0,096
0,112
,187**
,138*
0,044
-0,018
0,035
0,028
-,196**
-,220**
0,027
,185**
-0,125
0,005
-0,116
-0,129
0,061
,200**
-0,051
0,091
-0,016
0,038
,154*
-0,062
0,063
-0,074
-0,123
-0,118
-0,07
,155*
-,149*
-,292**
0,03
,218**
,211**
-0,104
,195**
**
**
-0,044
0,033
-0,021
-,176**
1
0,037
,357**
1
-0,056
-0,105
0,103
1
-0,048
,276**
,339**
-,135*
1
,174
-,269
0,132
-0,011
0,059
0,066
-0,005
-0,03
-0,01
-0,027
0,078
0,071
-,261**
-0,053
-0,02
-,190**
,332**
1

Credit Scoring

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Credit Scoring

Transféré par

Droits d'auteur :

Formats disponibles

UNIVERSITE PROTESTANTE AU CONGO

Facult dAdministration des affaires et Sciences Economiques

CENTRE CONGOLAIS ALLEMAND DE MICROFINANCE

Gestion des risques de crdit: notation de risque en microfinance

Mmoire dfendu en vue de lobtention du

A mes chers parents Masaba ma Boboy et Molingo Germaine et

Table des matires

Mise en contexte ........................................................................................................................ 1

Hypothses de recherche .......................................................................................................... 4

Intrt du travail ......................................................................................................................... 5

Dlimitation du travail ................................................................................................................ 5

Chapitre I : Analyse thorique du credit scoring .................................................................................. 6

Rgression logistique ........................................................................................................... 35

Rseaux de neurones ........................................................................................................... 36

Chapitre III : Construction et valuation des fiches de notation statistique ..................................... 44

Analyse discriminante .......................................................................................................... 44

3.1.2. Modlisation par les rseaux de neurones ........................................................................ 48

Pouvoir discriminant ............................................................................................................ 54

Critres pratiques ................................................................................................................. 56

3.3. Choix du modle de scoring ...................................................................................................... 56

Liste des figures

Liste des tableaux

Afin de sassurer que cette probabilit se rapproche de lunit (viter le risque de

Toutefois, dans ce contexte dincertitude et dasymtrie dinformation, le processus

Ce mmoire sinsrant dans le prolongement de travaux de Vigano (1993);

De manire concrte, nos investigations se dclinent en trois questions majeures :

Chapitre I: Analyse thorique du credit scoring

et de leurs bnfices dans la prise de dcision, soient poses (Wonderlic 1952). En

destimer la probabilit du dfaut de remboursement et (iii) rduire ce risque un

ellencessite une base de donnes robustes, qui enregistre les antcdents

lutilisation de connaissances quantitatives dans une base de donnes pour

subjectives de lagent de crdit sur la solvabilit dun client (Schreiner,

la technique perd son pouvoir prdictif en cas dun changement brusque

1.2.3. Complmentarit de lvaluation subjective et valuation statistique

Le client soumet une demande

Lagent de crdit procde une valuation

Risque prvu accept

Source : Schreiner (2003).

Figure 1:Dmarche dutilisation de la fiche de notation

1.3. Les avantages du credit scoring

La dlgation de la dcision de crdit

L'valuation statistique par la mthode du crdit scoring prend en considration une

gographique peut indiquer le niveau la sant financire de lemprunteur. La variable

Variables communment utiliss dans

Variables inclues dans les fiches de notation

Membre de la famille en charge

le temps dans la nouvelle maison

Temps pass dans

Vigano (1993)-Burkina Faso

Source: Dinh & Kleimeier (2006).

1.5 Credit scoring et ses techniques de modlisation

Tableau 1:Comparaison des rsultats (en % des groupes correctement classifis)

Rgression Logistique RPA Programmation Rseau

Sources : Thomas (2002)

Source : Crook et al (2007, p.1457)

De ce point de vue, lvaluation du pouvoir de prdiction est le seul moyen susceptible

Dunn et Frey (1976)

Le problme du choix de la meilleure technique destimation des scores reste aussi

Vigano (1993, Burkinan

Reinke (1998, South frica)

Tobit Maximun Likelihood

Schreiner (2001, Bolivie)

Vogelgsang (2001, Bolivie)

Random Utility Modle