Académique Documents
Professionnel Documents
Culture Documents
BP : 570 /BUKAVU
DECLARATION D’AUTHENTICITE
DECLARATION D’AUTHENTICITE
Moi, KULONDWA CIBASA Patrick, déclare sur mon honneur que ce mémoire est mon
travail original, qu'il n'a jamais été déposé dans aucune autre université ou institut supérieur
en vue de l'obtention d'un quelconque titre académique, et n'a jamais fait l'objet d'une
quelconque publication par le passé. Là où je me suis inspiré des travaux d’autres auteurs,
ceux-ci ont été reconnus et dûment référencés.
CONSENTEMENT
CONSENTEMENT
Nous certifions que ce travail a été produit sous notre direction et/ou encadrement et a été déposé à la
faculté avec notre consentement.
EPIGRAPHE
« L’insuffisance de ressources financières n’étant qu’un problème parmi d’autres, considérer la
microfinance comme une panacée pour éradiquer la pauvreté serait lui prêter des vertus
excessives. Par ailleurs selon la manière dont il est mis en œuvre et vécu par les emprunteurs, il
peut tout aussi bien alléger la pauvreté que l’alourdir en aggravant l’insolvabilité des
bénéficiaires »
Guerin,1999.
III
DEDICACE
REMERCIEMENTS
Nos remerciements s’adressent en premier lieu à l’Eternel Dieu Tout Puissant ; père céleste pour
sa grâce et sa bienveillance qu’il ne cesse de nous accorder.
Notre profonde reconnaissance envers le Prof. Dr. Matabaro Borauzima Luc et à l’Ass Irenge
Alain respectivement directeur et encadreur de ce mémoire. Leurs remarques, conseils et
encouragements ont été d’une grande importance tout au long de cette recherche. Nous leur
exprimons notre gratitude pour tout ce qu’ils nous ont apporté dans le but de rendre excellent
cette œuvre et pour la confiance et le privilège qu’ils m’ont accordés.
A nos parents Emmanuel cibasa et Feza charlotte pour ses différents efforts pour notre
scolarisation ;
Enfin, certaines personnes ne sont pas nommément citées ici par souci de concision. Cependant,
que tous ceux et toutes celles qui reconnaissent m’avoir aidé, de quelque façon que ce soit,
trouvent ici mes sentiments de profonde gratitude.
Nos plus sincères remerciements s’adressent aussi à nos frères Murhula Cibasa Justin, Jado
Cibasa,Roger Cibasa,Crispin Cibasa,Amani kaningu,Dieumerci rugango,Amani mulinga,Aksanti
mulinga,Shukuru lwikungu, sœurs Mapendo cibasa,Immaculee cibasa,Gisele cibasa ;Mugoli
cibasa,Jeanne d’arc cibasa, Marie salome cibasa,Francine cituli,Godelive cituli,Jado
sanvura,Kujirabwinja claver,Thiery mugisho,Toni iragi,Prince byenda,Pascal assani; amis et
toute autre connaissance pour leur soutien pour notre formation intellectuelle.
A mon amie de près Laetitia katabana ;
A tous,nous exprimons notre profonde gratitude.
VI
SIGLES ET ABBREVIATIONS
COOPEC : Coopérative d’Epargne et de Crédit
OR : Odd Ratio
EPIGRAPHE...................................................................................................................................II
DEDICACE....................................................................................................................................III
REMERCIEMENTS......................................................................................................................IV
SIGLES ET ABBREVIATIONS...................................................................................................VI
RESUME.....................................................................................................................................VIII
II.4.1. Méthodes......................................................................................................................20
CONCLUSION..............................................................................................................................42
BIBLIOGRAPHIE.........................................................................................................................43
VII
RESUME
Contexte et objectif : Les institutions de la microfinance (IMF) sont spécialisées dans la collecte
de l’épargne et de l’offre de microcrédit à une partie de la clientèle, ne pouvant pas accéder à un
crédit bancaire classique pour défaut de garanties pouvant couvrir le risque lié au non
remboursement de leur prêt. De ce fait, on assiste à une massification croissante de l’offre de
microcrédit dans les pays en développement dont le revenu des ménages reste modeste. En
d’autres termes, l’accès au microcrédit, des ménages pauvres, devient de plus en plus élargi d’où
la hausse de l’encours de microcrédit de la part des IMF. L’objectif de cette étude est de
sélectionner le modèle de prévision de la probabilité de défaut des crédits dans les institutions des
microfinances, nous avons fait les estimations des modèles logit, probit et le random forest, logit,
probit,support vector machine et decision tree.
Méthodologie → Avec une observation des données secondaires, nous avons utilisé les modèle
nous avons fait les estimations des modèles logit, probit et le random pour prévoir la probabilité
de défaut de crédit dans les institutions des microfinances.
Résultats → Sur base des critères d’un logiciel R nous ous avons trouvé que que le modèle
Random forest est le meilleur modèle pour la prévision de la probabilité des défauts de crédit
dans les institutions de microfinances, une attitude plus conservatrice améliore significativement
de la performance du modèle dans la prédiction des mauvais ou des bons emprunteurs.
Le modèle Random forest a un bon pouvoir de prédiction car il prévoit correctement 99.1% de la
prédiction de la probabilité de défaut.
Contribution et originalité →la recherche mise sur la sélection d’un modèle de probabilité de
défaut de crédit dans les institutions des microfinances, celle-ci sera un élément clé pour une
bonne prévision, elle sera une bonne source de la théorie de signal afin de permettre aux
institutions de microfinances de prendre des décisions éclairées et mettre en place des stratégies
conformes à la situation de donner le crédit aux emprunteurs. C’est une source d’inspiration pour d’autres
chercheurs qui seront dans le même cadre de cette étude.
INTRODUCTION
Cependant on prédit que l’utilisation d’un modèle peut aider à réduire les coûts d'octroi des prêts
aux emprunteurs. Cette technique compare les données quantitatives et qualitatives relatives à
l'emprunteur, au prêt, et au prêteur avec des cas passés semblables. Le partage des mêmes
caractéristiques avec les cas passés qui ont eu des problèmes de remboursement est un signe que
le prêt courant aura aussi des problèmes de remboursement. Les prêteurs par carte de crédit dans
les pays riches octroient chaque année un nombre massif de petits prêts, à court terme, et à faible
coût depuis qu'ils se servent des modèles statistiques sont faciles à réaliser et qui prévoient
exactement le risque des emprunteurs potentiels (Lewis 1990)
Par ailleurs un des moyens de contrôler les effets négatifs des asymétries informationnelles et les
coûts de transactions est l'utilisation du modèle crédit scoring. Le scoring peut aider à réduire les
coûts d'octroi des prêts aux emprunteurs. Cette technique compare les données quantitatives et
qualitatives relatives à l'emprunteur, au prêt, et au prêteur avec des cas passés semblables. Le
partage des mêmes caractéristiques avec les cas passés qui ont eu des problèmes de
remboursement est un signe que le prêt courant aura aussi des problèmes de remboursement. Les
prêteurs par carte de crédit dans les pays riches octroient chaque année un nombre massif de
petits prêts, à court terme, et à faible coût depuis qu'ils se servent des modèles statistiques
nommés scorecard qui sont faciles à réaliser et qui prévoient exactement le risque des
emprunteurs potentiels (Lewis, 1990). Bien évidemment, les micro prêteurs utilisent également
2
un type de scoring implicite et subjectif du fait qu'ils évaluent les emprunteurs en se basant sur
leurs propres expériences et leurs connaissances historiques. La plupart des recherches (Berger,
Frame & Miller, 2002 ; Frame, Padhi & Woosely, 2001 ; Martell, Panichelli, Strauch & Taylor-
Shoff, 1999), suggèrent que le scoring combiné avec les bureaux de crédit ont le potentiel
d'améliorer considérablement les résultats des prêts formels dans les pays à haut revenu. Avec
une bonne connaissance du risque, les prêteurs peuvent approuver des emprunteurs pauvres mais
sûrs et rejeter des emprunteurs non pauvres mais risqués. Ainsi, les prêteurs peuvent gagner du
temps qui aurait dû être gaspillé dans des emprunteurs délinquants et, par conséquent, peuvent
déployer le temps gagné dans la recherche d'autres emprunteurs (Schreiner et al 2002).
En effet, les auteurs des modèles du crédit trouvés dans la littérature se basent uniquement dans
la formulation de ces modèles sur les emprunteurs acceptés et ils ne prennent pas en
considération les cas rejetés. Cet inconvénient est de nature à biaiser l'estimation ainsi que les
résultats issus du modèle (Ben Soltane Bassem 2008).
En revanche la somme des caractéristiques pondérées définit la probabilité que le prêt, une fois
déboursé, va être "mauvais", où mauvais est défini par le prêteur. Les poids de chaque
caractéristique dans la fiche d'évaluation sont basés sur une analyse statistique du rapport entre la
caractéristique et le remboursement dans la base de données historique du prêteur. Une fois la
fiche d'évaluation statistique est achevée, le micro prêteur peut en servir dans son travail
quotidien. Il peut adopter un système de cotation à quatre niveaux «sûr», «normal», «risqué», et
«très risqué». Les emprunteurs dont les risques estimés par la fiche d'évaluation statistique
indiquent qu'ils sont «sûrs» sont rapidement acceptés et même peuvent être qualifiés pour des
lignes de crédit ou d'autres récompenses avantageuses. Les candidats dont les risques estimés
«normaux» sont agréés comme d'habitude et comme si les micro prêteurs n'avaient pas utilisées
aucune fiche d'évaluation statistique. Pour contrôler le risque des candidats «risqués», le comité
du crédit devra exa- miner attentivement ces candidatures, éventuellement réajuster les montants
demandés. Enfin, les candidats qualifiés «très risqués» seront automatiquement rejetés. Plusieurs
modèles statistiques ont lié les arriérés aux caractéristiques du prêteur, de l'emprunteur, et du prêt
(Sharma et Zeller, 1997 ; Reinke, 1998 ; Zel- ler, 1998 ; Nannyonga, 2000 ; B. S. Bassem et T.
Borhen, 2008). D'une façon générale, ces modèles n'ont pas été très utiles comme scorecards
(d'ailleurs, ils n'étaient pas conçus pour cette fin) et ce pour trois raisons. D'abord, ces modèles
utilisent des échantillons de petite taille ce qui les rend moins robustes. Ensuite, quelques
modèles utilisent des caractéristiques que la plupart des prêteurs ne collectent pas ou qui sont
chères à collecter. Enfin, et le plus important, ces modèles manquent du pouvoir prédictif. Une
recherche bibliographique est nécessaire pour confirmer que le modèle peut vraiment prédire le
risque, et d'une manière primordiale convaincre les agents du crédit, et les directeurs de crédit que
ce modèle fonctionne convenablement. La plupart des modèles statistiques académiques visent à
détecter les caractéristiques liées avec le risque, mais pas à aider le micro prêteur à donner des
scores aux emprunteurs (Ben Soltane Bassem 2008)
En RDC, toutes les structures disposent d’un service de remboursements, même s’il est
embryonnaire a beaucoup d’égard. Les taux de remboursement dans les délais des emprunts
contractés par les clients restent en général faibles. Ils avoisinent pour certains 45 % et d’autres
75 %. Cela fait que le remboursement des épargnes en pâtit également et que cela met souvent les
structures IMF en difficulté. Conformément à la spirale habituelle déjà fortement documentée, les
cas de crédits considérés comme cadeau sont fréquents non seulement pour les structures de
4
financement initiées par l’Etat et pour lesquelles les interférences politiques sont manifestes, mais
aussi pour les structures des ONG où certains responsables eux-mêmes servent de filière pour le
dérapage et le manque de sérieux dans la collecte des fonds. On finit par assister à ce que gentil et
fournier appellent ou qualifient de solidarité perverse dans le non-remboursement, surtout lorsque
les attitudes et les actes des structures sont observées par les bénéficiaires. Les modalités de suivi
des prêts sont différentes d’une IMF à une autre. Dans les COOPEC, on dénombre plusieurs
types de suivi. Il s’agit notamment des modèles suivants : le contrôle de surveillance des
activités, le contrôle après échéance de 15 jours par la commission de crédit, le suivi de
conformité de crédit, le suivi après retard d’un mois, le suivi au début de l’activité après un mois
par le gérant et les rondes hebdomadaires auprès des débiteurs. Par contre dans les mutualités
d’épargne et de crédit on identifie des mécanismes presque analogues tels que le suivi ordinaire
en cas de non-remboursement après chaque mois par la commission de crédit, la vérification des
écritures et de la conformité des comptables, le contrôle interne de la tenue des écritures et des
données comptables et aussi les rondes hebdomadaires auprès des débiteurs. Ce qui est
intéressant par contre, c’est de voir les difficultés et l’embarras dans lequel se retrouvent les
structures de financement la plupart de fois lorsqu’ils font face à des impayées. La tendance est
d’essayer d’être compréhensif et d’accorder un nouveau moratoire. On effectue alors les
descentes sur terrain, on essaie de négocier et de convaincre de fournir un effort, et on procède au
retranchement des intérêts dans le compte du débiteur. On envoie les avis de remboursement et ce
n’est que lorsque tous les mécanismes sont épuisés qu’on essaie alors de saisir la justice et de
procéder éventuellement au recouvrement forcé. Il est important que les structures de
microfinance soient alertées sur les coûts de recouvrement des crédits non payés et que les
mécanismes soient mis en place comme ailleurs pour l’établissement d’une agence de
recouvrement impersonnel et plus experte qui centraliserait l’actionnement des garanties et avals
de frères qu’on accorde souvent tout en espérant que le cas de leur mise en jeu ne se réalisera pas.
(Mugumo 2001) ;
Eu égard à ce qui précède, cette étude cherche à identifier le modèle de prévision de probabilité
de crédit et particulièrement à l’IMF FINCA et répondre aux questions suivantes :
Quel est le meilleur modèle de prévision de la probabilité de défaut des crédits dans les
institutions des microfinances ?
5
L’objectif général de la présente étude est de sélectionner le meilleur modèle dans la prévision de
défaut de remboursement de crédit dans les institutions de microfinances.
Analyser les différents modèles pour la prévision de défauts des crédits dans les institutions des
microfinances
Cette étude contribue à la littérature existante sur les emprunteurs faisant défauts dans les
institutions des microfinances.
De ce fait, l’intérêt est à considérer sur le plan personnel, sur le plan scientifique et sur le plan
économique. Personnellement, cette étude nous permet d’appréhender le modèle de prévision de
la probabilité des défauts de remboursement des microfinances et, sur le point de vue des IMF, la
contribution à l’évaluation de risques en utilisant ce modèle pour la performance de leurs
entreprises. Scientifiquement, cette étude contribue à la littérature existante sur la sélection du
modèle de probabilité défaut de remboursement dans les institutions des microfinances.
Pratiquement, enfin, les résultats de cette étude constituent, pour les dirigeants des institutions de
microfinances, un outil de prise de décision dans leur marche vers l’octroi de crédit. S’agissant de
la méthodologie, cette étude utilise les données secondaires des microfinances.
Les données sont saisies dans des feuilles de calcul Excel en vue de leur traitement. Différents
tests statistiques sont faits pour juger de la validité et de la fiabilité des échelles de mesure et les
analyses économétriques sont faites pour déterminer la probabilité de défaut de remboursement
dans les institutions de microfinances.
Hormis l’introduction et la conclusion, ce travail porte sur trois chapitres : le premier chapitre de
la revue de la littérature dans lequel nous présentons les différentes théories liées à notre sujet de
recherche mais aussi quelques résultats des études empiriques ; le chapitre deuxième présente
l’approche méthodologique dans lequel nous présentons les différentes voies que nous avons
6
suivies pour mettre au point ce travail et le chapitre troisième enfin concerne la présentation et
discussion des résultats de l’étude.
7
Pour une IMF, la sélection consiste à choisir les clients les plus solvables (écrémage) ou à les
tarifier par type de risque (séparation) ou à les ajuster par le bas.
b. Modèle : il s’agit ici d’un modèle statistique, c’est une description mathématique
approximative du mécanisme qui a généré les observations, que l’on suppose être un processus
stochastique et non un processus détérministe.il s’exprime généralement à l’aide d’une famille de
distributions (ensemble de distributions ) et d’hypothèses sur les variables aléatoires.
En revanche plusieurs modèles statistiques ont lié les arriérés aux caractéristiques du prêteur, de
l'emprunteur, et du prêt (Sharma et Zeller, 1997 ; Reinke, 1998 ; Zel- ler, 1998 ; Nannyonga,
2000 ; B. S. Bassem et T. Borhen, 2008). D'une façon gé- nérale, ces modèles n'ont pas été très
utiles comme scorecards (d'ailleurs, ils n'étaient pas conçus pour cette fin) et ce pour trois raisons.
D'abord, ces modèles utilisent des échantillons de petite taille ce qui les rend moins robustes.
Ensuite, quelques modèles utilisent des caractéristiques que la plupart des prêteurs ne collectent
pas ou qui sont chères à collecter. Enfin, et le plus important, ces modèles manquent du pouvoir
prédictif.
c. Prévision : c’est une action de prévoir, c’est une opinion formée par le raisonnement sur les
choses futures. C’est une étude générale d’une situation donnée, dont on peut, par déduction,
8
calcul, mesure scientifique, connaitre par avance l’évolution ; par extension, ce que l’on prévoit,
ce qui est prévisible, ce que l’on juge devoir être.
D’une façon générale c’est la science de la description de l’avenir. Dans un sens plus restrictif, en
épistémologie contemporaine, la prévision se distingue de la prédiction qui est issue d’une loi ou
théorie scientifique hautement confirmée ou corroborée, tandis que la prévision découle
d’hypothèses ou de conjectures moins assurées.
d. Probabilité de défaut : est une mesure statistique qui quantifie la probabilité qu’un
emprunteur ne respecte pas ses obligations financières dans un délai donné. Il est exprimé en
pourcentage, représentant la probabilité de survenance d’un défaut. La probabilité de défaut est
un élément clé des modèles d’évaluation du risque et son exactitude est cruciale pour une gestion
efficace des risques.
Cependant pour calculer la PD, les institutions financières prennent en compte divers facteurs tels
que les antécédents de crédit de l’emprunteur, sa stabilité financière, son niveau de revenu et son
ratio dette/revenu. Ces facteurs sont pondérés et analysés, généralement au moyen de modèles
statistiques et d’algorithmes, pour générer un score de probabilité. Plus la probabilité est élevée,
plus l’emprunteur est considéré comme étant risque.
Par ailleurs l’importance du calcul de PD ne peut être surestimée ; déterminer avec précision la
probabilité de défaut permet aux institutions financières d’allouer efficacement leurs ressources,
de fixer des taux d’intérêt appropriés et d’établir des limites de crédit. De plus cela aide à
identifier les emprunteurs à haut risque, à établir une tarification basée sur le risque et à mettre en
œuvre des stratégies d’atténuation des risques.
Dans le paysage financier dynamique et imprévisible aujourd’hui, une évaluation et une gestion
précise des risques sont devenues plus cruciales que jamais. Les institutions financières et les
prêteurs s’appuient sur diverses méthodes et modèles pour évaluer la solvabilité et déterminer la
probabilité de défaut. L’un des éléments clés de ce processus est le calcul de la probabilité de
défaut. En comprenant et en calculant avec précision la probabilité de défaut, les préteurs peuvent
prendre des décisions éclairées, atténuer les risques et garantir un portefeuille plus sain.
9
Dans la littérature, plusieurs études ont été menées sur les déterminants de défaut de
remboursement dans les institutions de microfinance tant du point de vue des emprunteurs
individuels que des groupes. De façon générale, ces recherches se basent sur l’existence
d’asymétries d’informations à différents niveaux sur le marché de la micro-finance. Viganò
(1993) a identifié cinq grands déterminants du risque de défaut de remboursement : la capacité de
rembourser, la volonté de rembourser, les conditions externes économiques et environnementales,
la qualité de l’information qui sert de base de décision pour l’octroi de crédit, la capacité du
prêteur à s’assurer de la bonne volonté de l’emprunteur à travers un contrat optimal. Boot (2000)
relève que la relation à long terme contribue à réduire les problèmes de sélection adverse et
d’aléa moral qui peuvent résulter notamment des nouveaux emprunteurs.
En revanche les garanties jouent également un rôle important dans l’analyse du défaut. D’un
point de vue théorique, les garanties sont perçues comme éléments atténuateurs du problème de
sélection adverse dont fait face le prêteur (Besanko et Thakor, 1987). Les garanties agissent alors
comme un signal permettant au prêteur de réduire ou d’éliminer le problème de sélection adverse
causé par l’existence d’asymétries informationnelles entre prêteur et emprunteurs. Toutefois, la
nature et l’évaluation des garanties réelles posent problème, car l’évaluation faite des garanties
est le plus souvent erronée et manque d’objectivité. Le recourt au crédit de groupe en est une
solution. Plusieurs auteurs ont démontré la performance de ce type de crédit. Toutefois, ces prêts
aussi sont sujets à des problèmes. Simtowe et Zeller (2006), résument ces problèmes en quatre
catégories et donnent les solutions théoriques à ce type de prêts. Dans un premier temps, les
auteurs évoquent que la sélection par les pairs permet de lutter contre la sélection adverse, car les
membres éviteront de s’associer avec ceux dont ils ne connaissent pas bien le profil de risque. Ce
principe permet la formation de groupes homogènes dans lesquels, tous les membres connaissent
parfaitement les caractéristiques de leurs partenaires portant sur le risque du projet, le niveau de
solvabilité (Van Tassel, 1999, Ghatak et Guinnane, 1999). La deuxième catégorie est liée à la
surveillance des pairs pour réduire le choix d’un projet très risqué et le détournement des fonds à
d’autres fins. Elle constitue un élément important permettant la réussite des crédits de groupe
(Stiglitz, 1990, Aghion, 1999). Wenner (1995) observe cependant que le groupe doit être
restreint. Le troisième groupe est relatif à l’échec du projet pour des raisons exogènes ou qui sont
10
Par conséquent le risque de crédit, ou plus généralement le risque de contrepartie, est le principal
risque auquel est exposé un établissement bancaire. Il s’agit du risque qu’une contrepartie ne
puisse pas rembourser sa dette (le principal et/ou les intérêts) à temps, ou plus généralement
(dans le cas du risque de contrepartie), qu’elle fasse défaut avant le dénouement de l’opération
initiée. Le risque de crédit fera l’objet d’une étude renouvelée et approfondie dans la partie
suivante. Il importe donc de rappeler comment il est appréhendé dans le cadre de la
réglementation actuelle, en commençant par la définition des principales mesures et des
paramètres de calcul.
La microfinance est la combinaison de deux mots qui signifient petit paiement ou petit-prêt. Le
préfixe micro vient du mot grec « mikros » qui signifie « petit » ou encore « la division ». Quant
au terme finance, il est dérivé du latin « finanre » qui selon l’encyclopédie Hachette veut dire «
fixer une indemnité » ou « une amende », ou encore « ce qui rapporte de l'argent » ou concerne «
le paiement d'une certaine somme d'argent ».
La première utilisation du mot microfinance remonte vers les années 89 lors de la conférence
organisée par la banque mondiale sur les micro-entreprises. Sa mise en place est une solution au
retrait progressif des États, compte tenu des difficultés pour intervenir dans toutes les branches de
l'économie.
Par la suite la microfinance est entrée dans une nouvelle étape de développement, elle doit
répondre à des besoins beaucoup plus complexes et soumis à de perpétuels changements. Nous
11
notons la présence de plusieurs IMF avec des buts différents, par exemple les IMF à but lucratif
dont l’objectif est la maximisation du profit (c’est la commercialisation de la microfinance)
De plus la microfinance est un moyen de lutte contre la pauvreté dans les pays en développement,
à travers le financement des activités génératrices de revenus pour les ménages pauvres.
Cependant, la meilleure manière d'aider les pauvres à avoir accès aux services financiers oppose
l’approche des welfarists à celle des institutionalists. Bien qu’elles partagent l’objectif de
réduction de la pauvreté, ces deux approches placent la microfinance à la croisée des chemins.
(Philippe ADAIR et al 2010)
Par ailleurs la microfinance a occupé une place prépondérante dans la lutte contre la pauvreté
dans les pays en développement. Son essor considérable a soulevé des débats centrés
principalement autour de son taux d’intérêt ou du niveau de sa performance. Bien que la plupart
des chercheurs partagent l’idée qu’elle permet de réduire la pauvreté, il n’en demeure pas moins
que sa démarche a fait l’objet de discussion entre les deux principales écoles (Welfaristes et
institutionnalistes), qui se sont opposées sur la manière d’aider les pauvres à avoir accès aux
services financiers. Pour les Welfaristes, la microfinance doit avoir une mission sociale en
prônant le bien-être des emprunteurs. Les défenseurs de cette école supposent que le concept
même de la rentabilité est en contradiction avec la mission sociale des IMF (Martinez, 2007)..
Quant aux institutionnalistes, ils considèrent que les taux d’intérêt appliqués par les IMF doivent
être nettement supérieurs à ceux appliqués par les banques afin de faire face aux différentes
charges opérationnelles et financières et couvrir les risques liés aux non- remboursements. A cet
effet, ils estiment que la préservation de la qualité des portefeuilles justifie la hausse des taux
d’intérêt car un niveau élevé d’impayés risque de fragiliser la situation financière des IMF. Cette
dernière mouvance semble gagner du terrain dans la plupart des pays en développement car ces
derniers se heurtent de plus en plus à une hausse des taux d’intérêt des IMF.(Djibril faye et al
2019)
Pour la Banque Mondiale (2000), la microfinance correspond à l'idée selon laquelle les pauvres
comme toutes les autres personnes doivent avoir accès à un large panel de services financiers à
faible coût. Elle correspond à l'offre de services de prêts, d'épargne ainsi que d'autres services de
base proposés aux exclus du système formel des banques (CGAP, 1997).
12
Cependant microfinance a plusieurs objectifs parmi lesquels le ciblage des populations pauvres
afin de faciliter le développement des activités génératrices de revenus et de l’épargne (Delalande
et Paquette, 2007). Pour Labie et al. (2007), la microfinance regroupe l'ensemble des mécanismes
et des services financiers adaptés aux besoins des ménages actifs mais n’ayant pas accès aux
circuits financiers classiques. Elle joue donc un rôle positif en aidant à mieux maitriser les
dépenses liées aux risques, à mieux gérer les rythmes entre recette et dépense (Martinez, 2007).
D'après Christen et al. (2003), la microfinance désigne la prestation de services bancaires aux
personnes à faible revenu, elle leur permet également de diversifier et d'accroître leurs sources de
revenu, ce qui constitue un moyen non négligeable dans la lutte contre la pauvreté et la faim
((Littlefield et al, 2003) in (Fodé Ndiaye, 2009)). Selon Blondeau (2006), la microfinance est la
fourniture d'un ensemble de services financiers aux personnes qui sont exclus du système
bancaire.
De plus, Gentil et Servet (2002) stipulent que le terme microfinance recouvre un ensemble très
diversifié de dispositifs offrant des services d'épargne, de prêt ou d'assurance à de larges fractions
des populations rurales, mais aussi urbaines, n'ayant pas accès aux services financiers des
établissements soumis à des contraintes de rentabilité et à certains ratios prudentiels. Elle est
encore appréhendée comme la fourniture de prêt, d'épargne, de transfert d'argent, d'assurance aux
populations à faible revenu (Lafoucade et al, 2005).
Dans un modèle ordonné, les modalités de la variable à expliquer sont hiérarchisées. Elles
indiquent l’appartenance de l’individu à une classe ou à une catégorie, par exemple
l’appartenance à une tranche de revenu. Nous pouvons distinguer deux classes de modèles à
choix multiples ordonnés en fonction de la variable à expliquer qui est issue, soit d’une «
discrétisation » d’une variable continue telle que l’appartenance à une tranche de salaire, soit
directement d’une appartenance à une catégorie.
Le modèle logit est de plus en plus utilisé dans des applications pratiques. Cela peut se justifier
par son habileté à prendre en compte dans l’analyse les similarités entre les pairs d’alternatives.
On distingue deux différentes spécifications de ce modèle : le modèle Utility Maximization
Nested Logit (UMNL) et le modèle Non-Normalized Nested Logit (NNNL). Cette dernière
spécification étant non consistante avec la théorie de l’utilité aléatoire (RUT), la forme UMNL
est habituellement préférée (Silberhorn, Boztuǧ et Hildebrandt, 2006).
Comme pour le modèle de choix binaire, le recours à une fonction de répartition normale, permet
de définir un modèle de type Probit et une fonction de répartition de type logistique permet de
définir un modèle Logit. L’estimation de tous les paramètres, les coefficients de régression (ai) et
les valeurs des seuils (ci) des modèles ordonnés (Probit ou Logit) est effectuée à l’aide des
algorithmes de maximisation d’une fonction de Log-vraisemblance définie par les Pi j. Les
valeurs des coefficients des modèles ne sont pas directement interprétables en termes de
propension marginale, seuls les signes des coefficients indiquent si la variable agit positivement
ou négativement sur la variable latente. Les résultats d’estimation s’apprécient de la même
manière que pour les modèles de choix binaires. (Régis Bourbonnais)
Comme notre variable expliquée (la demande de crédit) est dichotomique nous nous trouvons
astreint de choisir un modèle d'analyse approprié et adapté. Dans cette perspective, souligne que
les modèles dichotomiques logit et probit admettent pour variable expliquée, non pas un codage
quantitatif associé à la réalisation d’un événement (comme dans le cas de la spécification
14
Ce type de modèle repose sur l'hypothèse que les notations qualitatives (rating) des entreprises
sont déterminées par une fonction score continue non observable. En général cette fonction score
est une fonction croissante des probabilités de défaut pour une entreprise donnée à une date
donnée. La notation qualitative est alors obtenue en échantillonnant la fonction score en fonction
d'une partition déterminée par le modèle.
Les Support Vector Machines (SVMs) sont une méthode de classification qui montre de bonnes
performances dans la résolution de problèmes variés tels que la reconnaissance de formes
[Burges, 1998] ou la catégorisation de textes [Joachims, 1998]. Le classifieur est alors un donc
sous-espace vectoriel de dimension N-1 dans un espace de dimension N ✭✭ déplié ✮✮, établit à
l’aide d’un nombre réduit de points : les vecteurs de support. Dans cet article, nous montrons
comment les Support Vector Machines peuvent être utilisées pour résoudre des problèmes de
défaut de remboursement de crédit.
L’objectif primordial de support vector machine est de construire une fonction qui permet une de
montrer de bonnes capacités à remplir efficacement sa mission dans de nombreux domaines.
e. Le Random Forest
La méthode des Random Forests existe dépuis peu de temps. Elle a été développée par Breiman
(2001). Elle trouve déjà de plusieurs applications dans différents domaines telles que l’écologie
(Brosteaux, 2005) ou l’agriculture (Cutler et al., 2007). Parmi les capacités des RF nous pouvons
citer la possibilité de rendre libre le problème de multi-colinéarité et de la présence de données
manquantes, de permettre le traitement à la fois des variables qualitatives et quantitatives à des
échanges des variables étudiées et de mesurer l’augmentation de l’erreur éventuelle. Par ailleurs
l’interprétation est ensuite facilitée par le calcul d’un indice donnant l’avantage de chaque
variable dans l’agrégation de modèles.
15
On prédit que l’objectif de l’étude par Random Forests est de rendre compte ou de déceler
l’importance des variables dans un jeu de données. Conférer une importance aux variables
explicatives nous a conduits à examiner la sensibilité de ces variables pour une variable à
expliquer fixée. L’importance des variables est donnée par l’indice de Gini, plus cet indice est
élevé plus la variable Xi est importante (S. Taibi-Hassani et al).
Et donc pour le modèle Random Forest il consiste à diminuer la prédiction de faux négatifs.
Cependant cette action a pour conséquence de diminuer la précision ce qui s’accompagne d’une
augmentation de la prédiction de faux positifs.
H1. Le modèle random forest serait le meilleur modèle dans la prévision de la probabilité des
défauts de crédit de remboursement dans les institutions des microfinances.
Les modèles de score sont des techniques statistiques qui s’efforcent de synthétiser, au moyen
d’une note, dite score, le risque de non-remboursement d’un emprunteur existant ou potentiel,
pour estimer la performance future de son prêt (Feldman, 1997) ou pour prédire la probabilité
qu’il fasse défaut (Mester, 1997). En effet, le problème, est de déceler parmi les informations qui
caractérisent un emprunteur, celles qui expliquent au mieux sa solvabilité. Une pondération est
attribuée à chaque information et la totalisation est comparée à une note critique préalablement
établie (appelée seuil critique) permettant de distinguer les entreprises en difficulté (qui
présentent un risque défaut ou de défaillance) de celles qui ne le sont pas et indiquant s’il faut
leur accepter ou refuser le crédit. L’intérêt de cette démarche est bien évidemment d’anticiper une
défaillance future en observant les entreprises a priori. À ce titre, le crédit scoring facilite la prise
de décision (De Coussergues, 1996, p.185).
g. Arbre de décision
Il est définit comme un ensemble de règles de classification basant leur décision sur des tests
associes aux informations, de manière à organiser les données de façon logique et hiérarchisée,
utilisant une structure algorithmique d’arbre.
16
Et donc tout arbre de décision définit un Classifier qui se traduit aussitôt en terme de règles de
décision de beaucoup d’avantages des arbres de décision dont décisions aisément interprétables et
classification très rapide. Dans cette étude cet arbre permet de prendre de décision pour le
meilleur modèle pour prévenir la probabilité de défaut dans les IMF.
Steve Castanet et Romain Mazoué dans la Modélisation des corrélations de défauts dans
l'analyse du risque de crédit avec comme objectif de l'utilisation des modèles affines est de
pouvoir spécifier des facteurs afin de modéliser la corrélation des défauts existant dans les
portefeuilles de créances détenus par les banques. L'objectif de ce modèle est de décrire les
différentes étapes qui, grâce aux modèles affines en temps discret vont permettre d'étudier la
relation entre les spreads de crédit observés et les prix des obligations. Il est alors possible de
relier probabilités historiques et probabilités risques neutres. Il trouve le résultat selon lequel le
modèle affine permet d'étudier précisément les composantes du spread de crédit, notamment en
faisant apparaître les termes relatifs à la corrélation du défaut. Cependant, les estimations des
sensibilités deviennent rapidement lourdes quand le nombre de facteurs augmentent, surtout si on
les choisit de manière dynamique. Par ailleurs, la quantité d'information à réunir pour obtenir des
estimations correctes est très élevée, même si ces informations sont facilement observables donc
pour ces auteurs c’est le modèle affine qui est le plus meilleur.
Par ailleurs, Arcadius Y. J. AKOSSOU 2014, dans son étude les déterminants de la performance
de remboursement des emprunteurs et des groupes de crédit. Les taux de défaut de
remboursement dans les échantillons considérés sont relativement élevés. Plusieurs facteurs
expliquent ce taux tant au niveau des crédits individuels que de groupe. Le risque de défaut chez
l’emprunteur est lié à la relation de long terme que ce dernier entretien avec la structure, la
garantie mise en jeu pour la demande et le niveau de richesse de l’emprunteur. Le risque de
défaut lié au crédit de groupe s’explique par la distance moyenne des lieux de résidence des
membres par rapport à leur lieu de travail, la fréquence des réunions, l’ethnie, l’activité exercée
17
par les membres, l’importance du montant de crédit demandé et le niveau de richesse des
membres du groupe ;Faute de statistiques existantes en la matière, des données primaires ont été
collectées à partir des dossiers des emprunteurs d’une par La modélisation de la probabilité du
défaut de remboursement a permis de dégager les variables La surveillance des pairs a aussi
l’avantage de favoriser l’assistance des pairs si les raisons de la défaillance sont justifiées. Elle
permet également d’exercer plus de pression en cas de défaillance volontaire. Il trouve le résultat
selon lequel la méthode la plus utilisée pour couvrir les arriérés est la contribution à part égale de
chaque membre est en conformité avec l’affirmation de Huppi et Feder (1990) et les résultats de
Noglo et Androuais (2013), La comparaison des procédures de sélection a montré que la méthode
Backward/Forward en utilisant le critère BIC fait le meilleur choix de sous ensemble de variables
pour la prévision de la probabilité de défaut des crédits dans les institutions des microfinances,
selon eux c’est le modèle Backward/Forward qui est le meilleur dans la probabilité de défaut de
crédit.
Par la suite, Julien DHIMA (2019) dans l’Évolution des méthodes de gestion des risques dans les
banques sous la réglementation de Bâle III La probabilité de défaut PD est estimée en fonction de
la classe de notation de la contrepartie. L’établissement utilise son propre système de notation.
Pour les particuliers et les professionnels la notation est une fonction de variables caractéristiques
de l’emprunteur (âge, endettement, profession, salaire, ancienneté au travail etc.), de variables de
transaction (type de crédit, échéance etc.) et de variables de comportement (nombre de jours non
payés, incidents dans le passé etc.). Pour la grande clientèle (corporates, institutions financières
etc.) elle dépend de variables quantitatives (chiffre d’affaire, résultat net, ROA, ratio Dette/Fonds
Propres etc.), de données qualitatives (positionnement sur le marché, qualité de management,
ancienneté dans le secteur, diversification de l’activité etc.) et de variables comportementales
(existence d’un impayé ainsi que sa durée etc.). En fin de période, la banque doit comparer les
PD estimées aux taux de défaut effectivement réalisés (back-testing). Elle doit également suivre
l’évolution des ratings des contreparties d’une année à l’autre en construisant des matrices de
transition afin d’étudier la stabilité du modèle stress test , La perte en cas de défaut LGD est
estimée en fonction du type de l’actif et du collatéral. Elle correspond au taux de perte
économique et comprend le capital, les intérêts et les frais de recouvrement pour mieux prédire
ces défauts il récommande le modèle probit ou logit.l’auteur considère que ce modèle est plus
meilleur dans la prévision de défaut de crédit dans les IMF ;
18
Contrairement Schreiner (2004) Prédire un modèle sur la probabilité que les prêts de ce prêteur
vont avoir un retard de remboursement de 15 jours ou plus, Il dévélope un modèle du crédit
scoring pour une institution de microfinance Bolivienne, Il trouve le résultat selon lequel en
utilisant les informations relatives à 39.951 prêts qui contiennent 1.987 prêts possédant des
arriérés de 15 jours ou plus, l'auteur prouve que ce modèle peut fonctionner convenablement en
microfinance. Il est supérieur à tous les bons modèles naïfs classiques couramment utilisés par les
prêteurs avec lesquels tous les prêts approuvés par la procédure d'évaluation traditionnelle sont
déboursés,l’auteur prédit par conséquant que le modèle crédit scoring est le plus meilleur dans la
prévision de la probabilité de défaut dans les institutions des microfinances.
Eu égard à ce qui précède, notre étude ayant comme objectif de sélectionner le modèle de
prévision de la probabilité de défaut des crédits dans les institutions des microfinances, nous
avons fait les estimation des modèles logit, probit ,le random forest,support vector machine et
decision tree.
Nous avons trouvés le résultat selon lequel le modèle Random forest est le meilleur modèle pour
la prévision de la probabilité des défauts de crédit dans les institutions de microfinances, Une
attitude plus conservatrice améliore significativement de la performance du modèle dans la
prédiction des mauvais ou des bons emprunteurs.
Le modèle Random forest a un bon pouvoir de prédiction car il prévoit correctement 99.1% de la
prédiction de la probabilité de défaut
19
Les données collectées aussi bien au niveau des bases des données de microfinances ont subies
une phase préliminaire d’analyse simple en utilisant les techniques de statistique descriptive.
Cette description a consisté à calculer des moyennes, des écarts-types, des valeurs minimums, des
valeurs maximums et des proportions.
II.4.1. Méthodes
L’objectif principal de cette recherche est de développer un modèle statistique qui puisse
permettre de distinguer les bons emprunteurs des mauvais. Un emprunteur est considéré comme
bon s’il rembourse (ou a toujours remboursé) correctement son prêt et un mauvais emprunteur
dans le cas contraire. Les données collectées sur les emprunteurs d’une part et sur les
groupements d’autre part ont été exploitées pour atteindre cet objectif. Dans la mesure où la
variable défaut de remboursement est une variable qualitative, la méthode utilisée pour la
modélisation est la régression logistique. Pour cette modélisation, une partie des données est
utilisée pour construire les modèles (estimations des paramètres) et l’autre partie pour la
validation.
L’objectif de la régression logistique est de modéliser une variable qualitative en fonction des
variables quantitatives. Dans le cas où la variable qualitative a deux modalités comme dans la
21
La probabilité a posteriori d’obtenir la modalité 1 de Y sachant la valeur prise par X est notée
p(1/X) (Steve Castanet et al 2008).
En s'alignant sur l'objectif de notre étude qui est de sélectionner le meilleur modèle de prévision
de la probabilité des défauts des crédits dans les institutions des microfinances, discriminant entre
bons et mauvais emprunteurs, nous avons opté pour la régression logistique. Ce type de modèle
recourt à l'approche du maximum de vraisemblance pour estimer les paramètres du modèle. Le
terme d'erreur est supposé suivre une distribution logistique. La régression logistique s'utilise
lorsque la variable dépendante est qualitative, le plus souvent binaire ou dichotomique. Quand
aux variables explicatives, ils peuvent être par contre soit qualitatives soit quantitatives. La
variable dépendante est habituellement la survenue ou non d'un événement (dans notre cas
remboursement avec un retard qui dépasse 30 jours), et les variables explicatives sont
susceptibles d'influencer la survenue de cet événement. Cette méthode présente l'avantage de
quantifier la force de l'association entre chaque variable indépendante et la variable dépendante
en tenant compte de l'effet des autres variables intégrées dans le modèle. La régression logistique
est relativement simple à comprendre et à appliquer, et ses résultats peuvent être aisément
interprétés. Les coefficients estimés par le modèle sont, en effet, liés mathématiquement à l'Odd
Ratio (ou rapport de côtes en français), qui quantifie la force de l'association entre la survenue
d'un événement (retard de remboursement de 30 jours ou plus), représenté par une variable
dichotomique ou binaire et les facteurs susceptibles de l'influencer, représenté par des variables
explicatives. L'Odd Ratio prend des valeurs positives et indique trois situations à savoir :
OR¿ 1: le risque de survenue de l'événement binaire à expliquer est augmenté par la variable
explicative.
OR=1 : la variable explicative (ou sa modalité) n'influe pas sur la variable à expliquer,
22
OR>1 : le risque de survenue de l'événement binaire à expliquer est augmenté par la variable
explicative.
L'Odd Ratio est calculée à partir des coefficients estimés de la régression logistique :
Les modèles de départ sont codifiés qualitativement de façon binaire (dichotomique), le choix
entre le modèle de Régression Logistique (Logit) et Normale (Probit) permet alors de cibler le
vrai modèle qui convient pour la spécification. Dans cette perspective, Hurlin (2003) souligne
que les modèles dichotomiques Logit et Probit admettent pour la variable expliquée, non pas un
codage quantitatif associé à la réalisation d’un événement (comme dans le cas de la spécification
linéaire), mais la probabilité d’apparition de cet événement, conditionnellement aux variables
Dans ce point, il est proposé une discussion succincte sur le choix entre l’utilisation d’un modèle
logit ou d’un modèle probit. En suite intervient le test de normalité et afin la modélisation du
modèle retenu.
(
Pi= prob decr é d=
1
X1 )
f (x ,β)
Ce dernier désigne un vecteur des variables explicatives susceptibles d’influencer la demande des
crédits financés par les IMF. Soulignons par ailleurs que pour estimer la probabilité de défaut de
crédit, nous avions, partant du test de normalité le choix d’utiliser soit la fonction de répartition
de la loi logistique, soit celle de la loi normale centrée réduite.
Hurlin (2003), abordant les conditions d’usage du modèle logit et probit, soutient que le modèle
logit est approprié lorsque la fonction de répartition suit une loi logistique tandis que le modèle
probit est indiqué si la fonction de répartition suit une loi normale centrée réduite. Ces deux
modèles (logit et probit) fournissent des résultats semblables en termes de signe et de
significativité des coefficients. Cependant, les valeurs de ces coefficients ne sont pas directement
comparables mais il est possible d’approximer les valeurs des coefficients du modèle probit à
partir de celles du modèle logit en divisant celles-ci par /√ 3 (Bourbonnais, 2009) ou par 1,6
pour une approximation plus précise (Amemiya, 1981, cité par Hurlin, (2003)).
La probabilité pour que cet événement (la demande de crédit) n’apparaisse pas sera donnée par
Prob ¿
Les Support Vector Machines (SVMs) sont une méthode de classification qui montre de bonnes
performances dans la résolution de problèmes variés tels que la reconnaissance de formes
[Burges, 1998] ou la catégorisation de textes [Joachims, 1998]. Le classifieur est alors un donc
sous-espace vectoriel de dimension N-1 dans un espace de dimension N ✭✭ déplié ✮✮, établit à
l’aide d’un nombre réduit de points : les vecteurs de support. Dans cet article, nous montrons
25
comment les Support Vector Machines peuvent être utilisées pour résoudre des problèmes de
défaut de remboursement de crédit.
L’objectif primordial de support vector machine est de construire une fonction qui permet une de
montrer de bonnes capacités à remplir éfficacement sa mission dans de nombreux domaines.
f(x) = w.x+b = 0 (5) où w ∈ R x ∈ X , b ∈ R et signifiant produit d’un élément par lequel on peut
multiplier les vecteurs d’un espace vectoriel. La propriété remarquable des SVMs est que cet
hyperplan est optimal, c’est-à-dire qu’il maximise la distance minimale (marge) entre les
exemples et le classifieur. Les points les plus proches, qui seuls sont utilisés pour la
détermination de l’hyperplan, sont appelés vecteurs de support (SV).
Le Random Forest
La méthode des Random Forests existe dépuis peu de temps. Elle a été développée par Breiman
(2001). Elle trouve déjà de plusieurs applications dans différents domaines tels que l’écologie
(Brosteaux, 2005) ou l’agriculture (Cutler et al., 2007). Parmi les capacités des RF nous pouvons
citer la possibilité de rendre libre le problème de multi-colinéarité et de la présence de données
manquantes, de permettre le traitement à la fois des variables qualitatives et quantitatives à des
échanges des variables étudiées et de mesurer l’augmentation de l’erreur éventuelle. Par ailleurs
l’interprétation est ensuite facilitée par le calcul d’un indice donnant l’avantage de chaque
variable dans l’agrégation de modèles.
On prédit que l’objectif de l’étude par Random Forests est de rendre compte ou de déceler
l’importance des variables dans un jeu de données. Conférer une importance aux variables
explicatives Xi nous a conduits à examiner la sensibilité de ces variables pour une variable à
expliquer fixée Y. L’importance des variables est donnée par l’indice de Gini, plus cet indice est
élevé plus la variable Xi est importante (S. Taibi-Hassani et al 2013).
En suite ce modèle est constitué de plusieurs centaines d’arbres de décision qui vont prendre part
pour prédire le risque de probabilité de défaut de crédit dans les institutions des microfinances
26
comme dans notre cas, ce sont les informations sur le défaut de crédit et quelques caractéristiques
biométriques qui participent à fournir les meilleures prédictions.il consiste de plus à évaluer le
modèle qui a été auparavant optimisé ou amélioré sur des données inconnues et ainsi chercher à
connaitre la qualité des prédictions.
Et donc pour le modèle Random Forest il consiste à diminuer la prédiction de faux négatifs.
Cependant cette action a pour conséquence de diminuer la précision ce qui s’accompagne d’une
augmentation de la prédiction de faux positifs.
arbre de décision
Il est définit comme un ensemble de règles de classification basant leur décision sur des tests
associes aux informations, de manière à organiser les données de façon logique et hiérarchisée,
utilisant une structure algorithmique d’arbre.
Cet arbre a comme organisation nœuds internes (nœuds de décision) : identifié par des tests ´
applicables à toute action de décrire une sollicitation pressante. Généralement, un nœud interne
est un test sur ce qui est propre et particulier à un être ; Arcs issus d’un nœud interne : réponses
possibles au test du nœud ; Feuilles de l’arbre : identifiées par une classe ; Chaque nœud interne
ou feuille, est marquée par sa position (listes des numéros des arcs qui permettent d’avoir un
accès en partant de la racine.
Et donc tout arbre de décision définit un Classifier qui se traduit aussitôt en terme de règles de
décision de beaucoup d’avantages des arbres de décision aisément interprétables et classification
très rapide. Dans cette étude cet arbre permet de prendre de décision pour le meilleur modèle
pour prévenir la probabilité de défaut dans les IMF.
Etant donné que l'objectif de ce travail, nous distinguons les bons emprunteurs des mauvais,
nous avons jugé nécessaire de faire tout d'abord la distinction entre ce que nous entendons par
bons et mauvais emprunteurs. Ainsi, un emprunteur est considéré comme bon s'il a remboursé
son prêt avec un retard de remboursement inférieur à 30 jours. Par contre, un mauvais emprunteur
27
est un emprunteur qui a connu au moins une fois un retard de remboursement de son prêt de 30
jours ou plus.
Ecart temps entre la date de Ecart Temp Cette variable indique le nombre des jours
demande de crédit et celle compris entre la date de demande de crédit et celle
d’octroi de crédit d’octroi de crédit
Nombre des cycles NBRECYCL Il s’agit du nombre de fois que le client a déjà
demandé le crédit depuis son adhésion dans
l’institution.
31
La maturité moyenne de la période est de 11,59% (valeur max. 100%, valeur min.0% et écart
type de 1.48%). Quant à l’Objet crédit, 0,83% est le taux moyen (une valeur maximale de 100%,
une dispersion très grande au-delà de la moyenne et une valeur minimale de 0%). La rentabilité
économique est de 0,47% (valeur maximale 95%, valeur minimale 10 % et écart type de 0,19)..
S’agissant du ratio crédit, le score moyen est de 0,63.la rentabilité opérationnelle représente en
moyenne, 0,47 %, et la taille minimale de 10.9% et la valeur maximale de 95%. Quant à l’âge
41.35 ans est la moyenne globale, la valeur minimale est de 18 et la valeur maximale est de 67.
32
Le tableau présente les valeurs moyennes et les écarts-types des caractéristiques quantitatives
relatives aux emprunteurs. Le tableau présente l’effet des variables catégorielles sur le défaut de
remboursement selon les catégories. De l’examen de ce tableau, il apparait que la maturité, le
sexe, l’âge, l’objet de crédit, le rationnement de crédit, le nombre de cycles, l’indication sur le
prêt antérieur autrement la relation de l’emprunteur avec l’agence, le ratio d’endettement ont un
effet sur le défaut de remboursement. Dans le même constant la rentabilité économique et la
rentabilité opérationnelle influencent la qualité de l’emprunteur. Il se constate que les clients en
retard de paiement depuis une très longue durée, tel un an ou plus, comme n’étant pas encore
officiellement en défaut, peut être assimilé à un manque de transparence ; le prêt est simplement
défaillant, le taux de remboursement peut aussi provenir de défaut en terme de gestion de la part
des institutions sur une forme du prêt ou être dû en partie à la clientèle.
RISK MAT SEX AGE OBJCRE RATIOCRE LOCAG NBRECYCL RATEND RTECO RTOP
RISK 1
MAT 0.108 1
-
NBRECYCL -0.233*** -0.00852 -0.0477 0.123* -0.111 -0.104 0.149** 1
RTECO -0.00128 -0.275*** -0.0356 0.0136 -0.0167 -0.0429 -0.0322 -0.0689 -0.0179 1
RTOP 0.117* -0.124* -0.0299 -0.00426 -0.0475 0.104 0.121* -0.141* -0.125* 0.187** 1
Le tableau montre que les trois premières variables: RISK, MAT et SEX appartiennent à un
groupe similaire puisque leur corrélation en valeur absolue est relativement forte (sauf pour la
variable AGE). Au contraire, la corrélation entre les variables objet de crédit et les autres
variables est très faible, on peut donc prévoir que ces variables vont former une dimension à part
dans l'analyse factorielle. La matrice de corrélation est utilisée pour extraire les facteurs à travers
une analyse en composante principale.
Par ailleurs, nous pouvons soupçonner l’existence d’un faible (même très faible) taux de
multicolinéarité entre les variables indépendantes des facteurs de prévision d’un modèle de
probabilité des défauts de crédit dans les IMF (au regard des coefficients de corrélation qui ne
dépassent pas 50% en termes de liaison). Sauf pour les quelques cas analysés précédents, et
encore plus que les corrélations sont non significatives statistiquement. Ici il est possible de
souligner une liaison partielle. Pratiquement, les tests de détection de la multi colinéarité de
Faraar et Glauber, et de Klein peuvent cerner les cas de multicolinéarité. Celui de Klein consiste
à comparer le coefficient de détermination du modèle R² et les coefficients de détermination R ij²
entre variables explicatives considérées deux à deux. Il y a présomption de multicolinéarité
lorsque la plupart des Rij² sont supérieurs au R2. Dans le cas où les regresseurs sont orthogonaux
(c'est-à-dire indépendants), la matrice présentant la décomposition de la variance en termes de
contribution de chaque variable indépendante dans la variance totale devrait être égale à la
matrice unitaire. On pourrait examiner la dépendance de la variance vis-à-vis des principales
variables exogènes, en se focalisant sur les variables ayant un « nombre de condition » élevé. Le
nombre de condition est une mesure de la dépendance des variables indépendantes. Le tableau
des coefficients de corrélation met en évidence, d’une part, des très faibles corrélations entre les
variables explicatives. C’est le cas, par exemple des variables telles que : le ratio d’endettement
(r=-0.0666), la rentabilité économique (r=0.0689),la localisation des clients dans l’agence (r=-
0.0911), … ; (pour les modèles 1&2). Ainsi que les corrélations entre les variables telles que : la
rentabilité opérationnelle (r=0.029), ratio crédit (r=-0.0217), … ; . Par conséquent, il apparait
raisonnable de conclure que la présomption de liaison soit partielle, et moins pertinente.
34
(1) (2)
Logit Probit
VARIABLES Défaut Defaut
Les résultats définitifs des régressions logistiques binaires (modèles 1&2) et à choix ordonnés
montrent clairement plus de significativité (en nombre de variables et en robustesse) des variables
indépendantes dans la sphère de tous les modèles. On cite dans le modèle 1, les
variables : maturité (à 13%), l’objet crédit (à 56%), ratio crédit (à 46%), localisation dans
l’agence (à 34%), nombre de cycle (à 20%), ratio d’endettement (97%), rentabilité économique
(83%), et la rentabilité opérationnelle (à 93%). Dans le modèle 2, les variables : maturité (à 7%),
35
l’objet crédit (à 32%), ratio crédit (à 25%), localisation dans l’agence (à 20%), nombre cycle (à
11%), ratio d’endettement (52%), rentabilité économique (48%), et la rentabilité opérationnelle
(53%).
Les paramètres avec des coefficients positifs influencent positivement la probabilité de défaut et
ceux munis de coefficients négatifs l’affecte négativement. Dans cette équation, on constate que
(AGE qui est considéré comme le nombre d’années que le client a déjà vécu), le nombre des fois
que le client a déjà demandé le crédit depuis son adhésion dans l’institution (NBRECYL), le ratio
d’endettement (RATEND) réduit la probabilité de défaut quand ils augmentent. Au contraire, la
maturité qui est une variable qui représente le crédit exprimé en nombre de mois (MAT), Le sexe
du client, l’objet de crédit, le rationnement de crédit, la localisation d’agence, la rentabilité
économique et la rentabilité opérationnelle ont une relation positive avec la probabilité de défaut.
On constate que plus les conditions financières sont élevées, plus grande est la probabilité de
défaut. L’exigence de conditions financières vise au moins deux objectifs. Premièrement, les
conditions financières visent à tester la disposition de l’emprunteur à contribuer financièrement
au projet à financer et son engagement envers ce projet et deuxièmement, elles visent à sécuriser
l’institution contre le risque de crédit. On constate que l’Object de crédit, le ratio de crédit et la
rentabilité opérationnelle influence le défaut de remboursement des crédits dans les institutions
des microfinances.
La variable dépendante est habituellement la survenue ou non d'un événement (dans notre cas
remboursement avec un retard qui dépasse 30 jours), et les variables explicatives sont
susceptibles d'influencer la survenue de cet événement. On constate l'avantage de quantifier la
force de l'association entre chaque variable indépendante et la variable dépendante en tenant
compte de l'effet des autres variables intégrées dans le modèle. Par ailleurs ces résultats peuvent
être aisément interprétés. Les coefficients estimés par le modèle sont, en effet, liés
mathématiquement à l'Odd Ratio (ou rapport de côtes en français), qui quantifie la force de
l'association entre le survenue d'un événement (retard de remboursement de 30 jours ou plus),
représenté par une variable dichotomique ou binaire et les facteurs susceptibles de l'influencer,
représenté par des variables explicatives. L'Odd Ratio prend des valeurs positives et indique trois
situations à savoir :
36
OR¿ 1: le risque de survenue de l'événement binaire à expliquer est augmenté par la variable
explicative.
OR=1 : la variable explicative (ou sa modalité) n'influe pas sur la variable à expliquer,
OR>1 : le risque de survenue de l'événement binaire à expliquer est augmenté par la variable
explicative.
L'Odd Ratio est calculée à partir des coefficients estimés de la régression logistique.
Le modèle prédictif se concentre sur la grande capacité de prédiction des indicateurs mesurés, la
démarche permet de sélectionner un des modèles pour la prévision de la probabilité de défaut de
remboursement dans les institutions des microfinances.
Précisio
Model/Indicator n Sensibilité Spécificité
prédiction supérieure aux autres modèles comparatifs, cette prédiction est bien sûre, variable
selon les domaines d’analyse. Ces tailles ou son niveau de précision, de sensibilité et spécificité
peuvent paraître modeste mais elles doivent être confrontées à d’autres modèles et surtout au
besoin de la recherche. L’autre apport du modèle est d’apprécier le poids relatif de chaque facteur
dans la prédiction du de probabilité de défaut de remboursement. On trouvera que soit l’attitude,
soit la norme subjective, soit le contrôle perçus prédit le meilleur modèle pour la probabilité de
défaut de crédit.
Les modèles testés présentent une précision, sensibilité et une spécificité. Le pourcentage d'erreur
de classement d'un bon emprunteur dans la catégorie «mauvais emprunteur». Le pourcentage
d'erreur de classement d'un mauvais emprunteur dans la catégorie «bons emprunteurs». En d'autre
terme, ces modèles permettent de prédire et avec succès le fait d'être un mauvais emprunteur,
alors qu'être un bon emprunteur sera prédit avec succès. Les résultats montrent également que ces
modèles permettent de classer correctement la prévision de probabilité de défaut des crédits dans
les institutions de microfinances. Ces résultats pourraient être plus forts en terme de capacité
prédictive.
On constate que le modèle probit prédit correctement 77,2% de précision sur 48,8 de sensibilité
et 87,8 de spécificité pour la prévision de la probabilité des crédits dans les institutions de
microfinances ;le modèle Logit nous fournit un pourcentage de 77,8% pour la précision,51,1%
pour la sensibilité et 87,8% pour la spécificité, decision trees 87,6% pour la précision,75% pour
la sensibilité et 92,3% pour la spécificité,le Support vector machine 85,3% pour la
précision ;55,9% pour la sensibilité et 96,4% pour la spécificité ; la Random forest nous fournis
un pourcentage elevé plusque les autres modèles de 98,3% de précision,96,4% de sensibilité et
99,1% de spécificité. A travers ces résultats il se constate que le modèle Random forest est le
meilleur modèle pour la prévision de la probabilité des défauts de crédit dans les institutions de
microfinances , Une attitude plus conservatrice améliore significativement de la performance du
modèle dans la prédiction des mauvais ou des bons emprunteurs.
Le modèle Random forest a un bon pouvoir de prédiction car il prévoit correctement 99.1% de la
prédiction de la probabilité de défaut.
Il
se constate ici d’une représentation graphique basée sur petit ensemble de forme géométrique
connecté par des arcs orientés.
Les formes sont considérées comme les nœuds particuliers appelés racine ; en suivant un arc, le
premier nœud est le parent et le second est appelé fils.
En effet, l’avantage de cet arbre des décisions est d’utiliser ces formes géométriques pour
détecter le meilleur modèle de prévision de la probabilité des crédits dans les institutions de
microfinances.
Il bien entendu que réévaluer l’arbre peut être construit sur l’échantillon test pour déterminer la
meilleure solution.
En effet, l’échantillon devient partie prenante dans la construction du modèle, il joue le rôle
d’échantillon de réglage. On constate que, cet arbre de décision a des caractéristiques selon les
points forts et les point faibles ; le présent arbre de décision présente des performances
comparables aux autres modèles supervisés.
De ce fait, il est possible avec cet arbre de décision de trouver une représentation qui apporte une
solution à tous problèmes au cas où plusieurs modèles décrivent de la même manière des
étiquettes différentes. Cela ne veut pas dire pour autant qu’un algorithme d’induction d’arbre est
capable de trouver la solution.
En effet, le principe de construction pas à pas, local sur chaque sommet qualifié de myope
(kononenko et al,1997), empêche de trouver la solution.
39
Nous avons trouvés que le modèle Random forest est le meilleur modèle pour la prévision de la
probabilité des défauts de crédit dans les institutions des microfinances , Une attitude plus
conservatrice améliore significativement de la performance du modèle dans la prédiction des
mauvais ou des bons emprunteurs.
Le modèle Random forest a un bon pouvoir de prédiction car il prévoit correctement 99.1% de la
prédiction de la probabilité de défaut.
Ces résultats sont similaires à ceux décrits dans les travaux de Steve Castanet et Romain Mazoué
(2022) qui ont utilisé aussi de données chronologiques ayant cherché tout d’abord la
stationnarité de ces données avec le test de ADF sur les rendements, Steve Castanet et Romain
Mazoué dans la Modélisation des corrélations de défauts dans l'analyse du risque de crédit avec
comme objectif l'utilisation des modèles est de pouvoir spécifier des facteurs afin de modéliser la
corrélation des défauts existant dans les portefeuilles de créances détenues par les banques.
L'objectif de ce modèle de décrire les différentes étapes qui, grâce aux modèles affines en temps
discret vont permettre d'étudier la relation entre les spreads des crédits observés et les prix des
obligations. Il est alors possible de relier les probabilités historiques et probabilités risques
neutres. Il trouve le résultat selon lequel le modèle permet d'étudier précisément les
composantes du spread de crédit, notamment en faisant apparaître les termes relatifs à la
corrélation du défaut. Cependant, les estimations des sensibilités deviennent rapidement lourdes
quand le nombre de facteurs augmentent, surtout si on les choisit dynamiques
Arcadius Y. J. AKOSSOU 2014, qui ont fait recours au modèle random forest dans l’étude de
déterminants de la performance de remboursement des emprunteurs et des groupes de crédit. Les
taux de défaut de remboursement dans les échantillons considérés sont relativement élevés.
Plusieurs facteurs expliquent ce taux tant au niveau des crédits individuels que de groupe. Le
risque de défaut chez l’emprunteur est lié à la relation de long terme que ce dernier entretien avec
la structure, la garantie mise en jeu pour la demande et le niveau de richesse de l’emprunteur. Le
41
risque de défaut lié au crédit de groupe s’explique par la distance moyenne des lieux de résidence
des membres par rapport à leur lieu de travail, la fréquence des réunions, l’ethnie, l’activité
exercée par les membres, l’importance du montant de crédit demandé et le niveau de richesse des
membres du groupe ;Faute de statistiques existantes en la matière, des données primaires ont été
collectées à partir des dossiers des emprunteurs d’une par La modélisation de la probabilité du
défaut de remboursement a permis de dégager les variables, la surveillance des pairs a aussi
l’avantage de favoriser l’assistance des pairs si les raisons de la défaillance sont justifiées. Elle
permet également d’exercer plus de pression en cas de défaillance volontaire. Il trouve le résultat
selon lequel la méthode la plus utilisée pour couvrir les arriérés est la contribution à part égale de
chaque membre est en conformité avec l’affirmation de Huppi et Feder (1990) et les résultats de
Noglo et Androuais (2013), La comparaison des procédures de sélection a montré que la méthode
Backward/Forward en utilisant le critère BIC fait le meilleur choix de sous ensemble de variables
pour la prévision de la probabilité de défaut des crédits dans les institutions des microfinances.ils
trouvent que leur modèle est capable de fournir des prévisions précises de la probabilité de défaut
de crédit dans les institutions des microfinances, dans notre contexte nous nous sommes basés sur
l’évolution des crédits dans le passé pour parvenir à prévoir ce modèle dans le futur et nous
avons aussi trouvé que notre modèle était plus précis dans la prévision de probabilité de crédit
dans les institutions des microfinances.
CONCLUSION
Ce travail a porté sur la sélection d’un modèle de prévision de la probabilité de défaut des crédits
dans les institutions de microfinances le cas de FINCA. L’étude s’est fondée sur deux
préoccupations principales. D’abord, Analyser les différents modèles pour la prévision de défauts
des crédits dans les institutions des microfinances en suite analyser l’avantage de ce modèle dans
la prévision de probabilité des défauts de remboursement de crédit dans les institutions des
42
microfinances où nous avons montré le modèle qui convient dans la prévision de probabilité de
crédit dans les institutions des microfinances et montre l’avantage de ce modèle.
Au tour de trois chapitres, mis à part l’introduction et la conclusion, ce travail a été organisé. Le
premier a porté sur la revue de la littérature théorique et empirique, le deuxième chapitre sur la
méthodologie et enfin le troisième sur la présentation et discussion des résultats
Nous avons utilisés les différents modèles, nous avons fait les estimations des modèles logit,
probit et le random forest,support vector machine et decision tree.
Nous avons trouvés que le modèle Random forest est le meilleur modèle pour la prévision de la
probabilité des défauts de crédit dans les institutions de microfinances , Une attitude plus
conservatrice améliore significativement de la performance du modèle dans la prédiction des
mauvais ou des bons emprunteurs.Le modèle Random forest a un bon pouvoir de prédiction car il
prévoit correctement 99.1% de la prédiction de la probabilité de défaut.
Les méthodes qui nous ont permis de réaliser nos différents tests économétriques ne sont pas
certes exemptées d’insuffisances, étant donné que notre modèle de regression logistique,probit et
logit, peut-être nos résultats seraient probablement encore plus fiables que ceux que nous avons
obtenus.
BIBLIOGRAPHIE
16. Gutiérrez-nieto b., serrano-cinca c., molinero c. m., 2005, « microfinance institutions and
efficiency”, omega international journal of management science, 35, 131- 142.
17. Gutiérrez-nieto b., serrano-cinca c., molinero c. m., 2007, “social efficiency in
microfinance institutions”, journal of the operational research society, november, 1-16.
18. Hocking r. r. [1976]. the analysis and selection of variables in linear regression.
biometrics 32, 1- 49.
19. Honlonkou a.n., 2002, evaluation de la performance de remboursement dans les
institutions de micro-finance au benin’, mondes en developpement n° 119: la
microfinance et l’evolution des systemes financiers. 30, 73–77
20. Honlonkou a. n., acclassato d. h. et quenum c. v. c. (2006). determinants de la
performance de remboursement dans les institutions de microfinance au benin. annals of
public and cooperative economics 77 (1), 53–81.
21. Hurlin, Ch. (2003), Cours d’économétrie des variables quantitatives, modèles
dichotomiques univariées, Faculté des sciences économiques et de gestion, Université
d’Orléans, Orléans-la-Source, inédit
22. Koffi mowu,2019, les facteurs determinant la performance de credits de remboursement
23. dans les imf,togo,pg 331-337.
24. Lahcen el kharti,2014, les determinants de la viabilite des institutions de microfinance au
maroc : une analyse en donnees de panel,pg 3-15.
24. M. hudon et t. ouro-koura 2006, etude des facteurs contingents du taux de remboursement
au 25. sein d’une institution de microfinance: le cas du togo,pg 3-16.
28. Maurice armand djontu**, joseph nzongang,2018, les determinants de l’efficience des
institutions de microfinance au cameroun,pg 5-19
45
32. Rosaline dado worou, 2019,impact des pratiques de gestion des ressources humaines sur
l’acceptation de l’erp dans les entreprises en afrique : cas de deux entreprises en afrique
de l’ouest,belgique,pg 8-26.
33. Steve castanet et romain mazoue, 2008, modelisation des correlations de defauts dans
l'analyse du risque de credit,pg 4-19.
34. Viganò, laura. (1993). “a credit scoring model for development banks”: an african case
study, savings and development, n4-xvii
35. Wenner m. (1995). group credit: a means to improve information transfer and loan
repayment performance, j. dev. stud., 32 (2), 263-281.
36. Yawo agbenyegan noglo, 2013,la micro-finance est-elle une solution efficace aux causes
du rationnement bancaire ? une analyse econometrique a travers les modeles probit et
binomial negatif,togo,6-18.