Memoire Corigé Patrick Cibasa

I
République Démocratique du Congo

ENSEIGNEMENT SUPERIEUR ET UNIVERSITAIRE
UNIVERSITE OFFICIELLE DE BUKAVU
U.O.B
BP : 570 /BUKAVU
FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION

DEPARTEMENT DE GESTION FINANCIERE
Sélection d’un modèle de prévision de la probabilité de défaut de

crédit dans les institutions des micro finances
Mémoire présenté et défendu en vue de l’obtention du

diplôme de licence en Sciences économiques et de gestion,
département de Gestion Financière
Par KULONDWA CIBASA Patrick
Encadré par Assistant IRENGE Alain
Directeur : Prof. Dr. MATABARO BORAUZIMA Luc
Année académique 2022 – 2023

I
DECLARATION D’AUTHENTICITE
DECLARATION D’AUTHENTICITE
Moi, KULONDWA CIBASA Patrick, déclare sur mon honneur que ce mémoire est mon
travail original, qu'il n'a jamais été déposé dans aucune autre université ou institut supérieur
en vue de l'obtention d'un quelconque titre académique, et n'a jamais fait l'objet d'une
quelconque publication par le passé. Là où je me suis inspiré des travaux d’autres auteurs,
ceux-ci ont été reconnus et dûment référencés.
Signature : ……………………………………… Date……………………………….

Nom de l’Etudiant
CONSENTEMENT
CONSENTEMENT
Nous certifions que ce travail a été produit sous notre direction et/ou encadrement et a été déposé à la
faculté avec notre consentement.
Signature : ……………………………………… Date……………………………….

Nom de l’Encadreur
Signature : ……………………………………… Date……………………………….

Nom du Directeur
II
EPIGRAPHE
« L’insuffisance de ressources financières n’étant qu’un problème parmi d’autres, considérer la
microfinance comme une panacée pour éradiquer la pauvreté serait lui prêter des vertus
excessives. Par ailleurs selon la manière dont il est mis en œuvre et vécu par les emprunteurs, il
peut tout aussi bien alléger la pauvreté que l’alourdir en aggravant l’insolvabilité des
bénéficiaires »
Guerin,1999.
III
KULONDWA CIBASA Patrick

IV
DEDICACE
A mon père, A ma mère, A mes frères et sœurs.

V
REMERCIEMENTS
Nos remerciements s’adressent en premier lieu à l’Eternel Dieu Tout Puissant ; père céleste pour
sa grâce et sa bienveillance qu’il ne cesse de nous accorder.
Au corps académique de l’Université Officielle de Bukavu et plus particulièrement à la faculté

des sciences économiques et de gestion pour leur formation intégrale.
Notre profonde reconnaissance envers le Prof. Dr. Matabaro Borauzima Luc et à l’Ass Irenge
Alain respectivement directeur et encadreur de ce mémoire. Leurs remarques, conseils et
encouragements ont été d’une grande importance tout au long de cette recherche. Nous leur
exprimons notre gratitude pour tout ce qu’ils nous ont apporté dans le but de rendre excellent
cette œuvre et pour la confiance et le privilège qu’ils m’ont accordés.
A nos parents Emmanuel cibasa et Feza charlotte pour ses différents efforts pour notre
scolarisation ;
Enfin, certaines personnes ne sont pas nommément citées ici par souci de concision. Cependant,
que tous ceux et toutes celles qui reconnaissent m’avoir aidé, de quelque façon que ce soit,
trouvent ici mes sentiments de profonde gratitude.
Nos plus sincères remerciements s’adressent aussi à nos frères Murhula Cibasa Justin, Jado
Cibasa,Roger Cibasa,Crispin Cibasa,Amani kaningu,Dieumerci rugango,Amani mulinga,Aksanti
mulinga,Shukuru lwikungu, sœurs Mapendo cibasa,Immaculee cibasa,Gisele cibasa ;Mugoli
cibasa,Jeanne d’arc cibasa, Marie salome cibasa,Francine cituli,Godelive cituli,Jado
sanvura,Kujirabwinja claver,Thiery mugisho,Toni iragi,Prince byenda,Pascal assani; amis et
toute autre connaissance pour leur soutien pour notre formation intellectuelle.
A mon amie de près Laetitia katabana ;
A tous,nous exprimons notre profonde gratitude.
VI

VII
SIGLES ET ABBREVIATIONS
COOPEC : Coopérative d’Epargne et de Crédit
CSSFD : Cellule de Surveillance des Systèmes Financiers Décentralisés
FCFA : Francs des Colonies Françaises en Afrique
FECECAM : Fédération des Caisses de Crédit Agricole et Mutuel
IMF : Institution de microfinance
ONG : Organisation Non Gouvernementale
OR : Odd Ratio
PADME : Association pour la Promotion et l’Appui au Développement des

Microentreprises
PD : Probabilité de Défaut
RDC : République Démocratique du Congo
SFD : Systèmes Financiers Décentralisés

V
TABLE DES MATIERES

DECLARATION D’AUTHENTICITE............................................................................................I
EPIGRAPHE...................................................................................................................................II
DEDICACE....................................................................................................................................III
REMERCIEMENTS......................................................................................................................IV
SIGLES ET ABBREVIATIONS...................................................................................................VI
TABLE DES MATIERES...............................................................................................................V
LISTE DES TABLEAUX ET FIGURES.....................................................................................VII
RESUME.....................................................................................................................................VIII
CHAP I : REVUE DE LA LITTERATURE ET DEFINITION DES HYPOTHESES..................7
I.1. REVUE THEORIQUE ET DEFINITION DES HYPOTHESES....................................7
I.1.1. Définitions des concepts..................................................................................................7
1.2. REVUE DE LA LITTERATURE THEORIQUE...........................................................12
I.3. REVUE EMPIRIQUE.......................................................................................................16
CHAP II : CADRE D’ETUDE ET APPROCHE METHODOLOGIQUE....................................19
II.1. Collecte des données.........................................................................................................19
II.2. Analyse des données.........................................................................................................19
II.3. Catégorisation des emprunteurs.....................................................................................19
II.4. Prédiction de la probabilité de défaut de remboursement (emprunteur)...................20
II.4.1. Méthodes......................................................................................................................20
II.4.2. Régression logistique....................................................................................................20
II.5. Estimation des paramètres...............................................................................................22
II.6. Présentation des outils de collecte et de traitement des données..................................27
II.7. Justification du choix des variables.................................................................................27
Chapitre Troisième : PRESENTATION ET DISCUSSION DES RESULTATS..........................31

VI
III.1. PRESENTATION ET INTERPRETATION DES RESULTATS..............................31
III.2. INDICATEURS POUR LA SELECTION DU MODELE DE PREDICTION...................36
III.2. DISCUSSION DES RESULTATS.......................................................................................40
CONCLUSION..............................................................................................................................42
BIBLIOGRAPHIE.........................................................................................................................43
VII
LISTE DES TABLEAUX ET FIGURES

Tableau n° 1 Synthèses des variables
Tableau n° 2. Synthèses des variables
Tableau n° 3: Statistiques descriptives
Tableau n° 4: Matrice de corrélation
Tableau n° 5 : Résultats de régression
Tableau n° 6: : Indicateurs pour la sélection du modèle de prédiction
Figure 1 : Arbre de décision (Décision trees)

VIII
RESUME
Contexte et objectif : Les institutions de la microfinance (IMF) sont spécialisées dans la collecte
de l’épargne et de l’offre de microcrédit à une partie de la clientèle, ne pouvant pas accéder à un
crédit bancaire classique pour défaut de garanties pouvant couvrir le risque lié au non
remboursement de leur prêt. De ce fait, on assiste à une massification croissante de l’offre de
microcrédit dans les pays en développement dont le revenu des ménages reste modeste. En
d’autres termes, l’accès au microcrédit, des ménages pauvres, devient de plus en plus élargi d’où
la hausse de l’encours de microcrédit de la part des IMF. L’objectif de cette étude est de
sélectionner le modèle de prévision de la probabilité de défaut des crédits dans les institutions des
microfinances, nous avons fait les estimations des modèles logit, probit et le random forest, logit,
probit,support vector machine et decision tree.
Méthodologie → Avec une observation des données secondaires, nous avons utilisé les modèle
nous avons fait les estimations des modèles logit, probit et le random pour prévoir la probabilité
de défaut de crédit dans les institutions des microfinances.
Résultats → Sur base des critères d’un logiciel R nous ous avons trouvé que que le modèle
Random forest est le meilleur modèle pour la prévision de la probabilité des défauts de crédit
dans les institutions de microfinances, une attitude plus conservatrice améliore significativement
de la performance du modèle dans la prédiction des mauvais ou des bons emprunteurs.
Le modèle Random forest a un bon pouvoir de prédiction car il prévoit correctement 99.1% de la
prédiction de la probabilité de défaut.
Contribution et originalité →la recherche mise sur la sélection d’un modèle de probabilité de
défaut de crédit dans les institutions des microfinances, celle-ci sera un élément clé pour une
bonne prévision, elle sera une bonne source de la théorie de signal afin de permettre aux
institutions de microfinances de prendre des décisions éclairées et mettre en place des stratégies
conformes à la situation de donner le crédit aux emprunteurs. C’est une source d’inspiration pour d’autres
chercheurs qui seront dans le même cadre de cette étude.
Mots clés : Défaut des crédits

1
INTRODUCTION
Les institutions de la microfinance (IMF) sont spécialisées dans la collecte de l’épargne et de

l’offre de microcrédit à une partie de la clientèle, ne pouvant pas accéder à un crédit bancaire
classique pour défaut de garanties pouvant couvrir le risque lié au non remboursement de leur
prêt. De ce fait, on assiste à une massification croissante de l’offre de microcrédit dans les pays
en développement dont le revenu des ménages reste modeste. En d’autres termes, l’accès au
microcrédit, des ménages pauvres, devient de plus en plus élargi d’où la hausse de l’encours de
microcrédit de la part des IMF. La massification de l’offre de fonds prêtables ou la hausse de
l’encours de crédit est une résultante de la hausse des remboursements (baisse du risque de non
remboursement) constatée au niveau des IMF. Cette situation permet, d’une part, le
renouvellement des fonds prêtables et d’autre part, une viabilité financière et institutionnelle des
IMF. ( Guérin 2000)
Cependant on prédit que l’utilisation d’un modèle peut aider à réduire les coûts d'octroi des prêts
aux emprunteurs. Cette technique compare les données quantitatives et qualitatives relatives à
l'emprunteur, au prêt, et au prêteur avec des cas passés semblables. Le partage des mêmes
caractéristiques avec les cas passés qui ont eu des problèmes de remboursement est un signe que
le prêt courant aura aussi des problèmes de remboursement. Les prêteurs par carte de crédit dans
les pays riches octroient chaque année un nombre massif de petits prêts, à court terme, et à faible
coût depuis qu'ils se servent des modèles statistiques sont faciles à réaliser et qui prévoient
exactement le risque des emprunteurs potentiels (Lewis 1990)
Par ailleurs un des moyens de contrôler les effets négatifs des asymétries informationnelles et les
coûts de transactions est l'utilisation du modèle crédit scoring. Le scoring peut aider à réduire les
coûts d'octroi des prêts aux emprunteurs. Cette technique compare les données quantitatives et
qualitatives relatives à l'emprunteur, au prêt, et au prêteur avec des cas passés semblables. Le
partage des mêmes caractéristiques avec les cas passés qui ont eu des problèmes de
remboursement est un signe que le prêt courant aura aussi des problèmes de remboursement. Les
prêteurs par carte de crédit dans les pays riches octroient chaque année un nombre massif de
petits prêts, à court terme, et à faible coût depuis qu'ils se servent des modèles statistiques
nommés scorecard qui sont faciles à réaliser et qui prévoient exactement le risque des
emprunteurs potentiels (Lewis, 1990). Bien évidemment, les micro prêteurs utilisent également
2
un type de scoring implicite et subjectif du fait qu'ils évaluent les emprunteurs en se basant sur
leurs propres expériences et leurs connaissances historiques. La plupart des recherches (Berger,
Frame & Miller, 2002 ; Frame, Padhi & Woosely, 2001 ; Martell, Panichelli, Strauch & Taylor-
Shoff, 1999), suggèrent que le scoring combiné avec les bureaux de crédit ont le potentiel
d'améliorer considérablement les résultats des prêts formels dans les pays à haut revenu. Avec
une bonne connaissance du risque, les prêteurs peuvent approuver des emprunteurs pauvres mais
sûrs et rejeter des emprunteurs non pauvres mais risqués. Ainsi, les prêteurs peuvent gagner du
temps qui aurait dû être gaspillé dans des emprunteurs délinquants et, par conséquent, peuvent
déployer le temps gagné dans la recherche d'autres emprunteurs (Schreiner et al 2002).
En effet, les auteurs des modèles du crédit trouvés dans la littérature se basent uniquement dans
la formulation de ces modèles sur les emprunteurs acceptés et ils ne prennent pas en
considération les cas rejetés. Cet inconvénient est de nature à biaiser l'estimation ainsi que les
résultats issus du modèle (Ben Soltane Bassem 2008).
De plus dans le contexte actuel du financement du développement en Afrique subsaharienne,

plusieurs arguments justifient l’importance de cette problématique. Une bonne performance en
matière de remboursement est cruciale pour la pérennité´ des IMF et l’élargissement de l’accès
des défavorises aux services financiers. Or, dans le contexte informationnel caractéristique des
pays de l’Afrique subsaharienne, les prêts octroyés par les IMF sont de plus en plus risques.
Selon plusieurs auteurs, les problèmes d’imperfection des marchés sont plus prononcés dans les
pays en développement caractérisés par une intervention massive de l’Etat et beaucoup de
rigidités structurelles (Kirkpatrick et Weiss, 1996; Brent, 1998). L’environnement des
microentreprises est caractérisé´ par un cadre fiscal et réglementaire rigide et souvent inadapté à
la réalité, par des marchés incertains, fluctuants et fortement concurrentiels, par des difficultés
d’approvisionnement et d’actualisation des qualifications techniques (Botzung et Bissonais,
1998). Cette grande imperfection du marché financier, exacerbée par l’importance du secteur
informel (Lanha, 2002), est susceptible d’accroitre les coûts liés aux défauts de paiement et la
fragilité des structures de financement. Sur le plan pratique, les recommandations qui sont issues
de la présente investigation pour la conduite à tenir par les IMF permettraient de faciliter un accès
plus accru des petits opérateurs économiques au crédit (Lanha, 2002).
3
En revanche la somme des caractéristiques pondérées définit la probabilité que le prêt, une fois
déboursé, va être "mauvais", où mauvais est défini par le prêteur. Les poids de chaque
caractéristique dans la fiche d'évaluation sont basés sur une analyse statistique du rapport entre la
caractéristique et le remboursement dans la base de données historique du prêteur. Une fois la
fiche d'évaluation statistique est achevée, le micro prêteur peut en servir dans son travail
quotidien. Il peut adopter un système de cotation à quatre niveaux «sûr», «normal», «risqué», et
«très risqué». Les emprunteurs dont les risques estimés par la fiche d'évaluation statistique
indiquent qu'ils sont «sûrs» sont rapidement acceptés et même peuvent être qualifiés pour des
lignes de crédit ou d'autres récompenses avantageuses. Les candidats dont les risques estimés
«normaux» sont agréés comme d'habitude et comme si les micro prêteurs n'avaient pas utilisées
aucune fiche d'évaluation statistique. Pour contrôler le risque des candidats «risqués», le comité
du crédit devra examiner attentivement ces candidatures, éventuellement réajuster les montants
demandés. Enfin, les candidats qualifiés «très risqués» seront automatiquement rejetés. Plusieurs
modèles statistiques ont lié les arriérés aux caractéristiques du prêteur, de l'emprunteur, et du prêt
(Sharma et Zeller, 1997 ; Reinke, 1998 ; Zel- ler, 1998 ; Nannyonga, 2000 ; B. S. Bassem et T.
Borhen, 2008). D'une façon générale, ces modèles n'ont pas été très utiles comme scorecards
(d'ailleurs, ils n'étaient pas conçus pour cette fin) et ce pour trois raisons. D'abord, ces modèles
utilisent des échantillons de petite taille ce qui les rend moins robustes. Ensuite, quelques
modèles utilisent des caractéristiques que la plupart des prêteurs ne collectent pas ou qui sont
chères à collecter. Enfin, et le plus important, ces modèles manquent du pouvoir prédictif. Une
recherche bibliographique est nécessaire pour confirmer que le modèle peut vraiment prédire le
risque, et d'une manière primordiale convaincre les agents du crédit, et les directeurs de crédit que
ce modèle fonctionne convenablement. La plupart des modèles statistiques académiques visent à
détecter les caractéristiques liées avec le risque, mais pas à aider le micro prêteur à donner des
scores aux emprunteurs (Ben Soltane Bassem 2008)
En RDC, toutes les structures disposent d’un service de remboursements, même s’il est
embryonnaire a beaucoup d’égard. Les taux de remboursement dans les délais des emprunts
contractés par les clients restent en général faibles. Ils avoisinent pour certains 45 % et d’autres
75 %. Cela fait que le remboursement des épargnes en pâtit également et que cela met souvent les
structures IMF en difficulté. Conformément à la spirale habituelle déjà fortement documentée, les
cas de crédits considérés comme cadeau sont fréquents non seulement pour les structures de
4
financement initiées par l’Etat et pour lesquelles les interférences politiques sont manifestes, mais
aussi pour les structures des ONG où certains responsables eux-mêmes servent de filière pour le
dérapage et le manque de sérieux dans la collecte des fonds. On finit par assister à ce que gentil et
fournier appellent ou qualifient de solidarité perverse dans le non-remboursement, surtout lorsque
les attitudes et les actes des structures sont observées par les bénéficiaires. Les modalités de suivi
des prêts sont différentes d’une IMF à une autre. Dans les COOPEC, on dénombre plusieurs
types de suivi. Il s’agit notamment des modèles suivants : le contrôle de surveillance des
activités, le contrôle après échéance de 15 jours par la commission de crédit, le suivi de
conformité de crédit, le suivi après retard d’un mois, le suivi au début de l’activité après un mois
par le gérant et les rondes hebdomadaires auprès des débiteurs. Par contre dans les mutualités
d’épargne et de crédit on identifie des mécanismes presque analogues tels que le suivi ordinaire
en cas de non-remboursement après chaque mois par la commission de crédit, la vérification des
écritures et de la conformité des comptables, le contrôle interne de la tenue des écritures et des
données comptables et aussi les rondes hebdomadaires auprès des débiteurs. Ce qui est
intéressant par contre, c’est de voir les difficultés et l’embarras dans lequel se retrouvent les
structures de financement la plupart de fois lorsqu’ils font face à des impayées. La tendance est
d’essayer d’être compréhensif et d’accorder un nouveau moratoire. On effectue alors les
descentes sur terrain, on essaie de négocier et de convaincre de fournir un effort, et on procède au
retranchement des intérêts dans le compte du débiteur. On envoie les avis de remboursement et ce
n’est que lorsque tous les mécanismes sont épuisés qu’on essaie alors de saisir la justice et de
procéder éventuellement au recouvrement forcé. Il est important que les structures de
microfinance soient alertées sur les coûts de recouvrement des crédits non payés et que les
mécanismes soient mis en place comme ailleurs pour l’établissement d’une agence de
recouvrement impersonnel et plus experte qui centraliserait l’actionnement des garanties et avals
de frères qu’on accorde souvent tout en espérant que le cas de leur mise en jeu ne se réalisera pas.
(Mugumo 2001) ;
Eu égard à ce qui précède, cette étude cherche à identifier le modèle de prévision de probabilité
de crédit et particulièrement à l’IMF FINCA et répondre aux questions suivantes :
 Quel est le meilleur modèle de prévision de la probabilité de défaut des crédits dans les
institutions des microfinances ?
5
 Quel est l’avantage du modèle dans la prévision de probabilité des défauts de

remboursement de crédit dans les institutions des microfinances ?
L’objectif général de la présente étude est de sélectionner le meilleur modèle dans la prévision de
défaut de remboursement de crédit dans les institutions de microfinances.
De manière spécifique, il s’agit de :
Analyser les différents modèles pour la prévision de défauts des crédits dans les institutions des
microfinances
Analyser l’avantage de ce modèle dans la prévision de probabilité des défauts de remboursement

de crédit dans les institutions des microfinances.
Cette étude contribue à la littérature existante sur les emprunteurs faisant défauts dans les
institutions des microfinances.
De ce fait, l’intérêt est à considérer sur le plan personnel, sur le plan scientifique et sur le plan
économique. Personnellement, cette étude nous permet d’appréhender le modèle de prévision de
la probabilité des défauts de remboursement des microfinances et, sur le point de vue des IMF, la
contribution à l’évaluation de risques en utilisant ce modèle pour la performance de leurs
entreprises. Scientifiquement, cette étude contribue à la littérature existante sur la sélection du
modèle de probabilité défaut de remboursement dans les institutions des microfinances.
Pratiquement, enfin, les résultats de cette étude constituent, pour les dirigeants des institutions de
microfinances, un outil de prise de décision dans leur marche vers l’octroi de crédit. S’agissant de
la méthodologie, cette étude utilise les données secondaires des microfinances.
Les données sont saisies dans des feuilles de calcul Excel en vue de leur traitement. Différents
tests statistiques sont faits pour juger de la validité et de la fiabilité des échelles de mesure et les
analyses économétriques sont faites pour déterminer la probabilité de défaut de remboursement
dans les institutions de microfinances.
Hormis l’introduction et la conclusion, ce travail porte sur trois chapitres : le premier chapitre de
la revue de la littérature dans lequel nous présentons les différentes théories liées à notre sujet de
recherche mais aussi quelques résultats des études empiriques ; le chapitre deuxième présente
l’approche méthodologique dans lequel nous présentons les différentes voies que nous avons
6
suivies pour mettre au point ce travail et le chapitre troisième enfin concerne la présentation et
discussion des résultats de l’étude.
7
CHAP I : REVUE DE LA LITTERATURE ET DEFINITION DES HYPOTHESES

Ce chapitre examine deux sections principales, à savoir la revue théorique associée avec la
définition des hypothèses et la revue empirique.
I.1. REVUE THEORIQUE ET DEFINITION DES HYPOTHESES

I.1.1. Définitions des concepts
a. Sélection : Action de choisir les objets, les individus, les choses et tout autre qui conviennent
le mieux.
C’est encore un processus ou une opération volontaire et méthodique, phénomène inconscient ou

automatique par lequel, à l’intérieur d’un ensemble donné, certains éléments sont choisis, retenus
à l’exclusion des autres, en fonction de caractéristiques déterminées, éventuellement impliquées
par une certaine fin.
Pour une IMF, la sélection consiste à choisir les clients les plus solvables (écrémage) ou à les
tarifier par type de risque (séparation) ou à les ajuster par le bas.
b. Modèle : il s’agit ici d’un modèle statistique, c’est une description mathématique
approximative du mécanisme qui a généré les observations, que l’on suppose être un processus
stochastique et non un processus détérministe.il s’exprime généralement à l’aide d’une famille de
distributions (ensemble de distributions ) et d’hypothèses sur les variables aléatoires.
En revanche plusieurs modèles statistiques ont lié les arriérés aux caractéristiques du prêteur, de
l'emprunteur, et du prêt (Sharma et Zeller, 1997 ; Reinke, 1998 ; Zel- ler, 1998 ; Nannyonga,
2000 ; B. S. Bassem et T. Borhen, 2008). D'une façon gé- nérale, ces modèles n'ont pas été très
utiles comme scorecards (d'ailleurs, ils n'étaient pas conçus pour cette fin) et ce pour trois raisons.
D'abord, ces modèles utilisent des échantillons de petite taille ce qui les rend moins robustes.
Ensuite, quelques modèles utilisent des caractéristiques que la plupart des prêteurs ne collectent
pas ou qui sont chères à collecter. Enfin, et le plus important, ces modèles manquent du pouvoir
prédictif.
c. Prévision : c’est une action de prévoir, c’est une opinion formée par le raisonnement sur les
choses futures. C’est une étude générale d’une situation donnée, dont on peut, par déduction,
8
calcul, mesure scientifique, connaitre par avance l’évolution ; par extension, ce que l’on prévoit,
ce qui est prévisible, ce que l’on juge devoir être.
D’une façon générale c’est la science de la description de l’avenir. Dans un sens plus restrictif, en
épistémologie contemporaine, la prévision se distingue de la prédiction qui est issue d’une loi ou
théorie scientifique hautement confirmée ou corroborée, tandis que la prévision découle
d’hypothèses ou de conjectures moins assurées.
d. Probabilité de défaut : est une mesure statistique qui quantifie la probabilité qu’un
emprunteur ne respecte pas ses obligations financières dans un délai donné. Il est exprimé en
pourcentage, représentant la probabilité de survenance d’un défaut. La probabilité de défaut est
un élément clé des modèles d’évaluation du risque et son exactitude est cruciale pour une gestion
efficace des risques.
Cependant pour calculer la PD, les institutions financières prennent en compte divers facteurs tels
que les antécédents de crédit de l’emprunteur, sa stabilité financière, son niveau de revenu et son
ratio dette/revenu. Ces facteurs sont pondérés et analysés, généralement au moyen de modèles
statistiques et d’algorithmes, pour générer un score de probabilité. Plus la probabilité est élevée,
plus l’emprunteur est considéré comme étant risque.
Par ailleurs l’importance du calcul de PD ne peut être surestimée ; déterminer avec précision la
probabilité de défaut permet aux institutions financières d’allouer efficacement leurs ressources,
de fixer des taux d’intérêt appropriés et d’établir des limites de crédit. De plus cela aide à
identifier les emprunteurs à haut risque, à établir une tarification basée sur le risque et à mettre en
œuvre des stratégies d’atténuation des risques.
Dans le paysage financier dynamique et imprévisible aujourd’hui, une évaluation et une gestion
précise des risques sont devenues plus cruciales que jamais. Les institutions financières et les
prêteurs s’appuient sur diverses méthodes et modèles pour évaluer la solvabilité et déterminer la
probabilité de défaut. L’un des éléments clés de ce processus est le calcul de la probabilité de
défaut. En comprenant et en calculant avec précision la probabilité de défaut, les préteurs peuvent
prendre des décisions éclairées, atténuer les risques et garantir un portefeuille plus sain.
9
e. Défaut de remboursement de crédit
Dans la littérature, plusieurs études ont été menées sur les déterminants de défaut de
remboursement dans les institutions de microfinance tant du point de vue des emprunteurs
individuels que des groupes. De façon générale, ces recherches se basent sur l’existence
d’asymétries d’informations à différents niveaux sur le marché de la micro-finance. Viganò
(1993) a identifié cinq grands déterminants du risque de défaut de remboursement : la capacité de
rembourser, la volonté de rembourser, les conditions externes économiques et environnementales,
la qualité de l’information qui sert de base de décision pour l’octroi de crédit, la capacité du
prêteur à s’assurer de la bonne volonté de l’emprunteur à travers un contrat optimal. Boot (2000)
relève que la relation à long terme contribue à réduire les problèmes de sélection adverse et
d’aléa moral qui peuvent résulter notamment des nouveaux emprunteurs.
En revanche les garanties jouent également un rôle important dans l’analyse du défaut. D’un
point de vue théorique, les garanties sont perçues comme éléments atténuateurs du problème de
sélection adverse dont fait face le prêteur (Besanko et Thakor, 1987). Les garanties agissent alors
comme un signal permettant au prêteur de réduire ou d’éliminer le problème de sélection adverse
causé par l’existence d’asymétries informationnelles entre prêteur et emprunteurs. Toutefois, la
nature et l’évaluation des garanties réelles posent problème, car l’évaluation faite des garanties
est le plus souvent erronée et manque d’objectivité. Le recourt au crédit de groupe en est une
solution. Plusieurs auteurs ont démontré la performance de ce type de crédit. Toutefois, ces prêts
aussi sont sujets à des problèmes. Simtowe et Zeller (2006), résument ces problèmes en quatre
catégories et donnent les solutions théoriques à ce type de prêts. Dans un premier temps, les
auteurs évoquent que la sélection par les pairs permet de lutter contre la sélection adverse, car les
membres éviteront de s’associer avec ceux dont ils ne connaissent pas bien le profil de risque. Ce
principe permet la formation de groupes homogènes dans lesquels, tous les membres connaissent
parfaitement les caractéristiques de leurs partenaires portant sur le risque du projet, le niveau de
solvabilité (Van Tassel, 1999, Ghatak et Guinnane, 1999). La deuxième catégorie est liée à la
surveillance des pairs pour réduire le choix d’un projet très risqué et le détournement des fonds à
d’autres fins. Elle constitue un élément important permettant la réussite des crédits de groupe
(Stiglitz, 1990, Aghion, 1999). Wenner (1995) observe cependant que le groupe doit être
restreint. Le troisième groupe est relatif à l’échec du projet pour des raisons exogènes ou qui sont
10
au-delà du contrôle du membre du groupe. La solidarité intra-groupe permet toutefois d’assurer

un remboursement à temps (Huppi et Feder, 1990). La dernière catégorie est liée à la pression
mutuelle pour éviter le défaut de remboursement. Cette pression des pairs permet de réduire le
hasard moral ex- post et d’éviter le risque pour le groupe d’être privé de crédit futur (Wydick,
1999). Néanmoins, Diagne et al. (2000) signalent que la pression peut avoir un impact négatif ou
faible sur le remboursement. En plus de ces quatre éléments, d’autres facteurs ont été mentionnés
dans la littérature. Il s’agit entre autres du capital social et des options extérieures du crédit. Ces
arguments font donc du groupe avec caution solidaire un instrument plus performant que le crédit
individuel.
Par conséquent le risque de crédit, ou plus généralement le risque de contrepartie, est le principal
risque auquel est exposé un établissement bancaire. Il s’agit du risque qu’une contrepartie ne
puisse pas rembourser sa dette (le principal et/ou les intérêts) à temps, ou plus généralement
(dans le cas du risque de contrepartie), qu’elle fasse défaut avant le dénouement de l’opération
initiée. Le risque de crédit fera l’objet d’une étude renouvelée et approfondie dans la partie
suivante. Il importe donc de rappeler comment il est appréhendé dans le cadre de la
réglementation actuelle, en commençant par la définition des principales mesures et des
paramètres de calcul.
f. Institution des microfinances
La microfinance est la combinaison de deux mots qui signifient petit paiement ou petit-prêt. Le
préfixe micro vient du mot grec « mikros » qui signifie « petit » ou encore « la division ». Quant
au terme finance, il est dérivé du latin « finanre » qui selon l’encyclopédie Hachette veut dire «
fixer une indemnité » ou « une amende », ou encore « ce qui rapporte de l'argent » ou concerne «
le paiement d'une certaine somme d'argent ».
La première utilisation du mot microfinance remonte vers les années 89 lors de la conférence
organisée par la banque mondiale sur les micro-entreprises. Sa mise en place est une solution au
retrait progressif des États, compte tenu des difficultés pour intervenir dans toutes les branches de
l'économie.
Par la suite la microfinance est entrée dans une nouvelle étape de développement, elle doit
répondre à des besoins beaucoup plus complexes et soumis à de perpétuels changements. Nous
11
notons la présence de plusieurs IMF avec des buts différents, par exemple les IMF à but lucratif
dont l’objectif est la maximisation du profit (c’est la commercialisation de la microfinance)
De plus la microfinance est un moyen de lutte contre la pauvreté dans les pays en développement,
à travers le financement des activités génératrices de revenus pour les ménages pauvres.
Cependant, la meilleure manière d'aider les pauvres à avoir accès aux services financiers oppose
l’approche des welfarists à celle des institutionalists. Bien qu’elles partagent l’objectif de
réduction de la pauvreté, ces deux approches placent la microfinance à la croisée des chemins.
(Philippe ADAIR et al 2010)
Par ailleurs la microfinance a occupé une place prépondérante dans la lutte contre la pauvreté
dans les pays en développement. Son essor considérable a soulevé des débats centrés
principalement autour de son taux d’intérêt ou du niveau de sa performance. Bien que la plupart
des chercheurs partagent l’idée qu’elle permet de réduire la pauvreté, il n’en demeure pas moins
que sa démarche a fait l’objet de discussion entre les deux principales écoles (Welfaristes et
institutionnalistes), qui se sont opposées sur la manière d’aider les pauvres à avoir accès aux
services financiers. Pour les Welfaristes, la microfinance doit avoir une mission sociale en
prônant le bien-être des emprunteurs. Les défenseurs de cette école supposent que le concept
même de la rentabilité est en contradiction avec la mission sociale des IMF (Martinez, 2007)..
Quant aux institutionnalistes, ils considèrent que les taux d’intérêt appliqués par les IMF doivent
être nettement supérieurs à ceux appliqués par les banques afin de faire face aux différentes
charges opérationnelles et financières et couvrir les risques liés aux non- remboursements. A cet
effet, ils estiment que la préservation de la qualité des portefeuilles justifie la hausse des taux
d’intérêt car un niveau élevé d’impayés risque de fragiliser la situation financière des IMF. Cette
dernière mouvance semble gagner du terrain dans la plupart des pays en développement car ces
derniers se heurtent de plus en plus à une hausse des taux d’intérêt des IMF.(Djibril faye et al
2019)
Pour la Banque Mondiale (2000), la microfinance correspond à l'idée selon laquelle les pauvres
comme toutes les autres personnes doivent avoir accès à un large panel de services financiers à
faible coût. Elle correspond à l'offre de services de prêts, d'épargne ainsi que d'autres services de
base proposés aux exclus du système formel des banques (CGAP, 1997).
12
Cependant microfinance a plusieurs objectifs parmi lesquels le ciblage des populations pauvres
afin de faciliter le développement des activités génératrices de revenus et de l’épargne (Delalande
et Paquette, 2007). Pour Labie et al. (2007), la microfinance regroupe l'ensemble des mécanismes
et des services financiers adaptés aux besoins des ménages actifs mais n’ayant pas accès aux
circuits financiers classiques. Elle joue donc un rôle positif en aidant à mieux maitriser les
dépenses liées aux risques, à mieux gérer les rythmes entre recette et dépense (Martinez, 2007).
D'après Christen et al. (2003), la microfinance désigne la prestation de services bancaires aux
personnes à faible revenu, elle leur permet également de diversifier et d'accroître leurs sources de
revenu, ce qui constitue un moyen non négligeable dans la lutte contre la pauvreté et la faim
((Littlefield et al, 2003) in (Fodé Ndiaye, 2009)). Selon Blondeau (2006), la microfinance est la
fourniture d'un ensemble de services financiers aux personnes qui sont exclus du système
bancaire.
De plus, Gentil et Servet (2002) stipulent que le terme microfinance recouvre un ensemble très
diversifié de dispositifs offrant des services d'épargne, de prêt ou d'assurance à de larges fractions
des populations rurales, mais aussi urbaines, n'ayant pas accès aux services financiers des
établissements soumis à des contraintes de rentabilité et à certains ratios prudentiels. Elle est
encore appréhendée comme la fourniture de prêt, d'épargne, de transfert d'argent, d'assurance aux
populations à faible revenu (Lafoucade et al, 2005).
1.2. REVUE DE LA LITTERATURE THEORIQUE

a. Enjeux relatifs à la modélisation du risque de crédit
Les institutions Financières accumulent une grande quantité de risque de crédit, soit par
l'intermédiaire de leurs portefeuilles de créances composés des différents types de crédits
accordés aux particuliers (lignes de crédits, crédits à la consommation, crédit hypothécaire), soit
par les prêts aux entreprises. Une autre exposition au risque de crédit se situe au niveau du risque
de contrepartie dans les portefeuilles d'actifs et des produits dérivés de crédit, dont l'objet est de
transférer le risque de crédit. Le marché des dérivés de crédit a connu une très forte croissance
depuis une dizaine d'années, de l'ordre de 50 % par an, et atteint selon les estimations un volume
compris entre 20 000 et 30 000 milliards de USD à la n de l'année 2006. La modélisation du
risque de crédit revêt donc un intérêt majeur afin d'une part de mesurer le risque de crédit contenu
dans les portefeuilles et d'autre part pour évaluer le prix des dérivés de crédit. De plus, la récente
13
réglementation Bâle II a renforcé les exigences réglementaires en termes d'évaluation du risque

de crédit, ce qui oblige les établissements financiers à évaluer avec plus de finesse leur risque de
contrepartie. Effectivement, l'optimisation de l'allocation des fonds propres dépend étroitement de
la justesse de leur modélisation du risque de crédit.
b. Modèle logit et modèle probit
Dans un modèle ordonné, les modalités de la variable à expliquer sont hiérarchisées. Elles
indiquent l’appartenance de l’individu à une classe ou à une catégorie, par exemple
l’appartenance à une tranche de revenu. Nous pouvons distinguer deux classes de modèles à
choix multiples ordonnés en fonction de la variable à expliquer qui est issue, soit d’une «
discrétisation » d’une variable continue telle que l’appartenance à une tranche de salaire, soit
directement d’une appartenance à une catégorie.
Le modèle logit est de plus en plus utilisé dans des applications pratiques. Cela peut se justifier
par son habileté à prendre en compte dans l’analyse les similarités entre les pairs d’alternatives.
On distingue deux différentes spécifications de ce modèle : le modèle Utility Maximization
Nested Logit (UMNL) et le modèle Non-Normalized Nested Logit (NNNL). Cette dernière
spécification étant non consistante avec la théorie de l’utilité aléatoire (RUT), la forme UMNL
est habituellement préférée (Silberhorn, Boztuǧ et Hildebrandt, 2006).
Comme pour le modèle de choix binaire, le recours à une fonction de répartition normale, permet
de définir un modèle de type Probit et une fonction de répartition de type logistique permet de
définir un modèle Logit. L’estimation de tous les paramètres, les coefficients de régression (ai) et
les valeurs des seuils (ci) des modèles ordonnés (Probit ou Logit) est effectuée à l’aide des
algorithmes de maximisation d’une fonction de Log-vraisemblance définie par les Pi j. Les
valeurs des coefficients des modèles ne sont pas directement interprétables en termes de
propension marginale, seuls les signes des coefficients indiquent si la variable agit positivement
ou négativement sur la variable latente. Les résultats d’estimation s’apprécient de la même
manière que pour les modèles de choix binaires. (Régis Bourbonnais)
Comme notre variable expliquée (la demande de crédit) est dichotomique nous nous trouvons
astreint de choisir un modèle d'analyse approprié et adapté. Dans cette perspective, souligne que
les modèles dichotomiques logit et probit admettent pour variable expliquée, non pas un codage
quantitatif associé à la réalisation d’un événement (comme dans le cas de la spécification
14
linéaire), mais la probabilité d’apparition de cet événement, conditionnellement aux variables

exogènes Hurlin (2003).
c. Modèles qualitatifs ordonnés
Ce type de modèle repose sur l'hypothèse que les notations qualitatives (rating) des entreprises
sont déterminées par une fonction score continue non observable. En général cette fonction score
est une fonction croissante des probabilités de défaut pour une entreprise donnée à une date
donnée. La notation qualitative est alors obtenue en échantillonnant la fonction score en fonction
d'une partition déterminée par le modèle.
d. Le support vector machine
Les Support Vector Machines (SVMs) sont une méthode de classification qui montre de bonnes
performances dans la résolution de problèmes variés tels que la reconnaissance de formes
[Burges, 1998] ou la catégorisation de textes [Joachims, 1998]. Le classifieur est alors un donc
sous-espace vectoriel de dimension N-1 dans un espace de dimension N ✭✭ déplié ✮✮, établit à
l’aide d’un nombre réduit de points : les vecteurs de support. Dans cet article, nous montrons
comment les Support Vector Machines peuvent être utilisées pour résoudre des problèmes de
défaut de remboursement de crédit.
L’objectif primordial de support vector machine est de construire une fonction qui permet une de
montrer de bonnes capacités à remplir efficacement sa mission dans de nombreux domaines.
e. Le Random Forest
La méthode des Random Forests existe dépuis peu de temps. Elle a été développée par Breiman
(2001). Elle trouve déjà de plusieurs applications dans différents domaines telles que l’écologie
(Brosteaux, 2005) ou l’agriculture (Cutler et al., 2007). Parmi les capacités des RF nous pouvons
citer la possibilité de rendre libre le problème de multi-colinéarité et de la présence de données
manquantes, de permettre le traitement à la fois des variables qualitatives et quantitatives à des
échanges des variables étudiées et de mesurer l’augmentation de l’erreur éventuelle. Par ailleurs
l’interprétation est ensuite facilitée par le calcul d’un indice donnant l’avantage de chaque
variable dans l’agrégation de modèles.
15
On prédit que l’objectif de l’étude par Random Forests est de rendre compte ou de déceler
l’importance des variables dans un jeu de données. Conférer une importance aux variables
explicatives nous a conduits à examiner la sensibilité de ces variables pour une variable à
expliquer fixée. L’importance des variables est donnée par l’indice de Gini, plus cet indice est
élevé plus la variable Xi est importante (S. Taibi-Hassani et al).
Et donc pour le modèle Random Forest il consiste à diminuer la prédiction de faux négatifs.
Cependant cette action a pour conséquence de diminuer la précision ce qui s’accompagne d’une
augmentation de la prédiction de faux positifs.
Ce modèle permet de prévenir de risque de défaut de remboursement et de promouvoir des

stratégies de prévention pour réduire l'incidence que ces défauts peuvent avoir sur l’institution.
H1. Le modèle random forest serait le meilleur modèle dans la prévision de la probabilité des
défauts de crédit de remboursement dans les institutions des microfinances.
f. Les modèles de crédit scoring
Les modèles de score sont des techniques statistiques qui s’efforcent de synthétiser, au moyen
d’une note, dite score, le risque de non-remboursement d’un emprunteur existant ou potentiel,
pour estimer la performance future de son prêt (Feldman, 1997) ou pour prédire la probabilité
qu’il fasse défaut (Mester, 1997). En effet, le problème, est de déceler parmi les informations qui
caractérisent un emprunteur, celles qui expliquent au mieux sa solvabilité. Une pondération est
attribuée à chaque information et la totalisation est comparée à une note critique préalablement
établie (appelée seuil critique) permettant de distinguer les entreprises en difficulté (qui
présentent un risque défaut ou de défaillance) de celles qui ne le sont pas et indiquant s’il faut
leur accepter ou refuser le crédit. L’intérêt de cette démarche est bien évidemment d’anticiper une
défaillance future en observant les entreprises a priori. À ce titre, le crédit scoring facilite la prise
de décision (De Coussergues, 1996, p.185).
g. Arbre de décision
Il est définit comme un ensemble de règles de classification basant leur décision sur des tests
associes aux informations, de manière à organiser les données de façon logique et hiérarchisée,
utilisant une structure algorithmique d’arbre.
16
Et donc tout arbre de décision définit un Classifier qui se traduit aussitôt en terme de règles de
décision de beaucoup d’avantages des arbres de décision dont décisions aisément interprétables et
classification très rapide. Dans cette étude cet arbre permet de prendre de décision pour le
meilleur modèle pour prévenir la probabilité de défaut dans les IMF.
H2. L’avantage de ce modèle serait de prévenir la probabilité des défauts de remboursement

dans les institutions des microfinances.
I.3. REVUE EMPIRIQUE.

Cette section essaye de présenter quelques études empiriques qui ont été menées dans différentes
contrées et qui ont trait à ce sujet.
Steve Castanet et Romain Mazoué dans la Modélisation des corrélations de défauts dans
l'analyse du risque de crédit avec comme objectif de l'utilisation des modèles affines est de
pouvoir spécifier des facteurs afin de modéliser la corrélation des défauts existant dans les
portefeuilles de créances détenus par les banques. L'objectif de ce modèle est de décrire les
différentes étapes qui, grâce aux modèles affines en temps discret vont permettre d'étudier la
relation entre les spreads de crédit observés et les prix des obligations. Il est alors possible de
relier probabilités historiques et probabilités risques neutres. Il trouve le résultat selon lequel le
modèle affine permet d'étudier précisément les composantes du spread de crédit, notamment en
faisant apparaître les termes relatifs à la corrélation du défaut. Cependant, les estimations des
sensibilités deviennent rapidement lourdes quand le nombre de facteurs augmentent, surtout si on
les choisit de manière dynamique. Par ailleurs, la quantité d'information à réunir pour obtenir des
estimations correctes est très élevée, même si ces informations sont facilement observables donc
pour ces auteurs c’est le modèle affine qui est le plus meilleur.
Par ailleurs, Arcadius Y. J. AKOSSOU 2014, dans son étude les déterminants de la performance
de remboursement des emprunteurs et des groupes de crédit. Les taux de défaut de
remboursement dans les échantillons considérés sont relativement élevés. Plusieurs facteurs
expliquent ce taux tant au niveau des crédits individuels que de groupe. Le risque de défaut chez
l’emprunteur est lié à la relation de long terme que ce dernier entretien avec la structure, la
garantie mise en jeu pour la demande et le niveau de richesse de l’emprunteur. Le risque de
défaut lié au crédit de groupe s’explique par la distance moyenne des lieux de résidence des
membres par rapport à leur lieu de travail, la fréquence des réunions, l’ethnie, l’activité exercée
17
par les membres, l’importance du montant de crédit demandé et le niveau de richesse des
membres du groupe ;Faute de statistiques existantes en la matière, des données primaires ont été
collectées à partir des dossiers des emprunteurs d’une par La modélisation de la probabilité du
défaut de remboursement a permis de dégager les variables La surveillance des pairs a aussi
l’avantage de favoriser l’assistance des pairs si les raisons de la défaillance sont justifiées. Elle
permet également d’exercer plus de pression en cas de défaillance volontaire. Il trouve le résultat
selon lequel la méthode la plus utilisée pour couvrir les arriérés est la contribution à part égale de
chaque membre est en conformité avec l’affirmation de Huppi et Feder (1990) et les résultats de
Noglo et Androuais (2013), La comparaison des procédures de sélection a montré que la méthode
Backward/Forward en utilisant le critère BIC fait le meilleur choix de sous ensemble de variables
pour la prévision de la probabilité de défaut des crédits dans les institutions des microfinances,
selon eux c’est le modèle Backward/Forward qui est le meilleur dans la probabilité de défaut de
crédit.
Par la suite, Julien DHIMA (2019) dans l’Évolution des méthodes de gestion des risques dans les
banques sous la réglementation de Bâle III La probabilité de défaut PD est estimée en fonction de
la classe de notation de la contrepartie. L’établissement utilise son propre système de notation.
Pour les particuliers et les professionnels la notation est une fonction de variables caractéristiques
de l’emprunteur (âge, endettement, profession, salaire, ancienneté au travail etc.), de variables de
transaction (type de crédit, échéance etc.) et de variables de comportement (nombre de jours non
payés, incidents dans le passé etc.). Pour la grande clientèle (corporates, institutions financières
etc.) elle dépend de variables quantitatives (chiffre d’affaire, résultat net, ROA, ratio Dette/Fonds
Propres etc.), de données qualitatives (positionnement sur le marché, qualité de management,
ancienneté dans le secteur, diversification de l’activité etc.) et de variables comportementales
(existence d’un impayé ainsi que sa durée etc.). En fin de période, la banque doit comparer les
PD estimées aux taux de défaut effectivement réalisés (back-testing). Elle doit également suivre
l’évolution des ratings des contreparties d’une année à l’autre en construisant des matrices de
transition afin d’étudier la stabilité du modèle stress test , La perte en cas de défaut LGD est
estimée en fonction du type de l’actif et du collatéral. Elle correspond au taux de perte
économique et comprend le capital, les intérêts et les frais de recouvrement pour mieux prédire
ces défauts il récommande le modèle probit ou logit.l’auteur considère que ce modèle est plus
meilleur dans la prévision de défaut de crédit dans les IMF ;
18
Contrairement Schreiner (2004) Prédire un modèle sur la probabilité que les prêts de ce prêteur
vont avoir un retard de remboursement de 15 jours ou plus, Il dévélope un modèle du crédit
scoring pour une institution de microfinance Bolivienne, Il trouve le résultat selon lequel en
utilisant les informations relatives à 39.951 prêts qui contiennent 1.987 prêts possédant des
arriérés de 15 jours ou plus, l'auteur prouve que ce modèle peut fonctionner convenablement en
microfinance. Il est supérieur à tous les bons modèles naïfs classiques couramment utilisés par les
prêteurs avec lesquels tous les prêts approuvés par la procédure d'évaluation traditionnelle sont
déboursés,l’auteur prédit par conséquant que le modèle crédit scoring est le plus meilleur dans la
prévision de la probabilité de défaut dans les institutions des microfinances.
Eu égard à ce qui précède, notre étude ayant comme objectif de sélectionner le modèle de
prévision de la probabilité de défaut des crédits dans les institutions des microfinances, nous
avons fait les estimation des modèles logit, probit ,le random forest,support vector machine et
decision tree.
Nous avons trouvés le résultat selon lequel le modèle Random forest est le meilleur modèle pour
la prévision de la probabilité des défauts de crédit dans les institutions de microfinances, Une
attitude plus conservatrice améliore significativement de la performance du modèle dans la
prédiction des mauvais ou des bons emprunteurs.
prédiction de la probabilité de défaut
19
CHAP II : CADRE D’ETUDE ET APPROCHE METHODOLOGIQUE

Dans ce chapitre, nous présentons la démarche scientifique que nous avons suivie pour atteindre
les objectifs de notre recherche. Cette démarche concerne la collecte des données pour le
traitement et l’analyse.
II.1. Collecte des données

Les données des emprunteurs ont été obtenues en étudiant leur dossier des micro finances A
défaut de disposer des statistiques globales sur les bons et les mauvais emprunteurs au niveau de
chaque structure, le nombre d’emprunteurs pour chaque catégorie (bon et mauvais) a été choisi en
respectant dans une certaine mesure leur proportion dans la population globale de clients fournie
par le personnel. Nous avons par ailleurs fait recours aux agents de crédit pour avoir plus
d’informations sur certains clients et sur les causes du défaut de remboursement.
II.2. Analyse des données

Dans le but de mener des analyses fines sur les données en série temporelles, (Hall, R., Jones, C,
1999), (Acemoglu, 2001), (Acemoglu, D., Johnson, S., Robinson, J.A., Yared, P, 2008) et
(Fisher, A. G. B, 1939) ont proposé une approche utile pour l’analyse dynamique des données de
panel avec un modèle parcimonieux pour détecter le lien de causalité entre les variables d’intérêt.
Les données collectées aussi bien au niveau des bases des données de microfinances ont subies
une phase préliminaire d’analyse simple en utilisant les techniques de statistique descriptive.
Cette description a consisté à calculer des moyennes, des écarts-types, des valeurs minimums, des
valeurs maximums et des proportions.
II.3. Catégorisation des emprunteurs

Les données des bases des données ont été exploitées pour atteindre cet objectif. Ainsi, pour
réaliser cette typologie, nous avons utilisé la méthode de classification numérique qui est suivie
d’une méthode d’analyse factorielle (Analyse en composante principale ou de l’analyse des
correspondances) afin d’observer les groupes constitués sur une carte factorielle.
20
II.3.1. Classification numérique
La méthode de classification numérique permet de réaliser une synthèse de l’information par la

structuration de la population. La réalisation d'une Classification ascendante hiérarchique passe
par trois étapes fondamentales.
- Calcul de la matrice de distance (ou de ressemblance) et le choix de la métrique.
- Choix du critère d’agrégation.
- Représentation graphique : le dendrogramme
II.4. Prédiction de la probabilité de défaut de remboursement (emprunteur)
II.4.1. Méthodes
L’objectif principal de cette recherche est de développer un modèle statistique qui puisse
permettre de distinguer les bons emprunteurs des mauvais. Un emprunteur est considéré comme
bon s’il rembourse (ou a toujours remboursé) correctement son prêt et un mauvais emprunteur
dans le cas contraire. Les données collectées sur les emprunteurs d’une part et sur les
groupements d’autre part ont été exploitées pour atteindre cet objectif. Dans la mesure où la
variable défaut de remboursement est une variable qualitative, la méthode utilisée pour la
modélisation est la régression logistique. Pour cette modélisation, une partie des données est
utilisée pour construire les modèles (estimations des paramètres) et l’autre partie pour la
validation.
II.4.2. Régression logistique

La régression logistique recourt très souvent à l’approche du Maximum de vraisemblance pour
estimer le modèle. Le terme d’erreur est supposé suivre une distribution logistique.
La fonction de répartition F (.) correspondant au modèle Logit est donné par la formule ci-
dessous :
xi β
e 1
F ( xi β )= x β
= −x β
∀i =1 ,2 , .. . N
1+ e i
1+ e i
L’objectif de la régression logistique est de modéliser une variable qualitative en fonction des
variables quantitatives. Dans le cas où la variable qualitative a deux modalités comme dans la
21
présente étude (variable défaut de remboursement) on parle de la régression logistique binaire.

On cherche alors à expliquer une variable Y ayant deux modalités 0 ou 1 par des variables
explicatives. Les variables explicatives X sont a priori quantitatives. Pour effectuer l'estimation,
on dispose d'un échantillon d'effectif n. Notons n1 le nombre d’observation correspondant à la
modalité 1 de Y et n2 celui relatif à la modalité 0 et p(1) et p(0) les probabilités correspondantes.
p(X/1) et p(X/0) représentent la distribution conditionnelle des X sachant la valeur prise par Y.
La probabilité a posteriori d’obtenir la modalité 1 de Y sachant la valeur prise par X est notée
p(1/X) (Steve Castanet et al 2008).
En s'alignant sur l'objectif de notre étude qui est de sélectionner le meilleur modèle de prévision
de la probabilité des défauts des crédits dans les institutions des microfinances, discriminant entre
bons et mauvais emprunteurs, nous avons opté pour la régression logistique. Ce type de modèle
recourt à l'approche du maximum de vraisemblance pour estimer les paramètres du modèle. Le
terme d'erreur est supposé suivre une distribution logistique. La régression logistique s'utilise
lorsque la variable dépendante est qualitative, le plus souvent binaire ou dichotomique. Quand
aux variables explicatives, ils peuvent être par contre soit qualitatives soit quantitatives. La
variable dépendante est habituellement la survenue ou non d'un événement (dans notre cas
remboursement avec un retard qui dépasse 30 jours), et les variables explicatives sont
susceptibles d'influencer la survenue de cet événement. Cette méthode présente l'avantage de
quantifier la force de l'association entre chaque variable indépendante et la variable dépendante
en tenant compte de l'effet des autres variables intégrées dans le modèle. La régression logistique
est relativement simple à comprendre et à appliquer, et ses résultats peuvent être aisément
interprétés. Les coefficients estimés par le modèle sont, en effet, liés mathématiquement à l'Odd
Ratio (ou rapport de côtes en français), qui quantifie la force de l'association entre la survenue
d'un événement (retard de remboursement de 30 jours ou plus), représenté par une variable
dichotomique ou binaire et les facteurs susceptibles de l'influencer, représenté par des variables
explicatives. L'Odd Ratio prend des valeurs positives et indique trois situations à savoir :
OR¿ 1: le risque de survenue de l'événement binaire à expliquer est augmenté par la variable
explicative.
OR=1 : la variable explicative (ou sa modalité) n'influe pas sur la variable à expliquer,
22
OR>1 : le risque de survenue de l'événement binaire à expliquer est augmenté par la variable
explicative.
L'Odd Ratio est calculée à partir des coefficients estimés de la régression logistique :
OR=exp(a) où a est la valeur estimée de la modalité de la variable dans le modèle de régression.

La régression logistique est un des modèles multivariés de choix pour déterminer les facteurs
associés avec le retard. Toutefois, il ne faut pas oublier qu'elle demeure une simplification
mathématique de phénomènes complexes et qu'elle repose théoriquement sur des conditions dont
le respect est trop peu souvent vérifié par les chercheurs qui l'appliquent. Pour la plupart des
problèmes pratiques d'évaluation par score, la régression logistique est aussi bonne, sinon
meilleure, que les autres techniques. Elle ne fait pas des prétentions au sujet des prédicteurs. Ce
type de méthode n'exige pas que les variables prédicatrices soient distribuées normalement,
linéaires ou qu'elles possèdent une variance égale entre chaque groupe (Desjardins, 2005).
Toutefois, cette technique s'applique uniquement à de grands échantillons et fournit des
estimations de probabilité ayant pour valeurs limites 0 et 1.
II.5. Estimation des paramètres

 Choix du modèle à utiliser
Les modèles de départ sont codifiés qualitativement de façon binaire (dichotomique), le choix
entre le modèle de Régression Logistique (Logit) et Normale (Probit) permet alors de cibler le
vrai modèle qui convient pour la spécification. Dans cette perspective, Hurlin (2003) souligne
que les modèles dichotomiques Logit et Probit admettent pour la variable expliquée, non pas un
codage quantitatif associé à la réalisation d’un événement (comme dans le cas de la spécification
linéaire), mais la probabilité d’apparition de cet événement, conditionnellement aux variables
exogènes. Ainsi, on considère le modèle ci-dessous : pi =Pr ob( FrCr=1/ x i )=F( x i β )
Où la fonction F ( xi β ) désigne une fonction de répartition, β est un vecteur des paramètres

x
(inconnus) associés au vecteur i .
 Spécification du modèle
23
Dans ce point, il est proposé une discussion succincte sur le choix entre l’utilisation d’un modèle
logit ou d’un modèle probit. En suite intervient le test de normalité et afin la modélisation du
modèle retenu.
 Modèle logit et modèle probit

Dans un modèle ordonné, les modalités de la variable à expliquer sont hiérarchisées. Elles
indiquent l’appartenance de l’individu à une classe ou à une catégorie, par exemple
l’appartenance à une tranche de revenu. Nous pouvons distinguer deux classes de modèles à
choix multiples ordonnés en fonction de la variable à expliquer qui est issue, soit d’une «
discrétisation » d’une variable continue telle que l’appartenance à une tranche de salaire, soit
directement d’une appartenance à une catégorie .
Le modèle logit est de plus en plus utilisé dans des applications pratiques. Cela peut se justifier
par son habileté à prendre en compte dans l’analyse les similarités entre les pairs d’alternatives.
On distingue deux différentes spécifications de ce modèle : le modèle Utility Maximization
Nested Logit (UMNL) et le modèle Non-Normalized Nested Logit (NNNL). Cette dernière
spécification étant non consistante avec la théorie de l’utilité aléatoire (RUT), la forme UMNL
est habituellement préférée (Silberhorn, Boztuǧ et Hildebrandt, 2006).
Comme pour le modèle de choix binaire, le recours à une fonction de répartition normale, permet
de définir un modèle de type Probit et une fonction de répartition de type logistique permet de
définir un modèle Logit. L’estimation de tous les paramètres, les coefficients de régression (ai) et
les valeurs des seuils (ci) des modèles ordonnés (Probit ou Logit) est effectuée à l’aide des
algorithmes de maximisation d’une fonction de Log-vraisemblance définie par les Pi j. Les
valeurs des coefficients des modèles ne sont pas directement interprétables en termes de
propension marginale, seuls les signes des coefficients indiquent si la variable agit positivement
ou négativement sur la variable latente. Les résultats d’estimation s’apprécient de la même
manière que pour les modèles de choix binaires. (Régis Bourbonnais 2009)
Comme notre variable expliquée (la demande de crédit) est dichotomique nous nous trouvons
astreint de choisir un modèle d'analyse approprié et adapté. Dans cette perspective, Hurlin (2003)
souligne que les modèles dichotomiques logit et probit admettent pour une variable expliquée,
non pas un codage quantitatif associé à la réalisation d’un événement (comme dans le cas de la
24
spécification linéaire), mais la probabilité d’apparition de cet événement, conditionnellement aux

variables exogènes.
Ainsi, on considère le modèle ci dessous :
(
Pi= prob decr é d=
1
X1 )
f (x ,β)
Où la fonction f ( x , β )désigne une fonction de répartition, β est un vecteur des paramètres

(inconnus) associés au vecteur X i.
Ce dernier désigne un vecteur des variables explicatives susceptibles d’influencer la demande des
crédits financés par les IMF. Soulignons par ailleurs que pour estimer la probabilité de défaut de
crédit, nous avions, partant du test de normalité le choix d’utiliser soit la fonction de répartition
de la loi logistique, soit celle de la loi normale centrée réduite.
Hurlin (2003), abordant les conditions d’usage du modèle logit et probit, soutient que le modèle
logit est approprié lorsque la fonction de répartition suit une loi logistique tandis que le modèle
probit est indiqué si la fonction de répartition suit une loi normale centrée réduite. Ces deux
modèles (logit et probit) fournissent des résultats semblables en termes de signe et de
significativité des coefficients. Cependant, les valeurs de ces coefficients ne sont pas directement
comparables mais il est possible d’approximer les valeurs des coefficients du modèle probit à
partir de celles du modèle logit en divisant celles-ci par /√ 3 (Bourbonnais, 2009) ou par 1,6
pour une approximation plus précise (Amemiya, 1981, cité par Hurlin, (2003)).
La probabilité pour que cet événement (la demande de crédit) n’apparaisse pas sera donnée par
Prob ¿
 Le support vector machine
Les Support Vector Machines (SVMs) sont une méthode de classification qui montre de bonnes
performances dans la résolution de problèmes variés tels que la reconnaissance de formes
[Burges, 1998] ou la catégorisation de textes [Joachims, 1998]. Le classifieur est alors un donc
sous-espace vectoriel de dimension N-1 dans un espace de dimension N ✭✭ déplié ✮✮, établit à
l’aide d’un nombre réduit de points : les vecteurs de support. Dans cet article, nous montrons
25
comment les Support Vector Machines peuvent être utilisées pour résoudre des problèmes de
défaut de remboursement de crédit.
L’objectif primordial de support vector machine est de construire une fonction qui permet une de
montrer de bonnes capacités à remplir éfficacement sa mission dans de nombreux domaines.
Considérons une base d’exemples S = {(x1,y1),(x2,y2),...,(Xn,Yn)} où xi est un vecteur dans un

espace X ∈ R et yi ∈ {−1,+1}. Dans une manière modeste lorsque les données sont linéairement
séparables, on construit un hyperplan qui sépare les exemples positifs des exemples négatifs :
f(x) = w.x+b = 0 (5) où w ∈ R x ∈ X , b ∈ R et signifiant produit d’un élément par lequel on peut
multiplier les vecteurs d’un espace vectoriel. La propriété remarquable des SVMs est que cet
hyperplan est optimal, c’est-à-dire qu’il maximise la distance minimale (marge) entre les
exemples et le classifieur. Les points les plus proches, qui seuls sont utilisés pour la
détermination de l’hyperplan, sont appelés vecteurs de support (SV).
 Le Random Forest
La méthode des Random Forests existe dépuis peu de temps. Elle a été développée par Breiman
(2001). Elle trouve déjà de plusieurs applications dans différents domaines tels que l’écologie
(Brosteaux, 2005) ou l’agriculture (Cutler et al., 2007). Parmi les capacités des RF nous pouvons
citer la possibilité de rendre libre le problème de multi-colinéarité et de la présence de données
manquantes, de permettre le traitement à la fois des variables qualitatives et quantitatives à des
échanges des variables étudiées et de mesurer l’augmentation de l’erreur éventuelle. Par ailleurs
l’interprétation est ensuite facilitée par le calcul d’un indice donnant l’avantage de chaque
variable dans l’agrégation de modèles.
On prédit que l’objectif de l’étude par Random Forests est de rendre compte ou de déceler
l’importance des variables dans un jeu de données. Conférer une importance aux variables
explicatives Xi nous a conduits à examiner la sensibilité de ces variables pour une variable à
expliquer fixée Y. L’importance des variables est donnée par l’indice de Gini, plus cet indice est
élevé plus la variable Xi est importante (S. Taibi-Hassani et al 2013).
En suite ce modèle est constitué de plusieurs centaines d’arbres de décision qui vont prendre part
pour prédire le risque de probabilité de défaut de crédit dans les institutions des microfinances
26
comme dans notre cas, ce sont les informations sur le défaut de crédit et quelques caractéristiques
biométriques qui participent à fournir les meilleures prédictions.il consiste de plus à évaluer le
modèle qui a été auparavant optimisé ou amélioré sur des données inconnues et ainsi chercher à
connaitre la qualité des prédictions.
Et donc pour le modèle Random Forest il consiste à diminuer la prédiction de faux négatifs.
Cependant cette action a pour conséquence de diminuer la précision ce qui s’accompagne d’une
augmentation de la prédiction de faux positifs.
Ce modèle permet de prévenir de risque de défaut de remboursement et de promouvoir des

stratégies de prévention pour réduire l'incidence que ces défauts peuvent avoir sur l’institution.
 arbre de décision
Il est définit comme un ensemble de règles de classification basant leur décision sur des tests
associes aux informations, de manière à organiser les données de façon logique et hiérarchisée,
utilisant une structure algorithmique d’arbre.
Cet arbre a comme organisation nœuds internes (nœuds de décision) : identifié par des tests ´
applicables à toute action de décrire une sollicitation pressante. Généralement, un nœud interne
est un test sur ce qui est propre et particulier à un être ; Arcs issus d’un nœud interne : réponses
possibles au test du nœud ; Feuilles de l’arbre : identifiées par une classe ; Chaque nœud interne
ou feuille, est marquée par sa position (listes des numéros des arcs qui permettent d’avoir un
accès en partant de la racine.
Et donc tout arbre de décision définit un Classifier qui se traduit aussitôt en terme de règles de
décision de beaucoup d’avantages des arbres de décision aisément interprétables et classification
très rapide. Dans cette étude cet arbre permet de prendre de décision pour le meilleur modèle
pour prévenir la probabilité de défaut dans les IMF.
 Distinction entre «bons» et «mauvais» emprunteurs
Etant donné que l'objectif de ce travail, nous distinguons les bons emprunteurs des mauvais,
nous avons jugé nécessaire de faire tout d'abord la distinction entre ce que nous entendons par
bons et mauvais emprunteurs. Ainsi, un emprunteur est considéré comme bon s'il a remboursé
son prêt avec un retard de remboursement inférieur à 30 jours. Par contre, un mauvais emprunteur
27
est un emprunteur qui a connu au moins une fois un retard de remboursement de son prêt de 30
jours ou plus.
II.6. Présentation des outils de collecte et de traitement des données

Pour collecter les données, la base donnée de FINCA au niveau international, ce sont les données
en coupe instantané. Les traitements des données ont été faits en utilisant conjointement le tableur
d’Excel, les logiciels R (Version 3.5.0). Le premier nous a servi dans le dépouillement des
données et leur codification, les seconds nous ont permis de réaliser les différents tests ; et de
ceux-ci, dégager les différents résultats des modèles utilisés par les IMF.
II.7. Justification du choix des variables

Les procédures de sélection de variables sont les stratégies développées pour optimiser les
critères de sélection. En effet, les données collectées lors de l'observation d'un phénomène ou
mesurées sur un système physique ne sont pas toutes aussi informatives : certaines variables
peuvent correspondre à du bruit, être peu significatives, corrélées ou non pertinentes pour la tâche
à réaliser. La sélection de variables est donc un problème complexe et fait l'objet de recherches
dans de nombreuses disciplines. Dans le domaine de la régression, de nombreuses procédures de
choix de variables sont présentées dans la littérature. D’une manière générale, il n'y a pas de
sous-ensemble meilleur aux autres, il en existe plusieurs la plupart du temps. La raison justifiant
l'utilisation d'un sous-ensemble de variables plutôt que l'ensemble complet est que le modèle
obtenu à partir du sous-ensemble peut estimer les coefficients de régression et prédire les
réponses futures, avec une variance inférieure à celle du modèle complet (Hocking 2015).
La seule façon de trouver avec certitude le meilleur sous-ensemble de variables en termes de

qualité d’ajustement et de prédiction est évidemment l'étude de toutes les combinaisons de
variables possibles. Cependant, les procédures exhaustives sont très lourdes, fastidieuses et
difficiles à utiliser sans un ordinateur rapide. Elles ne sont réalisables que si le nombre de
variables est faible. En effet, pour un nombre de k variables explicatives, on a k 2 équations de
régression différentes (tous les modèles incluant un terme constant y compris le modèle constant
qui ne contient aucune variable explicative). L’examen de tous les modèles serait donc sans
intérêt, car nombreux d’entre eux seront très voisins. Aussi, lorsque le nombre de variables
disponibles est relativement élevé (plus de 10 ou de 20 variables par exemple), utilise-t-on
28
généralement certaines procédures de sélection systématique des variables (Dagnelie,1986). Dans

la présente étude, nous avons opté pour la méthode de régression logistique, car elle est la plus
utilisée et elle est disponible dans la plupart des logiciels statistiques pour prédire la prévision de
probabilité des défauts de remboursement dans les institutions des microfinances.
Tableau n° 2 Synthèses des variables
Variables exogènes Symboles et signes Description des variables

attendus
Liquidité générale LQG (stocks+créances à CT+Trésorérie)/les

dettes à CT
Solvabilité SOLV Capitaux propres/Dettes à CTet LT
Rentabilité opérationnelle RTOP EBE(excèdent brut d’exploitation/chiffre

d’affaire
Ratio d’endettement RATEND Charges financières/chiffres d’Affaire
Rentabilité financière RTFIN Résultat net/capitaux propres
Rentabilité économique RTECO Résultat net/Total bilan
Objet de crédit OBJCRE Il s’agit de l’objet sur lequel porte le crédit

qui prend la valeur 1 lorsque le crédit est
octroyé pour des fins de production et 0 pour
des fins de consommation.
Rationnement crédit RATIOCRE Le rationnement existe lorsque le montant

est octroyé est inférieur au montant
demandé, cette variable prend la valeur 1 si
le montant est rationné et O si non.
Expérience EXPER Il s’agit du nombre des mois que le client a

déjà effectué dans son activité principale.
Elle prend la valeur 1 si l’activité est entre 6
29
et 12 mois d’existence et 0 si l’activité a

plus de 12 mois.
Tableau n° 3. Synthèses des variables
Age Age (-) Cette variable indique le nombre d’année que le

client a déjà vécu
Niveau d’étude NIET Cette variable prend la valeur 1 si le client à un

niveau universitaire et 0 dans d’autres cas
Sexe SEX Il s’agit ici du sexe du client. Elle prend la valeur

1 si l’emprunteur est du sexe masculin et 0 si le
client est féminin.
Revenu professionnel REVPROF Cette variable mesure les recettes mensuelles

encaissées par le client dans son activité
principale.
Montant octroyé MTOCRT Il s’agit du montant de crédit effectivement reçu

par l’emprunteur libellé en dollars américains
Maturité MAT La variable représente la maturité du crédit

exprimé en nombre des mois
Localisation agence LOCAG Il s’agit du lieu où le client a pris le crédit, elle

prendra la valeur 1 si l’agence est dans le centre-
ville et 0 si non
30
Ecart temps entre la date de Ecart Temp Cette variable indique le nombre des jours
demande de crédit et celle compris entre la date de demande de crédit et celle
d’octroi de crédit d’octroi de crédit
Nombre des cycles NBRECYCL Il s’agit du nombre de fois que le client a déjà
demandé le crédit depuis son adhésion dans
l’institution.
31
CHAP III : PRESENTATION ET DISCUSSION DES RESULTATS
III.1. PRESENTATION ET INTERPRETATION DES RESULTATS

Le chapitre présente d’abord Statistiques descriptives dans la première section, Ensuite, il
examine les autre Matrice de corrélation, Résultats de régression, Indicateurs pour la sélection du
modèle de prédiction en fin la discussion des résultats.
Tableau n° 4 : Statistiques descriptives
Variable Obs Mean Std. Dev. Min Max
RISK 307 0.2736156 0.4465419 0 1
MAT 307 11.59609 1.484027 6 18
SEX 307 0.5765472 0.4949125 0 1
AGE 307 41.35179 13.8762 18 67
OBJCRE 307 0.8306189 0.3757006 0 1
RATIOCRE 307 0.6384365 0.4812377 0 1
LOCAG 307 0.5895765 0.4927137 0 1
NBRECYCL 307 1.843648 0.8753993 1 4
RATEND 307 0.3248265 0.1746769 0.100557 1.12
RTECO 307 0.477632 0.1953242 0.109 0.95
RTOP 307 0.4796582 0.1711774 0.109 0.95
Sources : Nos analyses avec le logiciel R 3.5.0
La maturité moyenne de la période est de 11,59% (valeur max. 100%, valeur min.0% et écart
type de 1.48%). Quant à l’Objet crédit, 0,83% est le taux moyen (une valeur maximale de 100%,
une dispersion très grande au-delà de la moyenne et une valeur minimale de 0%). La rentabilité
économique est de 0,47% (valeur maximale 95%, valeur minimale 10 % et écart type de 0,19)..
S’agissant du ratio crédit, le score moyen est de 0,63.la rentabilité opérationnelle représente en
moyenne, 0,47 %, et la taille minimale de 10.9% et la valeur maximale de 95%. Quant à l’âge
41.35 ans est la moyenne globale, la valeur minimale est de 18 et la valeur maximale est de 67.
32
Le tableau présente les valeurs moyennes et les écarts-types des caractéristiques quantitatives
relatives aux emprunteurs. Le tableau présente l’effet des variables catégorielles sur le défaut de
remboursement selon les catégories. De l’examen de ce tableau, il apparait que la maturité, le
sexe, l’âge, l’objet de crédit, le rationnement de crédit, le nombre de cycles, l’indication sur le
prêt antérieur autrement la relation de l’emprunteur avec l’agence, le ratio d’endettement ont un
effet sur le défaut de remboursement. Dans le même constant la rentabilité économique et la
rentabilité opérationnelle influencent la qualité de l’emprunteur. Il se constate que les clients en
retard de paiement depuis une très longue durée, tel un an ou plus, comme n’étant pas encore
officiellement en défaut, peut être assimilé à un manque de transparence ; le prêt est simplement
défaillant, le taux de remboursement peut aussi provenir de défaut en terme de gestion de la part
des institutions sur une forme du prêt ou être dû en partie à la clientèle.
Tableau n° 5: Matrice de corrélation
RISK MAT SEX AGE OBJCRE RATIOCRE LOCAG NBRECYCL RATEND RTECO RTOP
RISK 1
MAT 0.108 1
SEX 0.215*** 0.0244 1
AGE -0.231*** -0.119* -0.11 1
OBJCRE 0.160** 0.0176 0.0348 -0.0124 1
RATIOCRE 0.355*** 0.0511 0.137* -0.157** 0.0217 1
LOCAG 0.0813 -0.156** 0.022 -0.0911 -0.00604 0.00611 1
-
NBRECYCL -0.233*** -0.00852 -0.0477 0.123* -0.111 -0.104 0.149** 1
RATEND -0.191*** -0.0666 -0.0549 0.118* 0.0827 -0.0985 -0.0124 0.0989 1
RTECO -0.00128 -0.275*** -0.0356 0.0136 -0.0167 -0.0429 -0.0322 -0.0689 -0.0179 1
RTOP 0.117* -0.124* -0.0299 -0.00426 -0.0475 0.104 0.121* -0.141* -0.125* 0.187** 1
Le point de départ est l'interprétation de la matrice des corrélations.

33
Le tableau montre que les trois premières variables: RISK, MAT et SEX appartiennent à un
groupe similaire puisque leur corrélation en valeur absolue est relativement forte (sauf pour la
variable AGE). Au contraire, la corrélation entre les variables objet de crédit et les autres
variables est très faible, on peut donc prévoir que ces variables vont former une dimension à part
dans l'analyse factorielle. La matrice de corrélation est utilisée pour extraire les facteurs à travers
une analyse en composante principale.
Par ailleurs, nous pouvons soupçonner l’existence d’un faible (même très faible) taux de
multicolinéarité entre les variables indépendantes des facteurs de prévision d’un modèle de
probabilité des défauts de crédit dans les IMF (au regard des coefficients de corrélation qui ne
dépassent pas 50% en termes de liaison). Sauf pour les quelques cas analysés précédents, et
encore plus que les corrélations sont non significatives statistiquement. Ici il est possible de
souligner une liaison partielle. Pratiquement, les tests de détection de la multi colinéarité de
Faraar et Glauber, et de Klein peuvent cerner les cas de multicolinéarité. Celui de Klein consiste
à comparer le coefficient de détermination du modèle R² et les coefficients de détermination R ij²
entre variables explicatives considérées deux à deux. Il y a présomption de multicolinéarité
lorsque la plupart des Rij² sont supérieurs au R2. Dans le cas où les regresseurs sont orthogonaux
(c'est-à-dire indépendants), la matrice présentant la décomposition de la variance en termes de
contribution de chaque variable indépendante dans la variance totale devrait être égale à la
matrice unitaire. On pourrait examiner la dépendance de la variance vis-à-vis des principales
variables exogènes, en se focalisant sur les variables ayant un « nombre de condition » élevé. Le
nombre de condition est une mesure de la dépendance des variables indépendantes. Le tableau
des coefficients de corrélation met en évidence, d’une part, des très faibles corrélations entre les
variables explicatives. C’est le cas, par exemple des variables telles que : le ratio d’endettement
(r=-0.0666), la rentabilité économique (r=0.0689),la localisation des clients dans l’agence (r=-
0.0911), … ; (pour les modèles 1&2). Ainsi que les corrélations entre les variables telles que : la
rentabilité opérationnelle (r=0.029), ratio crédit (r=-0.0217), … ; . Par conséquent, il apparait
raisonnable de conclure que la présomption de liaison soit partielle, et moins pertinente.
34
Tableau n° 6 : Résultats de régression
(1) (2)
Logit Probit
VARIABLES Défaut Defaut
MAT 0.30847** 0.18164**

(0.13369) (0.07974)
SEX 0.82479** 0.46010**
(0.33305) (09297)
AGE -0.02745** -0.01652**
(0.01150) (0.00671)
OBJCRE 1.48931*** 0.91129***
(0.56299) (0.32843)
RATIOCRE 2.30751*** 1.33334***
(0.46584) (0.25233)
LOCAG 0.78487** 0.47044**
(0.34919) (0.20752)
NBRECYCL -0.51983*** -0.31540***
(0.20050) (0.11549)
RATEND -2.29671** -1.31434**
(0.97338) (0.52895)
RTECO 0.71355 0.38740
(0.83207) (0.48808)
RTOP 1.33733 0.70017
(0.93954) (0.53742)
Constant -7.00034*** -4.04940***
(2.33859) (1.35545)
Observations 307 307

Standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1
Les résultats définitifs des régressions logistiques binaires (modèles 1&2) et à choix ordonnés
montrent clairement plus de significativité (en nombre de variables et en robustesse) des variables
indépendantes dans la sphère de tous les modèles. On cite dans le modèle 1, les
variables : maturité (à 13%), l’objet crédit (à 56%), ratio crédit (à 46%), localisation dans
l’agence (à 34%), nombre de cycle (à 20%), ratio d’endettement (97%), rentabilité économique
(83%), et la rentabilité opérationnelle (à 93%). Dans le modèle 2, les variables : maturité (à 7%),
35
l’objet crédit (à 32%), ratio crédit (à 25%), localisation dans l’agence (à 20%), nombre cycle (à
11%), ratio d’endettement (52%), rentabilité économique (48%), et la rentabilité opérationnelle
(53%).
Les paramètres avec des coefficients positifs influencent positivement la probabilité de défaut et
ceux munis de coefficients négatifs l’affecte négativement. Dans cette équation, on constate que
(AGE qui est considéré comme le nombre d’années que le client a déjà vécu), le nombre des fois
que le client a déjà demandé le crédit depuis son adhésion dans l’institution (NBRECYL), le ratio
d’endettement (RATEND) réduit la probabilité de défaut quand ils augmentent. Au contraire, la
maturité qui est une variable qui représente le crédit exprimé en nombre de mois (MAT), Le sexe
du client, l’objet de crédit, le rationnement de crédit, la localisation d’agence, la rentabilité
économique et la rentabilité opérationnelle ont une relation positive avec la probabilité de défaut.
On constate que plus les conditions financières sont élevées, plus grande est la probabilité de
défaut. L’exigence de conditions financières vise au moins deux objectifs. Premièrement, les
conditions financières visent à tester la disposition de l’emprunteur à contribuer financièrement
au projet à financer et son engagement envers ce projet et deuxièmement, elles visent à sécuriser
l’institution contre le risque de crédit. On constate que l’Object de crédit, le ratio de crédit et la
rentabilité opérationnelle influence le défaut de remboursement des crédits dans les institutions
des microfinances.
La variable dépendante est habituellement la survenue ou non d'un événement (dans notre cas
remboursement avec un retard qui dépasse 30 jours), et les variables explicatives sont
susceptibles d'influencer la survenue de cet événement. On constate l'avantage de quantifier la
force de l'association entre chaque variable indépendante et la variable dépendante en tenant
compte de l'effet des autres variables intégrées dans le modèle. Par ailleurs ces résultats peuvent
être aisément interprétés. Les coefficients estimés par le modèle sont, en effet, liés
mathématiquement à l'Odd Ratio (ou rapport de côtes en français), qui quantifie la force de
l'association entre le survenue d'un événement (retard de remboursement de 30 jours ou plus),
représenté par une variable dichotomique ou binaire et les facteurs susceptibles de l'influencer,
représenté par des variables explicatives. L'Odd Ratio prend des valeurs positives et indique trois
situations à savoir :
36
OR¿ 1: le risque de survenue de l'événement binaire à expliquer est augmenté par la variable
explicative.
OR=1 : la variable explicative (ou sa modalité) n'influe pas sur la variable à expliquer,
OR>1 : le risque de survenue de l'événement binaire à expliquer est augmenté par la variable
explicative.
L'Odd Ratio est calculée à partir des coefficients estimés de la régression logistique.
III.2. INDICATEURS POUR LA SELECTION DU MODELE DE PREDICTION

Pour avoir un modèle adéquat, il faut tout d’abord disposer des données fiables et en quantité
suffisante, il s’agit dans ce cas la nécessité d’avoir les données et rechercher une méthodologie
prévisionnelle qui consiste à dégager dans la série elle-même un certain nombre de composantes
que l’on peut prolonger dans le futur et des méthodes explicatives, recherchant des liaisons entre
la série à prévoir et des séries explicatives à travers les calculs de corrélation. La dernière étape
consiste à réaliser un modèle de prévision, à le simuler et à émettre des prévisions ; constituer un
modèle suppose de le spécifier puis de l’ajuster sur les données du passé d’où on essaye de faire
de prévision et comparer avec les autres modèles. La prévision est souvent considérée comme
l’aspect le plus problématique de la gestion, mais les experts pensent qu’il est possible d’établir
des bonnes prévisions grâce à des méthodes appropriées, qu’il faut avoir confiance de les utiliser.
Le modèle prédictif se concentre sur la grande capacité de prédiction des indicateurs mesurés, la
démarche permet de sélectionner un des modèles pour la prévision de la probabilité de défaut de
remboursement dans les institutions des microfinances.
Tableau n° 7: la sélection du modèle de prédiction
Précisio
Model/Indicator n Sensibilité Spécificité
Probit 0.7720 0.4881 0.8789

Sources : Nos analyses
Logit 0.7785 0.5119 0.8789
avec le logiciel R 3.5.0
Random Forest 0.9837 0.9643 0.991
Le modèle atteint son
Decision Trees 0.8762 0.75 0.9238
objectif s’il permet une
Support Vector
Machine 0.8534 0.5595 0.9641
37
prédiction supérieure aux autres modèles comparatifs, cette prédiction est bien sûre, variable
selon les domaines d’analyse. Ces tailles ou son niveau de précision, de sensibilité et spécificité
peuvent paraître modeste mais elles doivent être confrontées à d’autres modèles et surtout au
besoin de la recherche. L’autre apport du modèle est d’apprécier le poids relatif de chaque facteur
dans la prédiction du de probabilité de défaut de remboursement. On trouvera que soit l’attitude,
soit la norme subjective, soit le contrôle perçus prédit le meilleur modèle pour la probabilité de
défaut de crédit.
Les modèles testés présentent une précision, sensibilité et une spécificité. Le pourcentage d'erreur
de classement d'un bon emprunteur dans la catégorie «mauvais emprunteur». Le pourcentage
d'erreur de classement d'un mauvais emprunteur dans la catégorie «bons emprunteurs». En d'autre
terme, ces modèles permettent de prédire et avec succès le fait d'être un mauvais emprunteur,
alors qu'être un bon emprunteur sera prédit avec succès. Les résultats montrent également que ces
modèles permettent de classer correctement la prévision de probabilité de défaut des crédits dans
les institutions de microfinances. Ces résultats pourraient être plus forts en terme de capacité
prédictive.
On constate que le modèle probit prédit correctement 77,2% de précision sur 48,8 de sensibilité
et 87,8 de spécificité pour la prévision de la probabilité des crédits dans les institutions de
microfinances ;le modèle Logit nous fournit un pourcentage de 77,8% pour la précision,51,1%
pour la sensibilité et 87,8% pour la spécificité, decision trees 87,6% pour la précision,75% pour
la sensibilité et 92,3% pour la spécificité,le Support vector machine 85,3% pour la
précision ;55,9% pour la sensibilité et 96,4% pour la spécificité ; la Random forest nous fournis
un pourcentage elevé plusque les autres modèles de 98,3% de précision,96,4% de sensibilité et
99,1% de spécificité. A travers ces résultats il se constate que le modèle Random forest est le
meilleur modèle pour la prévision de la probabilité des défauts de crédit dans les institutions de
microfinances , Une attitude plus conservatrice améliore significativement de la performance du
modèle dans la prédiction des mauvais ou des bons emprunteurs.
Figure 1 : Abres de décision (Décision trees)

38
Il
se constate ici d’une représentation graphique basée sur petit ensemble de forme géométrique
connecté par des arcs orientés.
Les formes sont considérées comme les nœuds particuliers appelés racine ; en suivant un arc, le
premier nœud est le parent et le second est appelé fils.
En effet, l’avantage de cet arbre des décisions est d’utiliser ces formes géométriques pour
détecter le meilleur modèle de prévision de la probabilité des crédits dans les institutions de
microfinances.
Il bien entendu que réévaluer l’arbre peut être construit sur l’échantillon test pour déterminer la
meilleure solution.
En effet, l’échantillon devient partie prenante dans la construction du modèle, il joue le rôle
d’échantillon de réglage. On constate que, cet arbre de décision a des caractéristiques selon les
points forts et les point faibles ; le présent arbre de décision présente des performances
comparables aux autres modèles supervisés.
De ce fait, il est possible avec cet arbre de décision de trouver une représentation qui apporte une
solution à tous problèmes au cas où plusieurs modèles décrivent de la même manière des
étiquettes différentes. Cela ne veut pas dire pour autant qu’un algorithme d’induction d’arbre est
capable de trouver la solution.
En effet, le principe de construction pas à pas, local sur chaque sommet qualifié de myope
(kononenko et al,1997), empêche de trouver la solution.
39
III.2. DISCUSSION DES RESULTATS

Les tests statistiques utilisés dans les lignes précédentes nous ont fournis informations sur la
variable en étude ainsi qu’à la validation des certaines hypothèses avancées dans cette recherche.
Cette partie de la recherche nous laisse l’occasion de commenter nos résultats et les confronter à
d’autres travaux antérieurs.
40
Ayant comme objectif de sélectionner le modèle de prévision de la probabilité de défaut des

crédits dans les institutions des microfinances, nous avons fait les estimations des modèles logit,
probit ,le random forest,support vector machine et decision tree.
Nous avons trouvés que le modèle Random forest est le meilleur modèle pour la prévision de la
probabilité des défauts de crédit dans les institutions des microfinances , Une attitude plus
conservatrice améliore significativement de la performance du modèle dans la prédiction des
mauvais ou des bons emprunteurs.
Ces résultats sont similaires à ceux décrits dans les travaux de Steve Castanet et Romain Mazoué
(2022) qui ont utilisé aussi de données chronologiques ayant cherché tout d’abord la
stationnarité de ces données avec le test de ADF sur les rendements, Steve Castanet et Romain
Mazoué dans la Modélisation des corrélations de défauts dans l'analyse du risque de crédit avec
comme objectif l'utilisation des modèles est de pouvoir spécifier des facteurs afin de modéliser la
corrélation des défauts existant dans les portefeuilles de créances détenues par les banques.
L'objectif de ce modèle de décrire les différentes étapes qui, grâce aux modèles affines en temps
discret vont permettre d'étudier la relation entre les spreads des crédits observés et les prix des
obligations. Il est alors possible de relier les probabilités historiques et probabilités risques
neutres. Il trouve le résultat selon lequel le modèle permet d'étudier précisément les
composantes du spread de crédit, notamment en faisant apparaître les termes relatifs à la
corrélation du défaut. Cependant, les estimations des sensibilités deviennent rapidement lourdes
quand le nombre de facteurs augmentent, surtout si on les choisit dynamiques
Contrairement aux résultats des travaux des autres auteurs comme :
Arcadius Y. J. AKOSSOU 2014, qui ont fait recours au modèle random forest dans l’étude de
déterminants de la performance de remboursement des emprunteurs et des groupes de crédit. Les
taux de défaut de remboursement dans les échantillons considérés sont relativement élevés.
Plusieurs facteurs expliquent ce taux tant au niveau des crédits individuels que de groupe. Le
risque de défaut chez l’emprunteur est lié à la relation de long terme que ce dernier entretien avec
la structure, la garantie mise en jeu pour la demande et le niveau de richesse de l’emprunteur. Le
41
risque de défaut lié au crédit de groupe s’explique par la distance moyenne des lieux de résidence
des membres par rapport à leur lieu de travail, la fréquence des réunions, l’ethnie, l’activité
exercée par les membres, l’importance du montant de crédit demandé et le niveau de richesse des
membres du groupe ;Faute de statistiques existantes en la matière, des données primaires ont été
collectées à partir des dossiers des emprunteurs d’une par La modélisation de la probabilité du
défaut de remboursement a permis de dégager les variables, la surveillance des pairs a aussi
l’avantage de favoriser l’assistance des pairs si les raisons de la défaillance sont justifiées. Elle
permet également d’exercer plus de pression en cas de défaillance volontaire. Il trouve le résultat
selon lequel la méthode la plus utilisée pour couvrir les arriérés est la contribution à part égale de
chaque membre est en conformité avec l’affirmation de Huppi et Feder (1990) et les résultats de
Noglo et Androuais (2013), La comparaison des procédures de sélection a montré que la méthode
Backward/Forward en utilisant le critère BIC fait le meilleur choix de sous ensemble de variables
pour la prévision de la probabilité de défaut des crédits dans les institutions des microfinances.ils
trouvent que leur modèle est capable de fournir des prévisions précises de la probabilité de défaut
de crédit dans les institutions des microfinances, dans notre contexte nous nous sommes basés sur
l’évolution des crédits dans le passé pour parvenir à prévoir ce modèle dans le futur et nous
avons aussi trouvé que notre modèle était plus précis dans la prévision de probabilité de crédit
dans les institutions des microfinances.
CONCLUSION
Ce travail a porté sur la sélection d’un modèle de prévision de la probabilité de défaut des crédits
dans les institutions de microfinances le cas de FINCA. L’étude s’est fondée sur deux
préoccupations principales. D’abord, Analyser les différents modèles pour la prévision de défauts
des crédits dans les institutions des microfinances en suite analyser l’avantage de ce modèle dans
la prévision de probabilité des défauts de remboursement de crédit dans les institutions des
42
microfinances où nous avons montré le modèle qui convient dans la prévision de probabilité de
crédit dans les institutions des microfinances et montre l’avantage de ce modèle.
Au tour de trois chapitres, mis à part l’introduction et la conclusion, ce travail a été organisé. Le
premier a porté sur la revue de la littérature théorique et empirique, le deuxième chapitre sur la
méthodologie et enfin le troisième sur la présentation et discussion des résultats
Nous avons utilisés les différents modèles, nous avons fait les estimations des modèles logit,
probit et le random forest,support vector machine et decision tree.
Nous avons trouvés que le modèle Random forest est le meilleur modèle pour la prévision de la
probabilité des défauts de crédit dans les institutions de microfinances , Une attitude plus
conservatrice améliore significativement de la performance du modèle dans la prédiction des
mauvais ou des bons emprunteurs.Le modèle Random forest a un bon pouvoir de prédiction car il
prévoit correctement 99.1% de la prédiction de la probabilité de défaut.
Au vu d’une certaine littérature empirique sur la sélection du modèle de prévision de probabilité

de défaut de remboursement dans les institutions de microfinances avec des modèles encore plus
innovants que ceux de la famille logit,probit et Random forest et ses extensions, nous aurions pu
nous aussi expérimenter ces modèles innovants dans le cadre de cette étude, peut-être nos
résultats seraient encore meilleurs que ceux que nous avons obtenus.
Les méthodes qui nous ont permis de réaliser nos différents tests économétriques ne sont pas
certes exemptées d’insuffisances, étant donné que notre modèle de regression logistique,probit et
logit, peut-être nos résultats seraient probablement encore plus fiables que ceux que nous avons
obtenus.
BIBLIOGRAPHIE
1. Akaike, h. [1973]. information theory and an extension of the maximum likelihood

principle. in b. n. petrov and f. csaki ed. 2nd international symposium on information
theory 267-281. akademia kiado, budapest.
43
2. Alexis charbonneau,2013, la mise en place d'un modele d'evaluation du risque de credit

dans le cadre de la reforme solvabilite 2,pg 40-55.
3. Amemiya, T. (1981), « Qualitative Response Models : A Survey », Journal of Economic
Littérature, 19 (4), 481-536
4. Arcadius y. j. akossou, recherche des determinants du defaut de remboursement dans une
institution de micro finance, umr 7351 cnrs uns universite de nice – sophia antipolis, ufr
sciences – parc valrose 06108 cedex 02,2013.
5. Ben soltane bassem,2008, déterminants de la durée de retard de remboursement des
microcrédits individuels: application d'un modèle de durée,pg 4-34.
6. Boubacar diallo,2006, un modele de “credit scoring” pour une institution de micro-
finance africaine,mali,pg 18.
7. Bourbonnais, R. (1998), Econométrie : manuel et exercices corrigés, Université de Paris-
Dauphine, 2ème édition, Dunod, Paris
8. Bzeouich boudour,2013, la relation entre la performance financiere et sociale des
institutions de microfinance,tunisie,pg9-29.
9. Dhib nahla„ diener francine , diener marc « modelisation mathematique du flux espere
d’un microentrepreneur », econometrica, 2013
10. Dichter t. w., 1996, “questioning the future of ngos in microfinance”, journal of
international development, 8 (2), 259-269.
11. Dilruba khanam, 2018,financial sustainability of non-governmental microfinance
institutions (mfis): a cost-efficiency analysis of brac, asa, and proshika from
bangladesh,bangladesh,51pg.
12. Dr.riad baha, dr.fatima zohra soukeur,2019, modelisation du risque de solvabilite des pme
: une application de la methode du credit scoring,algerie,pg 59-67.
13. Emile aifa,2022, anciennete, asymetrie d’information et impayes dans une institution de
microfinance,benin,pg 22-34.
14. Gnoudanfoly amadou soro, 2014, analyse des d´eterminants de l’acces a la microfinance :
le cas des cooperatives d’´epargne et de credit en cote d’ivoire,pg 7-15.
15. Godquin m. (2004). microfinance repayment performance in bangladesh: how to improve
the allocation of loans by mfis, world development, 32 (11), 1909-1926
44
16. Gutiérrez-nieto b., serrano-cinca c., molinero c. m., 2005, « microfinance institutions and
efficiency”, omega international journal of management science, 35, 131- 142.
17. Gutiérrez-nieto b., serrano-cinca c., molinero c. m., 2007, “social efficiency in
microfinance institutions”, journal of the operational research society, november, 1-16.
18. Hocking r. r. [1976]. the analysis and selection of variables in linear regression.
biometrics 32, 1- 49.
19. Honlonkou a.n., 2002, evaluation de la performance de remboursement dans les
institutions de micro-finance au benin’, mondes en developpement n° 119: la
microfinance et l’evolution des systemes financiers. 30, 73–77
20. Honlonkou a. n., acclassato d. h. et quenum c. v. c. (2006). determinants de la
performance de remboursement dans les institutions de microfinance au benin. annals of
public and cooperative economics 77 (1), 53–81.
21. Hurlin, Ch. (2003), Cours d’économétrie des variables quantitatives, modèles
dichotomiques univariées, Faculté des sciences économiques et de gestion, Université
d’Orléans, Orléans-la-Source, inédit
22. Koffi mowu,2019, les facteurs determinant la performance de credits de remboursement
23. dans les imf,togo,pg 331-337.
24. Lahcen el kharti,2014, les determinants de la viabilite des institutions de microfinance au
maroc : une analyse en donnees de panel,pg 3-15.
23. Lansana bangoura1 didier hounwanou, microfinance, accompagnement des demandeurs

de credits : une analyse economique des contrats alternatifs,france,pg 3-12,2015.
24. M. hudon et t. ouro-koura 2006, etude des facteurs contingents du taux de remboursement
au 25. sein d’une institution de microfinance: le cas du togo,pg 3-16.
26. Mamadou ndione,2019, determinants de la performance des institutions de micro-credits :

uemoa et brics,france,pg 12-34.
27. Maty sene,2018, les determinants de la viabilite financiere,france,pg 3-11.
28. Maurice armand djontu**, joseph nzongang,2018, les determinants de l’efficience des
institutions de microfinance au cameroun,pg 5-19
45
29. Mushi mugumo, ph.d,2002, les facteurs determinants du secteur de la micro-finance en

republique democratique du congo,p 07-15.
30. Philibert andriamanantena, abdou issouf„ mamy raoul ravelomanana, rakotozafy

rivo,2023, application de double sanction sociale pour les modeles generalises d’octroi de
credit en microfinance,madascar pge 12
31. Philippe adair et imene berguiga,2010, les facteurs determinants de la performance

sociale et de la performance financiere des institutions de microfinance dans la region
mena, universite paris,pg 4-16.
32. Rosaline dado worou, 2019,impact des pratiques de gestion des ressources humaines sur
l’acceptation de l’erp dans les entreprises en afrique : cas de deux entreprises en afrique
de l’ouest,belgique,pg 8-26.
33. Steve castanet et romain mazoue, 2008, modelisation des correlations de defauts dans
l'analyse du risque de credit,pg 4-19.
34. Viganò, laura. (1993). “a credit scoring model for development banks”: an african case
study, savings and development, n4-xvii
35. Wenner m. (1995). group credit: a means to improve information transfer and loan
repayment performance, j. dev. stud., 32 (2), 263-281.
36. Yawo agbenyegan noglo, 2013,la micro-finance est-elle une solution efficace aux causes
du rationnement bancaire ? une analyse econometrique a travers les modeles probit et
binomial negatif,togo,6-18.

Memoire Corigé Patrick Cibasa

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Memoire Corigé Patrick Cibasa

Transféré par

Droits d'auteur :

Formats disponibles

I

République Démocratique du Congo

FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION

Sélection d’un modèle de prévision de la probabilité de défaut de

Mémoire présenté et défendu en vue de l’obtention du

Par KULONDWA CIBASA Patrick

Encadré par Assistant IRENGE Alain

Directeur : Prof. Dr. MATABARO BORAUZIMA Luc

Année académique 2022 – 2023

Signature : ……………………………………… Date……………………………….

Signature : ……………………………………… Date……………………………….

Signature : ……………………………………… Date……………………………….

KULONDWA CIBASA Patrick

A mon père, A ma mère, A mes frères et sœurs.

KULONDWA CIBASA Patrick

Au corps académique de l’Université Officielle de Bukavu et plus particulièrement à la faculté

KULONDWA CIBASA Patrick

CSSFD : Cellule de Surveillance des Systèmes Financiers Décentralisés

FCFA : Francs des Colonies Françaises en Afrique

FECECAM : Fédération des Caisses de Crédit Agricole et Mutuel

IMF : Institution de microfinance

ONG : Organisation Non Gouvernementale

PADME : Association pour la Promotion et l’Appui au Développement des

SFD : Systèmes Financiers Décentralisés

TABLE DES MATIERES

TABLE DES MATIERES...............................................................................................................V

LISTE DES TABLEAUX ET FIGURES.....................................................................................VII

CHAP I : REVUE DE LA LITTERATURE ET DEFINITION DES HYPOTHESES..................7

I.1. REVUE THEORIQUE ET DEFINITION DES HYPOTHESES....................................7

I.1.1. Définitions des concepts..................................................................................................7

1.2. REVUE DE LA LITTERATURE THEORIQUE...........................................................12

I.3. REVUE EMPIRIQUE.......................................................................................................16

CHAP II : CADRE D’ETUDE ET APPROCHE METHODOLOGIQUE....................................19

II.1. Collecte des données.........................................................................................................19

II.2. Analyse des données.........................................................................................................19

II.3. Catégorisation des emprunteurs.....................................................................................19

II.4. Prédiction de la probabilité de défaut de remboursement (emprunteur)...................20

II.4.2. Régression logistique....................................................................................................20

II.5. Estimation des paramètres...............................................................................................22

II.6. Présentation des outils de collecte et de traitement des données..................................27

II.7. Justification du choix des variables.................................................................................27

Chapitre Troisième : PRESENTATION ET DISCUSSION DES RESULTATS..........................31

III.1. PRESENTATION ET INTERPRETATION DES RESULTATS..............................31

III.2. INDICATEURS POUR LA SELECTION DU MODELE DE PREDICTION...................36

III.2. DISCUSSION DES RESULTATS.......................................................................................40

LISTE DES TABLEAUX ET FIGURES

Tableau n° 2. Synthèses des variables

Tableau n° 3: Statistiques descriptives

Tableau n° 4: Matrice de corrélation

Tableau n° 5 : Résultats de régression

Tableau n° 6: : Indicateurs pour la sélection du modèle de prédiction

Figure 1 : Arbre de décision (Décision trees)

Mots clés : Défaut des crédits

Les institutions de la microfinance (IMF) sont spécialisées dans la collecte de l’épargne et de

De plus dans le contexte actuel du financement du développement en Afrique subsaharienne,

 Quel est l’avantage du modèle dans la prévision de probabilité des défauts de

De manière spécifique, il s’agit de :

Analyser l’avantage de ce modèle dans la prévision de probabilité des défauts de remboursement

CHAP I : REVUE DE LA LITTERATURE ET DEFINITION DES HYPOTHESES

I.1. REVUE THEORIQUE ET DEFINITION DES HYPOTHESES

C’est encore un processus ou une opération volontaire et méthodique, phénomène inconscient ou

e. Défaut de remboursement de crédit

au-delà du contrôle du membre du groupe. La solidarité intra-groupe permet toutefois d’assurer