Académique Documents
Professionnel Documents
Culture Documents
RÉALISÉ PAR:
KADDOURI SALAHEDDINE
TOUILE SALAHEDDINE
WAQFI ABDELILAH
Plan
1. Introduction
2. Les principes du scoring
3. Les notation de scoring
4. La réalisation d’un modèle linéaire généralisé sur
l’application R
5. Conclusion
Introduction:
Le scoring des clients est un processus utilisé par les entreprises pour
évaluer la solvabilité et le risque de non-remboursement d'un client
potentiel ou existant. Le score de crédit est calculé en utilisant des
informations sur le comportement financier passé et présent du client,
telles que l'historique des paiements, le montant des dettes, la durée du
crédit, le type de crédit et le nombre de demandes de crédit récentes.
Les principes du scoring:
Il existe plusieurs principes de scoring qui guident la mise en place de cette méthode. Voici
quelques-uns de ces principes :
Utilisation de données pertinentes : Les modèles de scoring doivent utiliser des données
pertinentes et fiables pour évaluer le risque de crédit ou le potentiel de profit associé à un client.
Analyse statistique : Le scoring doit être basé sur une analyse statistique rigoureuse pour assurer
une évaluation précise du risque de crédit ou du potentiel de profit.
Transparence : Les entreprises doivent être transparentes quant aux méthodes utilisées pour
calculer les scores de crédit ou de profit.
Équité : Les modèles de scoring doivent être équitables et non discriminatoires. Les entreprises ne
doivent pas utiliser des critères de discrimination illégale, tels que la race, le sexe ou la religion,
pour évaluer le risque de crédit ou le potentiel de profit d'un client.
Les principes du scoring:
Notation interne
Notation externe
La notation interne:
Aa1, Aa2, AA+, AA, AA- AA+, AA, AA- Quasiment similaire à la meilleure noté, l’émetteur
Aa3 noté AA est très fiable.
A1, A2, A3 A+, A, A- A+, A, A- Bonne qualité mais le risque peut être présent dans
certaines circonstances économiques.
Baa1, Baa2, BBB+, BBB, BBB+, BBB, Solvabilité moyenne et la qualité est inférieure.
Baa3 BBB- BBB-
Ba1, Ba2,
A partir de cette note, l’affaire commence à être
Ba3 BB+, BB, BB- BB+, BB, BB- spéculative. Le risque de non remboursement est plus important sur le long
terme.
L’évaluation des risques crédit est devenue un des soucis majeurs des
institutions financières, ainsi il est nécessaire d’élaborer un système
statistique pour maintenir les niveaux des risques associés au crédits.
Autrement dit la connaissance des déterminants de la solvabilité des clients,
peut aider la banque à les accorder des crédits.
I. Description des données:
Plan de sondage :
Notre base de données représente les caractéristiques des clients d’une banque particulière, ces
données concernent, l’âge, le revenu, le montant et la solvabilité des crédits accordés. Il s’agit
d’une base de données artificielle, extrait du site : www.kaggle.com
Les données sont réparties selon 1000 observations, ainsi tout le travail est réaliser sous R.
• I-1 Importation des données:
# A tibble: 6 × 4
revenu age montant default
<dbl> <dbl> <dbl> <dbl>
1 50502. 28 3977. 0
2 24061. 35 3981. 1
3 56086. 35 3991. 0
4 33198. 59 3993. 0
5 30948. 43 3996. 0
6 35109. 41 4003. 0
Notre base de données est constitué de 4 variables et1000 observations est nommée « crédit », ainsi
au-dessus les six premières observations du liste, avec les variables, le revenu annuel de l’individu,
son âge, le montant annuel du crédit, et sa solvabilité.
I-2Les indicateurs de dispersion:
Boites à moustaches
On remarque que les jeunes entre 18 ans et 30 ans sont plus capable de rendre la dette, que les clients
d’âge 40 ans et plus
La variable revenu :
Il est remarquable le revenu annuel des clients n’a pas d’influence sur la solvabilité des clients.
I.3.Analyse des données :
0.765 0.235
Dimensions d’échantillon du test :
[1] 200 4
0 1
0.86 0.14
II. La régression logistique :
1 2 3 4 5 6
2.819596e-05 1.028627e -02 9.780625e-01 6.944349e-08 1.235873e-01 5.527419e-06
Cette étape donne les probabilités de solvabilité de chaque client de notre base de données, et pour
identifier les mauvais et les bons emprunteurs.
II.3. Métriques d’évaluation de performance du Modèle :
La courbe ROC commence dans l’angle inférieure gauche, avec la sensibilité 0, et une spécificité égale 1, correspondant au
classement de tous les clients, comme étant des cas de solvabilité des clients.
La zone optimale de la courbe ROC est celle qui est proche du coin supérieur gauche, ainsi cette zone correspond à des
sensibilités plus élevées associées.
AUC comprise entre … Interprétation
0.5-0.6 Aucune relation
0.6-0.7 Liaison faible
0.7-0.8 Liaison significative
0.8-0.9 Liaison forte
0.9-1 Corrélation
Les lignes de la matrice de confusion représentent les prédictions alors que les colonnes représentent les
classes réelles.
Le calcul des vrais positifs (VP), des vrais négatifs (VN), des faux positifs (FP) et des faux négatifs
(FN), le pourcentage de sensibilité (Se), la spécificité (Sp) et le taux de classification (Tc) permet de faire
cette évaluation
Matrice de confusion
1 0
1 47 0
0 12 141
Il est à noter qu’au cours de notre travail, nous avons eu à faire face à quelques Contraintes, notamment
la non disponibilité de données financières c’est pour ça nous avons utilisé une base de
donnes artificielle
Merci pour votre attention