Académique Documents
Professionnel Documents
Culture Documents
net/publication/330703296
CITATIONS READS
4 340
2 authors:
All content following this page was uploaded by Sami Mestiri on 29 January 2019.
Résumé : L’objectif de cet article est de comparer deux techniques de classification des
entreprises : la régression logistique semi paramétrique et les réseaux de neurones dans le
but de prévoir le risque de crédit des banques tunisiennes. L’échantillon utilisé comporte
528 firmes tunisiennes de différents secteurs d’activités dont nous disposons des bilans
et des comptes financiers des exercices 1999-2006. Une différence a été constatée entre le
modèle régression logistique semi paramétrique et celui basé sur les réseaux de neurones
en terme de performance de distinction entre les entreprises saines et celles en détresse. En
fait, nous avons démontré que les modèles basés sur les réseaux de neurones donnent des
meilleurs résultats des prévisions en termes de bon classement ainsi que par les résultats
obtenus de la courbe ROC.
Mots clés : Prévision ; Détresse financière ; Régression logistique semi paramétrique ;
Réseaux de neurones ; Courbe ROC.
Abstract : The aim of this paper is to compare tow different forecasting financial dis-
tress : the semi parametric logistic scoring model versus artificial neural networks in order
to predict the credit risk banks in Tunisia. The sample includes 528 Tunisian firms from
different sectors of activities that we have balance sheets and income statements for fiscal
years 1999-2006. There was performance difference between models based on semi para-
metric logistic model and artificial neural networks for distinction between the financial
health firms and default firms. The results obtained show that the use of artificial neural
networks improves the quality of model predictions in terms of good classification as well
as by the ROC curve result.
Key words : Forecasting ; Financial distress ; Logistic semi parametric model ; Neural
networks ; Curve ROC.
1 Introduction
La prévision de la détresse financière d’entreprises est une procédure très importante
pour ceux qui y sont impliqués (actionnaires, gestionnaires, salariés, prêteurs, fournisseurs,
clients et surtout l’État). Les modèles de prévision servent comme "système d’alerte " pour
1
les gestionnaires d’entreprises qui peuvent entreprendre des actions de prévention contre
le risque de faillite (par exemple, opération de rachat, de liquidation, de redressement,
etc.). D’autre part, ces modèles peuvent être aussi utiles pour les professionnels des éta-
blissements financiers dans l’évaluation et la sélection des entreprises auxquelles ils prêtent
des crédits. En partant de ces considérations et devant l’ampleur du phénomène, diverses
études et recherches ont été menées dans ce sens durant ces trente dernières années. Elles
visaient à mettre en évidence les principaux indicateurs permettant de prévoir à temps les
difficultés éprouvées par les entreprises. Nous pouvons citer parmi les premiers travaux, à
titre d’exemple, ceux de Beaver (1966) et Altman(1968).
Depuis cette période et jusqu’à nos jours, le nombre des études sur l’évaluation des
risques de faillite et la prévision de la détresse financière des entreprises ne cesse d’ac-
croître. Il suffit de citer Bardos et Zhu (1997), Chava et Jarrow (2004) et Hillegeist (2004).
La grande majorité de ces recherches s’appuie sur des outils d’analyse statistique de gran-
deurs comptables et de ratios financiers pour discriminer les entreprises saines des entre-
prises défaillantes. Ces études ont abouti à une fonction de score qui est un indicateur de
synthèse censé donner en un chiffre, le degré de défaillance possible d’une entreprise.
Ce papier s’intègre dans le cadre de comparaison de deux techniques de classification
des entreprises : la régression logistique semi paramétrique et les réseaux de neurones.
Ainsi, nous avons réalisé une recherche exploratoire des nouvelles relations fonctionnelles
entre les ratios et la probabilité de la détresse. Ces relations fonctionnelles ont été estimées
à travers le modèle de régression logistique semi paramétrique. D’un autre coté, nous avons
appliqué la technique des réseaux de neurones artificiels à la prévision de la détresse
financière des firmes tunisiennes
2
linéaires au sein d’un même modèle.
Dans notre application, nous avons choisi de retenir 7 ratios significatifs liés aux dif-
férentes dimensions de l’analyse financière et qui représentent les différents critères d’ap-
préciation de la bonne santé d’une entreprise. Sur la base des constats tirés à partir
des présentations graphiques de nuages des points des ratios en fonction des rapports de
chances correspondants, il est intéressant de considérer une modification de la variable ca-
pacité d’endettement R21 dans le modèle de régression. Ainsi, nous considérons ce modèle
de régression logistique semi paramétrique, qui s’écrit sous la forme suivante :
µ ¶
pi
log = β1 R7i + β2 R9i + β3 R10i + β4 R14i + β5 R15i + β6 R20i + f (R21i ) (1)
1 − pi
Avec pi = P (yi = 1|Rk , ), pour (i = 1, ..., n) et (k = 7, 9, 10, 14, 15, 20, 21) est la probabi-
lité a posteriori d’appartenance au groupe d’entreprises en détresse, β est un coefficient
inconnu et f est une fonction de lissage inconnue.
Selon l’approche de Wand et Ngo (2004), l’estimation du modèle de régression logis-
tique semi paramétrique (1) revient à estimer le modèle de régression logistique à effets
aléatoires.
La figure (1) représente la courbe de la fonction f (R21 ) estimée de la variable capacité
d’endettement à long terme avec son intervalle de confiance à 95%. D’après ce graphe,
pour un seuil inférieur à 1, la probabilité de détresse est une fonction décroissante de la
capacité d’endettement à long terme et pour un seuil supérieur à 1, elle devient croissante.
3
15
10
s(X2,2)
5
0
−5
X2
(1992), Altman (1994), ont intégré les progrès enregistrés en matière d’intelligence artifi-
cielle pour la construction des modèles de prévision de la détresse financière des firmes.
Les modèles développés sont non linéaires et non paramétriques et tiennent compte des
avancées effectuées en matière de reproduction artificielle des réseaux de neurones et de
génétique.
Dans le contexte de notre travail, plusieurs chercheurs (Perez, 2006 ; Chih-Fong et
Jhen-Wei, 2008 ;Tilmont, 1998 ; Bardos et Zhu, 1997) ont proposé l’emploi de modèles
basés sur les réseaux de neurones en vue d’améliorer la prise de décision du banquier.
Étant donné que les modèles de réseaux de neurones se construisent par apprentissage
à partir d’un certain nombre d’observations, tout au long de cette application, nous avons
utilisé uniquement 80% des observations pour la Formation (Apprentissage) et les 20%
restant afin de tester la capacité prédictive réelle du réseau.
Le réseau a été entraîné sur tout l’ensemble d’apprentissage correspondant aux 7 ratios
calculés. Pour chaque configuration à tester, le réseau de neurones essaie de déterminer
l’ensemble des pondérations optimales des inputs. Les valeurs des outputs obtenus, grâce
à chaque système de pondération, sont comparées au statut réel de l’entreprise : saine ou
en détresse, ce statut étant appréhendé à travers un score égal à 1 lorsque l’entreprise est
saine et à 0 dans le cas contraire. Le pourcentage de classifications correctes des firmes
est calculé en rapportant le nombre d’observations correctement classées au nombre total
d’observations dans l’échantillon d’apprentissage.
4
Le réseaux de neurones La régre. logistique semi
Ŷ = 1 Ŷ = 0 Total Ŷ = 1 Ŷ = 0 Total
Y =1 24 14 38 6 3 9
Y =0 65 510 575 83 521 604
Le taux d’erreur 0.128 0.140
Tab. 1 – Matrice de confusion des modèles estimés pour l’échantillon test
courbe de ROC "Receiver Operating Curve" en calculant les indices associés tels que l’aire
sous la courbe de ROC.
Nous rappelons que le taux d’erreur de classement est égal au nombre de mauvais
classement rapporté à l’effectif total. D’après la table 1, le taux d’erreur de classement
égal à 14% pour le modèle de la régression logistique semiparamétrique et 12.8% pour
les réseaux des neurones c.à.d une amélioration de prédiction de 1.2%. Ce qui prouve
l’importance de l’utilisation de la technique des réseaux des neurones dans le calcul de
risque de la détresse.
La courbe ROC est un outil graphique qui permet d’évaluer et de comparer globale-
ment le comportement des fonctions de scores (Pepe(2000)). Elle est indépendante des
coûts de mauvaise affectation. Elle est aussi opérationnelle même dans le cas des dis-
tributions très déséquilibrées. Mieux, même si les proportions des classes ne sont pas
représentatives des probabilités a priori, la courbe ROC reste valable.
La courbe ROC de semi param. (AUC=0.684)La courbe ROC des réseaux (AUC=0.709)
1.0
1.0
0.8
0.8
0.6
0.6
sensibilité
sensibilité
0.4
0.4
0.2
0.2
0.0
0.0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
1−spécificité 1−spécificité
D’après la figure 2, il est évident que la règle de classification basée sur les réseaux de
neurones est plus performante que celle basée sur la régression logistique semi paramé-
trique. Ceci nous amène à conclure que la validité de la fonction de score issue du modèle
de réseaux de neurones est meilleur que celle obtenue à partir du modèle de régression
logistique semi paramétrique.
L’aire sous la courbe ROC (AUC) mesure la qualité de discrimination du modèle
5
View publication stats
et traduit la probabilité qu’une entreprise saine ait un score supérieur au score d’une
entreprise en détresse, ceux-ci étant tirés au hasard. L’AUC du modèle de régression
logistique semi paramétrique est égale à 0.61 par contre l’AUC de réseaux de neurones
est égale à 0.709 ; plus sont proches de un.
En conclusion, dans ce papier nous avons attiré l’attention sur l’aspect non linéaire des
relations entre les ratios et la probabilité de la détresse. D’autre part, nous avons montré
que les réseaux de neurones artificiels est un outil de prévision puissant en matière de
détresse financière des firmes.
Bibliographie
[1] Altman, E. I. (1968). Financial ratios, discriminant analysis and the prediction of
corporate bankruptcy. The Journal of Finance, 23(4) :589-609.
[2] Altman E.I, Marco G. and Varetto F. (1994), Corporate distress diagnosis : compa-
risons using linear discriminant analysis and neural networks : the Italian experience,
Journal of banking and finance, 18 :505-529.
[3] Bardos, M. and Zhu, W. H. (1997). Comparaison de l’analyse discriminante linéaire
et des réseaux de neurones. application à la détection de défaillance d’entreprises. Revue
Statistique Appliquée.
[4] Beaver, W. H. (1966). Financial ratios as predictors of failure. Journal of Accounting
Research, 4 :71-111.
[5] Breslow, N. and Clayton, D. G. (1993). Approximate Inference in Generalized Linear
Mixed Models. Journal of the American Statistical Association, 88 :9 - 25.
[6] Chava, S. and Jarrow, R. A. (2004). Bankruptcy Prediction with Industry Effects.
Review of Finance, 8(4) :537-569.
[7] Tam K.Y.et Kiang M.Y. (1992), Managerial application of neural networks : the case
of bank failure predictions, Management science, 38 : 926-947.
[8] Ngo, L. and Wand, M. (2003). "Smoothing with mixed model software". Journal of
Statistical Software, 4(1) :1-54.
[9] Pepe, M. S. (2000). Receiver operating characteristic methodology. Journal of the
American Statistical Association, 95(449) :308-311.
[10] Press, S. J. and Wilson, S. (1978). Choosing between logistic regression and discrimi-
nant analysis. Journal of the American Statistical Association, 73(364) :699-705.
[11] S. Hillegeist, E. Keating, D. C. and Lundstedt, K. (2004). Assessing the probability
of bankruptcy. Review of Accounting Studies, 9 :5-34.
[12] Zhang, D. and Lin, X. (2003). "Hypothesis testing in semiparametric additive mixed
models".Biostat, 4(1) :57-74.