Vous êtes sur la page 1sur 7

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/330703296

Détection de la défaillance des entreprises tunisiennes par la régression


logistique semi paramétrique et les réseaux de neurones

Conference Paper · May 2013

CITATIONS READS

4 340

2 authors:

Sami Mestiri Abdeljelil Farhat


Faculté des Sciences Économiques et de Gestion de Mahdia Faculté des sciences économiques et de gestion, Mahdia, Tunisia
60 PUBLICATIONS 28 CITATIONS 35 PUBLICATIONS 330 CITATIONS

SEE PROFILE SEE PROFILE

All content following this page was uploaded by Sami Mestiri on 29 January 2019.

The user has requested enhancement of the downloaded file.


La prévision de la détresse financière des
entreprises tunisiennes par le modèle régression
logistique semi paramétrique et les réseaux de
neurones
Sami Mestiri &Abdeljelil Farhat
Unité de recherche EAS-Mahdia
Faculté des sciences économiques et de gestion de Mahdia,
Université de Monastir, Tunisie.

Résumé : L’objectif de cet article est de comparer deux techniques de classification des
entreprises : la régression logistique semi paramétrique et les réseaux de neurones dans le
but de prévoir le risque de crédit des banques tunisiennes. L’échantillon utilisé comporte
528 firmes tunisiennes de différents secteurs d’activités dont nous disposons des bilans
et des comptes financiers des exercices 1999-2006. Une différence a été constatée entre le
modèle régression logistique semi paramétrique et celui basé sur les réseaux de neurones
en terme de performance de distinction entre les entreprises saines et celles en détresse. En
fait, nous avons démontré que les modèles basés sur les réseaux de neurones donnent des
meilleurs résultats des prévisions en termes de bon classement ainsi que par les résultats
obtenus de la courbe ROC.
Mots clés : Prévision ; Détresse financière ; Régression logistique semi paramétrique ;
Réseaux de neurones ; Courbe ROC.

Abstract : The aim of this paper is to compare tow different forecasting financial dis-
tress : the semi parametric logistic scoring model versus artificial neural networks in order
to predict the credit risk banks in Tunisia. The sample includes 528 Tunisian firms from
different sectors of activities that we have balance sheets and income statements for fiscal
years 1999-2006. There was performance difference between models based on semi para-
metric logistic model and artificial neural networks for distinction between the financial
health firms and default firms. The results obtained show that the use of artificial neural
networks improves the quality of model predictions in terms of good classification as well
as by the ROC curve result.
Key words : Forecasting ; Financial distress ; Logistic semi parametric model ; Neural
networks ; Curve ROC.

1 Introduction
La prévision de la détresse financière d’entreprises est une procédure très importante
pour ceux qui y sont impliqués (actionnaires, gestionnaires, salariés, prêteurs, fournisseurs,
clients et surtout l’État). Les modèles de prévision servent comme "système d’alerte " pour

1
les gestionnaires d’entreprises qui peuvent entreprendre des actions de prévention contre
le risque de faillite (par exemple, opération de rachat, de liquidation, de redressement,
etc.). D’autre part, ces modèles peuvent être aussi utiles pour les professionnels des éta-
blissements financiers dans l’évaluation et la sélection des entreprises auxquelles ils prêtent
des crédits. En partant de ces considérations et devant l’ampleur du phénomène, diverses
études et recherches ont été menées dans ce sens durant ces trente dernières années. Elles
visaient à mettre en évidence les principaux indicateurs permettant de prévoir à temps les
difficultés éprouvées par les entreprises. Nous pouvons citer parmi les premiers travaux, à
titre d’exemple, ceux de Beaver (1966) et Altman(1968).
Depuis cette période et jusqu’à nos jours, le nombre des études sur l’évaluation des
risques de faillite et la prévision de la détresse financière des entreprises ne cesse d’ac-
croître. Il suffit de citer Bardos et Zhu (1997), Chava et Jarrow (2004) et Hillegeist (2004).
La grande majorité de ces recherches s’appuie sur des outils d’analyse statistique de gran-
deurs comptables et de ratios financiers pour discriminer les entreprises saines des entre-
prises défaillantes. Ces études ont abouti à une fonction de score qui est un indicateur de
synthèse censé donner en un chiffre, le degré de défaillance possible d’une entreprise.
Ce papier s’intègre dans le cadre de comparaison de deux techniques de classification
des entreprises : la régression logistique semi paramétrique et les réseaux de neurones.
Ainsi, nous avons réalisé une recherche exploratoire des nouvelles relations fonctionnelles
entre les ratios et la probabilité de la détresse. Ces relations fonctionnelles ont été estimées
à travers le modèle de régression logistique semi paramétrique. D’un autre coté, nous avons
appliqué la technique des réseaux de neurones artificiels à la prévision de la détresse
financière des firmes tunisiennes

2 Le modèle de régression logistique semi paramétrique


Dans une étude relative à des entreprises américaines, Press et Wilson (1978) ont utilisé
des données de ratios en coupe transversale pour examiner si les coefficients de la fonction
de score estimés à partir du modèle de la régression logistique sont des déterminants
valides de la faillite des entreprises. Une caractéristique importante de ce modèle est que
les variables explicatives sont liées paramétriquement à la moyenne conditionnelle de la
variable expliquée
En réalité, l’hypothèse que la forme fonctionnelle dans le modèle de régression est
linéaire n’est souvent pas appropriée surtout lorsque le phénomène étudié est compliqué.
Pour contourner cette lacune, Zhang et Lin (2003) ont proposé une modélisation flexible
des effets des variables explicatives où le prédicteur linéaire dans le modèle de régression
est remplacé par des fonctions non paramétriques. Le nouveau modèle est nommé le
"Modèle de régression logistique semi paramétrique". L’intérêt principal du modèle semi
paramétrique est qu’il permet de distinguer les relations linéaires et les relations non

2
linéaires au sein d’un même modèle.
Dans notre application, nous avons choisi de retenir 7 ratios significatifs liés aux dif-
férentes dimensions de l’analyse financière et qui représentent les différents critères d’ap-
préciation de la bonne santé d’une entreprise. Sur la base des constats tirés à partir
des présentations graphiques de nuages des points des ratios en fonction des rapports de
chances correspondants, il est intéressant de considérer une modification de la variable ca-
pacité d’endettement R21 dans le modèle de régression. Ainsi, nous considérons ce modèle
de régression logistique semi paramétrique, qui s’écrit sous la forme suivante :

µ ¶
pi
log = β1 R7i + β2 R9i + β3 R10i + β4 R14i + β5 R15i + β6 R20i + f (R21i ) (1)
1 − pi

-R7 : Rotation de l’actif.


-R9 : Rentabilité économique.
-R10 :Rentabilité des capitaux.
-R14 :Taux de rentabilité des capitaux.
-R15 :Rotation des capitaux.
-R20 :Ratio des charges financières.
-R21 :Capacité d’endettement.

Avec pi = P (yi = 1|Rk , ), pour (i = 1, ..., n) et (k = 7, 9, 10, 14, 15, 20, 21) est la probabi-
lité a posteriori d’appartenance au groupe d’entreprises en détresse, β est un coefficient
inconnu et f est une fonction de lissage inconnue.
Selon l’approche de Wand et Ngo (2004), l’estimation du modèle de régression logis-
tique semi paramétrique (1) revient à estimer le modèle de régression logistique à effets
aléatoires.
La figure (1) représente la courbe de la fonction f (R21 ) estimée de la variable capacité
d’endettement à long terme avec son intervalle de confiance à 95%. D’après ce graphe,
pour un seuil inférieur à 1, la probabilité de détresse est une fonction décroissante de la
capacité d’endettement à long terme et pour un seuil supérieur à 1, elle devient croissante.

3 Les réseaux de neurones


Si l’analyse par le modèle de régression logistique semi paramétrique est devenue
connue comme une procédure économétrique caractérisée par deux étapes (la création
d’un modèle suivie par l’estimation de ses paramètres), les réseaux de neurones appar-
tiennent à une catégorie différente d’outils d’analyse des données. En effet, Tam et Kiang

3
15
10
s(X2,2)

5
0
−5

−1.0 −0.5 0.0 0.5 1.0 1.5 2.0

X2

Fig. 1 – La courbe de la fonction estimée f (R21 )

(1992), Altman (1994), ont intégré les progrès enregistrés en matière d’intelligence artifi-
cielle pour la construction des modèles de prévision de la détresse financière des firmes.
Les modèles développés sont non linéaires et non paramétriques et tiennent compte des
avancées effectuées en matière de reproduction artificielle des réseaux de neurones et de
génétique.
Dans le contexte de notre travail, plusieurs chercheurs (Perez, 2006 ; Chih-Fong et
Jhen-Wei, 2008 ;Tilmont, 1998 ; Bardos et Zhu, 1997) ont proposé l’emploi de modèles
basés sur les réseaux de neurones en vue d’améliorer la prise de décision du banquier.
Étant donné que les modèles de réseaux de neurones se construisent par apprentissage
à partir d’un certain nombre d’observations, tout au long de cette application, nous avons
utilisé uniquement 80% des observations pour la Formation (Apprentissage) et les 20%
restant afin de tester la capacité prédictive réelle du réseau.
Le réseau a été entraîné sur tout l’ensemble d’apprentissage correspondant aux 7 ratios
calculés. Pour chaque configuration à tester, le réseau de neurones essaie de déterminer
l’ensemble des pondérations optimales des inputs. Les valeurs des outputs obtenus, grâce
à chaque système de pondération, sont comparées au statut réel de l’entreprise : saine ou
en détresse, ce statut étant appréhendé à travers un score égal à 1 lorsque l’entreprise est
saine et à 0 dans le cas contraire. Le pourcentage de classifications correctes des firmes
est calculé en rapportant le nombre d’observations correctement classées au nombre total
d’observations dans l’échantillon d’apprentissage.

4 La validation des fonctions de score de la détresse


Après avoir déterminé des fonctions de score de la détresse, il faut en évaluer leurs
efficacités. Nous pouvons le faire par les tests du pouvoir discriminant et les tests du
pouvoir prédictif. Ainsi, nous allons calculer le taux d’erreur de classement et tracer la

4
Le réseaux de neurones La régre. logistique semi
Ŷ = 1 Ŷ = 0 Total Ŷ = 1 Ŷ = 0 Total
Y =1 24 14 38 6 3 9
Y =0 65 510 575 83 521 604
Le taux d’erreur 0.128 0.140
Tab. 1 – Matrice de confusion des modèles estimés pour l’échantillon test

courbe de ROC "Receiver Operating Curve" en calculant les indices associés tels que l’aire
sous la courbe de ROC.
Nous rappelons que le taux d’erreur de classement est égal au nombre de mauvais
classement rapporté à l’effectif total. D’après la table 1, le taux d’erreur de classement
égal à 14% pour le modèle de la régression logistique semiparamétrique et 12.8% pour
les réseaux des neurones c.à.d une amélioration de prédiction de 1.2%. Ce qui prouve
l’importance de l’utilisation de la technique des réseaux des neurones dans le calcul de
risque de la détresse.
La courbe ROC est un outil graphique qui permet d’évaluer et de comparer globale-
ment le comportement des fonctions de scores (Pepe(2000)). Elle est indépendante des
coûts de mauvaise affectation. Elle est aussi opérationnelle même dans le cas des dis-
tributions très déséquilibrées. Mieux, même si les proportions des classes ne sont pas
représentatives des probabilités a priori, la courbe ROC reste valable.

La courbe ROC de semi param. (AUC=0.684)La courbe ROC des réseaux (AUC=0.709)
1.0

1.0
0.8

0.8
0.6

0.6
sensibilité

sensibilité
0.4

0.4
0.2

0.2
0.0

0.0

0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0

1−spécificité 1−spécificité

Fig. 2 – Les courbes ROC des modèles établis

D’après la figure 2, il est évident que la règle de classification basée sur les réseaux de
neurones est plus performante que celle basée sur la régression logistique semi paramé-
trique. Ceci nous amène à conclure que la validité de la fonction de score issue du modèle
de réseaux de neurones est meilleur que celle obtenue à partir du modèle de régression
logistique semi paramétrique.
L’aire sous la courbe ROC (AUC) mesure la qualité de discrimination du modèle

5
View publication stats

et traduit la probabilité qu’une entreprise saine ait un score supérieur au score d’une
entreprise en détresse, ceux-ci étant tirés au hasard. L’AUC du modèle de régression
logistique semi paramétrique est égale à 0.61 par contre l’AUC de réseaux de neurones
est égale à 0.709 ; plus sont proches de un.
En conclusion, dans ce papier nous avons attiré l’attention sur l’aspect non linéaire des
relations entre les ratios et la probabilité de la détresse. D’autre part, nous avons montré
que les réseaux de neurones artificiels est un outil de prévision puissant en matière de
détresse financière des firmes.

Bibliographie
[1] Altman, E. I. (1968). Financial ratios, discriminant analysis and the prediction of
corporate bankruptcy. The Journal of Finance, 23(4) :589-609.
[2] Altman E.I, Marco G. and Varetto F. (1994), Corporate distress diagnosis : compa-
risons using linear discriminant analysis and neural networks : the Italian experience,
Journal of banking and finance, 18 :505-529.
[3] Bardos, M. and Zhu, W. H. (1997). Comparaison de l’analyse discriminante linéaire
et des réseaux de neurones. application à la détection de défaillance d’entreprises. Revue
Statistique Appliquée.
[4] Beaver, W. H. (1966). Financial ratios as predictors of failure. Journal of Accounting
Research, 4 :71-111.
[5] Breslow, N. and Clayton, D. G. (1993). Approximate Inference in Generalized Linear
Mixed Models. Journal of the American Statistical Association, 88 :9 - 25.
[6] Chava, S. and Jarrow, R. A. (2004). Bankruptcy Prediction with Industry Effects.
Review of Finance, 8(4) :537-569.
[7] Tam K.Y.et Kiang M.Y. (1992), Managerial application of neural networks : the case
of bank failure predictions, Management science, 38 : 926-947.
[8] Ngo, L. and Wand, M. (2003). "Smoothing with mixed model software". Journal of
Statistical Software, 4(1) :1-54.
[9] Pepe, M. S. (2000). Receiver operating characteristic methodology. Journal of the
American Statistical Association, 95(449) :308-311.
[10] Press, S. J. and Wilson, S. (1978). Choosing between logistic regression and discrimi-
nant analysis. Journal of the American Statistical Association, 73(364) :699-705.
[11] S. Hillegeist, E. Keating, D. C. and Lundstedt, K. (2004). Assessing the probability
of bankruptcy. Review of Accounting Studies, 9 :5-34.
[12] Zhang, D. and Lin, X. (2003). "Hypothesis testing in semiparametric additive mixed
models".Biostat, 4(1) :57-74.

Vous aimerez peut-être aussi