Académique Documents
Professionnel Documents
Culture Documents
Nous disposons de la base Faillite où les ratios suivants sont observés sur 46 entreprises :
QUESTIONS
Les variables X1, X2, X3 et X4 sont des variables quantitatives continues puisque ce sont des
ratios financiers. Ils prennent donc des valeurs appartenant à l’ensemble des nombres réels.
La variable Y est une variable qualitative dichotomique.
2) D’après vous, est-ce qu’il semble y avoir des différences de distribution des
variables explicatives selon les modalités de la variable expliquée ? Justifiez.
4) Pour chaque méthode de sélection des variables explicatives dans le cadre d’une
estimation de type Logit quel est le modèle retenu pour l’estimation ? Indiquer
quelle figure correspond à quelle méthode.
6) Cette statistique suit une loi du Chi2 à combien de degrés de liberté ? En vous
référant à la table du Chi2, la p-value de ce test est-elle inférieure à 5% ? A 1% ? A
0.5% ? Qu’en concluez-vous ?
Cette statistique suit une loi du Chi2 à 2 degrés de liberté puisqu’il y a deux variables dans le
modèle estimé. En se référant à la ligne correspondant à 2 degrés de liberté dans la table on
peut voir que la valeur de la statistique que nous avons calculé, 70.114, est bien supérieure à
la valeur correspondant au seuil de 5%, de 1% et de 0.5%. On peut donc en conclure que
notre modèle est significatif, c’est-à-dire qu’au moins un des coefficients estimés est
effectivement non-nul.
1-(28.364/63.421)=1-0.447=0.553.
On peut donc conclure que le modèle est plutôt un bon modèle. En effet, malgré le fait que le
R2 de McFadden puisse aller de 0 à 1, des valeurs entre 0.2 et 0.4 sont plutôt considérée
comme étant bonnes (de l’avis de McFadden lui-même).
La spécificité est calculée comme la capacité à prédire une absence de faillite. C’est égal à
24/(24+1). Le nombre de 0 correctement prédit sur le nombre de 0 qui existent dans
l’échantillon. On obtient une spécificité de 96%.
Le taux de faux positifs est l’oppose de la spécificité (qu’on peut considéré comme le « taux
de vrais négatifs »). Il est donc de 4%. Enfin le taux d’erreur est le nombre de prédiction
incorrecte rapportée au nombre de prédiction totale. Soit 4/46=0.09%.
On peut donc conclure que notre modèle effectue un excellent travail de prédiction. Il repère
très bien les faillites, avec une sensibilité et une précision élevée. Il a un très faible taux
d’erreur et de faux positifs.
Au vu des résultats à la figure 11 on peut voir que les deux coefficients associés aux variable
X1 et X3 sont significatifs (p-value < 0.05). Ces coefficients sont négatifs. On peut donc en
conclure que plus le taux de couverture est élevé (toutes choses égales par ailleurs) plus la
probabilité de faillite sera faible. Similairement plus la capacité de remboursement est élevée
(toutes choses égales par ailleurs) plus la probabilité de faillite sera faible.
On ne peut se référer à la valeur des coefficients pour répondre à cette question. Il faut donc
se référer à la figure 9 qui représente les effets marginaux. En moyenne une augmentation de
la capacité de remboursement de 1 fera chuter de 28% la probabilité de faillite d’une
entreprise.
11) Vérifier s’il n’existe pas des données pouvant influencer les résultats de
l’estimation.
On se réfère aux résidus (figure 12). On considère qu’une observation influe fortement les
résultats de l’estimation si la valeur du résidu pour cette observation est supérieure à 2 en
valeur absolue. Il y a une seule observation correspondant à ce cas est c’est l’observation n°
16.
12) On réestime le modèle précédent en utilisant un modèle de type Probit cette fois.
Répondez à nouveau aux questions 4,5,6,7,9 et 10 pour ce modèle.
Les méthodes pour répondre sont exactement les même, seules les valeurs changent. Je ne
rédige donc pas de correction pour cette question.
SORTIES
Figure 12 - Résidus
Figure 13 - Tableau de prédiction (en ligne les modalités observées et en colonne les prédictions du modèle
Logit)
Figure 14 - Table de la loi du Chi2 (dl= degrés de libertés)
Figure 15 - Méthode 1 de sélection des variables
Figure 16 - Méthode 2 de sélection des variables
Figure 17 - Méthode 3 de sélection des variables
Figure 18 - Estimation du modèle (Probit)