Vous êtes sur la page 1sur 33

lisation de la dure

Mode e de vie
t des clients
du pre

le 7 Avril 2017

Rapport projet statistique

Realise par :
Salma AIT ELHADJ OMAR Encadre par :
Sarah AKHMOUCH Fouad MARRI
Rajae AZENNOUD Saad BENJELOUN
Najla LAAZIZI
Rapport projet statistique Projet 4

Contents
1 Nettoyage de la base de donn ees : 3
1.1 Conversion des variables en format date : . . . . . . . . . . . . . . . . 4
1.2 Valeurs manquantes : . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2 Analyse Exploratoire de donn ees : 7


2.1 Frequence de la duree de vie du pret : . . . . . . . . . . . . . . . . . . 7
2.2 Effet des variables sur la duree de vie du pret: . . . . . . . . . . . . . 9
2.3 Correlation : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3 Analyse Kaplan-Meier : 21
3.1 Ajustement de la base de donnees : . . . . . . . . . . . . . . . . . . . 21
3.2 Courbes de survie : . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

1
Rapport projet statistique Projet 4

Introduction
Dans le cursus de formation dingenieurs, plus precisement durant la deuxi`eme annee,
les el`eves sont censes realiser un projet statistique par groupe. Ce projet peut etre
un plus pour note avenir professionnel. Nous avons le projet de modelisation de la
prediction de la duree dun pret.
Notre equipe se compose de quatre membres, se constitue donc de Sarah AKHMOUCH,
Salma AIT EL HADJ OMAR, Rajae AZENNOUD et de Najla LAAZIZI. Globale-
ment le travail etait plutot collectif.
La modelisation statistique se fait generalement par des logiciels tels SAS et R. Nous
avons choisi de travailler avec le logiciel SAS pour sa capacite de traitement de bases
de donnees plus volumineuses.
Nous allons donc voir `a travers ce rapport dans une premi`ere partie la procedure
de nettoyage de la base de donnees, ensuite nous allons detailler notre analyse ex-
ploratoire de donnees ainsi que lanalyse de la modelisation faite par la methode
Kaplan-Meier, et finalement une conclusion recapitulative des resultats obtenus.

Prob
ematique
Avant acceptation de toutes demandes de prets, tout institut de pret proc`ede tout
dabord par une evaluation du risque du credit, qui sevalue par une prediction de
la duree de remboursement en prenant en consideration plusieurs facteurs qui sont
: le montant et le cout du pret... Il est donc important de savoir si la duree de son
pret est trop longue ou trop courte pour negocier de meilleures conditions.
Notre projet consiste a` modeliser cette duree. Il soul`eve donc un facteur critique
dans le secteur des prets.

2
Rapport projet statistique Projet 4

1 Nettoyage de la base de donn


ees :
Notre base de donnees contient 34 715 observations, et se compose initialement de
15 variables qui sont:

ID CLIENT : Ldentifiant du client.


DATE DEBU T PRET : La date de debut du pret.
DATE F IN PRET : La date de fin du pret.
ST AT U T PRET : Specifie si le remboursement est `a terme ou bien anticipe.
DU REE THEORIQUE : La duree au bout de laquelle le client est suppose ren-
bourser le pret.
M ON T AN T PRET : Le montant du pret du client.
T AU X PRET : Le taux fixe par linstitue de pret.
M ARQU E : La marque de la voiture que le client souhaite acheter.
M ON T AN T VEHICULE : Le montant du vehicule choisi par le client.
P U ISSAN CE FISCALE : la puissance du moteur du vehicule souhaite.
AN NAISSANCE : Lannee de naissance du client.
DEPARTEMENT :La region `a laquelle appartient le client.
PROFESSION : La profession du client.
SIT FAMILIALE : La situation familiale du client : marie , celibataire, veuf, separe,
divorce ou inconnu.
SIT IMMOB : La situation immobiliare du client : prorietaire, locataire ou autre.

Il est indispensable de nettoyer la base de donnees avant dentamer le travail. Les


valeurs manquantes, les doublons et les variables avec un type inadequat peuvent
causer un blocage lors de la modelisation ou bien fausser les resultats. Il faut noter
que la base de donnees de notre projet ne contient pas de doublons.

N.B :
Montant vehicule en euros.
Nous avons decide de travailler avec la Duree de pret en jours, vu que le fait
de la convertir en mois ne permettra pas de bien visualiser la difference de la
duree de pret par clients.

3
Rapport projet statistique Projet 4

1.1 Conversion des variables en format date :

Nous avons commence par unifier les formats sous lesquels les dates sont ecrites dans
la base de donnees initiale:

Pour cela, nous avons eu recours au Bloc-notes afin de les modifier au format ddm-
mYYYY. Ensuite, sous SAS, nous avons pu convertir les dates au format voulu
(date9.1) `a laide du code suivant :
Data projetV2DATE;
infile /folders/myfolders/Najla/P4V2.csv firstobs=2 delimiter=";";
length DATE_DEBUT_PRET $12.;
input ID_CLIENT$ DATE_DEBUT_PRET$ DATE_FIN_PRET$ STATUT_PRET$
DUREE_THEORIQUE_PRET MONTANT_PRET TAUX_PRET MARQUE$
MONTANT_VEHICULE PUISSANCE_FISCALE AN_NAISSANCE $ DEPARTEMENT$
PROFESSION$ SIT_FAMILIALE$ SIT_IMMOB$;
run;
Ce bout de code nous a permis de charger la base de donnees modifiee tout en
precisant le type des variables DATE DEBUT PRET et DATE FIN PRET (Chane
de caract`eres). Cette etape est importante puisque nous allons par la suite utiliser
la fonction substr qui ne prend en argument que des chanes de caract`eres :
Data DataFinal;
SET projetV2DATE;
format DateDebut date9.1;
format DateFin date9.1;
a=substr(trim(left(DATE_DEBUT_PRET)),1,2);

4
Rapport projet statistique Projet 4

b=substr(trim(left(DATE_DEBUT_PRET)),3,2);
c=substr(trim(left(DATE_DEBUT_PRET)),5,4);
DateDebut=mdy(input(b,2.),input(a,2.),input(c,4.));
a2=substr(trim(left(DATE_FIN_PRET)),1,2);
b2=substr(trim(left(DATE_FIN_PRET)),3,2);
c2=substr(trim(left(DATE_FIN_PRET)),5,4);
DateFin=mdy(input(b2,2.),input(a2,2.),input(c2,4.));
RUN;

1.2 Valeurs manquantes :

Dune part, les colonnes MARQUE, PROFESSION et PUISSANCE FISCALE ont


un nombre total de 1210 des valeurs manquantes (Nous leur avons affecte les valeurs
VIDE, VIDE et 0, respectivement). Ce dernier represente un pourcentage inferieur
a` 10%, donc les prets correspondants a` ces valeurs peuvent etre supprimes.
proc sql;
select count(*)
from DataFinal
where MARQUE=VIDE OR PROFESSION=VIDE OR PUISSANCE_FISCALE=0;
quit;
/* DELETING MISSING VALUES > DataFinal */
proc sql;
Delete from DataFinal
where PROFESSION = VIDE OR MARQUE = VIDE OR PUISSANCE_FISCALE = 0;
quit;
Dautre part, les valeurs manquantes de la colonne STATUT P RET constituent plus
de 30% du nombre total des observations comme le montre la capture ci-dessous:

5
Rapport projet statistique Projet 4

Il est vrai que le pourcentage de ces valeurs est important, cependant, nous avons
choisi `a ne pas les remplacer par la valeur la plus frequente (ici: Remboursement a`
terme) puisque la frequence du statut Rembt A Terme est proche a` celle du statut
Rembt Anticipe.
Nous observons aussi que des observations ont des dates de debut de pret superieures
a` celles du fin de pret, ce qui engendreda des durees de pret negatives, ces cas seront
traites ulterieurement dans la partie 3.1 .

6
Rapport projet statistique Projet 4

2 Analyse Exploratoire de donn


ees :
Avant dentamer la partie modelisation, il nous a fallu de bien comprendre la base
de donnees de notre projet. Il sagit detudier leffet de chaque variable sur loutput
 dur
ee  et la correlation entre eux.

2.1 Fr
equence de la dur
ee de vie du pr
et :

Nous avons commence par calculer la frequence de chacune des valeurs de loutput,
en utilisant la methode PROC FREQ et PROC UNIVARIATE.
En dessous, un script du code SAS utilise pour ce faire :

7
Rapport projet statistique Projet 4

Resultats :

8
Rapport projet statistique Projet 4

Interpretation :
On constate une grande difference entre les frequences des diverses valeurs. La plage
[1084 :1113] jours contient les durees de prets les plus frequentes, qui atteignent une
valeur de 3,38 enregistree pour une duree de 1097. Quant aux valeurs comprises
entre une duree de 1450 et 1497, elles ont des frequences plus ou moins moyennes
qui varient entre 0.06 et 0.24. Pour toutes les autres valeurs de loutput, il sav`ere
que leurs frequences sont pratiquement faibles.

2.2 Effet des variables sur la dur


ee de vie du pr
et:

Dans un deuxi`eme temps, nous avons essaye de decortiquer leffet des autres variables
sur loutput. Pour ceci, nous avons eu recours a` la methode PROCPLOT qui affiche

9
Rapport projet statistique Projet 4

en resultat un plot de la duree en fonction de la variable `a laquelle on veut etudier


leffet. Le code utilise pour obtenir ces plots est le suivant :

-Relation Duree-Age :

10
Rapport projet statistique Projet 4

Interpretation
- On remarque quaucune personne ayant un age compris entre 18 ans et 30 ans dans
la base de donnees etudiee na eu recours a` un pret.
- les durees comprises entre 60 jours et 1180 jours, un pret de 1400 jours ainsi
quun pret de 1970 jours sont generalement enregistres pour des clients de differentes
categories dage.
- Un pret qui dure un jour et les durees comprises entre 1170 jours et 1350 jours sont
presque demandes par des clients de differents ages sauf une petite discontinuite qui
varie selon la duree.
- Pour les durees qui varient entre 1500 jours et 1820 jours sont dispatchees sur des
categories particuli`eres et enregistrent des discontinuites remarquables.
-Relation Duree-Duree theorique pret :

11
Rapport projet statistique Projet 4

Interpretation :
- On remarque que les durees theoriques du pret sont principalement : 36,48 et 60
jours.
- Theoriquement, il y a des clients qui ont voulu un pret de 36 jours mais on constate
que, pour des raisons donnees, ils ont soit prolonge soit reduit la duree pour que la
duree pratique setale de 0jours `a 1180 jours.
- Pour une duree theorique de 48 jours, pratiquement les durees sont comprises entre
0jours et 1450 jours.
- Les clients qui ont prevu une duree de pret de 60 jours, ils ont enregistre des durees
reelles allant de 60 jours a` 1820jours.
-Relation Duree-Situation immobili`ere :

12
Rapport projet statistique Projet 4

Interpretation :
- On constate que les prets avec une duree comprise entre 0 et 1850 jours sont prevus
pour les clients qui ont une situation immobili`ere : proprietaire, locataire ou autre.
- On remarque quil y a une discontinuite au niveau des durees comprises entre [0
:200]; [1175 :1300] et [1500 :1800] pour les clients qui ont une situation immobili`ere
: Non reponse.
- Les durees de pret allant de 10 `a 1240 jours sont enregistrees pour les clients avec
une situation immobili`ere accedant-propriete.
-Relation Duree-Situation familiale :

13
Rapport projet statistique Projet 4

Interpretation :
On remarque que les clients celibataires, finances ou encore maries ont principale-
ment eu recours `a des prets de durees divers et variees. Pour les inconnus et les
separes, on constate une discontinuite pour les durees comprises entre 1200 jours
et 1800 jours. Quant aux clients veufs, ils sont plutot interesses a` des prets qui
appartiennent a` [1 :1500] jours.
-Relation Duree-Marque :

Interpretation :

14
Rapport projet statistique Projet 4

Il sav`ere que les clients ont interet `a preter les marques :X, Y, W et Z pour presque
toutes les durees etudiees mais pour la marque V, ils ne depassent pas 1440 jours.
-Relation Duree-Statut Pret :

Interpretation :
On remarque que pour presque toutes les durees, les clients favorisent un rembourse-
ment anticipe. Rares sont les durees pour lesquelles les clients qui on choisi un
remboursement a` terme.

15
Rapport projet statistique Projet 4

-Relation Duree-Montant Vehicule :

Interpretation :
Pour un montant vehicule compris entre 10000 et 60000 les clients choisissent des
prets de durees allant de 0 `a 1800 jours. Quant aux montants inferieurs a` 10000 et
superieurs a` 12000 aucun pret na ete enregistre et pour ceux qui sont compris entre
60000 et 12000 rares sont les prets enregistres.

16
Rapport projet statistique Projet 4

-Relation Duree-Puissance fiscale :

Interpretation :
On remarque que les clients ne choisissent pour aucune duree les vehicules qui ont
une puissance fiscale superieure a` 0 est inferieure `a 4, alors quils choisissent pour
des durees variees les vehicules qui ont des puissances fiscales comprises entre 4 et
20. Et rarement o` u ils optent pour des vehicules de puissances superieures `a 20.

17
Rapport projet statistique Projet 4

-Relation Duree-Profession :

Interpretation :
On remarque que generalement, il ny a pas un effet remarquable de la profession
sur loutput.

18
Rapport projet statistique Projet 4

2.3 Corr
elation :

Afin detudier lintensite de la liaison qui peut exister entre la duree de vie du pret
et les variables numeriques existantes, nous avons calcule la correlation en utilisant
la methode PROC CORR .
En dessous, un script du code SAS utilise pour ce faire :

Resultats :

19
Rapport projet statistique Projet 4

Interpretation :
La duree et lage ont une correlation legerement positive.
La duree et la duree theorique pret ont une correlation legerement negative.
La duree et le mantant pret ont une correlation faiblement negative.
La duree et le montant vehicule ont une correlation faiblement negative.
La duree et le montant pret ont une correlation legerement negative.
La duree et la puissance fiscale ont une correlation faiblement negative.
La duree et le taux pret ont une correlation faiblement negative.
De ce fait, on peut conclure que la variable duree de vie du pret nest pas trop liee
aux variables numeriques etudiees.

20
Rapport projet statistique Projet 4

3 Analyse Kaplan-Meier :
La methode de Kaplan-Meier permet danalyser levolution de leffectif dune pop-
ulation donnee avec le temps ou bien dans notre cas permet davoir une courbe de
survie de la duree de pret en fonction de nombreux param`etres quon detaillera par
la suite.
Plus precisement cette methode permet davoir rapidement, sans necessiter que les
intervalles de temps soient reguliers, la courbe de survie, ainsi que les statistiques
essentielles comme le temps median residuel de survie.
La fonction de survie est une estimation statistique du temps restant avant la mort,
lechec ou la panne.
Cette fonction est notee S(t) et est definie par: S(t)= P(T > t) qui represente
la probabilite de survie jusquau temps t, cest-`a-dire la probabilite que lechec
survienne apr`es le temps t (T est une variable aleatoire symbolisant le moment du
dec`es).

Estimateur de Kaplan-Meier Il estime la probabilite de survie jusqu`a chaque


temps devenement dans la base de donnees depuis le debut du suivi. Apr`es fragmen-
tation de la probabilite de survie en des probabilites conditionnelles, nous obtenons
la forme suivante de lestimateur de Kaplan-Meier:
=Q
S(t) ni di
ti <t ni

o`u ni est le nombre de survivants juste avant t et di est le nombre de dec`es au


temps ti .
Donc la courbe generee par cette fonction permet de modeliser la probabilite que
lechec intervienne apr`es un temps t donne. Dans notre cas, lechec represente le
remboursement du pret.

3.1 Ajustement de la base de donn


ees :

Avant de proceder a` la modelisation de Kaplan-Meier, il est indispensable de preparer


la base de donnees. Cet ajustement a ete realise selon les etapes suivantes:
- Ajout de la colonne CENSOR: qui prend la valeur 0 si lobservation est censuree
(cest-`a-dire si le pret est non encore rembourse ou si sa duree est negative).
- Modification de la colonne DUREE: nous avons transforme toutes les valeurs de la
colonne DUREE a` leurs valeurs absolues..
- Ajout de la colonne MONTH: qui indique la duree en mois entre la date de debut
et la date de fin du pret.
Ensuite, nous avons affecte aux dates de fin des pret manquantes la date la plus

21
Rapport projet statistique Projet 4

recente qui figure dans la base de donnees, il sagit du 28 juin 2009 (ou encore 18076
jours depuis le 01/01/1960).

3.2 Courbes de survie :

Courbes par type de pr et Nous avons procede par la methode de Kaplan-Meier


pour modeliser la duree de pret, en utilisant la methode PROC LIFETEST (voir
code ci-dessous) :

Ce code nous a permis dobtenir les resultats suivants :


Pour la premi`ere courbe ( Renboursement a` terme ) :

La figure ci-dessus presente les estimations de survie des temps de survie pour les
clients ayant un remboursement a` terme. Nous remarquons quil n ya aucune valeur
qui estime lintervalle de confiance.

22
Rapport projet statistique Projet 4

Pour la deuxi`eme courbe ( Renboursement anticipe ) :

La figure ci-dessus presente les estimations de survie des temps de survie pour les
clients ayant un remboursement `a terme. Le temps moyen de survie de la duree de
pret dans ce traitement est de 20 mois.

Pour resumer ce que nous venons de dire, vous trouverez ci-dessous la courbe de
survie de notre modele :

La figure ci-dessus affiche la courbe de survie de la duree de pret par rapport aux
types de remboursement.
Nous remarquons que la probabilite de survie pour la premi`ere courbe ( Rembourse-
ment a` terme) reste constante dans lintervalle de 0 a` 37 mois. Ceci est du au fait

23
Rapport projet statistique Projet 4

que par definition le remboursement `a terme ne se rembourse qu `a la fin de la duree


theorique, donc apres 36 ou 48 ou 60 mois ( voir le tableau ci-dessous) :

Dapr`es ces resultats, nous estimons que le pret anticipe est mieux que celui `a terme,
il a une probabilite de survie qui saffaiblie avec le temps, ce qui veut dire une duree
de vie plus faible que pour le pret `a terme.

Courbe par situation familiale En changeant largument de STRATA en SIT FAMILIALE,


nous obtenons les resultats suivants: Dapr`es les statistiques descriptives de la vari-
able MONTH, la variation des quartiles entre les six niveaux de discretisation est
faible.

24
Rapport projet statistique Projet 4

Dapr`es cette courbe, nous constatons que pour une duree inferieure a` 36, la prob-
abilite de survie des clients veufs est superieure `a celles des autres. Inversement,
la probabilite de survie des clients separes est inferieure a` celles des autres. Ceci
est en correlation avec lintuition puisque les separes et les celibataires ont moins de
charges financi`eres que les veufs et les maries, donc la duree de remboursement pour
ces clients est generalement plus courte que celle des clients maries par exemple.

Courbes par type de profession Par changement de largument de STRATA


en PREFESSION nous obtenons les resultats suivants:

Dapr`es cette courbe, nous constatons que pour une duree inferieure a` 36, la prob-
abilite de survie des clients ayant une profession de AGRICULT est superieure
a` celles des autres. Inversement, la probabilite de survie des clients ayant une pro-
fession OUVRIER est inferieure a` celles des autres. Ceci parat bizarre car le
salaire moyen dun simple ouvrier est faible en comparaison avec les autres salaires
des autres professions.

25
Rapport projet statistique Projet 4

Ceci est en relation avec le montant du pret, le montant du pret dun ouvrier est le
plus faible, donc il rembourse plus rapidement son pret. Dautre part, un agricul-
teur en general est celui qui a le plus souvent besoin dun pret avec un montant
considerable, cest pour cela il a la plus grande probabilite de survie.

Courbe par situation immobili` ere Pour la variable situation immobili`ere, nous
obtenons les courbes suivantes:

Nous constatons donc que lorsque la duree depasse 48 mois, les durees de vie des
clients ne dependent pas vraiment de leurs situations immobili`eres. Par contre, pour
une duree inferieure `a 36 mois, les clients proprietaires ont une probabilite de survie
superieure aux autres, une probabilite qui devient la plus faible apr`es 36 mois. A ce
stade, la probabilite de survie des locataires surpasse les autres.
Ceci pourrait etre du au fait que les proprietaires pref`erent des prets avec une duree
theorique de 36 mois, ce qui explique que la probabilite de survie baisse sev`erement

26
Rapport projet statistique Projet 4

apr`es les 36 mois.


De plus, malgre quintuitivement nous pourrons considerer que les locataires rem-
bourseront leurs prets sur une duree plus longue que celle des proprietaires, ces
derniers pourront etre entrain de rembourser simultanement des credits immobiliers,
ce qui explique que la courbe de survie des proprietaires est en-dessus de celle des
locataires.

Courbe en fonction des puissances fiscales Pour la variable puissance fiscale,


nous avons choisi de segmenter ses valeurs en six intervalles: valeurs inferieures a`
5, valeurs entre 5 et 10, valeurs entre 10 et 15, valeurs entre 15 et 20, valeurs entre
20 et 25, valeurs superieures a` 25. En compilant le code, nous obtenons les courbes
suivantes:

Nous observons que pour une duree inferieure `a 36 mois, les clients avec des vehicules
ayant des puissances fiscales dans les intervalles [20,25] et [0,5] ont une probabilite
de survie superieures `a ceux avec des puissances fiscales dans les intervalles [25,30]
et [10,15]. Apr`es 36 mois, la courbe [25,30] surpasse les autres.

27
Rapport projet statistique Projet 4

Ceci pourrait indiquer le fait que les clients avec des vehicules qui depassent 25
en puissance fiscale pref`erent des prets de 48 mois pour les rembourser, ce qui est
logique puisque la somme pretee est probablement plus importante. Tandis que ceux
avec des puissances fiscales dans les intervalles [20,25] et [0,5] pref`erent des prets de
36 mois.

Courbe en fonction des taux de pr et Pour la variable taux de pret, nous avons
choisi de segmenter ses valeurs en cinq intervalles: valeurs inferieures a` 2, valeurs
entre 2 et 4, valeurs entre 4 et 6, valeurs entre 6 et 8, valeurs superieures `a 25. En
compilant le code, nous obtenons les courbes suivants:

Nous observons que les prets avec des taux appartenant a` lintervalle [2,4] ont une
probabilite de survie importante par rapport aux autres avant que la duree atteigne
36 mois. Par la suite, elle bascule pratiquement vers 0. Ceci montre que ces taux
correspondent generalement aux prets de duree theorique de 36 mois.
Dautre part, les probabilites de survie des prets avec un taux superieur a` 8% sont
repartis plus uniformement. Ils ont la probabilite de survie la plus faible jusqu`a 36

28
Rapport projet statistique Projet 4

mois. Ensuite, leur probabilite devient la plus elevee. Ces prets sont rembourses de
mani`ere plus ou moins uniforme sur toute la duree de letude.

Courbe en fonction des montants des v ehicules Pour la variable montants


des vehicules, nous avons choisi de segmenter ses valeurs en quatre intervalles:
valeurs inferieures a` 25000, valeurs entre 25000 et 50000, valeurs entre 50000 et
75000, valeurs superieures a` 75000.
Nous obtenons ainsi les courbes suivantes:

Les differentes courbes suivent `a peu pr`es le meme mod`ele, a` lexception de la courbe
correspondante aux vehicules dont le montant depasse 75000, qui a visiblement une
probabilite de survie elevee en la comparant aux autres types de vehicules. Ceci est
en effet en accord avec lintuition, puisqu`a ce type de vehicules sont associes des
prets qui auront besoin de plus de temps pour etre rembourses.

29
Rapport projet statistique Projet 4

Courbe en fonction des montants des pr ets Par changement de largument


de STRATA en MONTANT PRET avec un regroupemet des montants les plus
proches nous obtenons les resultats suivants:

Dapr`es cette courbe, nous constatons que la probabilite de survie des clients ayant
un montant de pret > = 63276 est superieure a` celles des autres.
Nous remarquons aussi que pour une duree inferieure `a 36 mois, les clients ayant un
montant de pret entre 25205 et 49171 ont la plus faible probabilite de survie et les
clients ayant un montant de pret < 9999 ont la plus faible probabilite de survie.
Neanmoins, apr`es le mois 36, lordre sinverse.
Intuitivement, ce resultat est correct, car avoir un pret avec un montant faible veut
dire une duree de remboursement plus rapide, donc une probabilite qui saffaiblie
au fil du temps. Contrairement aux autres clients ayant un montant de pret eleve,
la duree de remboursement sera plus grande que celle davant, ce qui entrane une
probabilite de survie plus grande.

30
Rapport projet statistique Projet 4

R
esum
e de lanalyse Kaplan-Meier
Le pret anticipe est mieux que celui a` terme.
La variable profession donne une idee sur si le client aura besoin dune duree
de pret plus large ou pas.
Les proprietaires ont une probabilite de survie plus grande que les locataires.
Les clients avec des vehicules qui depassent 25 en puissance fiscale pref`erent
des prets de 48 moins. Tandis que ceux avec des puissances fiscales entre 20
et 25, et entre 0 et 5 pref`erent des prets de 36 mois.
Les prets avec des taux entre 2% et 4% correspondent aux prets de duree
theorique de 36 mois. Dautre part les prets avec un taux superieur `a 8% sont
rembourses de mani`ere plus ou moins uniforme sur toute la duree de letude.
Les vehicules ayant un montant qui depasse 75000 ont une probabilite de survie
elevee en comparaison avec les autres types de vehicules.
Pour une duree inferieure a` 36 mois, les clients ayant les montants de prets les
plus faible ont la plus faible probabilite de survie. Apr`es le mois 36, lordre
sinverse.

31
Rapport projet statistique Projet 4

Conclusion
A terme de ce rapport, et apr`es avoir calcule leffet des variables de notre base de
donnees sur la duree ainsi que la correlation entre eux, nous avons trouve que ces
variables ninfluencent pas trop la duree de pret . En outre, nous avons constate
quil y a une faible correlation entre les variables numeriques etudiees et la duree.
Generalement, elles varient dans deux sens opposes (correlation negative).
Dautre part, la methode de Kaplan-Meier nous a permis davoir une vision plus
claire et plus specifique sur la comprehension et lestimation de la duree de vie dun
pret ce qui nous a amene `a des interpretations qui pourront aider a` ameliorer les
decisions futures de linstitut de pret.

En se basant sur les resultats auxquels nous avons abouti, quelques actions sav`erent
tr`es astucieuses pour ameliorer et rendre plus benefique le service de pret que pro-
pose certaines societes, on cite:
- Proposer des offres ou des reductions qui pourraient attirer les clients qui ont
interet a` emprunter pour des durees courtes
- Sinteresser plutot a` des marques de vehicules, que les clients empruntent pour des
durees assez longues, en variant la gamme proposee
- Essayer dencourager les jeunes ages de 18 ans a` 30 ans, et qui ont une profession,
a` faire des emprunts en essayant de reduire un peu les taux au debut.

32

Vous aimerez peut-être aussi