Ricco RAKOTOMALALA
Ricco Rakotomalala
Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/
PLAN
1.
2.
3.
4.
5.
6.
Bibliographie
Ricco Rakotomalala
Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/
Ricco Rakotomalala
Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/
Contexte du scoring
Contexte : apprentissage supervis,
une variable cible Y binaire {+, - }
des descripteurs tous qualitatifs (cods 0/1, codage disjonctif complet)
Exemple : apprcier les chances dacceptation dune demande de financement
(un crdit) dun achat effectue par un client [oui = +, non = -]
Motif_AppMenager Motif_Mobilier Motif_HiFi
Assurance_oui Assurance_non Acceptation
0
0
1
1
0 oui
0
1
0
0
1 non
0
1
0
0
1 non
0
1
0
1
0 oui
0
0
1
1
0 non
0
1
0
1
0 non
0
0
1
0
1 non
0
0
1
1
0 oui
0
0
1
1
0 oui
0
0
1
1
0 oui
Variable cible : Y =
Acceptation {+, -}
Note
20
0
7
80
0
Ex. 1 : client effectuant une demande pour motif = mobilier et ne prenant pas
dassurance assurance = non se voit attribuer la note 0 + 0 = 0 il a un
minimum de chances de voir accepte sa demande de crdit (pire cas).
Ex. 2 : client effectuant une demande pour motif = appareil mnager et prenant
une assurance assurance = oui se voit attribuer la note 20 + 80 = 100 il
maximise ses chances de voir accepte sa demande crdit (meilleur cas).
Ricco Rakotomalala
Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/
Attribute
constant
Coef.
1.12037
Motif = App.Mnager
est la modalit de rfrence
M otif_M obilier
-0.50059
M otif_HiFi
-0.32038
Assurance_non
-1.98367
modalit de rfrence
Coefficients de la
Grille de score
rgression logistique
Attribute
constant
Coef.
Motif_AppMenager
Motif_Mobilier
Motif_HiFi
Assurance_oui
Assurance_non
1.12037
M otif_M obilier
-0.50059
M otif_HiFi
-0.32038
Assurance_non
-1.98367
Note
20
0
7
80
0
de la modalit de rfrence
Ricco Rakotomalala
Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/
Ricco Rakotomalala
Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/
Coef.
1.12037
0.00000
-0.50059
-0.32038
0.00000
-1.98367
Attribute
Motif_AppMenager
Motif_Mobilier
Motif_HiFi
Assurance_oui
Assurance_non
Coef.
0.00000
-0.50059
-0.32038
0.00000
-1.98367
Minmotif = -0.50059
Minassurance = -1.98367
Coef + |Minvariable|
Attribute
Motif_AppMenager
Motif_Mobilier
Motif_HiFi
Assurance_oui
Assurance_non
Coef.
0.50059
0.00000
0.18021
1.98367
0.00000
Mise lchelle : caler la note maximale 100 (ou 1000, ou 10000, etc.)
Etape 4 : identifier le maximum des points
Attribute
Motif_AppMenager
Motif_Mobilier
Motif_HiFi
Assurance_oui
Assurance_non
Coef.
0.50059
0.00000
0.18021
1.98367
0.00000
Maxmotif = 0.50059
MAXpoints =
0.50059 + 1.98367
= 2.48426
Maxassurance = 1.98367
Etape 5 : Calculer le
facteur de correction
100
MAX points
100
2.48426
40 .25342
Motif_AppMenager
Motif_Mobilier
Motif_HiFi
Assurance_oui
Assurance_non
Score
20
0
7
80
0
Ricco Rakotomalala
Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/
10
Ricco Rakotomalala
Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/
11
Comment dterminer la
valeur seuil si on
sappuie sur le score ?
a0 Y ( )
a1 x1 ( ) a2 x2 ( )
a0 Y ( )
seuil Y ( )
SCORE ( )
seuil Y ( )
Ricco Rakotomalala
Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/
12
Attribute
constant
Motif_AppMenager
Motif_Mobilier
Motif_HiFi
Assurance_oui
Assurance_non
Coef.
1.12037
0.00000
-0.50059
-0.32038
0.00000
-1.98367
On reproduit lidentique le
comportement de la rgression
logistique avec la rgle de dcision :
54 .9 Y ( )
SCORE ( )
54 .9 Y ( )
13
Ricco Rakotomalala
Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/
14
NB. La mthode MDLPC (Fayyad & Irani, 1993) disponible dans de nombreux logiciels
(Tanagra, Weka, R [package discretization], etc.) est un arbre de dcision avec une
rgle darrt spcifique la discrtisation.
Ricco Rakotomalala
Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/
15
[3137.5 ; +[
[2030 ; 3137.5[
Rgression logistique
Attribute
Coef.
constant
1.59696
REV.A : [0 ; 2030[
0.00000
-1.72488
0.02628
Motif_AppMenager
0.00000
Motif_Mobilier
Motif_HiFi
Assurance_oui
Assurance_non
-0.27986
-0.10055
0.00000
-2.07249
Ricco Rakotomalala
Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/
Revenu.Menage
2264
2181
4265
4431
3008
3042
4237
8454
3797
5193
REV.B
REV.C
1
1
0
0
1
1
0
0
0
0
0
0
1
1
0
0
1
1
1
1
Grille de score
Attribute
REV.A : [0 ; 2030[
REV.B : [2030 ; 3137.5[
REV.C : [3137.5 ; +00[
Moti f_AppMena ger
Moti f_Mobi l i er
Moti f_Hi Fi
As s ura nce_oui
As s ura nce_non
Score
42
0
43
7
0
4
51
0
16
Ricco Rakotomalala
Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/
17
Calcul en 3 tapes :
(1) AFCM sur les descripteurs
(catgoriels ou discrtiss)
(2) ADL sur une slection (*) des
facteurs de lAFCM
(3) Reconstitution de la fonction
de classement sur les
indicatrices originelles
Ricco Rakotomalala
Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/
18
Attribute = Value
Motif = AppMenager
Motif = Mobilier
Axis_1
Axis_2
Axis_3
0.9750
-1.3746
-0.9750
-0.4900
-0.3314
0.4900
0.2617
0.7349
-0.2617
Motif = HiFi
Assurance = oui
-0.1633
0.0000
-0.1633
Assurance = non
1.5308
0.0000
1.5308
Attribute
Coef.
M CA_1_Axis_1
-0.4750
M CA_1_Axis_2
-0.0402
M CA_1_Axis_3
-0.7749
les facteurs
constant
0.6071
A ttri bute = V a l ue
Coef.
Constant
0 .6 0 7 1
Motif = AppMenager
0 .3 4 7 8
Motif = Mobilier
-0 .1 3 3 6
Motif = HiFi
0 .0 4 8 9
Assurance = oui
0 .2 0 4 1
Assurance = non
-1 .9 1 3 3
19
Grille de score
Attribute = Value
Note (/100)
19
0
7
81
0
20
Ricco Rakotomalala
Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/
21
Ricco Rakotomalala
Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/
22