Académique Documents
Professionnel Documents
Culture Documents
Ciel
Couvert Pluie
Ensoleillé
u L'une des nombreuses qualités des arbres de décision est qu'ils nécessitent
très peu de préparation de données. En particulier, ils ne nécessitent pas du
tout de mise à l'échelle ou de centrage des caractéristiques.
u Comme vous pouvez le voir, les arbres de décision sont assez intuitifs et leurs
décisions sont faciles à interpréter, nous appelons ce genre de modèle : des
boîtes blanches. En revanche, d’autres algorithmes comme le boosting ou les
réseaux de neurones sont généralement considérés comme des modèles de
boîte noire.
⋮ ⋮ ⋮ ⋮ ⋮
leaf node
AI For You - Morgan Gautherot 8
Estimation de la probabilité d’appartenance
population = [nb setosa, nb versicolor, nb virginica]
6 Sepal length
AI For You - Morgan Gautherot 10
population = [nb setosa, nb versicolor, nb virginica]
Pureté
pop. = [50, 50, 50]
Sepal length ≥ 6
I. setosa False True
pop. = [50, 0, 0] pop. = [0, 50, 50]
Petal length ≥ 5
Pure
I. versicolor False True I. virginica
pop. = [0, 49, 5] pop. = [0, 1, 45]
Impure
)!"#$%& )'()*+&
𝐽 𝑘 = 𝐺01234* + 𝐺567!8*
) )
𝐺01234* = 0.41
𝑚01234* = 70/150
2) 𝐺567!8* = 0.47 𝐽 0 =
;,
$+,
0.41 +
<,
$+,
0.47 = 0.44
𝑚567!8* = 80/150
𝐺01234* = 0.60
𝑚01234* = 92/150
3) 𝐺567!8* = 0.27 𝐽 0 =
.'
$+,
0.0 +
+<
$+,
0.27 = 0.41
𝑚567!8* = 58/150
AI For You - Morgan Gautherot 14
Construction d’un arbre
Sepal length ≥ 6
I. setosa False True
pop. = [50, 0, 0] pop. = [0, 50, 50]
16
3 72 1 2017 180
2 58 1 2010 140
3 76 0 1998 160
⋮ ⋮ ⋮ ⋮ ⋮
220
Prix
180
145
110
50 60 Surface 80
AI For You - Morgan Gautherot 19
Pureté 𝑚𝑜𝑦𝑒𝑛𝑛𝑒 = 𝑥̅
Données
𝑀𝑆𝐸,-./01 = 549
𝑚,-./01
= 80/200
𝑚
2) 𝑀𝑆𝐸234561 = 710 𝐽 0 =
<,
',,
549 +
$',
',,
710 = 646
𝑚234561
= 120/200
𝑚
𝑀𝑆𝐸,-./01 = 879
𝑚,-./01
= 150/200
𝑚
3) 𝑀𝑆𝐸234561 = 200 𝐽 0 =
$+,
',,
879 +
+,
',,
200 = 709
𝑚234561
= 50/200
𝑚
AI For You - Morgan Gautherot 22
Des solutions raisonnablement bonne
u Les arbres de décision aiment les limites de décision orthogonales, ce qui les
rend sensibles à la rotation des ensembles d'entraînement.
u Ils sont également instables car ils sont très sensibles à de petites variations
des données d’entraînement