Vous êtes sur la page 1sur 16

APPRENTISSAGE SUPERVISÉ

Arbres de décision
décision

CORRECTION TD1
EXERCICE1&2

3 LIRI Dr. Imen Khamassi


Correction Exercice 2
2

 Construire l’arbre de décision correspondant à


l’ensemble d’apprentissage suivant :
Age Concurrence Type Profit
Agé Non Software Baisse
Moyen Oui Software Baisse
Moyen Non Hardware Hausse
Agé Non Hardware Baisse
Récent Non Hardware Hausse
Récent Non Software Hausse
Moyen Non Software Hausse
Récent Oui Software Hausse
Moyen Oui Hardware Baisse
Agé Oui Software Baisse
Correction Exercice 2
3

 Détailler les différents calculs des ratios de gain à


chaque niveau de l’arbre.
Attributs Classe

Age Concurrence Type Profit


Agé Non Software Baisse
Valeurs des attributs

Moyen Oui Software Baisse


Moyen Non Hardware Hausse
Agé Non Hardware Baisse
Récent Non Hardware Hausse
Récent Non Software Hausse
Moyen Non Software Hausse
Récent Oui Software Hausse
Moyen Oui Hardware Baisse
Agé Oui Software Baisse
Info(T)
4
Age Concurrence Type Profit
Agé Non Software Baisse
Moyen Oui Software Baisse
Moyen Non Hardware Hausse
Agé Non Hardware Baisse
Récent Non Hardware Hausse
Récent Non Software Hausse
Moyen Non Software Hausse
Récent Oui Software Hausse
Moyen Oui Hardware Baisse
Agé Oui Software Baisse

2
Info(T) = - ∑ freq(T, Cj) log2 freq(T, Cj)
j=1
|T| |T|

Info(T) = - 5/10 log2 5/10 - 5/10 log2 5/10 = 1


InfoAge(T)
5

Age Concurrence Type Profit InfoAge(T) = ∑ |Ti|


Info(Ti)
Agé Non Software Baisse i∈DAge |T|
Agé Non Hardware Baisse DAge ={Agé, Moyen, Récent}
Agé Oui Software Baisse Revenu
Moyen Oui Software Baisse
Moyen Non Hardware Hausse Agé Moyen Récent
Moyen Non Software Hausse
Moyen Oui Hardware Baisse
Récent Non Hardware Hausse Info (TAgé) Info(TMoyen) Info(TRécent)
Récent Non Software Hausse
Récent Oui Software Hausse
Info(TAgé) = - 3/3 log2 3/3 =0
Info(TMoyen) = - 2/4 log2 2/4 - 2/4 log2 2/4 = 1
Info(TRécent) = - 3/3 log2 3/3 = 0
InfoAge(T)= 3/10 Info (TAgé) + 4/10 Info (TMoyen) +3/10 Info (TRécent)
= 0.4
Gain ratio(Age)
6

Age Concurrence Type Profit


Agé Non Software Baisse
Agé Non Hardware Baisse
Agé Oui Software Baisse
Moyen Oui Software Baisse
Moyen Non Hardware Hausse Gain(T, RAge) = Info(T) – InfoAge(T)
Moyen Non Software Hausse =1- 0.4
Moyen Oui Hardware Baisse =0.6
Récent Non Hardware Hausse
Récent Non Software Hausse
Récent Oui Software Hausse

|Ti|
Split Info(T, Age) = - ∑ log2 |Ti|
i∈DAge |T| |T|
Split Info(T, Age) = - 3/10 log2 3/10 - 4/10 log2 4/10 - 3/10 log2 3/10 =
0.6
Gain Ratio(T, Age) = = 0.381
1.57
InfoConcurrence(T)
7

Age Concurrence Type Profit


InfoConcurrence(T) = ∑ |Ti|
Agé Non Software Baisse
Info(Ti)
|T|
i∈DConcurrence
Moyen Non Hardware Hausse
Agé Non Hardware Baisse
DConcurrence ={Non, Oui}
Récent Non Hardware Hausse
Récent Non Software Hausse Concurrence
Moyen Non Software Hausse
Moyen Oui Software Baisse Non Oui
Récent Oui Software Hausse
Moyen Oui Hardware Baisse
Info(TNon) Info (TOui)
Agé Oui Software Baisse

Info(TNon) = - 2/6 log2 2/6 - 4/6 log2 4/6 =0.918


Info(TOui) = - 3/4 log2 3/4 - 1/4 log2 1/4 =0.811

InfoConcurrence(T)= 6/10 Info(TNon) + 4/10 Info(TOui) =0.875


Gain ratio(Concurrence)
8

Age Concurrence Type Profit


Agé Non Software Baisse
Moyen Non Hardware Hausse
Gain(T, Concurrence) = Info(T) – InfoConcurrence(T)
Agé Non Hardware Baisse = 1- 0.875
Récent Non Hardware Hausse =0.125
Récent Non Software Hausse
Moyen Non Software Hausse
Moyen Oui Software Baisse
Récent Oui Software Hausse
Moyen Oui Hardware Baisse
Agé Oui Software Baisse

|Ti|
Split Info(T, Concurrence) = - ∑ log2 |Ti|
|T|
i∈DConcurrence |T|
Split Info(T, Concurrence) = - 6/10 log2 6/10 - 4/10 log2 4/10 =0.970
0.125
Gain Ratio(T, Concurrence) = = 0.128
0.970
InfoType(T)
9

Age Concurrence Type Profit |Ti|


Moyen Non Hardware Hausse
InfoType(T) = ∑ Info(Ti)
i∈DType |T|
Agé Non Hardware Baisse
Récent Non Hardware Hausse
Moyen Oui Hardware Baisse
DType={Software, Hardware}
Moyen Non Software Hausse
Récent Oui Software Hausse Type
Agé Oui Software Baisse
Agé Non Software Baisse Software Hardware
Moyen Oui Software Baisse
Récent Non Software Hausse
Info (TSoftware) Info (THardware)
Info(THardware) = - 2/4 log22/4 - 2/4 log2 2/4 =1

Info(TSoftware) = - 3/6 log2 3/6 - 3/6 log2 3/6 = 1


InfoType(T)= 4/10 Info(THardware) + 6/10 Info(TSoftware)
=1
Gain ratio(T, Type)
10

Age Concurrence Type Profit


Moyen Non Hardware Hausse
Agé Non Hardware Baisse Gain(T, Type) = Info(T) – InfoType(T)
Récent Non Hardware Hausse = 1-1
Moyen Oui Hardware Baisse =0
Moyen Non Software Hausse
Récent Oui Software Hausse
Agé Oui Software Baisse
Agé Non Software Baisse
Moyen Oui Software Baisse
Récent Non Software Hausse

Split Info(T, Type) = - ∑ |Ti| |Ti|


i∈Type
log2
|T| |T|
Split Info(T, Type) = - 4/10 log2 4/10 - 6/10 log2 6/10 = 0.970
0
Gain Ratio(T, Type) = =0
0.97
Arbre de décision:
décision: Niveau 1
11

Gain Ratio(T, Age) = 0. 381


Gain Ratio(T, Concurrence) = 0. 128

Gain Ratio(T, Type) = 0

Racine Age

Agé Récent
Moyen
Age= Moyen (1)
(1)
12

Info(TMoyen) = Info(M) = - 2/4 log2 2/4 - 2/4 log2 2/4 = 1


Age= Moyen (2)
13

InfoConcurrence(MOui)=- 2/2 log2 2/2 = 0


InfoConcurrence(MNon) = - 2/2 log2 2/2 = 0

InfoConcurrence(M)= ((2/4) * 0) + ((2/4) * 0)= 0


Gain(M, Concurrence) = Info(M)- InfoConcurrence(M)=1-0=1
Split Info(M, Concurrence) = - 2/4 log2 2/4 - 2/4 log2 2/4 = 1
Gain Ratio(M, Concurrence) = 1
Age= Moyen (3)
14

InfoType(MHardware)=- 1/2 log2 1/2 - 1/2 log2 1/2 = 1


InfoType(MSoftware))=- 1/2 log2 1/2 - 1/2 log2 1/2 = 1

InfoType(M)= ((2/4) * 1) + ((2/4) * 1)= 1


Gain(M, Type) = Info(M)- InfoType(M)=1-1=0
Split Info(M, Type) = - 2/4 log2 2/4 - 2/4 log2 2/4 = 1
Gain Ratio(M, Type) = 0
Arbre de décision:Niveau
décision:Niveau 2 (1)
15

Gain Ratio(M, Concurrence) = 1


Gain Ratio(M, Type) = 0
Age

Agé Récent
Moyen

Concurrence

Oui Non
Arbre de décision
décision final
16

Age

Agé Récent
Moyen
Baisse Hausse
Concurrence

Oui Non

Baisse Hausse

Règles de décision de l’arbre


Si (Age = Agé) alors Baisse
Si (Age = Moyen) ∧ (Concurrence= Oui) alors Baisse
Si (Age = Moyen) ∧ (Concurrence = Non) alors Hausse
Si (Age =Récent) alors Hausse

Vous aimerez peut-être aussi