Vous êtes sur la page 1sur 4

Compte Rendu TP5

Mohamed Farouk HAMADI

Amir BENREZGUI

L3CS01
Partie théorique (calcul de l’indice de Gini):

Client Age concurrence type Profit

0 Agee non Software Baisse


1 Moyen oui Software Baisse
2 Moyen non Hardware Hausse
3 Agee non Hardware Baisse
4 Récent non Hardware Hausse
5 Récent non Software Hausse
6 Moyen non Software Hausse
7 Récent oui Software Hausse
8 Moyen oui Hardware Baisse
9 Agee oui Software Baisse

Indice de Gini avant séparation :


IG(avantsep) = 1 - ((5/10)² + (5/10)²) = 1 - (0.25 + 0.25) = 1 - 0.5 = 0.5

IG(Age) = IG(avantsep) - (IG(Age=Agee) + IG(Age=Moyen) + IG(Age=Récent))


= 0.5 - (0 + 0.5 + 0) = 0

IG(Age=Agee) = 1 - ((3/3)² + 0) = 0
IG(Age=Moyen) = 1 - ((2/4)² + (2/4)²) = 0.5
IG(Age=Récent) = 1 - ((0/3)² + (3/3)²) = 0

IG(concurrence) = IG(avantsep) - (IG(concurrence=oui) + IG(concurrence=non))


= 0.5 - (0.375 + 0.44) = -0.31

IG(concurrence=oui) = 1 - ((3/4)² + (1/4)²) = 0.375


IG(concurrence=non) = 1 - ((2/6)² + (4/6)²) = 0.44

IG(type) = IG(avantsep) - (IG(type=Software) + IG(type=Hardware)) = 0.5 - (0.5 + 0.5) = -0.5


IG(type=Software) = 1 - ((3/6)² + (3/6)²) = 0.5
IG(type=Hardware) = 1 - ((2/4)² + (2/4)²) = 0.5

IG(Age) > IG(concurrence) > IG(type)

La meilleure variable descriptive, laquelle va être un nœud de division racine, c’est l'âge
avec IG = 0

Vous aimerez peut-être aussi