Académique Documents
Professionnel Documents
Culture Documents
(Sommaire)
IV-2 ID3
L’algorithme ne fonctionne que sur des caractéristiques nominales. Donc,
si on a des caractéristiques continues, il faut appliquer la discritésation.
Aussi, il est utilisé pour le classement seulement.
Où:
IV-2-2 Exemple
On veut estimer une décision (jouer ou non) en se basant sur 4
caractéristiques: temps, température, humidité et vent. On va construire
un arbre de décision en se basant sur les données suivants:
P(jouer=oui) = 9/14
P(jouer=non) = 5/14
temps:
Le caractéristique “temps” divise les données sur 3 sous ensembles. Voici
le nombre des occurrences de chaque classe dans chaque sous-ensemble:
P(S_ensoleilé) = 5/14
P(S_nuageux) = 4/14
P(S_pluvieux) = 5/14
(Sommaire)
IV-3 C4.5
Cet algorithme est une amélioration sur l’algorithme ID3. Parmi les
améliorations:
Etant donnée:
C: un ensemble de classes
S: un ensemble de donnée d’entrainement
: un vecteur de caractéristiques
: un hyper-ensemble contenant des ensembles avec les mêmes
valeurs de la caractéristique .
IG(S, ): le gain d’information en divisant l’ensemble de
données S avec la caractéristique .