Vous êtes sur la page 1sur 50

TP N°2:

Arbre de Décision
Exercice N°1:
Construire un arbre de décision
REMARQUE:
Impossible de construire cette arbre
c’est juste un seul nœud.
• rpart peut accepter plusieurs paramètres
optionnels, y compris control, qui permet de
spécifier les paramètres de l'algorithme de
partitionnement récursif.
• minsplit : le nombre minimal d'observations
nécessaires dans un nœud pour que la division soit
considérée.
Minsplit est égale à 2
Manipulation de l’arbre pour avoir plusieurs formes selon les commandes
Les commandes
• uniform=T : Cette commande est utilisée pour dessiner
l'arbre de décision avec une longueur uniforme pour toutes
les branches.
• use.n=T : Cette commande est utilisée pour afficher le
nombre d'observations dans chaque nœud.
• all=T : Cette commande est utilisée pour afficher le
pourcentage de chaque catégorie dans chaque nœud.
• branch=0 : Cette commande est utilisée pour dessiner
toutes les branches, y compris celles qui ont une longueur
nulle (c'est-à-dire les nœuds terminaux).
• branch=.7 : Cette commande est utilisée pour dessiner
uniquement les branches dont la longueur est supérieure à
0.7 .
• compress=T : Cette commande est utilisée pour
compresser l'arbre de décision en supprimant les
branches vides
• margin=.1 : Cette commande est utilisée pour
spécifier la marge autour de l'arbre de décision
dans l'affichage graphique.
• fancy=T : Cette commande est utilisée pour
ajouter des éléments graphiques
supplémentaires à l'arbre de décision, tels que
des flèches, des couleurs et des formes, pour le
rendre plus facile à lire et plus esthétique.
minsplit=5
Exercice N°2:
Elagage
• Pour afficher les 10 premières lignes
data.cars[1 :10,]
• Str: permet de visualiser la structure d'un
objet, y compris les noms, les types et les
valeurs de ses attributs.
la dépendance 2 à 2 entre
attributs :
Construction d’une arbre de
décision avec un minsplit=1
• le paramètre cp (cost complexity parameter) est
souvent utilisé pour contrôler la complexité d'un
arbre de décision créé à l'aide de la fonction
rpart() du package rpart.
• Élagage d'un arbre de décision fait référence à la
suppression de certaines branches ou sous-
arbres de l'arbre afin de simplifier sa structure et
d'améliorer sa généralisation.
• D’où on a un excellent élagage.
Erreur d’apprentissage
• Pour générer un arbre optimal avec la valeur
optimale de cp sur R, nous pouvons utiliser la
fonction prune() du package tree.
• La fonction lines() permet de tracer une ligne entre
les points spécifiés, tandis que points() permet de
dessiner des points aux coordonnées spécifiées.

Vous aimerez peut-être aussi