Vous êtes sur la page 1sur 10

Arbre de decision

Présenter :
Nesrine TRABELSI
MBA2
2

Plan

Definition

Les avantages et les inconvenients

Quand utiliser un arbre de decision

Exemples

Conclusion
Definiton
• Les algorithmes de Decision tree, que l’on appelle
également arbres de décision font partie de la catégorie
des algorithmes supervisés, ils permettent de prédire
une valeur (prédiction) ou une catégorie (classement).
• C’est une méthode très populaire en Data Science et qui
a donné naissance à d’autres algorithmes plus puissants
tels que Random Forest ou XGBoost par exemple.
Comme son nom l’indique, cet algorithme se base sur la
construction d’un arbre ce qui rend la méthode assez
simple à expliquer et plus facile à interpréter.
Les avantages et
les inconvenients
• Avantages :
• Facile à comprendre : Le 1er avantage de cet algorithme c’est qu’il
est intuitif. Comme vous pourrez le voir dans les explications de son
fonctionnement il est vraiment simple à comprendre. Et naturellement
on a toujours tendance à préférer utiliser quelque chose que l’on
comprend et que l’on maitrise.
• Facile à interpréter : Son 2e avantage c’est qu’il est facile à
interpréter. Les résultats peuvent être présentés à des équipes métier et
les règles de décision produites par l’arbre sont faciles à comprendre.
• Temps d’exécution raisonnable. Enfin un dernier avantage qui peut
avoir son importance, c’est un algorithme assez simple qui n’est pas
très coûteux en temps de calcul.
• Inconvénients :
• Faible performance. Le principal inconvénient des arbres de
décision pour moi est le manque de performance par rapport à
d’autres algorithmes. Mais il est parfois nécessaire de faire un
choix entre performance et interprétabilité.
• Risque de sur-apprentissage : Deuxième inconvénient ou en tout
cas un piège dans lequel il ne faut pas tomber… L’overfitting
c’est-à-dire le sur-apprentissage (l’algorithme apprend avec
tellement de précision les données d’entrainement qu’il ne
parvient pas à généraliser un résultat satisfaisant sur de nouvelles
données). Pour éviter cela il est important de bien élaguer son
arbre de décision.
Quand utiliser un
arbre de décision ?
• Vous avez un projet de Data Science ou plus simplement
d’analyse de données et vous vous demandez naturellement
si vous pourriez utiliser cet algorithme ? Et oui comme je te
comprends, les arbres de décision peuvent vraiment être une
très bonne solution si vous êtes dans un des cas suivant :
• Utiliser un arbre de décision quand on est débutant.
Pour construire un premier algorithme de classement, je
recommanderais vraiment de commencer par celui.
D’autant plus qu’il est nécessaire de d’abord bien le
comprendre avant de passer à des méthodes plus complexes
• Utiliser un arbre de décision quand l’interprétabilité des résultats est plus
importante que la performance. Dans certains cas les utilisateurs de
l’algorithme veulent vraiment maitriser les règles qui permettent à
l’algorithme de faire un choix. Par exemple dans le cas d’une segmentation
client, il est souvent préférable d’avoir quelques règles de décision simples.
Elles permettent aux équipes marketing de comprendre qui sont les clients qui
composent chaque groupe. Par exemple si le client a fait plus de 3 achats avec
un panier moyen supérieur à 100€ alors il appartient au segment Premium.
• Utiliser un arbre de décision quand l’algorithme ne peut pas être
industrialisé tel quel. Certains outils et certaines infrastructures data (c’est de
plus en plus rares heureusement) ne permettent pas d’industrialiser
directement des algorithmes codés en Python, R (ou autres langages). Dans ce
cas l’arbre de décision peut être converti en règles de décision qui pourront à
leur tour être codées en sql.  
Exemple
Exemple
Conclusion
• Un arbre de décision est un diagramme ramifié initié d'un seul
point et illustrant les conséquences possibles par rapport à
différentes décisions ou actions séquentielles entreprises sous
l'influences de différentes circonstances externes. Des probabilités
relatives aux divers résultats atteints peuvent être assignées. Ce peut
être un outil valable lors de discussions sur les effets possibles dans
le long terme de différentes décisions ou ensembles de décisions.
• Un arbre de décision est donc une aide à la décision, un outil qui
utilise un arbre, sous un schéma ramifié comme graphique,
organigramme, diagramme ou modèle de décisions, et de leurs
conséquences possibles, y compris les chances de résultats de
l'événement, les coûts des ressources, et l'utilité. C'est un moyen
d'afficher un algorithme.

Vous aimerez peut-être aussi