Académique Documents
Professionnel Documents
Culture Documents
▪ Bagging:
Introduit en 1996 est l’acronyme de Bootstrap Aggregating. C’est une technique utilisée pour
améliorer la performance de la classification des arbres de décision considérés comme classifieurs
faibles.
▪ L’objectif général de la technique de Bagging est de corriger l’instabilité des arbres de décision en
réduisant la variance de l’estimateur.
variance.
« forêts aléatoires ».
No Yes 125 No
Yes No
No Yes 180 Yes
Yes No 210 No
Yes No 168 No
Yes Maladie Cardiaque No Maladie Cardiaque
Correct Incorrect Correct Incorrect 0.2
Yes Yes 172 No 3 0 4 1
Equipe Machine Learning Esprit 2021/2022 16
Douleurs Artères Poids du Maladie
Poids
thoracique obsturées patient cardiaque
L’étape suivante consiste à calculer l’importance du
Yes Yes 205 Yes 1/8
1er stump crée, en évaluant sa classification.
No Yes 180 Yes 1/8
Poids du patient > 176
Yes No 210 Yes 1/8
Yes No 168 No 1/8 des poids relatifs aux observations non correctement
classifiées
Yes Yes 172 No 1/8
Equipe Machine Learning Esprit 2021/2022 17
Douleurs Artères Poids du Maladie
Poids
thoracique obsturées patient cardiaque
1/8
L’erreur totale d’un stump est 0 pour un stump
No Yes 125 No
parfait, et est égale à 1 pour un mauvais stump.
Yes No 168 No 1/8
1/8
l’importance (pertinence) d’un stump:
No Yes 125 No
1/8
𝒑𝒐𝒊𝒅𝒔𝒏𝒐𝒖𝒗 = 𝒑𝒐𝒊𝒅𝒔 ∗ 𝒆−𝜶
Yes Yes 172 No
Equipe Machine Learning Esprit 2021/2022 20
Douleurs Artères Poids du Maladie Poids
Poids Nv Poids
thoracique obsturées patient cardiaque Normalisés
Les nouveaux poids seront
Yes Yes 205 Yes 1/8 0.05 0.07
normalisés
No Yes 180 Yes 1/8 0.05 0.07
Yes No 168 No 0.07 0.84-0.91 se trouvent dans le bucket et en fonction de cela, nous
créerons notre nouvel ensemble de données ci-
Yes Yes 172 No 0.07 0.91-0.99 dessous.
Equipe Machine Learning Esprit 2021/2022 23
Douleurs Artères Poids du Maladie Maladie
Douleurs Artères Poids du
thoracique obsturées patient cardiaque thoracique obsturées patient cardiaque
La prédiction du « strong learner » sera la moyenne de toutes les réponses (pondérées) des « weak
learner ».
Classe yes= 1
Donc Sign(1.25) = positif Classe No= -1
donc la 1ère observation appartient à la
classe 1 (yes).
Equipe Machine Learning Esprit 2021/2022 27
AdaBoost est relativement robuste au surapprentissage dans les
ensembles de données à faible bruit.