Académique Documents
Professionnel Documents
Culture Documents
Etant donné:
Un langage pour répondre aux exemples " : fonctionnalités (x,y)
Espace dans les lieux #, disponible dans cette langue
Un langage d'hypothèses (une fonction de # &)
Sur la liste : h
tq pour tout") = +), ), ") ≈ /)
[Ces diapositives ont été créées par Dan Klein, Pieter Abbeel, Sergey Levine. Tous les documents CS188 se trouvent sur http://ai.berkeley.edu.]
§Problème:
§ Comprend :
§ Classification (sorties = étiquettes de
classe) § Régression (sorties = nombres réels)
Machine Translated by Google
§ Véritable fonction
§ Réalisable : en H
Machine Translated by Google
§ Donc : nous avons besoin de mesurer à quel point une répartition est « bonne », même si les résultats ne sont pas parfaits.
séparé
• Resort&à&un&gourmand&heurisGc:&
– Début&de&vide&décision&arbre&
– Split&on&next(meilleur(a1ribute((feature)(
Récurseur
Entropie&H(Y)&de&a&aléatoire&variable&Y
• « Haute entropie » &&
– Y&est&from&a&uniform&like&distribuGon&
Entropie&d'une&pièce&flip& – Plat&histogramme&
Entropie&d'une&pièce&flip&
&eiportnE
aléatoire&variable&X
Probabilité&de&face&
X1 _ _
P(Y=t) = 5/6 Exemple: X1
X1 _ _ t F TTT
P(Y=f) = 1/6 TFT
TTT
P(X1=t) = 4/6 Y=t : 4 Y=t : 1
TFT TTT
P(X1=f) = 2/6 Y=f : 0 Y=f : 1
H(Y) = 5/6 log2 5/6 1/6 log2 1/6 TTT TFT
= 0,65 TTF
TFT H(Y|X1) = 4/6 (1 log2 1 + 0 log2 0)
TTF 2/6 (1/2 log2 1/2 + 1/2 log2 1/2) FFF
FFF = 2/6
1 peu
X1 _ _
Dans notre exemple en cours : TTT
TFT
IG(X1) = H(Oui) – H(Oui|X1) § Aussi appelée entropie de la distribution
= 0,65 – 0,33 TTT § Plus uniforme = entropie plus élevée
0 bit
§ Retour aux arbres de décision ! § Maintenant, nous devons continuer à faire pousser l'arbre !
§ Pour chaque division, comparez l'entropie avant et après
§ Deux branchements sont réalisés (pourquoi ?)
§ La différence est le gain d'information
§ Problème : il y a plus d'une distribution après la division ! § Que faire sous « plein » ?
§ Voyez quels sont les exemples…
UN?
Gini (Enfants) =
3/10 0 + *
7/10 0,49* =
0,343
Mesure du rendement
48
52 52
Machine Translated by Google
Erreur générale : Erreur qu'il soit présent aux nouvelles données (la définition
formelle est très importante à appeler dans l'espérance)
Entrée Test
52 53
Utilisez tous les dons pour la saisie et la validation Optimisez vos N'oublie pas
performances (+/ type Ecart) pour des montants plus raisonnables issus
du test.
Lors de l'utilisation d'un tour, les blocs sont accompagnés d'une validation et d'une union.
Ces autres viennent pendant l'entraînement
54
Machine Translated by Google
Bloc 1 Bloc 2 Bloc 3 Bloc 4 Bloc 5 Bloc 1 Bloc 2 Bloc 3 Bloc 4 Bloc 5
Essai 1 Introduction 1
Bloc 1 Bloc 2 Bloc 3 Bloc 4 Bloc 5 Bloc 1 Bloc 2 Bloc 3 Bloc 4 Bloc 5
..
.
Introduction 5 Essai 5 Performance 5
Machine Translated by Google
..
.
Parfum
Introduction 5 Essai 5 Performance 5
55 56
Pourcentage d'erreur : proportionnel aux observations de classe mal Problème : Quand les classes ne sont pas équipées
Problème : Quand les classes ne sont pas équipées Exemple : Détection de fraude
99 % des observations n'ont pas provoqué de fraude
Exemple : Détection de fraude
Un modèle qui utilise « non » pour générer un pourcentage de 1 %.
99 % des observations n'ont pas provoqué de fraude
Un modèle qui utilise « non » pour générer un pourcentage de 1 %. — Matrice de confusion (matrice de confusion)
Classe réelle
0 1
Classe 0 Vrais Négatifs (TN) Faux Négatifs (FN) Prédit 1
Faux Positifs (FP) Vrais Positifs (TP)
56 56