Académique Documents
Professionnel Documents
Culture Documents
1. Rechercher et citer toutes les fonctions de récompense qui existent ainsi que leurs fonctionnements
(Formule + Explications)
2. Lister toutes les fonctions de perte qui existent pour la classification et la régression ainsi que leurs
fonctionnements (Formule + Explications)
Réponse [1]
1. Fonction de récompense de réussite: Cette fonction de récompense est utilisée pour indiquer si une
tâche spécifique a été accomplie ou non. Elle est souvent utilisée pour les tâches de type "but" ou "buts
multiples".
Formule: r = 1 si la tâche est
accomplie, r = 0 sinon
2. Fonction de récompense de pénalité: Cette fonction de récompense est utilisée pour pénaliser les
actions qui ne sont pas désirées ou qui sont dangereuses.
Formule: r = -1 si une action non
désirée est effectuée, r = 0 sinon
3. Fonction de récompense de récompense cumulée : Elle est utilisée pour indiquer les actions qui mènent
à un état désiré à long terme. Elle cumule les récompenses à chaque étape jusqu'à ce que la tâche soit
accomplie.
Formule: r = 2(r_t) où r_t est la récompense obtenue à l'étape t.
4. Fonction de récompense de distance : Cette fonction de récompense est utilisée pour indiquer la
distance entre l'état actuel et l'état désiré. Elle peut être utilisée pour les tâches de navigation ou de
planification.
Formule: r = -d(s,s*) où d(s,s*) est la distance entre l'état actuel s et l'état désiré s*
5. Fonction de récompense de temps : Cette fonction de récompense est utilisée pour indiquer le temps
passé pour atteindre un état désiré. Elle peut être utilisée pour les tâches de temps critique ou de
performance.
Formule: r = -t où t est le temps passé pour atteindre l'état désiré
6. Fonction de récompense de cout
: Cette fonction de récompense est utilisée pour indiquer le coût (par exemple, en termes d'énergie ou
de ressources) associé à une action. Elle peut être utilisée pour les tâches de planification ou de
contrôle de coût.
Formule: r = -c où c est le coût associé à l'action
7. Fonction de récompense de confiance : Cette fonction de récompense est utilisée pour indiquer la
confiance d'un agent dans ses décisions. Elle peut être utilisée pour les tâches de prise de décision
incertaine.
Formule: r = conf(a) où conf(a)
est la confiance de l'agent dans l’action a.
8. Fonction de récompense de préférence: Cette fonction de récompense est utilisée pour indiquer les
préférences d'un agent pour différents états ou actions. Elle peut être utilisée pour les tâches de prise
de décision subjective.
Formule: r = pref (s) où pref (s) est la préférence de l'agent pour l'état s
Réponse [2]