Vous êtes sur la page 1sur 3

Apprentissage par Renforcement

Apprentissage par Renforcement


Introduction

• Apprentissage supervisé
– Classification, regression

• Apprentissage non supervisé


– ClusteringApprentissage par Renforcement

• Apprentissage par renforcement


– Plus général que l'apprentissage supervisé/non supervisé
– Apprendre de l'interaction avec l'environnement pour atteindre un objectif

environment
reward action
new state
agent

16/06/2022 Apprentissage par Renforcement 2


Introduction
Progrès récents

Le RL n'est pas un domaine nouveau, mais il s'est généralisé ces dernières années,
principalement grâce à des exploits liés au jeu :

 AlphaGo a battu le champion de go Lee Sedol en 2016 ;

 AlphaZero a atteint un niveau surhumain aux échecs, au shogi et au go en moins


de 24 heures en 2017 ;

 OpenAI Five a démontré un jeu de niveau expert contre d'autres équipes


compétitives de Dota 2 en 2019 ;

 AlphaStar a atteint le niveau Grandmaster de StarCraft 2 (0,2 % des meilleurs


joueurs humains), également en 2019.

16/06/2022 Apprentissage par Renforcement 3

Vous aimerez peut-être aussi