Présentation RL

Apprentissage par Renforcement
Apprentissage par Renforcement

Introduction
• Apprentissage supervisé
– Classification, regression
• Apprentissage non supervisé

– ClusteringApprentissage par Renforcement
• Apprentissage par renforcement

– Plus général que l'apprentissage supervisé/non supervisé
– Apprendre de l'interaction avec l'environnement pour atteindre un objectif
environment
reward action
new state
agent
16/06/2022 Apprentissage par Renforcement 2

Introduction
Progrès récents
Le RL n'est pas un domaine nouveau, mais il s'est généralisé ces dernières années,
principalement grâce à des exploits liés au jeu :
 AlphaGo a battu le champion de go Lee Sedol en 2016 ;
 AlphaZero a atteint un niveau surhumain aux échecs, au shogi et au go en moins

de 24 heures en 2017 ;
 OpenAI Five a démontré un jeu de niveau expert contre d'autres équipes

compétitives de Dota 2 en 2019 ;
 AlphaStar a atteint le niveau Grandmaster de StarCraft 2 (0,2 % des meilleurs

joueurs humains), également en 2019.
16/06/2022 Apprentissage par Renforcement 3

Présentation RL

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Présentation RL

Transféré par

Droits d'auteur :

Formats disponibles

Apprentissage par Renforcement

Apprentissage par Renforcement

• Apprentissage non supervisé

• Apprentissage par renforcement

16/06/2022 Apprentissage par Renforcement 2

 AlphaGo a battu le champion de go Lee Sedol en 2016 ;

 AlphaZero a atteint un niveau surhumain aux échecs, au shogi et au go en moins

 OpenAI Five a démontré un jeu de niveau expert contre d'autres équipes

 AlphaStar a atteint le niveau Grandmaster de StarCraft 2 (0,2 % des meilleurs

16/06/2022 Apprentissage par Renforcement 3

Vous aimerez peut-être aussi