Vous êtes sur la page 1sur 2

Faculté des sciences Meknès, Département d’informatique, Master Intelligence artificielle

Mini Projet : Path planning avec la méthode Q-learning


Le but de ce projet est de trouver le chemin optimal d’un robot pour aller de S à G.
Représentation de l’environnement :

Chemin valide:
(0,0),(0,1),(0,2),(0,3),(1,3),(1,4),(1,5),(2,5),(3,5),(4,5),(4,6),(4,7),(5,7),(6,7)(7,7),(7,8),(8,8),(8,9),(9,9)

Un chemin valide est un chemin qui commence par (0,0) et se termine par (9,9) et
ne coïncide pas avec les coordonnées des obstacles.
Chaque état est determiné par une position P(x,y), et a quatre possibles actions qui
sont : H, B, G et D. L’état initiale n’a que 2 actions possibles D et B.

Le signale de renforcement (Rward) :


Si P(x,y) = 1 alors R = -10
Si P(x,y) = 0 alors R= 1/dist(P(x,y),G) (G : Goal)

dist(P1, P2)= − + −
Faculté des sciences Meknès, Département d’informatique, Master Intelligence artificielle

Le travail à faire :
Développer un programme en utilisant la méthode Q-learning, pour trouver un
chemin optimale entre l’état initiale P(0,0) et l’état finale P(9,9).
Vous pouvez vous baser sur le diagramme de classe suivant (L’utilisation des mêmes
classes n’est pas obligatoire. Vous pouvez définir vos propres classes):

Pour ceux qui ont terminé : ajouter dans quelques cases de l’environnement des
fraises. Le robot gagne des points lorsqu’il les traverse.
NB : Pour ceux qui vont développer en JAVA, pour faciliter la tâche de gestion de
la matrice, ils peuvent utiliser l’API EJML pour modéliser l’environnement.
Bon courage
Pr. Said BENHLIMA

Vous aimerez peut-être aussi