Académique Documents
Professionnel Documents
Culture Documents
Chemin valide:
(0,0),(0,1),(0,2),(0,3),(1,3),(1,4),(1,5),(2,5),(3,5),(4,5),(4,6),(4,7),(5,7),(6,7)(7,7),(7,8),(8,8),(8,9),(9,9)
Un chemin valide est un chemin qui commence par (0,0) et se termine par (9,9) et
ne coïncide pas avec les coordonnées des obstacles.
Chaque état est determiné par une position P(x,y), et a quatre possibles actions qui
sont : H, B, G et D. L’état initiale n’a que 2 actions possibles D et B.
dist(P1, P2)= − + −
Faculté des sciences Meknès, Département d’informatique, Master Intelligence artificielle
Le travail à faire :
Développer un programme en utilisant la méthode Q-learning, pour trouver un
chemin optimale entre l’état initiale P(0,0) et l’état finale P(9,9).
Vous pouvez vous baser sur le diagramme de classe suivant (L’utilisation des mêmes
classes n’est pas obligatoire. Vous pouvez définir vos propres classes):
Pour ceux qui ont terminé : ajouter dans quelques cases de l’environnement des
fraises. Le robot gagne des points lorsqu’il les traverse.
NB : Pour ceux qui vont développer en JAVA, pour faciliter la tâche de gestion de
la matrice, ils peuvent utiliser l’API EJML pour modéliser l’environnement.
Bon courage
Pr. Said BENHLIMA