- DocumentTsitsiklis, John N._ Roy, Benjamin - Feature-based Methods for Large Scale Dynamic Programming (1996) [10.1007_bf00114724] - Libgen.litéléversé par
Orso Forghieri
- DocumentLearning to Act Using Real-time Dynamic Programmingtéléversé par
Orso Forghieri
- DocumentFeature-Based Aggregation and Deep Reinforcement Learningtéléversé par
Orso Forghieri
- DocumentNIPS 1999 Policy Gradient Methods for Reinforcement Learning With Function Approximation Papertéléversé par
Orso Forghieri
- DocumentOptimally solving Markov decision processes Alagoz Ayvaci Linderothtéléversé par
Orso Forghieri
- DocumentRésolution d’un programme lin ́eaire par l’Algorithme du simplexetéléversé par
Orso Forghieri
- DocumentRMDP_DivideConquer Methods_Metha_2015téléversé par
Orso Forghieri
- DocumentAn empirical study of policy convergence in Markov decision process value iteration Zobel 2005téléversé par
Orso Forghieri
- DocumentAn Adaptive State Aggregation Algorithm for Markov Decision Processestéléversé par
Orso Forghieri