Académique Documents
Professionnel Documents
Culture Documents
ML
25 de maio de 2014
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Introducao
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Introducao
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Introducao
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Behaviorismo
Behaviorismo
Enfase
na interacao com o ambiente e conceito de reforco.
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Behaviorismo
Behaviorismo
Enfase
na interacao com o ambiente e conceito de reforco.
Reforco e uma consequencia que ira estimular o comportamento futuro.
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Behaviorismo
Behaviorismo
Enfase
na interacao com o ambiente e conceito de reforco.
Reforco e uma consequencia que ira estimular o comportamento futuro.
https://www.youtube.com/watch?v=tV7Zp2B_mt8
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Motivacao
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Motivacao
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
MDP
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
MDP
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
MDP
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
MDP
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
MDP
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
MDP
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
MPD
Mecanica do MPD:
s0
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
MPD
Mecanica do MPD:
s0 a0
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
MPD
Mecanica do MPD:
s0 a0 s1
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
MPD
Mecanica do MPD:
s0 a0 s1 a1
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
MPD
Mecanica do MPD:
s0 a0 s1 a1 s2
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
MPD
Mecanica do MPD:
s0 a0 s1 a1 s2 . . .
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Recompensa
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Recompensa
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Condicoes
Restric
oes (descer estando no terreo, subir estando no u
ltimo, etc.)
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Condicoes
Restric
oes (descer estando no terreo, subir estando no u
ltimo, etc.)
No m
aximo um passageiro aguarda por andar.
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Condicoes
Restric
oes (descer estando no terreo, subir estando no u
ltimo, etc.)
No m
aximo um passageiro aguarda por andar.
Todos os passageiros saem do elevador apenas no andar t
erreo.
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Implementacao
Cada estado e computado como um vetor de 7 elementos
x = [c1 , c2 , c3 , c4 , p, v , o]T
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Implementacao
Cada estado e computado como um vetor de 7 elementos
x = [c1 , c2 , c3 , c4 , p, v , o]T
Em que
ci representa o n
umero de pessoas que aguardam no andar i.
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Implementacao
Cada estado e computado como um vetor de 7 elementos
x = [c1 , c2 , c3 , c4 , p, v , o]T
Em que
ci representa o n
umero de pessoas que aguardam no andar i.
p
e a posicao do elevador, pertencente a {0, 1, 2, 3, 4}.
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Implementacao
Cada estado e computado como um vetor de 7 elementos
x = [c1 , c2 , c3 , c4 , p, v , o]T
Em que
ci representa o n
umero de pessoas que aguardam no andar i.
p
e a posicao do elevador, pertencente a {0, 1, 2, 3, 4}.
v
e a velocidade do elevador, pertencente a {3, 0, 3}.
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Implementacao
Cada estado e computado como um vetor de 7 elementos
x = [c1 , c2 , c3 , c4 , p, v , o]T
Em que
ci representa o n
umero de pessoas que aguardam no andar i.
p
e a posicao do elevador, pertencente a {0, 1, 2, 3, 4}.
v
e a velocidade do elevador, pertencente a {3, 0, 3}.
o
e o n
umero de pessoas que ocupam o elevador, tomando valores
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Implementacao
Cada estado e computado como um vetor de 7 elementos
x = [c1 , c2 , c3 , c4 , p, v , o]T
Em que
ci representa o n
umero de pessoas que aguardam no andar i.
p
e a posicao do elevador, pertencente a {0, 1, 2, 3, 4}.
v
e a velocidade do elevador, pertencente a {3, 0, 3}.
o
e o n
umero de pessoas que ocupam o elevador, tomando valores
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Recompensa
F
ormula:
p(x) =
4
X
ci o
i=1
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Recompensa
F
ormula:
p(x) =
4
X
ci o
i=1
Interpretacao: Negativo do n
umero de passageiros aguardantes e
ocupantes.
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Execucao
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Execucao
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Resultados
Resultados obtidos:
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Resultados
Resultados obtidos:
Figura: :(
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Artigo original
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Artigo original
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Artigo original
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Artigo original
Andr
e Peric Tavares
Aprendizado de M
aquina
Otimizac
ao do Funcionamento de Elevadores Atrav
es de Reinforcement Learning
ML
Duvidas
Andr
e Peric Tavares
Aprendizado de M
aquina