Robust topological policy iteration for infinite horizon bounded Markov decision processes (2019)
- Autores:
- Autores USP: BARROS, LELIANE NUNES DE - IME ; DELGADO, KARINA VALDIVIA - EACH
- Unidades: IME; EACH
- DOI: 10.1016/j.ijar.2018.12.004
- Assuntos: PROCESSOS DE MARKOV; PROBABILIDADE
- Palavras-chave do autor: Probabilistic planning; Bounded-parameter Markov Decision; Processes; Asynchronous policy iteration
- Agências de fomento:
- Idioma: Inglês
- Imprenta:
- Fonte:
- Título do periódico: International Journal of Approximate Reasoning
- ISSN: 0888-613X
- Volume/Número/Paginação/Ano: v. 105, p. 287-304, 2019
- Este periódico é de assinatura
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: hybrid
- Licença: publisher-specific-oa
-
ABNT
REIS, Willy Arthur Silva e BARROS, Leliane Nunes de e DELGADO, Karina Valdivia. Robust topological policy iteration for infinite horizon bounded Markov decision processes. International Journal of Approximate Reasoning, v. 105, p. 287-304, 2019Tradução . . Disponível em: https://doi.org/10.1016/j.ijar.2018.12.004. Acesso em: 19 abr. 2024. -
APA
Reis, W. A. S., Barros, L. N. de, & Delgado, K. V. (2019). Robust topological policy iteration for infinite horizon bounded Markov decision processes. International Journal of Approximate Reasoning, 105, 287-304. doi:10.1016/j.ijar.2018.12.004 -
NLM
Reis WAS, Barros LN de, Delgado KV. Robust topological policy iteration for infinite horizon bounded Markov decision processes [Internet]. International Journal of Approximate Reasoning. 2019 ; 105 287-304.[citado 2024 abr. 19 ] Available from: https://doi.org/10.1016/j.ijar.2018.12.004 -
Vancouver
Reis WAS, Barros LN de, Delgado KV. Robust topological policy iteration for infinite horizon bounded Markov decision processes [Internet]. International Journal of Approximate Reasoning. 2019 ; 105 287-304.[citado 2024 abr. 19 ] Available from: https://doi.org/10.1016/j.ijar.2018.12.004 - Robust optimization for hybrid MDPs with state-dependent noise
- Symbolic bounded real-time dynamic programming
- Risk-sensitive Markov decision process with limited budget
- Symbolic dynamic programming for discrete and continuous state MDPs
- Learning to program using hierarchical model-based debugging
- B^2RTDP: an efficient solution for bounded-parameter Markov decision process
- ProPAT: a programming ITS based on pedagogical patterns
- Processo de decisão Markoviano com transição valorada por conjunto modelado como um Jogo alternado de soma zero
- Diagnostic of programs for programming learning tools
- Efficient solutions to factored MDPs with imprecise transition probabilities
Informações sobre o DOI: 10.1016/j.ijar.2018.12.004 (Fonte: oaDOI API)
Download do texto completo
Tipo | Nome | Link | |
---|---|---|---|
2918090.pdf |
Como citar
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas