Processo de decisão Markoviano com transição valorada por conjunto modelado como um Jogo alternado de soma zero (2012)
- Authors:
- USP affiliated authors: BARROS, LELIANE NUNES DE - IME ; DELGADO, KARINA VALDIVIA - EACH
- Unidades: IME; EACH
- Assunto: PROCESSOS DE MARKOV
- Language: Inglês
- Abstract: O modelo MDPST (Markov Decision Process with Set-valued Transitions), uma extensão dos processos de decisão markovianos (MDPs) capaz de modelar a combinacão de incerteza knightiana e incerteza probabilística, pode ser visto como um jogo de dois jogadores em que a Natureza faz o papel de um jogador adversário. Nesse artigo, estudamos a equivalência entre um MDPST e um jogo markoviano alternado de soma-zero (AMG). Além disso, propomos um novo modelo de jogo, chamado de AMGST (Al-ternating Markov Game with Set-valued Transitions) capaz de modelar um jogador com transições probabilísticas para conjuntos de estados e o outro jogador com transicões probabilísticas para elementos desses conjuntos.
- Imprenta:
- Publisher: SBC
- Publisher place: Porto Alegre
- Date published: 2012
- Source:
- Título do periódico: Proceedings
- ISSN: 2316-4220
- Conference titles: Brazilian Conference on Intelligent Systems - BRACIS
-
ABNT
BARROS, Leliane Nunes de e FRANCO, Fábio de Oliveira e DELGADO, Karina Valdivia. Processo de decisão Markoviano com transição valorada por conjunto modelado como um Jogo alternado de soma zero. 2012, Anais.. Porto Alegre: SBC, 2012. . Acesso em: 16 maio 2024. -
APA
Barros, L. N. de, Franco, F. de O., & Delgado, K. V. (2012). Processo de decisão Markoviano com transição valorada por conjunto modelado como um Jogo alternado de soma zero. In Proceedings. Porto Alegre: SBC. -
NLM
Barros LN de, Franco F de O, Delgado KV. Processo de decisão Markoviano com transição valorada por conjunto modelado como um Jogo alternado de soma zero. Proceedings. 2012 ;[citado 2024 maio 16 ] -
Vancouver
Barros LN de, Franco F de O, Delgado KV. Processo de decisão Markoviano com transição valorada por conjunto modelado como um Jogo alternado de soma zero. Proceedings. 2012 ;[citado 2024 maio 16 ] - Robust optimization for hybrid MDPs with state-dependent noise
- Symbolic bounded real-time dynamic programming
- Risk-sensitive Markov decision process with limited budget
- Symbolic dynamic programming for discrete and continuous state MDPs
- Learning to program using hierarchical model-based debugging
- B^2RTDP: an efficient solution for bounded-parameter Markov decision process
- ProPAT: a programming ITS based on pedagogical patterns
- Efficient solutions to factored MDPs with imprecise transition probabilities
- Diagnostic of programs for programming learning tools
- Real-time dynamic programming for Markov decision processes with imprecise probabilities
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas