Algoritmos assíncronos de iteração de política para Processos de Decisão Markovianos com Probabilidades Intervalares

Reis, Willy Arthur Silva; Delgado, Karina Valdivia

Tese

Algoritmos assíncronos de iteração de política para Processos de Decisão Markovianos com Probabilidades Intervalares (2019)

Authors:
- Reis, Willy Arthur Silva
- Delgado, Karina Valdivia (Orientador)
Autor USP: REIS, WILLY ARTHUR SILVA - IME
Unidade: IME
Sigla do Departamento: MAC
Assunto: CIÊNCIA DA COMPUTAÇÃO
Keywords: Asynchronous policy iteration; Iteração de política assíncrono; Markov Decision Processes with Imprecise Probabilities; Planejamento probabilístico; Probabilistic planning; Processos de Decisão Markovianos com Probabilidades Imprecisas
Agências de fomento:
- Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)
Language: Português
Abstract: Um Processo de Decisão Markoviano (MDP) pode ser usado para modelar problemas de decisão sequencial. No entanto, podem existir limitações na obtenção de probabilidades para modelagem da transição de estados ou falta de confiabilidade nas informações existentes sobre estas probabilidades. Um modelo menos restritivo e que pode resolver este problema é o Processo de Decisão Markoviano com Probabilidades Intervalares (BMDP), que permite a representação imprecisa das probabilidades de transição de estados e raciocínio sobre uma solução robusta. Para resolver BMDPs de horizonte infinito, existem os algoritmos síncronos de Iteração de Valor Intervalar e Iteração de Política Robusto, que são ineficientes quando o tamanho do espaço de estados é grande. Neste trabalho são propostos algoritmos assíncronos de Iteração de Política baseados no particionamento do espaço de estados em subconjuntos aleatórios (Robust Asynchronous Policy Iteration - RAPI) ou em componentes fortemente conexos (Robust Topological Policy Iteration - RTPI). Também são propostas formas de inicializar a função valor e a política dos algoritmos, de forma a melhorar a convergência destes. O desempenho dos algoritmos propostos é avaliado em comparação com o algoritmo de Iteração de Política Robusto para BMDPs para domínios de planejamento existentes e um novo domínio proposto. Os resultados dos experimentos realizados mostram que (i) quanto mais estruturado é o domínio, melhor é o desempenho do algoritmo RTPI; (ii) ouso de computação paralela no algoritmo RAPI possui um pequeno ganho computacional em relação à sua versão sequencial; e (iii) uma boa inicialização da função valor e política pode impactar positivamente o tempo de convergência dos algoritmos
Imprenta:
- Publisher place: São Paulo
- Date published: 2019
Data da defesa: 02.08.2019

How to cite

A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

ABNT

REIS, Willy Arthur Silva. Algoritmos assíncronos de iteração de política para Processos de Decisão Markovianos com Probabilidades Intervalares. 2019. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2019. Disponível em: http://www.teses.usp.br/teses/disponiveis/45/45134/tde-02092019-212258/. Acesso em: 18 abr. 2024.
APA

Reis, W. A. S. (2019). Algoritmos assíncronos de iteração de política para Processos de Decisão Markovianos com Probabilidades Intervalares (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/45/45134/tde-02092019-212258/
NLM

Reis WAS. Algoritmos assíncronos de iteração de política para Processos de Decisão Markovianos com Probabilidades Intervalares [Internet]. 2019 ;[citado 2024 abr. 18 ] Available from: http://www.teses.usp.br/teses/disponiveis/45/45134/tde-02092019-212258/
Vancouver

Reis WAS. Algoritmos assíncronos de iteração de política para Processos de Decisão Markovianos com Probabilidades Intervalares [Internet]. 2019 ;[citado 2024 abr. 18 ] Available from: http://www.teses.usp.br/teses/disponiveis/45/45134/tde-02092019-212258/

ReP

Exportar registro bibliográfico

Algoritmos assíncronos de iteração de política para Processos de Decisão Markovianos com Probabilidades Intervalares (2019)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

USP Schools

ReP

Exportar registro bibliográfico

Algoritmos assíncronos de iteração de política para Processos de Decisão Markovianos com Probabilidades Intervalares (2019)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: