Estratégias para otimização do algoritmo de Iteração de Valor Sensível a Risco (2018)
- Autores:
- Autor USP: BORGES, IGOR OLIVEIRA - EACH
- Unidade: EACH
- Assuntos: INTELIGÊNCIA ARTIFICIAL; PROCESSOS DE MARKOV; PROCESSOS ESTOCÁSTICOS; PROGRAMAÇÃO DINÂMICA; HEURÍSTICA
- Palavras-chave do autor: Planejamento Estocástico; Política Sensível a Risco; Processo de Decisão Markoviano Sensível a Risco; Risk Sensitive Markov Decision Process; Risk Sensitive Policy; Stochastic Planning
- Idioma: Português
- Resumo: Processos de decisão markovianos sensíveis a risco (Risk Sensitive Markov Decision Process - RS-MDP) permitem modelar atitudes de aversão e propensão ao risco no processo de tomada de decisão usando um fator de risco para representar a atitude ao risco. Para esse modelo, existem operadores que são baseados em funções de transformação linear por partes que incluem fator de risco e fator de desconto. Nesta dissertação são formulados dois algoritmos de Iteração de Valor Sensível a Risco baseados em um desses operadores, esses algoritmos são chamados de Iteração de Valor Sensível a Risco Síncrono (Risk Sensitive Value Iteration - RSVI) e Iteração de Valor Sensível a Risco Assíncrono (Asynchronous Risk Sensitive Value Iteration- A-RSVI)... (Continua)(Continuação) Também são propostas duas heurísticas que podem ser utilizadas para inicializar os valores dos algoritmos de forma a torná-los mais eficentes. Os resultados dos experimentos no domínio de Travessia do Rio em dois cenários de recompensas distintos mostram que: (i) o custo de processamento de políticas extremas a risco, tanto de aversão quanto de propensão, é elevado; (ii) um desconto elevado aumenta o tempo de convergência do algoritmo e reforça a sensibilidade ao risco adotada; (iii) políticas com valores para o fator de risco intermediários possuem custo computacional baixo e já possuem certa sensibilidade ao risco dependendo do fator de desconto utilizado; e (iv) o algoritmo A-RSVI com a heurística baseada no fator de risco pode reduzir o tempo para o algoritmo convergir, especialmente para valores extremos do fator de risco
- Imprenta:
- Data da defesa: 11.10.2018
-
ABNT
BORGES, Igor Oliveira. Estratégias para otimização do algoritmo de Iteração de Valor Sensível a Risco. 2018. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2018. Disponível em: http://www.teses.usp.br/teses/disponiveis/100/100131/tde-09012019-103826/. Acesso em: 29 mar. 2024. -
APA
Borges, I. O. (2018). Estratégias para otimização do algoritmo de Iteração de Valor Sensível a Risco (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/100/100131/tde-09012019-103826/ -
NLM
Borges IO. Estratégias para otimização do algoritmo de Iteração de Valor Sensível a Risco [Internet]. 2018 ;[citado 2024 mar. 29 ] Available from: http://www.teses.usp.br/teses/disponiveis/100/100131/tde-09012019-103826/ -
Vancouver
Borges IO. Estratégias para otimização do algoritmo de Iteração de Valor Sensível a Risco [Internet]. 2018 ;[citado 2024 mar. 29 ] Available from: http://www.teses.usp.br/teses/disponiveis/100/100131/tde-09012019-103826/
Como citar
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas