Ver registro no DEDALUS
Exportar registro bibliográfico

Estratégias para otimização do algoritmo de Iteração de Valor Sensível a Risco (2018)

  • Authors:
  • USP affiliated authors: BORGES, IGOR OLIVEIRA - EACH
  • USP Schools: EACH
  • Subjects: INTELIGÊNCIA ARTIFICIAL; PROCESSOS DE MARKOV; PROCESSOS ESTOCÁSTICOS; PROGRAMAÇÃO DINÂMICA; HEURÍSTICA
  • Keywords: Planejamento Estocástico; Política Sensível a Risco; Processo de Decisão Markoviano Sensível a Risco; Risk Sensitive Markov Decision Process; Risk Sensitive Policy; Stochastic Planning
  • Language: Português
  • Abstract: Processos de decisão markovianos sensíveis a risco (Risk Sensitive Markov Decision Process - RS-MDP) permitem modelar atitudes de aversão e propensão ao risco no processo de tomada de decisão usando um fator de risco para representar a atitude ao risco. Para esse modelo, existem operadores que são baseados em funções de transformação linear por partes que incluem fator de risco e fator de desconto. Nesta dissertação são formulados dois algoritmos de Iteração de Valor Sensível a Risco baseados em um desses operadores, esses algoritmos são chamados de Iteração de Valor Sensível a Risco Síncrono (Risk Sensitive Value Iteration - RSVI) e Iteração de Valor Sensível a Risco Assíncrono (Asynchronous Risk Sensitive Value Iteration- A-RSVI)... (Continua)(Continuação) Também são propostas duas heurísticas que podem ser utilizadas para inicializar os valores dos algoritmos de forma a torná-los mais eficentes. Os resultados dos experimentos no domínio de Travessia do Rio em dois cenários de recompensas distintos mostram que: (i) o custo de processamento de políticas extremas a risco, tanto de aversão quanto de propensão, é elevado; (ii) um desconto elevado aumenta o tempo de convergência do algoritmo e reforça a sensibilidade ao risco adotada; (iii) políticas com valores para o fator de risco intermediários possuem custo computacional baixo e já possuem certa sensibilidade ao risco dependendo do fator de desconto utilizado; e (iv) o algoritmo A-RSVI com a heurística baseada no fator de risco pode reduzir o tempo para o algoritmo convergir, especialmente para valores extremos do fator de risco
  • Imprenta:
  • Data da defesa: 11.10.2018
  • Acesso online ao documento

    Online access or search this record in

    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      BORGES, Igor Oliveira; DELGADO, Karina Valdivia. Estratégias para otimização do algoritmo de Iteração de Valor Sensível a Risco. 2018.Universidade de São Paulo, São Paulo, 2018. Disponível em: < http://www.teses.usp.br/teses/disponiveis/100/100131/tde-09012019-103826/ >.
    • APA

      Borges, I. O., & Delgado, K. V. (2018). Estratégias para otimização do algoritmo de Iteração de Valor Sensível a Risco. Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/100/100131/tde-09012019-103826/
    • NLM

      Borges IO, Delgado KV. Estratégias para otimização do algoritmo de Iteração de Valor Sensível a Risco [Internet]. 2018 ;Available from: http://www.teses.usp.br/teses/disponiveis/100/100131/tde-09012019-103826/
    • Vancouver

      Borges IO, Delgado KV. Estratégias para otimização do algoritmo de Iteração de Valor Sensível a Risco [Internet]. 2018 ;Available from: http://www.teses.usp.br/teses/disponiveis/100/100131/tde-09012019-103826/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: