Exportar registro bibliográfico

Synthesizing interpretable strategies for real-time planning in zero-sum games (2021)

  • Authors:
  • Autor USP: MARIñO, JULIAN RICARDO HERNANDEZ - ICMC
  • Unidade: ICMC
  • Sigla do Departamento: SSC
  • Subjects: INTELIGÊNCIA ARTIFICIAL; COMPUTAÇÃO EVOLUTIVA; ANÁLISE DE ALGORITMOS; TEMPO-REAL; SÍNTESE DE PROGRAMAS; JOGOS
  • Keywords: Algoritmo de busca; Evolutionary algorithm; Algoritmos evolutivo; Games; Program synthesis; RTS; RTS; Search algorithm; Self play; Self-play; Soma zero; Zero-sum
  • Agências de fomento:
  • Language: Inglês
  • Abstract: A Inteligência Artificial (IA) interpretável e explicável é projetada como um dos temas mais importantes para a comunidade nos próximos anos. Além de desenvolver abordagens eficazes de IA que possam ajudar aos humanos a resolver problemas, pode ser necessário entender as razões por trás das decisões de tais abordagens para finalmente confiar em seu comportamento. Os algoritmos baseados em busca e aprendizagem representam o estado da arte para o planejamento em jogos de soma zero em tempo real. O problema com essas abordagens é que geralmente o comportamento de seus agentes resultantes não é interpretável. Por outro lado, scripts geralmente não são tão eficazes quanto os métodos de busca, mas têm uma vantagem importante; eles podem ser mais facilmente interpretáveis. Nesta tese, apresentamos uma coleção de trabalhos onde abordamos o problema de sintetizar scripts interpretáveis e eficazes para o planejamento em domínios de tempo real de soma zero. Primeiro, abordamos o problema de gerar um conjunto de scripts que pode ser usado como uma abstração de ação para reduzir os espaços de busca de ações em jogos em tempo real de soma zero. Apresentamos uma abordagem evolutiva que pode gerar abstrações de ação que algoritmos baseados em busca podem usar para o planejamento. Sistemas baseados em busca que usam abstrações de ação geradas por nosso sistema superaram os métodos de busca do estado da arte que usamos nos experimentos, e venceram a competição mRTS do 2018. Tambémapresentamos o Gesy e o LS2, dois sistemas focados em sintetizar scripts que podem ser usados por si sós para planejamento em jogos em tempo real de soma zero. Gesy é um sistema que usa uma abordagem de Programação Genética (GP) para sintetizar scripts interpretáveis. LS2 é um sistema que combina um novo método para reduzir Linguagens Específicas de Domínio (DSLs) e um algoritmo de busca local que usa a self-play para sintetizar scripts interpretáveis. Os scripts que Gesy e LS2 sintetizam são competitivos com métodos complexos baseados em busca e scripts codificados por programadores profissionais. Também mostramos que os scripts sintetizados pelos dois sistemas podem ser usados para descobrir possíveis otimizações que os programadores poderiam incluir em suas implementações.
  • Imprenta:
  • Data da defesa: 15.10.2021
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      MARIÑO, Julian Ricardo Hernandez. Synthesizing interpretable strategies for real-time planning in zero-sum games. 2021. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2021. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-21122021-111842/. Acesso em: 30 abr. 2024.
    • APA

      Mariño, J. R. H. (2021). Synthesizing interpretable strategies for real-time planning in zero-sum games (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-21122021-111842/
    • NLM

      Mariño JRH. Synthesizing interpretable strategies for real-time planning in zero-sum games [Internet]. 2021 ;[citado 2024 abr. 30 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-21122021-111842/
    • Vancouver

      Mariño JRH. Synthesizing interpretable strategies for real-time planning in zero-sum games [Internet]. 2021 ;[citado 2024 abr. 30 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-21122021-111842/


Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2024