Estratégias para aplicação de políticas parciais com motivação intrínsica

Beirigo, Rafael Lemes; Reali Costa, Anna Helena

Tese

Estratégias para aplicação de políticas parciais com motivação intrínsica (2014)

Authors:
- Beirigo, Rafael Lemes
- Reali Costa, Anna Helena (Orientador)
Autor USP: BEIRIGO, RAFAEL LEMES - EP
Unidade: EP
Sigla do Departamento: PCS
Subjects: MOTIVAÇÃO INTRÍNSECA; APRENDIZADO COMPUTACIONAL
Keywords: APRENDIZADO POR ESFORÇO; POLÍTICAS PARCIAIS (APLICAÇÃO)
Language: Português
Abstract: As técnicas de Aprendizado por Reforço permitem a solução de um problema através da escolha de ações que maximizem valores de recompensas recebidas que refletem a qualidade das ações tomadas pelo agente em um processo de tentativa e erro. Em problemas com estrutura hierárquica, a solução final depende do encadeamento de soluções para subproblemas aí presentes, sendo frequente a repetição de subproblemas nesse encadeamento. Nesses casos, a utilização de políticas parciais permite o aprendizado e armazenamento das soluções individuais para cada subproblema, que podem então ser utilizadas múltiplas vezes na composição de uma solução completa para o problema final, acelerando o aprendizado. Apesar de vantajosa, a utilização de políticas parciais necessita de definições por parte do projetista, o que representa uma sobrecarga. Para contornar esse problema, foram propostas técnicas de descoberta automática de políticas parciais, dentre as quais a utilização de motivação intrínseca se destaca por permitir ao agente aprender soluções de subproblemas úteis na solução do problema final sem a necessidade de se definir manualmente novas recompensas para esses subproblemas individualmente. Apesar de promissora, essa proposta utiliza um conjunto de componentes de aprendizado que ainda carece de investigação aprofundada acerca dos impactos individual e coletivo de cada componente, notadamente a aplicação das políticas parciais durante o aprendizado. Nesta dissertação são propostas duas abordagens para a aplicação de políticas parciais no Aprendizado por Reforço com Motivação Intrínseca: (i) armazenamento das políticas parciais em aplicação pelo agente e (ii) exploração interna à aplicação das políticas parciais. O impacto das propostas no desempenho de aprendizado é avaliado experimentalmente em um domínio com forte caracterização hierárquica.
Imprenta:
- Publisher place: São Paulo
- Date published: 2014
Data da defesa: 02.10.2014

How to cite

A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

ABNT

BEIRIGO, Rafael Lemes. Estratégias para aplicação de políticas parciais com motivação intrínsica. 2014. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2014. Disponível em: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-12102015-140550/. Acesso em: 10 maio 2024.
APA

Beirigo, R. L. (2014). Estratégias para aplicação de políticas parciais com motivação intrínsica (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/3/3141/tde-12102015-140550/
NLM

Beirigo RL. Estratégias para aplicação de políticas parciais com motivação intrínsica [Internet]. 2014 ;[citado 2024 maio 10 ] Available from: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-12102015-140550/
Vancouver

Beirigo RL. Estratégias para aplicação de políticas parciais com motivação intrínsica [Internet]. 2014 ;[citado 2024 maio 10 ] Available from: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-12102015-140550/

ReP

Exportar registro bibliográfico

Estratégias para aplicação de políticas parciais com motivação intrínsica (2014)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

USP Schools

ReP

Exportar registro bibliográfico

Estratégias para aplicação de políticas parciais com motivação intrínsica (2014)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: