Processos de decisão Markovianos fatorados com probabilidades imprecisas (2010)
- Authors:
- Autor USP: DELGADO, KARINA VALDIVIA - IME
- Unidade: IME
- Sigla do Departamento: MAC
- Assunto: INTELIGÊNCIA ARTIFICIAL
- Agências de fomento:
- Language: Português
- Abstract: Em geral, quando modelamos problemas de planejamento probabilístico do mundo real, usando o arcabouço de Processos de Decisão Markovianos (MDPs), é difícil obter uma estimativa exata das probabilidades de transição. A incerteza surge naturalmente na especificação de um domínio, por exemplo, durante a aquisição das probabilidades de transição a partir de um especialista ou de dados observados através de técnicas de amostragem, ou ainda de distribuições de transição não estacionárias decorrentes do conhecimento insuficiente do domínio. Com o objetivo de se determinar uma política robusta, dada a incerteza nas transições de estado, Processos de Decisão Markovianos com Probabilidades Imprecisas (MDP-IPs) têm sido usados para modelar esses cenários. Infelizmente, apesar de existirem diversos algoritmos de solução para MDP-IPs, muitas vezes eles exigem chamadas externas de rotinas de otimização que podem ser extremamente custosas. Para resolver esta deficiência, nesta tese, introduzimos o MDP-IP fatorado e propomos métodos eficientes de programação matemática e programação dinâmica que permitem explorar a estrutura de um domínio de aplicação. O método baseado em programação matemática propõe soluções aproximadas eficientes para MDP-IPs fatorados, estendendo abordagens anteriores de programação linear para MDPs fatorados. Essa proposta, baseada numa formulação multilinear para aproximações robustas da função valor de estados, explora a representação fatorada de um MDP-IP, reduzindo em ordens de magnitude o tempo consumido em relação às abordagens não fatoradas previamente propostas. O segundo método proposto, baseado em programação dinâmica, resolve o gargalo computacional existente nas soluções de programação dinâmica para MDP-IPs propostas na literatura: a necessidade de resolver múltilos problemas de otimização não linear.
- Imprenta:
- Data da defesa: 19.01.2010
-
ABNT
DELGADO, Karina Valdivia. Processos de decisão Markovianos fatorados com probabilidades imprecisas. 2010. Tese (Doutorado) – Universidade de São Paulo, São Paulo, 2010. Disponível em: http://www.teses.usp.br/teses/disponiveis/45/45134/tde-28112010-095311/. Acesso em: 17 abr. 2024. -
APA
Delgado, K. V. (2010). Processos de decisão Markovianos fatorados com probabilidades imprecisas (Tese (Doutorado). Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/45/45134/tde-28112010-095311/ -
NLM
Delgado KV. Processos de decisão Markovianos fatorados com probabilidades imprecisas [Internet]. 2010 ;[citado 2024 abr. 17 ] Available from: http://www.teses.usp.br/teses/disponiveis/45/45134/tde-28112010-095311/ -
Vancouver
Delgado KV. Processos de decisão Markovianos fatorados com probabilidades imprecisas [Internet]. 2010 ;[citado 2024 abr. 17 ] Available from: http://www.teses.usp.br/teses/disponiveis/45/45134/tde-28112010-095311/ - Diagnóstico baseado em modelos num sistema tutor inteligente para programação com padrões pedagógicos
- Robust optimization for hybrid MDPs with state-dependent noise
- Symbolic bounded real-time dynamic programming
- Risk-sensitive Markov decision process with limited budget
- Symbolic dynamic programming for discrete and continuous state MDPs
- Learning to program using hierarchical model-based debugging
- B^2RTDP: an efficient solution for bounded-parameter Markov decision process
- ProPAT: a programming ITS based on pedagogical patterns
- Processo de decisão Markoviano com transição valorada por conjunto modelado como um Jogo alternado de soma zero
- Diagnostic of programs for programming learning tools
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas