Efficient online tree, rule-based and distance-based algorithms (2023)
- Authors:
- Autor USP: MASTELINI, SAULO MARTIELLO - ICMC
- Unidade: ICMC
- Sigla do Departamento: SME
- DOI: 10.11606/T.55.2023.tde-30082023-135843
- Subjects: APRENDIZADO COMPUTACIONAL; ELETRÔNICA DIGITAL; APRENDIZAGEM PROFUNDA; REGRESSÃO
- Keywords: Aprendizado supervisionado; Busca por vizinhos mais próximos; Computational performance; Desempenho computacional; Nearest neighbor search; Online machine learning; Regression; Supervised learning
- Agências de fomento:
- Language: Inglês
- Abstract: O rápido desenvolvimento de tecnologias digitais acarretou a produção constante de grandes volumes de dados, que se apresentam em diferentes formas e vêm de diferentes fontes. No início dos estudos de aprendizado de máquina (AM) a escassez de dados era um problema relevante em muitos domínios de aplicação, atualmente, no entanto, pode-se ter informação em demasia para tratar com algoritmos tradicionais de AM. Além disso, mudanças ao longo do tempo na distribuição probabilística que governa o processo de geração dos dados podem fazer com que as soluções tradicionais de AM se tornem inúteis em aplicações do mundo real. AM online (AMO) é uma área de estudos que busca criar soluções capazes de processar os dados incrementalmente, utilizando recursos computacionais limitados e lidando com distribuições de dados que mudam no decorrer do tempo. Apesar de a literatura em AMO apresentar soluções eficientes que foram aplicadas em domínios de aplicação diversos, existe uma tendência crescente de se criar algoritmos que focam apenas no desempenho preditivo, deixando o custo computacional em segundo plano. Essa observação é ainda mais predominante quando se considera tarefas de regressão que utilizam árvores e regras de decisão, bem como ensembles desses modelos, que estão dentre as soluções mais populares em AMO. Diminuir o custo computacional de soluções de AMO, de um ponto de vista do domínio de aplicação, pode ser mais relevante do que obter um leve aumento no desempenho preditivo.Assim, nessa tese, busca-se criar algoritmos de AMO cujo maior foco é a redução do tempo de processamento e do uso de memória em soluções de regressão baseadas em árvores e regras de decisão, além de ensembles formados por esses tipos de modelos. Um subproduto desejado é melhorar, ou pelo menos não impactar negativamente, o desempenho preditivo dos modelos. Na tese também é explorado um algoritmo eficiente para realizar buscas por vizinhos mais próximos de forma incremental. A tese é organizada como uma coleção de artigos, que compreende as publicações mais relevantes focadas nos temas apresentados. São abordadas estratégias para criar ensembles de regressão com baixo erro preditivo, propostos algoritmos eficientes de regressão incremental baseados em árvores de decisão, bem como um algoritmo para criação de ensembles baseados em árvores de decisão para regressão com baixo custo computacional e baixo erro preditivo. Por fim, é apresentado um algoritmo rápido e versátil para realizar buscas por vizinho mais próximo em janelas deslizantes de dados.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2023
- Data da defesa: 03.05.2023
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
MASTELINI, Saulo Martiello. Efficient online tree, rule-based and distance-based algorithms. 2023. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2023. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-30082023-135843/. Acesso em: 04 jun. 2024. -
APA
Mastelini, S. M. (2023). Efficient online tree, rule-based and distance-based algorithms (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-30082023-135843/ -
NLM
Mastelini SM. Efficient online tree, rule-based and distance-based algorithms [Internet]. 2023 ;[citado 2024 jun. 04 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-30082023-135843/ -
Vancouver
Mastelini SM. Efficient online tree, rule-based and distance-based algorithms [Internet]. 2023 ;[citado 2024 jun. 04 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-30082023-135843/ - Towards meta-learning for multi-target regression problems
- On ensemble techniques for data stream regression
- Improved prediction of soil properties with multi-target stacked generalisation on EDXRF spectra
- River: machine learning for streaming data in Python
- DSTARS: a multi-target deep structure for tracking asynchronous regressor
- Fast and lightweight binary and multi-branch Hoeffding tree regressors
- A meta-learning approach for selecting image segmentation algorithm
- Online local boosting: improving performance in online decision trees
- Online extra trees regressor
- Using dynamical quantization to perform split attempts in online tree regressors
Informações sobre o DOI: 10.11606/T.55.2023.tde-30082023-135843 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas