Ver registro no DEDALUS
Exportar registro bibliográfico

Algoritmos anytime baseados em instâncias para classificação em fluxo de dados (2016)

  • Authors:
  • USP affiliated authors: LEMES, CRISTIANO INÁCIO - ICMC
  • USP Schools: ICMC
  • Sigla do Departamento: SCC
  • Subjects: APRENDIZADO COMPUTACIONAL; MINERAÇÃO DE DADOS; ANÁLISE DE SÉRIES TEMPORAIS
  • Keywords: Algoritmo anytime; Algoritmo incremental; Anytime algorithm; Classificação baseada em instância; Concept change; Data stream; Fluxo de dados; Incremental algorithm; Instance-based classification; Mudança de conceito
  • Language: Português
  • Abstract: Aprendizado em fluxo de dados é uma área de pesquisa importante e que vem crescendo nos últimos tempos. Em muitas aplicações reais os dados são gerados em uma sequência temporal potencialmente infinita. O processamento em fluxo possui como principal característica a necessidade por respostas que atendam restrições severas de tempo e memória. Por exemplo, um classificador aplicado a um fluxo de dados deve prover uma resposta a um determinado evento antes que o próximo evento ocorra. Caso isso não ocorra, alguns eventos do fluxo podem ficar sem classificação. Muitos fluxos geram eventos em uma taxa de chegada com grande variabilidade, ou seja, o intervalo de tempo de ocorrência entre dois eventos sucessivos pode variar muito. Para que um sistema de aprendizado obtenha sucesso na aquisição de conhecimento é preciso que ele apresente duas características principais: (i) ser capaz de prover uma classificação para um novo exemplo em tempo hábil e (ii) ser capaz de adaptar o modelo de classificação de maneira a tratar mudanças de conceito, uma vez que os dados podem não apresentar uma distribuição estacionária. Algoritmos de aprendizado de máquina em lote não possuem essas propriedades, pois assumem que as distribuições são estacionárias e não estão preparados para atender restrições de memória e processamento. Para atender essas necessidades, esses algoritmos devem ser adaptados ao contexto de fluxo de dados. Uma possível adaptação é tornar o algoritmo de classificação anytime.Algoritmos anytime são capazes de serem interrompidos e prover uma resposta (classificação) aproximada a qualquer instante. Outra adaptação é tornar o algoritmo incremental, de maneira que seu modelo possa ser atualizado para novos exemplos do fluxo de dados. Neste trabalho é realizada a investigação de dois métodos capazes de realizar o aprendizado em um fluxo de dados. O primeiro é baseado no algoritmo k-vizinhos mais próximo anytime estado-da-arte, onde foi proposto um novo método de desempate para ser utilizado neste algoritmo. Os experimentos mostraram uma melhora consistente no desempenho deste algoritmo em várias bases de dados de benchmark. O segundo método proposto possui as características dos algoritmos anytime e é capaz de tratar a mudança de conceito nos dados. Este método foi chamado de Algoritmo Anytime Incremental e possui duas versões, uma baseado no algoritmo Space Saving e outra em uma Janela Deslizante. Os experimentos mostraram que em cada fluxo cada versão deste método proposto possui suas vantagens e desvantagens. Mas no geral, comparado com outros métodos baselines, ambas as versões apresentaram melhor desempenho
  • Imprenta:
  • Data da defesa: 09.03.2016
  • Acesso online ao documento

    Online access or search this record in

    Exemplares físicos disponíveis nas Bibliotecas da USP
    BibliotecaCód. de barrasNúm. de chamada
    ICMC30300051134T L552aa e.1
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      LEMES, Cristiano Inácio; BATISTA, Gustavo Enrique de Almeida Prado Alves. Algoritmos anytime baseados em instâncias para classificação em fluxo de dados. 2016.Universidade de São Paulo, São Carlos, 2016. Disponível em: < http://www.teses.usp.br/teses/disponiveis/55/55134/tde-02092016-134752/ >.
    • APA

      Lemes, C. I. Ã. ¡cio, & Batista, G. E. de A. P. A. (2016). Algoritmos anytime baseados em instâncias para classificação em fluxo de dados. Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-02092016-134752/
    • NLM

      Lemes CIácio, Batista GE de APA. Algoritmos anytime baseados em instâncias para classificação em fluxo de dados [Internet]. 2016 ;Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-02092016-134752/
    • Vancouver

      Lemes CIácio, Batista GE de APA. Algoritmos anytime baseados em instâncias para classificação em fluxo de dados [Internet]. 2016 ;Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-02092016-134752/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: