Ver registro no DEDALUS
Exportar registro bibliográfico

Técnicas de combinação para agrupamento centralizado e distribuído de dados (2011)

  • Authors:
  • USP affiliated authors: NALDI, MURILO COELHO - ICMC
  • USP Schools: ICMC
  • Sigla do Departamento: SCC
  • Subjects: MINERAÇÃO DE DADOS; APRENDIZADO COMPUTACIONAL; SISTEMAS DINÂMICOS
  • Language: Português
  • Abstract: A grande quantidade de dados gerada em diversas áreas do conhecimento cria a necessidade do desenvolvimento de técnicas de mineração de dados cada vez mais eficientes e eficazes. Técnicas de agrupamento têm sido utilizadas com sucesso em várias áreas, especialmente naquelas em que não há conhecimento prévio sobre a organização dos dados. Contudo, a utilização de diferentes algoritmos de agrupamento, ou variações de um mesmo algoritmo, pode gerar uma ampla variedade de resultados. Tamanha variedade cria a necessidade de métodos para avaliar e selecionar bons resultados. Uma forma de avaliar esses resultados consiste em utilizar índices de validação de agrupamentos. Entretanto, uma grande diversidade de índices de validação foi proposta na literatura, o que torna a escolha de um único índice de validação uma tarefa penosa caso os desempenhos dos índices comparados sejam desconhecidos para a classe de problemas de interesse. Com a finalidade de obter um consenso entre resultados, é possível combinar um conjunto de agrupamentos ou índices de validação em uma única solução final. Combinações de agrupamentos (clustering ensembles) foram bem sucedidas em obter soluções robustas a variações no cenário de aplicação, o que faz do uso de comitês de agrupamentos uma alternativa interessante para encontrar soluções de qualidade razoável, segundo diferentes índices de validação. Adicionalmente, utilizar uma combinação de índices de validação pode tornar a avaliação de agrupamentos mais completa, uma vez que uma maioria dos índices combinados pode compensar o fraco desempenho do restante. Em alguns casos, não é possível lidar com um único conjunto de dados centralizado, por razões físicas ou questões de privacidade, o que gera a necessidade de distribuir o processo de mineração. Combinações de agrupamentos também podem ser estendidas paraproblemas de agrupamento de dados distribuídos, uma vez que informações sobre os dados, oriundas de diferentes fontes, podem ser combinadas em uma única solução global. O principal objetivo desse trabalho consiste em investigar técnicas de combinação de agrupamentos e de índices de validação aplicadas na seleção de agrupamentos para combinação e na mineração distribuída de dados. Adicionalmente, algoritmos evolutivos de agrupamento são estudados com a finalidade de selecionar soluções de qualidade dentre os resultados obtidos. As técnicas desenvolvidas possuem complexidade computacional reduzida e escalabilidade, o que permite sua aplicação em grandes conjuntos de dados ou cenários em que os dados encontram-se distribuídos
  • Imprenta:
  • Data da defesa: 24.01.2011
  • Acesso online ao documento

    Online access or search this record in

    Exemplares físicos disponíveis nas Bibliotecas da USP
    BibliotecaCód. de barrasNúm. de chamada
    ICMC30300043676T N166tc e.1
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      NALDI, Murilo Coelho; CAMPELLO, Ricardo José Gabrielli Barreto. Técnicas de combinação para agrupamento centralizado e distribuído de dados. 2011.Universidade de São Paulo, São Carlos, 2011. Disponível em: < http://www.teses.usp.br/teses/disponiveis/55/55134/tde-16032011-113154/ >.
    • APA

      Naldi, M. C., & Campello, R. J. G. B. (2011). Técnicas de combinação para agrupamento centralizado e distribuído de dados. Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-16032011-113154/
    • NLM

      Naldi MC, Campello RJGB. Técnicas de combinação para agrupamento centralizado e distribuído de dados [Internet]. 2011 ;Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-16032011-113154/
    • Vancouver

      Naldi MC, Campello RJGB. Técnicas de combinação para agrupamento centralizado e distribuído de dados [Internet]. 2011 ;Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-16032011-113154/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: