Exportar registro bibliográfico

Biagrupamento heurístico e coagrupamento baseado em fatoração de matrizes: um estudo em dados textuais  (2018)

  • Authors:
  • Autor USP: DIAZ, ALEXANDRA KATIUSKA RAMOS - EACH
  • Unidade: EACH
  • Subjects: INTELIGÊNCIA ARTIFICIAL; MINERAÇÃO DE DADOS; FATORIZAÇÃO DE MATRIZES; MATRIZES ESPARSAS
  • Keywords: Algoritmos heurísticos; Biagrupamento; Biclustering; Coagrupamento; Coclustering; Fatoração de matrizes não-negativas; Heuristic algorithms; Mineração de textos; Text Mining
  • Language: Português
  • Abstract: Biagrupamento e coagrupamento são tarefas de mineração de dados que permitem a extração de informação relevante sobre dados e têm sido aplicadas com sucesso em uma ampla variedade de domínios, incluindo aqueles que envolvem dados textuais - foco de interesse desta pesquisa. Nas tarefas de biagrupamento e coagrupamento, os critérios de similaridade são aplicados simultaneamente às linhas e às colunas das matrizes de dados, agrupando simultaneamente os objetos e os atributos e possibilitando a criação de bigrupos/cogrupos. Contudo suas definições variam segundo suas naturezas e objetivos, sendo que a tarefa de coagrupamento pode ser vista como uma generalização da tarefa de biagrupamento. Estas tarefas, quando aplicadas nos dados textuais, demandam uma representação em um modelo de espaço vetorial que, comumente, leva à geração de espaços caracterizados pela alta dimensionalidade e esparsidade, afetando o desempenho de muitos dos algoritmos. Este trabalho apresenta uma análise do comportamento do algoritmo para biagrupamento Cheng e Church e do algoritmo para coagrupamento de decomposição de valores em blocos não negativos (Non-Negative Block Value Decomposition} - NBVD), aplicado ao contexto de dados textuais. Resultados experimentais quantitativos e qualitativos são apresentados a partir das experimentações destes algoritmos em conjuntos de dados sintéticos criados com diferentes níveis de esparsidade e em um conjunto de dados real... (Continua)(Continuação) Os resultados são avaliados em termos de medidas próprias de biagrupamento, medidas internas de agrupamento a partir das projeções nas linhas dos bigrupos/cogrupos e em termos de geração de informação. As análises dos resultados esclarecem questões referentes às dificuldades encontradas por estes algoritmos nos ambiente de experimentação, assim como se são capazes de fornecer informações diferenciadas e úteis na área de mineração de texto. De forma geral, as análises realizadas mostraram que o algoritmo NBVD é mais adequado para trabalhar com conjuntos de dados em altas dimensões e com alta esparsidade. O algoritmo de Cheng e Church, embora tenha obtidos resultados bons de acordo com os objetivos do algoritmo, no contexto de dados textuais, propiciou resultados com baixa relevância
  • Imprenta:
  • Data da defesa: 16.10.2018
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      RAMOS DIAZ, Alexandra Katiuska. Biagrupamento heurístico e coagrupamento baseado em fatoração de matrizes: um estudo em dados textuais . 2018. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2018. Disponível em: http://www.teses.usp.br/teses/disponiveis/100/100131/tde-12112018-182428/. Acesso em: 10 maio 2024.
    • APA

      Ramos Diaz, A. K. (2018). Biagrupamento heurístico e coagrupamento baseado em fatoração de matrizes: um estudo em dados textuais  (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/100/100131/tde-12112018-182428/
    • NLM

      Ramos Diaz AK. Biagrupamento heurístico e coagrupamento baseado em fatoração de matrizes: um estudo em dados textuais  [Internet]. 2018 ;[citado 2024 maio 10 ] Available from: http://www.teses.usp.br/teses/disponiveis/100/100131/tde-12112018-182428/
    • Vancouver

      Ramos Diaz AK. Biagrupamento heurístico e coagrupamento baseado em fatoração de matrizes: um estudo em dados textuais  [Internet]. 2018 ;[citado 2024 maio 10 ] Available from: http://www.teses.usp.br/teses/disponiveis/100/100131/tde-12112018-182428/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2024