Exportar registro bibliográfico

Contribuições para a construção de taxonomias de tópicos em domínios restritos utilizando aprendizado estatístico (2009)

  • Authors:
  • Autor USP: MOURA, MARIA FERNANDA - ICMC
  • Unidade: ICMC
  • Sigla do Departamento: SCC
  • Subjects: MINERAÇÃO DE DADOS; SISTEMAS BASEADOS EM CONHECIMENTO; INTELIGÊNCIA ARTIFICIAL
  • Language: Português
  • Abstract: A mineração de textos vem de encontro à realidade atual de se compreender e utilizar grandes massas de dados textuais. Uma forma de auxiliar a compreensão dessas coleções de textos é construir taxonomias de tópicos a partir delas. As taxonomias de tópicos devem organizar esses documentos, preferencialmente em hierarquias, identificando os grupos obtidos por meio de descritores. Construir manual, automática ou semi-automaticamente taxonomias de tópicos de qualidade é uma tarefa nada trivial. Assim, o objetivo deste trabalho é construir taxonomias de tópicos em domínios de conhecimento restrito, por meio de mineração de textos, a fim de auxiliar o especialista no domínio a compreender e organizar os textos. O domínio de conhecimento é restrito para que se possa trabalhar apenas com métodos de aprendizado estatístico não supervisionado sobre representações bag of words dos textos. Essas representações independem do contexto das palavras nos textos e, conseqüentemente, nos domínios. Assim, ao se restringir o domínio espera-se diminuir erros de interpretação dos resultados. A metodologia proposta para a construção de taxonomias de tópicos é uma instanciação do processo de mineração de textos. A cada etapa do processo propõem-se soluções adaptadas às necessidades específicas de construção de taxonomias de tópicos, dentre as quais algumas contribuições inovadoras ao estado da arte. Particularmente, este trabalho contribui em três frentes no estado da arte: seleção de atributos n-gramas em tarefas de mineração de textos, dois modelos para rotulação de agrupamento hierárquico de documentos e modelo de validação do processo de rotulação de agrupamento hierárquico de documentos. Além dessas contribuições, ocorrem outras em adaptações e metodologias de escolha detaxonomias obtidas. Finalmente, a metodologia desenvolvida foi aplicada a problemas reais, tendo obtido bons resultados
  • Imprenta:
  • Data da defesa: 26.10.2009
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      MOURA, Maria Fernanda. Contribuições para a construção de taxonomias de tópicos em domínios restritos utilizando aprendizado estatístico. 2009. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2009. Disponível em: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-05042010-162834/. Acesso em: 21 maio 2024.
    • APA

      Moura, M. F. (2009). Contribuições para a construção de taxonomias de tópicos em domínios restritos utilizando aprendizado estatístico (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-05042010-162834/
    • NLM

      Moura MF. Contribuições para a construção de taxonomias de tópicos em domínios restritos utilizando aprendizado estatístico [Internet]. 2009 ;[citado 2024 maio 21 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-05042010-162834/
    • Vancouver

      Moura MF. Contribuições para a construção de taxonomias de tópicos em domínios restritos utilizando aprendizado estatístico [Internet]. 2009 ;[citado 2024 maio 21 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-05042010-162834/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

    Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2024