Ver registro no DEDALUS
Exportar registro bibliográfico

Extração de informação de artigos científicos: uma abordagem baseada em indução de regras de etiquetagem (2007)

  • Authors:
  • USP affiliated authors: ÁLVAREZ, ALBERTO CÁCERES - ICMC
  • USP Schools: ICMC
  • Sigla do Departamento: SCE
  • Subjects: APRENDIZADO COMPUTACIONAL; PROCESSAMENTO DE LINGUAGEM NATURAL; INFORMAÇÃO (EXTRAÇÃO)
  • Language: Português
  • Abstract: Este trabalho faz parte do projeto de uma ferramenta denominada FIP (Ferramenta Inteligente de Apoio à Pesquisa) para recuperação, organização e mineração de grandes coleções de documentos. No contexto da ferramenta FIP, diversas técnicas de Recuperação de Informação, Mineração de Dados, Visualização de Informações e, em particular, técnicas de Extração de Informações, foco deste trabalho, são usadas. Sistemas de Extração de Informação atuam sobre um conjunto de dados não estruturados e objetivam localizar informações específicas em um documento ou coleção de documentos, extraí-las e estruturá-las com o intuito de facilitar o uso dessas informações. O objetivo específico desenvolvido nesta dissertação é induzir, de forma automática, um conjunto de regras para a extração de informações de artigos científicos. O sistema de extração proposto, inicialmente, analisa e extrai informações presentes no corpo dos artigos (título, autores, a filiação, resumo, palavras chaves) e, posteriormente, foca na extração das informações de suas referências bibliográficas. A proposta para extração automática das informações das referências é uma abordagem nova, baseada no mapeamento do problema de part-of-speech tagging ao problema de extração de informação. Como produto final do processo de extração, tem-se uma base de dados com as informações extraídas e estruturadas no formato XML, disponível à ferramenta FIP ou a qualquer outra aplicação. Os resultados obtidos foram avaliadosem termos das métricas precisão, cobertura e F-measure, alcançando bons resultados comparados com sistemas similares
  • Imprenta:
  • Data da defesa: 08.05.2007
  • Acesso online ao documento

    Online access or search this record in

    Exemplares físicos disponíveis nas Bibliotecas da USP
    BibliotecaCód. de barrasNúm. de chamada
    ICMC30300037505T A473ei e.1
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      ÁLVAREZ, Alberto Cáceres; LOPES, Alneu de Andrade. Extração de informação de artigos científicos: uma abordagem baseada em indução de regras de etiquetagem. 2007.Universidade de São Paulo, São Carlos, 2007. Disponível em: < http://www.teses.usp.br/teses/disponiveis/55/55134/tde-21062007-144352/ >.
    • APA

      Álvarez, A. C., & Lopes, A. de A. (2007). Extração de informação de artigos científicos: uma abordagem baseada em indução de regras de etiquetagem. Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-21062007-144352/
    • NLM

      Álvarez AC, Lopes A de A. Extração de informação de artigos científicos: uma abordagem baseada em indução de regras de etiquetagem [Internet]. 2007 ;Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-21062007-144352/
    • Vancouver

      Álvarez AC, Lopes A de A. Extração de informação de artigos científicos: uma abordagem baseada em indução de regras de etiquetagem [Internet]. 2007 ;Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-21062007-144352/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: