Ver registro no DEDALUS
Exportar registro bibliográfico

Um método para a fusão automática de sentenças similares em português (2010)

  • Authors:
  • USP affiliated authors: SENO, ELOIZE ROSSI MARQUES - ICMC
  • USP Schools: ICMC
  • Subjects: PROCESSAMENTO DE LINGUAGEM NATURAL; INTELIGÊNCIA ARTIFICIAL; LINGUÍSTICA COMPUTACIONAL; TRADUÇÃO AUTOMÁTICA
  • Language: Português
  • Abstract: Nos últimos anos, há um crescente interesse por aplicações do Processamento de Língua Natural (PLN) que processam uma coleção de textos sobre um mesmo assunto e produzem um novo texto de saída, quer seja um sumário ou uma resposta para uma dada pergunta. Para se produzir textos com qualidade, essas aplicações precisam lidar adequadamente com vários fenômenos, tais como a redundância, a contradição e a complementaridade de informações. Nesse contexto, um processo que permita a identificação de informações comuns em um conjunto de sentenças relacionadas, e gere uma nova sentença a partir da fusão de informações das sentenças de entrada, sem redundâncias e sem contradições, é de grande relevância para as aplicações que processam múltiplos textos. A fusão automática de sentenças é um tema de pesquisa relativamente recente na literatura de PLN e para a língua portuguesa, em particular, não se tem conhecimento de trabalhos dessa natureza. Neste trabalho propõe-se um método inédito para a fusão de sentenças similares em português, baseado em uma abordagem simbólica e independente de domínio, e produz-se o Zíper, um sistema de fusão sentencial que implementa o método proposto. O Zíper é o primeiro sistema a contemplar a geração de sentenças que expressam todas as informações das sentenças de entrada, ou seja, que representam a união do conjunto. Além disso, ele permite a geração de sentenças que expressam apenas as informações redundantes do conjunto (consideradas mais importantes),isto é, que representam a interseção das sentenças de entrada. O sistema foi avaliado intrinsecamente e os resultados obtidos mostram que, de modo geral, as sentenças produzidas são bem formadas e preservam a mensagem original do conjunto (isto é, a mensagem toda, na fusão por união e apenas a mensagem principal, na fusão por interseção). Zíper também foi avaliado extrinsecamente no contexto de um sumarizador multidocumento do português. Os resultados alcançados sugerem que o método proposto contribui para melhorar a qualidade dos sumários, reduzindo a redundância de informações, que frequentemente provoca a perda de coesão e de coerência
  • Imprenta:
  • Data da defesa: 24.05.2010
  • Acesso online ao documento

    Online access or search this record in

    Exemplares físicos disponíveis nas Bibliotecas da USP
    BibliotecaCód. de barrasNúm. de chamada
    ICMC30300042230T S478um e.1
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      SENO, Eloize Rossi Marques; NUNES, Maria das Graças Volpe. Um método para a fusão automática de sentenças similares em português. 2010.Universidade de São Paulo, São Carlos, 2010. Disponível em: < http://www.teses.usp.br/teses/disponiveis/55/55134/tde-14072010-092100/ >.
    • APA

      Seno, E. R. M., & Nunes, M. das G. V. (2010). Um método para a fusão automática de sentenças similares em português. Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-14072010-092100/
    • NLM

      Seno ERM, Nunes M das GV. Um método para a fusão automática de sentenças similares em português [Internet]. 2010 ;Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-14072010-092100/
    • Vancouver

      Seno ERM, Nunes M das GV. Um método para a fusão automática de sentenças similares em português [Internet]. 2010 ;Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-14072010-092100/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: