Exportar registro bibliográfico

Implementação, adaptação, combinação e avaliação de etiquetadores para o português do Brasil (2000)

  • Authors:
  • Autor USP: AIRES, RACHEL VIRGÍNIA XAVIER - ICMC
  • Unidade: ICMC
  • Subjects: PROCESSAMENTO DE LINGUAGEM NATURAL; LINGUAGEM NATURAL (APLICAÇÕES)
  • Language: Português
  • Abstract: A etiquetagem morfossintática é uma tarefa básica, bem conhecida e bastante explorada em diversas aplicações de Processamento de Línguas Naturaus (PLN), como análise sintática e extração e recuperação de informações. Os etiquetadores para a língua inglesa atingiram um estado da arte entre 96-99% de precisão geral. Diferentemente do inglês, para o português do Brasil não foram ainda exploradas todas as técnicas para a etiquetagem, nem se atingiu a precisão dos melhores etiquetadores para a língua inglesa. Com estas motivações, quatro etiquetadores disponíveis na WWW foram treinados - Unigrama (TreeTagger), Trigrama (TreeTagger), baseado em transformações (TBL) e baseado em máxima entropia (MXPOST) -, e um etiquetador simbólico foi desenvolvido (PoSiTagger). Todos os etiquetadores adaptados foram treinados com um corpus com cerca de 100.000 palavras formado por textos didáticos, jornalísticos e literários, e etiquetado com Nilc tagset. A maior precisão geral obtida foi a do MXPOST - 89,66%. Foram também implementados quatorze métodos para a combinação dos etiquetadores, dos quais sete superaram a precisão do MXPOST. A maior precisão obtida com os métodos de combinação foi 90,91%. A precisão geral sofreu a influência do tamanho do corpus manualmente etiquetado disponível para treinamento, do conjunto de etiquetas e dos tipos de texto utilizados
  • Imprenta:
  • Data da defesa: 25.10.2000

  • How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      AIRES, Rachel Virgínia Xavier. Implementação, adaptação, combinação e avaliação de etiquetadores para o português do Brasil. 2000. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2000. . Acesso em: 23 abr. 2024.
    • APA

      Aires, R. V. X. (2000). Implementação, adaptação, combinação e avaliação de etiquetadores para o português do Brasil (Dissertação (Mestrado). Universidade de São Paulo, São Carlos.
    • NLM

      Aires RVX. Implementação, adaptação, combinação e avaliação de etiquetadores para o português do Brasil. 2000 ;[citado 2024 abr. 23 ]
    • Vancouver

      Aires RVX. Implementação, adaptação, combinação e avaliação de etiquetadores para o português do Brasil. 2000 ;[citado 2024 abr. 23 ]

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2024