Implementação, adaptação, combinação e avaliação de etiquetadores para o português do Brasil (2000)
- Authors:
- Autor USP: AIRES, RACHEL VIRGÍNIA XAVIER - ICMC
- Unidade: ICMC
- Subjects: PROCESSAMENTO DE LINGUAGEM NATURAL; LINGUAGEM NATURAL (APLICAÇÕES)
- Language: Português
- Abstract: A etiquetagem morfossintática é uma tarefa básica, bem conhecida e bastante explorada em diversas aplicações de Processamento de Línguas Naturaus (PLN), como análise sintática e extração e recuperação de informações. Os etiquetadores para a língua inglesa atingiram um estado da arte entre 96-99% de precisão geral. Diferentemente do inglês, para o português do Brasil não foram ainda exploradas todas as técnicas para a etiquetagem, nem se atingiu a precisão dos melhores etiquetadores para a língua inglesa. Com estas motivações, quatro etiquetadores disponíveis na WWW foram treinados - Unigrama (TreeTagger), Trigrama (TreeTagger), baseado em transformações (TBL) e baseado em máxima entropia (MXPOST) -, e um etiquetador simbólico foi desenvolvido (PoSiTagger). Todos os etiquetadores adaptados foram treinados com um corpus com cerca de 100.000 palavras formado por textos didáticos, jornalísticos e literários, e etiquetado com Nilc tagset. A maior precisão geral obtida foi a do MXPOST - 89,66%. Foram também implementados quatorze métodos para a combinação dos etiquetadores, dos quais sete superaram a precisão do MXPOST. A maior precisão obtida com os métodos de combinação foi 90,91%. A precisão geral sofreu a influência do tamanho do corpus manualmente etiquetado disponível para treinamento, do conjunto de etiquetas e dos tipos de texto utilizados
- Imprenta:
- Publisher place: São Carlos
- Date published: 2000
- Data da defesa: 25.10.2000
-
ABNT
AIRES, Rachel Virgínia Xavier. Implementação, adaptação, combinação e avaliação de etiquetadores para o português do Brasil. 2000. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2000. . Acesso em: 23 abr. 2024. -
APA
Aires, R. V. X. (2000). Implementação, adaptação, combinação e avaliação de etiquetadores para o português do Brasil (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. -
NLM
Aires RVX. Implementação, adaptação, combinação e avaliação de etiquetadores para o português do Brasil. 2000 ;[citado 2024 abr. 23 ] -
Vancouver
Aires RVX. Implementação, adaptação, combinação e avaliação de etiquetadores para o português do Brasil. 2000 ;[citado 2024 abr. 23 ]
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas