Exportar registro bibliográfico

Development of new models for authorship recognition using complex networks (2017)

  • Authors:
  • Autor USP: MARINHO, VANESSA QUEIROZ - ICMC
  • Unidade: ICMC
  • Sigla do Departamento: SCC
  • Subjects: PROCESSAMENTO DE LINGUAGEM NATURAL; REDES COMPLEXAS; RECONHECIMENTO DE TEXTO; RECONHECIMENTO DE PADRÕES
  • Keywords: Authorship attribution; Complex networks; Natural language processing; Reconhecimento de autoria
  • Language: Inglês
  • Abstract: Redes complexas vem sendo aplicadas com sucesso em diferentes domínios, sendo o tema de estudo de distintas áreas que incluem, por exemplo, a física e a computação. A descoberta de que métodos de redes complexas podem ser utilizados para analisar textos em seus distintos níveis de complexidade proporcionou avanços em tarefas de processamento de línguas naturais (PLN). Exemplos de aplicações analisadas com os métodos de redes complexas são a detecção de palavras-chave, a criação de sumarizadores automáticos e o reconhecimento de autoria. Esta última tarefa tem sido estudada com certo sucesso através da representação de redes de co-ocorrência (ou adjacência) de palavras que conectam apenas as palavras mais próximas no texto. Apesar deste sucesso, poucos trabalhos tentaram estender essas redes ou utilizar diferentes representações. Além disso, muitas das abordagens utilizam um conjunto semelhante de medidas de redes complexas e não combinam suas técnicas com as utilizadas tradicionalmente na tarefa de reconhecimento de autoria. Esta pesquisa de mestrado propõe extensões à modelagem tradicional de co-ocorrência e investiga a adequabilidade de novos atributos e de outras modelagens (como as redes mesoscópicas e de entidades nomeadas) para a tarefa. A informação de conectividade de palavras funcionais é utilizada para complementar a caracterização da escrita dos autores, uma vez que essas palavras são relevantes para a tarefa. Finalmente, a maior contribuição deste trabalhoconsiste no desenvolvimento de classificadores híbridos, denominados labelled motifs, que combinam fatores tradicionais com as propriedades fornecidas pela análise topológica de redes complexas. A relevância desses classificadores é verificada no contexto de reconhecimento de autoria e identificação de translationese. Com esta abordagem híbrida, mostra-se que é possível melhorar o desempenho de técnicas baseadas em rede ao combiná-las com técnicas tradicionais em PLN. Através da adaptação, combinação e aperfeiçoamento da modelagem, não apenas o desempenho dos sistemas de reconhecimento de autoria foi melhorado, mas também foi possível entender melhor quais são os fatores quantitativos textuais (medidos via redes) que podem ser utilizados na área de estilometria. Os avanços obtidos durante este projeto podem ser utilizados para estudar aplicações relacionadas, como é o caso da análise de inconsistências estilísticas e plagiarismos, e análise da complexidade textual. Além disso, muitos dos métodos propostos neste trabalho podem ser facilmente aplicados em diversas línguas naturais.
  • Imprenta:
  • Data da defesa: 14.07.2017
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      MARINHO, Vanessa Queiroz. Development of new models for authorship recognition using complex networks. 2017. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2017. Disponível em: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-14112017-091805/. Acesso em: 21 maio 2024.
    • APA

      Marinho, V. Q. (2017). Development of new models for authorship recognition using complex networks (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-14112017-091805/
    • NLM

      Marinho VQ. Development of new models for authorship recognition using complex networks [Internet]. 2017 ;[citado 2024 maio 21 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-14112017-091805/
    • Vancouver

      Marinho VQ. Development of new models for authorship recognition using complex networks [Internet]. 2017 ;[citado 2024 maio 21 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-14112017-091805/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2024