Detecção automática de notícias falsas em português

Santos, Roney Lira de Sales; Pardo, Thiago Alexandre Salgueiro

Tese

Detecção automática de notícias falsas em português (2022)

Authors:
- Santos, Roney Lira de Sales
- Pardo, Thiago Alexandre Salgueiro (Orientador)
Autor USP: SANTOS, RONEY LIRA DE SALES - ICMC
Unidade: ICMC
Sigla do Departamento: SCC
DOI: 10.11606/T.55.2022.tde-14072022-165613
Subjects: APRENDIZADO COMPUTACIONAL; FAKE NEWS; LINGUÍSTICA COMPUTACIONAL; REPRESENTAÇÃO DE CONHECIMENTO; ANÁLISE DE TEXTO; LÍNGUA PORTUGUESA
Keywords: Atributos linguísticos; Checagem de fatos; Fact-checking; Grafo de conhecimento; Knowledge graph; Linguistic features; Machine learning; Notícia Falsa
Agências de fomento:
Language: Português
Abstract: A propagação e produção das notícias falsas são um problema atual e perigoso, que pode atingir as pessoas com consequências terríveis. Elas podem influenciar um grande número de pessoas em uma ampla gama de assuntos, que vão desde política à saúde. Embora sempre tenham existido, por meio de fofocas e tabloides, o volume de notícias falsas aumentou recentemente devido ao crescente número de usuários de redes sociais e mensageiros instantâneos, por conta da facilidade que se tem ao acesso a tais ambientes. Essas notícias podem causar perdas diretas a pessoas e corporações, pois notícias falsas podem incluir difamação de pessoas, produtos e empresas, por terem uma natureza apelativa. A dificuldade do humano de identificar as notícias falsas já foi foco de pesquisas que comprovaram esse fato, que pode estar relacionado a crenças e opiniões próprias que o humano não consegue distinguir do fato, além de não procurar o contexto que a notícia está inserida. Uma vez que a propagação de notícias falsas alcançou um ponto crítico, iniciativas de combate começaram a surgir. Entretanto, a escassez de conjunto de dados rotulados, principalmente em português, impedia que os classificadores filtrassem automaticamente esses documentos. Além disso, a falta de métodos e abordagens de checagem de fatos automática, também principalmente para o português, faz com que o trabalho manual esteja sujeito a erros e opiniões humanas, o que é altamente prejudicial nas tentativas de combate a esseproblema. Esta tese de doutorado tem como objetivo a investigação e proposição de abordagens que contenham métodos para a detecção de notícias falsas na língua portuguesa, por meio da análise linguística do texto e de checagem de fatos automática, uma vez que tem-se a hipótese de que as notícias falsas deixam pistas linguísticas que as fazem detectáveis, em comparação com notícias verdadeiras. Inspirado em iniciativas anteriores para outras línguas, é apresentado o primeiro corpus de referência nesta área para o português, composto por notícias verdadeiras e falsas alinhadas, que foram analisadas para descobrir alguns dos atributos linguísticos das notícias, denominado de FAKE.BR CORPUS. A partir dele, usando os atributos linguísticos extraídos, formas de representação textual, algoritmos de aprendizado de máquina e estruturas que mapeiam os eventos das notícias, como os grafos de conhecimento, nesta tese são detalhadas as abordagens adaptadas de outras línguas, bem como a proposição de novas abordagens para a detecção de notícias falsas em três tipos de abordagens: baseadas em atributos linguísticos baseadas no conteúdo e baseadas na estrutura do texto. Os resultados alcançados são promissores e mostram que há uma direção a ser tomada na difícil tarefa que é a detecção de notícias falsas na web, com contribuição para o PLN no português.
Imprenta:
- Publisher place: São Carlos
- Date published: 2022
Data da defesa: 09.05.2022

Informações sobre o DOI: 10.11606/T.55.2022.tde-14072022-165613 (Fonte: oaDOI API)

Este periódico é de acesso aberto
Este artigo é de acesso aberto
URL de acesso aberto
Cor do Acesso Aberto: gold
Licença: cc-by-nc-sa

How to cite

A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

ABNT

SANTOS, Roney Lira de Sales. Detecção automática de notícias falsas em português. 2022. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2022. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-14072022-165613/. Acesso em: 23 maio 2024.
APA

Santos, R. L. de S. (2022). Detecção automática de notícias falsas em português (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-14072022-165613/
NLM

Santos RL de S. Detecção automática de notícias falsas em português [Internet]. 2022 ;[citado 2024 maio 23 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-14072022-165613/
Vancouver

Santos RL de S. Detecção automática de notícias falsas em português [Internet]. 2022 ;[citado 2024 maio 23 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-14072022-165613/

ReP

Exportar registro bibliográfico

Detecção automática de notícias falsas em português (2022)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

USP Schools

ReP

Exportar registro bibliográfico

Detecção automática de notícias falsas em português (2022)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: