Detecção automática de notícias falsas em português (2022)
- Authors:
- Autor USP: SANTOS, RONEY LIRA DE SALES - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- DOI: 10.11606/T.55.2022.tde-14072022-165613
- Subjects: APRENDIZADO COMPUTACIONAL; FAKE NEWS; LINGUÍSTICA COMPUTACIONAL; REPRESENTAÇÃO DE CONHECIMENTO; ANÁLISE DE TEXTO; LÍNGUA PORTUGUESA
- Keywords: Atributos linguísticos; Checagem de fatos; Fact-checking; Grafo de conhecimento; Knowledge graph; Linguistic features; Machine learning; Notícia Falsa
- Agências de fomento:
- Language: Português
- Abstract: A propagação e produção das notícias falsas são um problema atual e perigoso, que pode atingir as pessoas com consequências terríveis. Elas podem influenciar um grande número de pessoas em uma ampla gama de assuntos, que vão desde política à saúde. Embora sempre tenham existido, por meio de fofocas e tabloides, o volume de notícias falsas aumentou recentemente devido ao crescente número de usuários de redes sociais e mensageiros instantâneos, por conta da facilidade que se tem ao acesso a tais ambientes. Essas notícias podem causar perdas diretas a pessoas e corporações, pois notícias falsas podem incluir difamação de pessoas, produtos e empresas, por terem uma natureza apelativa. A dificuldade do humano de identificar as notícias falsas já foi foco de pesquisas que comprovaram esse fato, que pode estar relacionado a crenças e opiniões próprias que o humano não consegue distinguir do fato, além de não procurar o contexto que a notícia está inserida. Uma vez que a propagação de notícias falsas alcançou um ponto crítico, iniciativas de combate começaram a surgir. Entretanto, a escassez de conjunto de dados rotulados, principalmente em português, impedia que os classificadores filtrassem automaticamente esses documentos. Além disso, a falta de métodos e abordagens de checagem de fatos automática, também principalmente para o português, faz com que o trabalho manual esteja sujeito a erros e opiniões humanas, o que é altamente prejudicial nas tentativas de combate a esseproblema. Esta tese de doutorado tem como objetivo a investigação e proposição de abordagens que contenham métodos para a detecção de notícias falsas na língua portuguesa, por meio da análise linguística do texto e de checagem de fatos automática, uma vez que tem-se a hipótese de que as notícias falsas deixam pistas linguísticas que as fazem detectáveis, em comparação com notícias verdadeiras. Inspirado em iniciativas anteriores para outras línguas, é apresentado o primeiro corpus de referência nesta área para o português, composto por notícias verdadeiras e falsas alinhadas, que foram analisadas para descobrir alguns dos atributos linguísticos das notícias, denominado de FAKE.BR CORPUS. A partir dele, usando os atributos linguísticos extraídos, formas de representação textual, algoritmos de aprendizado de máquina e estruturas que mapeiam os eventos das notícias, como os grafos de conhecimento, nesta tese são detalhadas as abordagens adaptadas de outras línguas, bem como a proposição de novas abordagens para a detecção de notícias falsas em três tipos de abordagens: baseadas em atributos linguísticos baseadas no conteúdo e baseadas na estrutura do texto. Os resultados alcançados são promissores e mostram que há uma direção a ser tomada na difícil tarefa que é a detecção de notícias falsas na web, com contribuição para o PLN no português.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2022
- Data da defesa: 09.05.2022
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
SANTOS, Roney Lira de Sales. Detecção automática de notícias falsas em português. 2022. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2022. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-14072022-165613/. Acesso em: 23 maio 2024. -
APA
Santos, R. L. de S. (2022). Detecção automática de notícias falsas em português (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-14072022-165613/ -
NLM
Santos RL de S. Detecção automática de notícias falsas em português [Internet]. 2022 ;[citado 2024 maio 23 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-14072022-165613/ -
Vancouver
Santos RL de S. Detecção automática de notícias falsas em português [Internet]. 2022 ;[citado 2024 maio 23 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-14072022-165613/ - A study of the influence of textual features in learning medical prior authorization
- Complexidade textual em notícias satíricas: o português do Brasil
- Public administration suppliers classification model based on supervised machine learning
- Linguistic analysis model for monitoring user reaction on satirical news for brazilian portuguese
- Towards automatically filtering fake news in Portuguese
- Structural characterization and graph-based detection of fake news in portuguese
- Fact-checking for portuguese: knowledge graph and Google search-based methods
- Measuring the impact of readability features in fake news Detection
Informações sobre o DOI: 10.11606/T.55.2022.tde-14072022-165613 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas