Please use this identifier to cite or link to this item:
http://riu.ufam.edu.br/handle/prefix/6934
metadata.dc.type: | Trabalho de Conclusão de Curso |
Title: | Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News |
metadata.dc.creator: | Gusmão, Felipe dos Santos |
metadata.dc.contributor.advisor1: | Pio, José Luiz de Souza |
metadata.dc.contributor.referee1: | Caldas, Ruiter Braga |
metadata.dc.contributor.referee2: | Januário, Francisco de Assis Pereira |
metadata.dc.description.resumo: | O presente trabalho objetiva analisar o desempenho de três modelos de clas- sificação de texto para a identificação de notícias falsas (fake news). Foi de- senvolvido um sistema de classificação de notícias utilizando variações do modelo BERT. Os modelos utilizados foram: BERT, DistilBERT e o BERTimbau. O cenário definido foi analisar 7200 amostras de notícias em português que estão pré-classificadas no corpus Fake.Br em 2 classes, notícias verdadeiras e notícias falsas, com 3600 amostras para cada classe. Foi comparada a per- formance dos 3 modelos para classificação do corpus utilizando as métricas de precisão, acurácia, e F1 de cada um dos modelos. Como esperado, já que é um modelo pré-treinado em português, o modelo BERTimbau apresentou os melhores resultados dentro das métricas avaliadas, obtendo 98% de precisão no segundo experimento. |
Abstract: | The present work aims to analyze the performance of three text classification models for identifying fake news. A news classification system was developed using variations of the BERT model. The models used were: BERT, DistilBERT and BERTimbau. The defined scenario was to analyze 7200 samples of news in Portuguese that are pre-classified in the Fake.br corpus into 2 classes, true news and fake news, with 3600 samples for each class. The performance of the 3 models for classifying this corpus was compared using metrics of precision, accuracy, and F1 of each of the models. As expected, as it is a pre-trained model in portuguese, the BERTimbau model presented the best results within the evaluated metrics, getting 98% precision on the second experiment. |
Keywords: | Fake news BERT DistilBERT BERTimbau |
metadata.dc.subject.cnpq: | ENGENHARIAS |
metadata.dc.language: | por |
metadata.dc.publisher.country: | Brasil |
metadata.dc.publisher.department: | FT - Faculdade de Tecnologia |
metadata.dc.publisher.course: | Engenharia da Computação - Bacharelado - Manaus |
metadata.dc.rights: | Acesso Aberto |
URI: | http://riu.ufam.edu.br/handle/prefix/6934 |
metadata.dc.subject.controlado: | Processamento de linguagem natural (Computação) Inteligência artificial Notícias falsas Desinformação |
Appears in Collections: | Trabalho de Conclusão de Curso - Graduação - Ciências Exatas e da Terra |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
TCC_FelipeGusmão.pdf | 1,08 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.