Reconhecimento de _bots_ no _Twitter: _uma abordagem utilizando aprendizagem em máquina

Reconhecimento de bots no Twitter: uma abordagem utilizando aprendizagem em máquina

Autor(a)
Oliveira, Érick Ritir.
<erickritir12@gmail.com>
Ano de publicação
2019
Data da defesa
30/08/2019
Curso/Outros
Ciência da Computação
Número de folhas
47
Tipo
TCC - Trabalho de Conclusão de Curso
Local
UFAL, Campus Arapiraca, Unidade Educacional ARAPIRACA
Resumo

As redes sociais são ambientes na internet onde é possível compartilhar e consumir conteúdos e notícias em tempo real. Nesse contexto, contas falsas, ou bots, são contas que poluem esses espaços com objetivos maliciosos, como fazer spam ou promover notícias falsas. Logo, faz-se necessário detectá-las e removê-las das redes sociais.Este trabalho tem como objetivo classificar, utilizando três tipos de atributos (de comportamento, de perfil e de texto), contas do Twitter em conta falsa ou legítima. Foram utilizados três classificadores (Rede Neural, Naive Bayes e Random Forest) a partir de uma base de dados previamente classificada. A base de dados foi construída a partir de dois data sets encontrados na literatura. Para avaliar as classificações, foram utilizadas as métricas acurácia, recall, precisão e F1 Score. A partir dos experimentos, notou-se que os métodos propostos apresentaram resultados interessantes, e que, analisando os dados extraídos das contas, notou-se que há diferenças no comportamento e no modo como contas falsas utilizam a plataforma do Twitter em relação a usuários legítimos.


Abstract

Social networks are environments on the Internet where it is possible to share and consume content and news in real time. In this context, fake accounts, or bots, are accounts that pollute these environments with malicious purposes, such as spamming or promoting fake news. Therefore, it is necessary to detect and remove them from social networks.This study aims to classify, using threetypesoffeatures(behavior,profileandtext),Twitteraccountsinfalseorlegitimateaccount. Three classifiers (Artificial Neural Network, Naive Bayes and Random Forest) were used from a previously classified database. The database was built from two data sets found in the literature. To evaluate the classification, we used the accuracy, recall, precision and F1 score metrics. From the experiments, it was noted that the proposed methods presented interesting results, and that, analyzing the data extracted from the accounts, it was noted that there are differences in the behavior and the way fake accounts use the Twitter platform in relation to legitimate users.


Orientador(a)
Dr. Cavalcante, Rodolfo Carneiro.
Banca Examinadora
Dr. Oliveira, Elthon Allex da Silva.
Dr. Neves, Tácito Trindade de Araújo Tiburtino.
Palavras-chave
Aprendizagem de máquina.
Twitter.
Mineração de textos.
Bots.
Áreas do Conhecimento/Localização
Coleção Propriedade Intelectual (CPI) - BSCA.
Categorias CNPQ
1.00.00.00-3 Ciências exatas e da terra.
Visualizações
198
Observações


Não foi possível exibir o PDF