Reconhecimento de _bots_ no _Twitter: _uma abordagem utilizando aprendizagem em máquina
Reconhecimento de bots no Twitter: uma abordagem utilizando aprendizagem em máquina
<erickritir12@gmail.com>
As redes sociais são ambientes na internet onde é possível compartilhar e consumir conteúdos e notícias em tempo real. Nesse contexto, contas falsas, ou bots, são contas que poluem esses espaços com objetivos maliciosos, como fazer spam ou promover notícias falsas. Logo, faz-se necessário detectá-las e removê-las das redes sociais.Este trabalho tem como objetivo classificar, utilizando três tipos de atributos (de comportamento, de perfil e de texto), contas do Twitter em conta falsa ou legítima. Foram utilizados três classificadores (Rede Neural, Naive Bayes e Random Forest) a partir de uma base de dados previamente classificada. A base de dados foi construída a partir de dois data sets encontrados na literatura. Para avaliar as classificações, foram utilizadas as métricas acurácia, recall, precisão e F1 Score. A partir dos experimentos, notou-se que os métodos propostos apresentaram resultados interessantes, e que, analisando os dados extraídos das contas, notou-se que há diferenças no comportamento e no modo como contas falsas utilizam a plataforma do Twitter em relação a usuários legítimos.
Social networks are environments on the Internet where it is possible to share and consume content and news in real time. In this context, fake accounts, or bots, are accounts that pollute these environments with malicious purposes, such as spamming or promoting fake news. Therefore, it is necessary to detect and remove them from social networks.This study aims to classify, using threetypesoffeatures(behavior,profileandtext),Twitteraccountsinfalseorlegitimateaccount. Three classifiers (Artificial Neural Network, Naive Bayes and Random Forest) were used from a previously classified database. The database was built from two data sets found in the literature. To evaluate the classification, we used the accuracy, recall, precision and F1 score metrics. From the experiments, it was noted that the proposed methods presented interesting results, and that, analyzing the data extracted from the accounts, it was noted that there are differences in the behavior and the way fake accounts use the Twitter platform in relation to legitimate users.
Dr. Neves, Tácito Trindade de Araújo Tiburtino.
Twitter.
Mineração de textos.
Bots.