dc.description.abstract |
A detecção de spam é crucial para a segurança e eficiência da comunicação. Com o uso crescente de dispositivos móveis e serviços de mensagens como o e-mail, o envio de spam tornou-se uma preocupação crescente. Essas mensagens indesejadas podem conter phishing, fraudes, links maliciosos e outros conteúdos prejudiciais, representando ameaças à segurança dos usuários e à integridade dos dados. Além disso, o spam excessivo pode prejudicar a eficácia da comunicação, sobrecarregando as caixas de entrada dos utilizadores e dificultando a identificação e resposta a mensagens legítimas. Neste contexto, nossa pesquisa explora e avalia diferentes modelos de classificação em Processamento de Linguagem Natural em um estudo de caso específico para detecção automática de spams em mensagens de texto. Para tanto, utilizamos uma base de dados precisa e, após tratamento e pré-processamento dos dados, identificamos uma disparidade na distribuição das mensagens, destacando a importância de abordagens equilibradas. Emprega mos vários algoritmos, como K-Nearest Neighbors, Naive Bayes Multinomial, Support Vector Classifier, Logistic Regression e Decision Tree Classifier, avaliando seu desempenho por meio de métricas como acurárica, precisão, recall e F1-Score. Destacamos que o Support Vector Classifier obteve o melhor desempenho, demonstrando sua eficácia na identificação precisa do spam, com um equilíbrio satisfatório entre precisão e recall. |
pt_BR |