Resumo:
Este trabalho teve como finalidade identificar e analisar focos da febre amarela no Brasil
através do uso de técnicas de mineração de textos e algoritmos de classificação Bayesianos.
Foi utilizado técnicas de mineração de texto para coleta e preparação dos dados minerados da
rede social Twitter, no período entre 13 de março a 4 de julho de 2018. Para isso, foram
verificadas as mensagens dos usuários da rede social que relatassem sintomas da doença ou
ainda mensagens com alguma relação ao dado pesquisado. Para identificar os casos de febre
amarela por meio da rede social Twitter, foi criado um modelo que teve uma taxa de acurácia
de 93% de acerto no dataset de treino/teste. Depois de termos identificado e analisado os
dados, foi possível correlacionar os dados recolhidos e verificados na rede social com as
informações dos meios oficiais de notificação. Os resultados mostraram uma alta correlação
entre os dados da rede social Twitter com os dados oficiais do Ministério da Saúde que foram
de 81% e 78% para o estado e a cidade respectivamente, mostrando que a rede social Twitter
pode ser usada para análise e prevenção de epidemias. De acordo com os resultados obtidos
na análise de correlação, foi possível concluir que as informações contidas na rede social do
Twitter podem ser usadas como fonte de dados para análise e previsão de epidemias.
Descrição:
RODRIGUES, E. M. Análise e previsão da epidemia da febre amarela utilizando dados da rede social Twitter e redes bayesianas. 2019. 51f. Trabalho de Conclusão de Curso (Graduação em Computação)- Universidade Estadual da Paraíba, Campina Grande, 2019.