Resumo:
Este trabalho aborda a detecção de pneumonia, uma patologia pulmonar e a maior responsável pela morte de crianças ao redor do mundo, a partir de imagens de radiografias pediátricas. O diagnóstico tradicional envolve a avaliação do histórico do paciente assim como radiografias torácicas. Para aprimorar esse processo, este trabalho utiliza modelos classificadores baseados em redes neurais convolucionais dentro da área de deep learning. Se utilizando do método de transfer learning foi possível utilizar os pesos pré-treinados da Inception-ResNet-V2, uma rede neural convolucional mais robusta, e a VGG-16 que possui uma estrutura bem mais simples. O objetivo é classificar imagens radiográficas infantis para identificar a presença ou ausência de pneumonia, comparando ambos os modelos para identificar o melhor deles, verificando a eficácia do data augmentation no balanceamento da base de imagens de treinamento, além da comparação com outros modelos presentes na literatura. O banco de dados inclui imagens divididas em duas classes sendo a Pneumonia, com 4273 imagens, e a Normal, com 1583 imagens. A base de treinamento, inicialmente desbalanceada, contém 3883 imagens de Pneumonia e 1349 imagens Normais. Para o processo de balanceamento, foi aplicado o método de aumento de dados usando a biblioteca Albumentations em Python. A avaliação dos modelos treinados incluiu métricas como Precision, Recall, F1-score e Acurácia, utilizando a matriz de confusão. Métodos gráficos de avaliação, como a curva ROC e Precision-Recall, também foram empregados. A partir do treinamento inicial com a base desbalanceada foi evidenciado um desempenho semelhante entre os modelos, com ligeira vantagem para a Inception-ResNet-V2 com AUC de 93% e acurácia de 93,26%. No entanto, ao equilibrar a base de treinamento, a VGG-16 apresentou melhorias significativas, atingindo AUC de 94% e acurácia de 94,23%. Na comparação com outros dois modelos existentes na literatura, treinados em 100 épocas, o melhor modelo deste trabalho obteve resultados semelhantes, porém, mais equilibrado quanto a sua sensibilidade e especificidade, sendo treinado em apenas 10 épocas. Com isso, a VGG-16, treinada com uma base balanceada, demonstrou melhor desempenho e equilíbrio na classificação. Quanto a eficácia do data augmentation foi mais evidente na VGG-16, indicando que arquiteturas mais simples podem se beneficiar mais desse método em comparação com modelos complexos como a Inception-ResNet-V2, destacando a importância do balanceamento e da escolha adequada de técnicas em diferentes arquiteturas.
Descrição:
SILVA, Giullber Valentim da. Classificação de imagens utilizando redes neurais convolucionais através do transfer learning. 2023. 67 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Universidade Estadual da Paraíba, Campina Grande, 2023.