UEPB - Repositório Digital

Redes neurais convolucionais aplicadas ao reconhecimento de emoções através da fala

Mostrar registro simples

dc.contributor.author Almeida, Jhônatan Izidro
dc.date.accessioned 2024-12-20T15:38:40Z
dc.date.available 2024-12-20T15:38:40Z
dc.date.issued 2024-11-22
dc.identifier.other 21. ed. CDD 006.3
dc.identifier.uri http://dspace.bc.uepb.edu.br/jspui/handle/123456789/33445
dc.description ALMEIDA, Jhônatan Izidro. Redes neurais convolucionais aplicadas ao reconhecimento de emoções através da fala. 2024. 61f. Trabalho de Conclusão de Curso (Graduação em Ciência da computação) - Universidade Estadual da Paraíba, Patos, 2024. pt_BR
dc.description.abstract Com a crescente onda de desenvolvimento tecnológico no campo da inteligência artificial, muitas outras áreas de conhecimento têm evoluído e se beneficiado dessa evolução, entre elas está a área de computação afetiva. No intuito de tornar a interação dos usuários com as máquinas ainda mais fluida e natural, pesquisas concernentes à computação afetiva têm sido realizadas no intuito de dotar as máquinas da capacidade de identificar, interpretar e sintetizar emoções. Porém, essa tarefa de classificação de emoções de forma automática enfrenta muitos desafios, dentre eles conseguir desenvolver um modelo que apresente bons resultados e que consiga generalizar bem a tarefa de classificação, além da limitada quantidade de bases de dados disponíveis para realizar o treinamento dos modelos de aprendizagem de máquina. A literatura apresenta modelos de redes neurais convolucionais treinadas a partir de características MFCC extraídas dos áudios de fala que apresentam resultados robustos na classificação automática de emoções. Portanto, neste trabalho foi utilizada esta técnica de reconhecimento de emoções através da fala, e assim foi desenvolvida uma arquitetura de rede neural convolucional que foi treinada e testada com os dados da base EmoUERJ. A arquitetura foi capaz de apresentar resultados robustos tanto na fase de treinamento quanto na fase de teste, com 93,73% e 95% de acurácia respectivamente, apesar de ter sido um projeto de pequena escala, com uma quantidade limitada de dados. Ainda foi realizado um experimento com áudios extraídos de vídeos do Youtube, a fim de testar a performance do modelo na classificação de áudios brutos de fora do contexto de treinamento, que apresentou no final do experimento uma acurácia de 65%, um resultado muito interessante vista a aplicação mais realista do modelo. pt_BR
dc.description.sponsorship Orientador: Esp. Jaian Tales Gomes Santos pt_BR
dc.language.iso other pt_BR
dc.subject Redes neurais convolucionais pt_BR
dc.subject Reconhecimento de emoções pt_BR
dc.subject Mel-Frequency Cepstral Coefficients (MFCC) pt_BR
dc.title Redes neurais convolucionais aplicadas ao reconhecimento de emoções através da fala pt_BR
dc.type Other pt_BR


Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Buscar DSpace


Busca avançada

Navegar

Minha conta