Use este identificador para citar ou linkar para este item: http://dspace.bc.uepb.edu.br/jspui/handle/123456789/33445
Título: Redes neurais convolucionais aplicadas ao reconhecimento de emoções através da fala
Autor(es): Almeida, Jhônatan Izidro
Palavras-chave: Redes neurais convolucionais
Reconhecimento de emoções
Mel-Frequency Cepstral Coefficients (MFCC)
Data do documento: 22-Nov-2024
Resumo: Com a crescente onda de desenvolvimento tecnológico no campo da inteligência artificial, muitas outras áreas de conhecimento têm evoluído e se beneficiado dessa evolução, entre elas está a área de computação afetiva. No intuito de tornar a interação dos usuários com as máquinas ainda mais fluida e natural, pesquisas concernentes à computação afetiva têm sido realizadas no intuito de dotar as máquinas da capacidade de identificar, interpretar e sintetizar emoções. Porém, essa tarefa de classificação de emoções de forma automática enfrenta muitos desafios, dentre eles conseguir desenvolver um modelo que apresente bons resultados e que consiga generalizar bem a tarefa de classificação, além da limitada quantidade de bases de dados disponíveis para realizar o treinamento dos modelos de aprendizagem de máquina. A literatura apresenta modelos de redes neurais convolucionais treinadas a partir de características MFCC extraídas dos áudios de fala que apresentam resultados robustos na classificação automática de emoções. Portanto, neste trabalho foi utilizada esta técnica de reconhecimento de emoções através da fala, e assim foi desenvolvida uma arquitetura de rede neural convolucional que foi treinada e testada com os dados da base EmoUERJ. A arquitetura foi capaz de apresentar resultados robustos tanto na fase de treinamento quanto na fase de teste, com 93,73% e 95% de acurácia respectivamente, apesar de ter sido um projeto de pequena escala, com uma quantidade limitada de dados. Ainda foi realizado um experimento com áudios extraídos de vídeos do Youtube, a fim de testar a performance do modelo na classificação de áudios brutos de fora do contexto de treinamento, que apresentou no final do experimento uma acurácia de 65%, um resultado muito interessante vista a aplicação mais realista do modelo.
Descrição: ALMEIDA, Jhônatan Izidro. Redes neurais convolucionais aplicadas ao reconhecimento de emoções através da fala. 2024. 61f. Trabalho de Conclusão de Curso (Graduação em Ciência da computação) - Universidade Estadual da Paraíba, Patos, 2024.
URI: http://dspace.bc.uepb.edu.br/jspui/handle/123456789/33445
Aparece nas coleções:81 - TCC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Termo_de_Deposito.pdfTermo de Depósito212.03 kBAdobe PDFVisualizar/Abrir
TCC II_Jhonatan_final.pdfTCC - Jhonatan Izidro Almeida1.93 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.