Resumo:
A criação da Nota Fiscal Eletrônica (NF-e) facilitou tanto a prestação de tributação quanto a sua fiscalização. As tributações são cobradas de maneira automática, através de códigos presentes na nota. Contudo, nem sempre esses códigos conferem com a descrição do produto, seja por possíveis erros de digitação na ocasião do cadastro dos códigos, ou por fraude fiscal. Dada a quantidade de NF-e emitidas diariamente, é inviável uma checagem unitária. Assim, a Secretaria de Estado da Fazenda da Paraíba (SEFAZ-PB), firmou uma parceria com a Universidade Estadual da Paraíba (UEPB ) para a criação de um classificador que fizesse a análise do campo de descrição dos produtos. No entanto, esse campo é de texto livre e não padronizado, sendo necessário o uso de técnicas de aprendizado de máquina em conjunto com técnicas de Processamento de Linguagem Natural (PLN), tal como a vetorização das palavras através de word embeddings. Após os testes, a maior acurácia foi de 97,47%, resultado obtido através do uso de uma Rede Neural artificial com LSTM e usando word2vec para a vetorização das palavras.
Descrição:
ARAUJO NETO, Antonio Marinho de. O uso de processamento de linguagem natural para classificação de produtos no contexto de notas fiscais eletrônicas. 2021. 25 p. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Estadual da Paraíba, Campina Grande, 2021.