UEPB - Repositório Digital

Interpretação de um modelo XGBOOST para previsão de UTI por valor de SHAP e comparação com os parâmetros do modelo de regressão logística

Mostrar registro simples

dc.contributor.author Silva, Luan Francisco da
dc.date.accessioned 2023-12-21T13:27:45Z
dc.date.available 2023-12-21T13:27:45Z
dc.date.issued 2023-12-07
dc.identifier.other CDD 519
dc.identifier.uri http://dspace.bc.uepb.edu.br/jspui/handle/123456789/30888
dc.description SILVA, Luan Francisco da. Interpretação de um modelo XGBOOST para previsão de UTI por valor de SHAP e comparação com os parâmetros do modelo de regressão logística. 2023. 44 p. Trabalho de Conclusão de Curso (Graduação em Estatística) - Universidade Estadual da Paraíba, Campina Grande, 2023. pt_BR
dc.description.abstract Os MLG são soluções para modelos lineares quando se tem impasses quanto as pressuposições necessárias para tal, como linearidade dos parâmetros e normalidade nos resíduos, ou ainda, problemas caracterizados no conjunto de dados, como valores de contagem, respostas binárias ou excesso de zeros, que corroboram para baixa qualidade no ajuste e, consequentemente, na interpretabilidade dos coeficientes. Esta teoria apresenta um leque de soluções sem perda da capacidade inferencial de um modelo linear. O uso da teoria de SHAP, nos permite obter informações sobre a importância de cada recurso (variável) no modelo de aprendizado de máquina, sob aspectos de comparação entre elas e de ranqueamento das mesmas. O principal objetivo deste trabalho foi fazer comparações entre esses dois tipos de interpretação, respeitando o fato de que são diferentes tipos de abordagem. Foi mostrado que a contribuição para o preditor linear e a contribuição dos valores de SHAP à probabilidade logarítmica, podem ser parecidas se considerarmos um contexto de efeito geral numa análise descritiva e de interpretação, visto que, sob certos aspectos, há variáveis ou recursos que possuem a mesma importância em ambos os modelos, mas que diferem em termos de direção, pois podem impactar tanto positivamente, quanto negativamente. As variáveis FADIGA, CARDIOPATI e HOSPITAL, são exemplos deste caso, já que no efeito geral, são parecidas em ambos os modelos. Apesar disso, a desproporcionalidade no impacto da variável HOSPITAL influencia muito na precisão do modelo de aprendizado de maquina, tornando-o um modelo com baixa capacidade de predizer a internação na UTI quando isto seria o correto. pt_BR
dc.description.sponsorship Orientador: Prof. Dr. Tiago Almeida de Oliveira pt_BR
dc.language.iso other pt_BR
dc.subject Valor de SHAP pt_BR
dc.subject MLG e SHAP pt_BR
dc.subject Interpretação de aprendizado de máquina pt_BR
dc.title Interpretação de um modelo XGBOOST para previsão de UTI por valor de SHAP e comparação com os parâmetros do modelo de regressão logística pt_BR
dc.type Other pt_BR


Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Buscar DSpace


Busca avançada

Navegar

Minha conta