Interpretação de um modelo XGBOOST para previsão de UTI por valor de SHAP e comparação com os parâmetros do modelo de regressão logística

Silva, Luan Francisco da

Interpretação de um modelo XGBOOST para previsão de UTI por valor de SHAP e comparação com os parâmetros do modelo de regressão logística

Silva, Luan Francisco da

URI: http://dspace.bc.uepb.edu.br/jspui/handle/123456789/30888

Data: 2023-12-07

Resumo:

Os MLG são soluções para modelos lineares quando se tem impasses quanto as pressuposições necessárias para tal, como linearidade dos parâmetros e normalidade nos resíduos, ou ainda, problemas caracterizados no conjunto de dados, como valores de contagem, respostas binárias ou excesso de zeros, que corroboram para baixa qualidade no ajuste e, consequentemente, na interpretabilidade dos coeficientes. Esta teoria apresenta um leque de soluções sem perda da capacidade inferencial de um modelo linear. O uso da teoria de SHAP, nos permite obter informações sobre a importância de cada recurso (variável) no modelo de aprendizado de máquina, sob aspectos de comparação entre elas e de ranqueamento das mesmas. O principal objetivo deste trabalho foi fazer comparações entre esses dois tipos de interpretação, respeitando o fato de que são diferentes tipos de abordagem. Foi mostrado que a contribuição para o preditor linear e a contribuição dos valores de SHAP à probabilidade logarítmica, podem ser parecidas se considerarmos um contexto de efeito geral numa análise descritiva e de interpretação, visto que, sob certos aspectos, há variáveis ou recursos que possuem a mesma importância em ambos os modelos, mas que diferem em termos de direção, pois podem impactar tanto positivamente, quanto negativamente. As variáveis FADIGA, CARDIOPATI e HOSPITAL, são exemplos deste caso, já que no efeito geral, são parecidas em ambos os modelos. Apesar disso, a desproporcionalidade no impacto da variável HOSPITAL influencia muito na precisão do modelo de aprendizado de maquina, tornando-o um modelo com baixa capacidade de predizer a internação na UTI quando isto seria o correto.

Descrição:

SILVA, Luan Francisco da. Interpretação de um modelo XGBOOST para previsão de UTI por valor de SHAP e comparação com os parâmetros do modelo de regressão logística. 2023. 44 p. Trabalho de Conclusão de Curso (Graduação em Estatística) - Universidade Estadual da Paraíba, Campina Grande, 2023.

Mostrar registro completo