Resumo:
Os MLG são soluções para modelos lineares quando se tem impasses quanto as pressuposições
necessárias para tal, como linearidade dos parâmetros e normalidade nos resíduos, ou ainda,
problemas caracterizados no conjunto de dados, como valores de contagem, respostas binárias
ou excesso de zeros, que corroboram para baixa qualidade no ajuste e, consequentemente,
na interpretabilidade dos coeficientes. Esta teoria apresenta um leque de soluções sem perda
da capacidade inferencial de um modelo linear. O uso da teoria de SHAP, nos permite obter
informações sobre a importância de cada recurso (variável) no modelo de aprendizado de
máquina, sob aspectos de comparação entre elas e de ranqueamento das mesmas. O principal
objetivo deste trabalho foi fazer comparações entre esses dois tipos de interpretação, respeitando
o fato de que são diferentes tipos de abordagem. Foi mostrado que a contribuição para o
preditor linear e a contribuição dos valores de SHAP à probabilidade logarítmica, podem ser
parecidas se considerarmos um contexto de efeito geral numa análise descritiva e de interpretação,
visto que, sob certos aspectos, há variáveis ou recursos que possuem a mesma importância
em ambos os modelos, mas que diferem em termos de direção, pois podem impactar tanto
positivamente, quanto negativamente. As variáveis FADIGA, CARDIOPATI e HOSPITAL, são
exemplos deste caso, já que no efeito geral, são parecidas em ambos os modelos. Apesar disso,
a desproporcionalidade no impacto da variável HOSPITAL influencia muito na precisão do
modelo de aprendizado de maquina, tornando-o um modelo com baixa capacidade de predizer a
internação na UTI quando isto seria o correto.
Descrição:
SILVA, Luan Francisco da. Interpretação de um modelo XGBOOST para previsão de UTI por valor de SHAP e comparação com os parâmetros do modelo de regressão logística. 2023. 44 p. Trabalho de Conclusão de Curso (Graduação em Estatística) - Universidade Estadual da Paraíba, Campina Grande, 2023.