Interpretação de um modelo XGBOOST para previsão de UTI por valor de SHAP e comparação com os parâmetros do modelo de regressão logística

Silva, Luan Francisco da

dc.contributor.author	Silva, Luan Francisco da
dc.date.accessioned	2023-12-21T13:27:45Z
dc.date.available	2023-12-21T13:27:45Z
dc.date.issued	2023-12-07
dc.identifier.other	CDD 519
dc.identifier.uri	http://dspace.bc.uepb.edu.br/jspui/handle/123456789/30888
dc.description	SILVA, Luan Francisco da. Interpretação de um modelo XGBOOST para previsão de UTI por valor de SHAP e comparação com os parâmetros do modelo de regressão logística. 2023. 44 p. Trabalho de Conclusão de Curso (Graduação em Estatística) - Universidade Estadual da Paraíba, Campina Grande, 2023.	pt_BR
dc.description.abstract	Os MLG são soluções para modelos lineares quando se tem impasses quanto as pressuposições necessárias para tal, como linearidade dos parâmetros e normalidade nos resíduos, ou ainda, problemas caracterizados no conjunto de dados, como valores de contagem, respostas binárias ou excesso de zeros, que corroboram para baixa qualidade no ajuste e, consequentemente, na interpretabilidade dos coeficientes. Esta teoria apresenta um leque de soluções sem perda da capacidade inferencial de um modelo linear. O uso da teoria de SHAP, nos permite obter informações sobre a importância de cada recurso (variável) no modelo de aprendizado de máquina, sob aspectos de comparação entre elas e de ranqueamento das mesmas. O principal objetivo deste trabalho foi fazer comparações entre esses dois tipos de interpretação, respeitando o fato de que são diferentes tipos de abordagem. Foi mostrado que a contribuição para o preditor linear e a contribuição dos valores de SHAP à probabilidade logarítmica, podem ser parecidas se considerarmos um contexto de efeito geral numa análise descritiva e de interpretação, visto que, sob certos aspectos, há variáveis ou recursos que possuem a mesma importância em ambos os modelos, mas que diferem em termos de direção, pois podem impactar tanto positivamente, quanto negativamente. As variáveis FADIGA, CARDIOPATI e HOSPITAL, são exemplos deste caso, já que no efeito geral, são parecidas em ambos os modelos. Apesar disso, a desproporcionalidade no impacto da variável HOSPITAL influencia muito na precisão do modelo de aprendizado de maquina, tornando-o um modelo com baixa capacidade de predizer a internação na UTI quando isto seria o correto.	pt_BR
dc.description.sponsorship	Orientador: Prof. Dr. Tiago Almeida de Oliveira	pt_BR
dc.language.iso	other	pt_BR
dc.subject	Valor de SHAP	pt_BR
dc.subject	MLG e SHAP	pt_BR
dc.subject	Interpretação de aprendizado de máquina	pt_BR
dc.title	Interpretação de um modelo XGBOOST para previsão de UTI por valor de SHAP e comparação com os parâmetros do modelo de regressão logística	pt_BR
dc.type	Other	pt_BR