MACHINE LEARNING E REGRESSÃO MULTIVARIADA APLICADOS À PREDICAO DA SOBREVIDA DO CÂNCER MAMA
O presente estudo iniciado durante a pandemia global do COVID-19 apresenta os resultados da comparação dos modelos desenvolvidos a partir dos algoritmos Random Survival Forest (que considera dados censurados de sobrevida no algoritmo Random Forest) e regressão multivariada de Cox (baseado na estatística multivariada de sobrevida) voltados à análise de sobrevida de pacientes diagnosticadas com câncer de mama. O estudo considerou uma amostra que continha dados de 4024 pacientes do sexo feminino diagnosticadas no período de 2006 a 2010 com câncer de mama (carcinoma ductal invasivo e carcinoma lobular). O modelo desenvolvido a partir da regressão multivariada de Cox revelou a idade, tamanho do tumor, estadiamento, estrogênio e progesterona como fatores de risco, que também foram considerados relevantes entre os atributos com maior ganho de informação pelo modelo apresentado pelo algoritmo Random Survival Forest. No geral, as medidas de avaliação dos modelos foram semelhantes. Temos evidências de que o modelo apresentado pelo algoritmo Random Survival Forest considerado na análise de sobrevida de câncer de mama apresentou-se em concordância com o modelo desenvolvido a partir regressão multivariada de Cox; e que os resultados são promissores para a prática clínica.