Método Spearman-Markowitz Clusterizado: Uma Nova Abordagem Híbrida para Seleção de Recursos em Modelos de Concessão de Crédito
A democratização e o livre acesso à grandes volumes de dados, tornou os estudos acerca dos métodos de seleção de recursos, um catalizador ao direcionar esforços na busca por excluir dados redundantes do processo de construção de um modelo de aprendizado de máquina, a fim de torná-lo menos propenso a sofrer sobreajuste (overfitting), bem como, mais simples e, consequentemente, menos custoso para monitoramento e consumo. Na literatura, existem, basicamente, quatro abordagens para métodos de seleção de recursos: embedded, filtro, embrulho (wrapper) e o método híbrido, resultado da combinação entre dois dos três primeiros. Este trabalho, propõe uma nova abordagem conjunta, voltada a resolver problemas envolvendo modelos preditivos de concessão de crédito, que combina conceitos do Modelo de Markowtiz para alocação portfólio ao Coeficiente de Correlação de Spearman, de modo que o método resultante seja competitivo a métodos tradicionalmente utilizados. O processo de validação e comparação do método proposto, denominado por Método Spearman-Markowitz Clusterizado (SMC), foi realizado por meio de estudos de simulação Monte Carlo em dados sintéticos de concessão de crédito, bem como, através de uma aplicação a um conjunto de dados reais de um Bureau de crédito.