Detecção de Fraudes em Operações com Cartões de Crédito: Uma Abordagem de Aprendizado de Máquina
Propõe-se neste trabalho a análise do problema de aprendizado supervisionado em aprendizado de máquina e algumas de suas aplicações no mercado financeiro, com enfoque no reconhecimento de transações fraudulentas em pagamentos via cartão de crédito. Para isso, primeiramente será abordado o conceito de fraude em meios de pagamento, suas consequências, e a importância do reconhecimento deste tipo de transação para mitigação de risco. Em seguida, serão descritos os problemas de aprendizado supervisionado, em que o objetivo é a estimação de variáveis categóricas (classificação) e numéricas (regressão) a partir de dados rotulados, e o problema de aprendizado não-supervisionado, em que o intuito é a construção de grupos (clusters) em dados não rotulados a partir de medidas de dissimilaridade. Isso é feito por meio de uma revisão bibliográfica abordando os conceitos de cada forma de aprendizado, os principais modelos matemáticos para resolução de cada um dos tipos de problema (Redes Bayesianas, Redes Neurais, Árvores de Decisão, K-Means, dentre outros), principais aplicações, implementação computacional e métodos de avaliação de desempenho dos modelos em questão. Na parte prática, visando avaliar os diferentes estimadores, será feita uma análise comparativa entre os principais modelos de classificação, analisando o desempenho destes no reconhecimento de transações fraudulentas para pagamentos via cartão de crédito. Todas as simulações numéricas são realizadas por meio de funções escritas na linguagem de programação Python, e os desempenhos dos modelos testados são medidos a partir de testes feitos em dados reais e dados gerados computacionalmente. Ao final do trabalho, são descritos os resultados das simulações realizadas, considerações finais, e proposta de continuidade deste estudo.