Detecção de Fraudes em Operações com Cartões de Crédito: uma Abordagem de Aprendizado de Máquina
Neste trabalho, é analisado o problema de aprendizado de máquina supervisionado e suas aplicações no reconhecimento de transações fraudulentas em pagamentos com cartão de crédito. Primeiramente, é discutido o conceito de fraude em meios de pagamento, suas consequências e a importância de detectar esse tipo de transação para mitigar riscos. Em seguida, são apresentados problemas de aprendizado de máquina supervisionado e não-supervisionado, bem como os principais algoritmos utilizados (como Redes Bayesianas, Redes Neurais, Árvores de Decisão e K-Means), suas aplicações, implementação computacional e métodos de avaliação de desempenho.
Em seguida, são descritas metodologias para combinação de algoritmos de aprendizado de máquina, com destaque para a agregação de classificadores e a combinação de métodos de aprendizado supervisionado e não-supervisionado (Mixed Learning). Como principais contribuições deste trabalho, destacam-se os novos algoritmos CC-OR, CCK-VM e CCK-OR, baseados em uma nova função para agregação de classificadores, aliada ao conceito de Mixed Learning, além de uma variação do algoritmo K-Nearest Neighbors adaptado para dados desbalanceados.
Para avaliar os diferentes estimadores, foram comparados os principais classificadores da literatura, operando individualmente e agregados por meio de voto majoritário, bem como os algoritmos propostos neste trabalho, avaliando-se o desempenho dos mesmos na detecção de operações fraudulentas. Foram realizadas simulações numéricas por meio de programas escritos em Python, utilizando dados reais e sintéticos, as quais revelaram ganhos no uso dos métodos propostos quando comparados com o estado da arte da área.