Portal de Programas de Pós-Graduação (UFABC)

SIGAA - Sistema Integrado de Gestão de Atividades Acadêmicas

PPGINF PÓS-GRADUAÇÃO EM ENGENHARIA DA INFORMAÇÃO FUNDAÇÃO UNIVERSIDADE FEDERAL DO ABC Phone: Not available E-mail: ppg.informacao@ufabc.edu.br http://propg.ufabc.edu.br/ppginfo

Banca de DEFESA: GUILHERME GARCIA HORTA

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
STUDENT : GUILHERME GARCIA HORTA
DATE: 21/06/2024
TIME: 09:30
LOCAL: https://conferenciaweb.rnp.br/webconf/murilo-13
TITLE:

Desbalanceamento, sobreposição e classificação de dados com aplicação em detecção de fraudes em cartões de crédito.

PAGES: 90
BIG AREA: Engenharias
AREA: Engenharia Elétrica
SUMMARY:

As fraudes em cartões de crédito são um problema crescente na sociedade moderna, especialmente com o aumento das modalidades de compras e pagamentos online. Logo, há alta demanda para sistemas de prevenção e detecção de fraudes que sejam robustos e confiáveis. A tarefa de detecção de fraudes pode ser tratada como um problema de classificação e, neste contexto, múltiplos autores relatam dificuldades ao treinar os classificadores nos conjuntos de dados de fraudes, que possivelmente apresentam desbalanceamento e sobreposição entre as classes. Técnicas de pré-processamento de amostragem, como sobre-amostragem e sub-amostragem, são frequentemente utilizadas na fase de pré-processamento para tratar o problema do desbalanceamento. Por outro lado, métricas de avaliação como o R-Valor e o R-Valor Aumentado foram apresentadas nos últimos anos para medir o nível de sobreposição presente nos dados. Portanto, este trabalho se propõe a analisar os comportamentos de diferentes classificadores quando há utilização de técnicas de amostragem em conjuntos de dados sintéticos desbalanceados e sobrepostos, além de efetuar este estudo em aplicação real, para um conjunto de dados de fraudes em cartões de crédito, objetivamente medindo os efeitos nas métricas acima mencionadas e também nos desempenhos de classificação. Este trabalho, bem como outros autores apontaram por meio de estudos em diversos conjuntos de dados, demonstra que a utilização da métrica R-Valor Aumentado é mais apropriada em cenário de dados desbalanceados em comparação ao R-Valor. Entretanto, este trabalho conclui que, para os conjuntos de dados estudados, os resultados de classificação obtidos após a aplicação das técnicas escolhidas de amostragem não apresentaram diferenças significativas em relação a não aplicação das mesmas, reforçando ponto trazido por certos autores que, supostamente, o problema de sobreposição dos dados pode ser mais oneroso de lidar que o desbalanceamento. Outra questão trazida a tona por este estudo é a relação entre a dispersão observada dos dados de cada classe em relação ao desempenho de classificação dos estimadores. Além disso, aponta-se que os algoritmos de classificação baseados em árvores de decisão obtiveram resultados bons para o conjunto de dados real de fraudes, considerando as circunstâncias de alto desbalanceamento e classes sobrepostas significativamente.

COMMITTEE MEMBERS:
Presidente - Interno ao Programa - 1761105 - MURILO BELLEZONI LOIOLA
Membro Titular - Examinador(a) Interno ao Programa - 1761107 - RICARDO SUYAMA
Membro Titular - Examinador(a) Externo à Instituição - LEVY BOCCATO - UNICAMP
Membro Suplente - Examinador(a) Interno ao Programa - 2356637 - KENJI NOSE FILHO
Membro Suplente - Examinador(a) Externo à Instituição - ROMIS RIBEIRO DE FAISSOL ATTUX - UNICAMP

Notícia cadastrada em: 04/06/2024 09:31