Seleção de Critérios de Validação em Agrupamento via Meta-Aprendizado
Na área de Mineração de Dados existem diferentes tarefas que podem ser adotadas para
a análise de grandes volumes de dados. Dentre elas, destaca-se o agrupamento de dados.
Como essa tarefa consiste em obter grupos para os quais não existe conhecimento prévio
sobre a partição real, deve-se fazer uma análise criteriosa do seu resultado e, para isso,
existem os critérios relativos de validação. Embora muitos critérios tenham sido propostos,
ainda é uma tarefa desafiadora indicar qual o critério é mais adequado para cada cenário de
aplicação. Considerando este fato, o presente trabalho propõe o uso de meta-aprendizado
para a seleção automática de critérios de validação de agrupamento, considerando as
caracteríısticas inerentes a cada problema sob investigação. Para isso, foi feito uma coleta
de meta-atributos, os quais foram obtidos a partir de cada base de dados. Os resultados
obtidos, provenientes da análise de 783 conjuntos de dados e de diversas fontes, revelaram
que o modelo Gradient Boosting obteve um precision de 0,83. Apesar dessa constatação foi
apresentado que o método funciona quando o critério relativo é representativo no conjunto
de dados e falha quando é menos representativo.