Ensembles de classificadores por meio de Algoritmos Evolutivos
A eficácia de um ensemble de classificadores depende da seleção de modelos de classificação que sejam acurados e diversos, ou seja, que cometam erros diferentes, para compor o comitê.
Realizar esta seleção de forma ótima é um problema difícil, pois o número de combinações possíveis é muito grande, tornando o espaço de busca muito amplo.
Os Algoritmos Evolutivos são meta-heurísticas que se mostraram efetivas em problemas NP-difícil e uma das vantagens deles em relação a métodos de busca tradicionais é que eles possuem menor propensão a ficarem presos em ótimos locais; isso se deve principalmente ao fato de processarem um conjunto de soluções (população) ao invés de apenas uma solução.
Além disso, existem Algoritmos Evolutivos que fazem uma busca por diversidade, cuja seleção dos indivíduos para compor a próxima geração é feita considerando a similaridade entre os membros da população.
Dadas essas características, a utilização de Algoritmos Evolutivos para buscar diversidade é uma abordagem apropriada para a otimização da construção de ensembles.
Portanto, foi desenvolvido neste projeto um Algoritmo Evolutivo chamado Diversity-based Classifier Ensemble (DCE) que incentiva a seleção de classificadores diversos para compor o comitê.
Entretanto, a execução deste Algoritmo Evolutivo para criar ensembles consome uma grande quantidade de processamento e memória.
Por este motivo, o Algoritmo Evolutivo paralelo chamado Parallel Diversity-based Classifier Ensemble (PDCE) também foi desenvolvido neste projeto utilizando a técnica global parallelisation model para distribuir o custo computacional entre diversas CPUs.
Os resultados preliminares obtidos a partir dos experimentos computacionais realizados indicam que os algoritmos DCE e PDCE podem ser ferramentas úteis quando comparadas com estratégias de buscas exaustivas para a resolução do problema de otimização de ensembles de classificadores.
Ainda com base nestes resultados, foram levantados pontos de melhoria e aspectos da abordagem adotada que serão melhor investigados na sequência deste trabalho.