Extração e Combinação de Múltiplas Visões para Classificação de Textos
Analisar a informação através de múltiplas perspectivas pode colaborar no entendimento dos dados e na extração de conhecimento, permitindo a exploração de um intervalo maior de características, principalmente em se tratando de textos. Para fazer uma análise significativa de todos os aspectos de um texto, é fundamental observá-lo através de múltiplas perspectivas permitindo assim uma investigação mais objetiva. Neste trabalho, estamos propondo uma técnica capaz de gerar múltiplas visões de textos para aprender suas características e incorporar seu conhecimento em uma única representação vetorial que seja apta para generalizar um modelo preditivo aprimorado que visa aperfeiçoar a classificação de documentos. Estamos apresentando duas propostas para combinar nossas múltiplas visões. Cada estratégia possui algumas variações que proporcionam mais flexibilidade. Avaliamos nossos métodos através da tarefa de classificação de textos sobre duas perspectivas diferentes. Inicialmente, comparamos nossa proposta contra métodos que usam uma única visão dos dados e posteriormente, confrontamos contra técnicas de estado-da-arte que também utilizam múltiplas visões. Executamos os experimentos com quatro classificadores em seis bases de textos diferentes. Nossas propostas superaram as técnicas concorrentes em quase todos os experimentos mostrando sua capacidade de aprender com múltiplas visões de textos.