PPGCCM PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO FUNDAÇÃO UNIVERSIDADE FEDERAL DO ABC Telefone/Ramal: Não informado http://propg.ufabc.edu.br/ppgccm

Banca de DEFESA: CLARISSA SIMOYAMA DAVID

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE : CLARISSA SIMOYAMA DAVID
DATA : 04/06/2020
HORA: 14:00
LOCAL: por participação remota + https://conferenciaweb.rnp.br/webconf/debora-29
TÍTULO:

Detecção de estruturas implícitas textuais por agrupamento hard


PÁGINAS: 50
RESUMO:

Com o grande aumento na disponibilidade de dados de várias áreas, há um interesse crescente na pesquisa de padrões em conjuntos de dados. Esses padrões podem ser usados para executar tarefas como agrupamento e classificação. A área de pesquisa de Aprendizado de Máquina (AM) apresenta vários algoritmos com o objetivo de realizar essas tarefas. No entanto, algumas fontes destes dados podem trazer variáveis (ou atributos) desnecessárias que podem comprometer a qualidade dos padrões extraídos e podem, por exemplo, prejudicar em tarefas de classificação, interferindo no valor de acurácia obtido pelo classificador. Neste trabalho é proposta uma representação de dados textuais incorporando taxas de ocorrências de palavras associadas a suas funções sintáticas utilizando tarefas de Processamento de Linguagem Natural (PLN), como o POS-Tagging. A partir dessa estrutura de dados obtida é proposta a atribuição de importância a grupos desses atributos para representar os textos. Utilizando primeiramente Aprendizado Não-supervisionado, é realizado o agrupamento hard das palavras com o algoritmo K-médias, reduzindo a complexidade da base de dados sem que informações importantes sejam perdidas, e após a definição do número de grupos ideal, pesos são atribuídos aos grupos de palavras. Com a abordagem de Aprendizado Supervisionado, é aplicada classificação nos textos, inicialmente com os atributos sendo as  palavras previamente taggeadas, havendo uma etapa de otimização dos pesos dos atributos com o auxílio de um algoritmo de otimização baseada em população. Os resultados mostram que com esta estrutura de dados e com a abordagem de atribuição de pesos aos atributos houve uma melhora significativa em relação ao valor da acurácia na tarefa de classificação.


MEMBROS DA BANCA:
Presidente - Interno ao Programa - 1918407 - DEBORA MARIA ROSSI DE MEDEIROS
Membro Titular - Examinador(a) Interno ao Programa - 1722875 - DAVID CORREA MARTINS JUNIOR
Membro Titular - Examinador(a) Externo à Instituição - MARCIO BASGALUPP - UNIFESP
Membro Titular - Examinador(a) Externo à Instituição - ANDRÉ CARLOS PONCE DE LEON FERREIRA DE CARVALHO - USP
Membro Suplente - Examinador(a) Interno ao Programa - 1934625 - JESUS PASCUAL MENA CHALCO
Notícia cadastrada em: 21/05/2020 09:45
SIGAA | UFABC - Núcleo de Tecnologia da Informação - ||||| | Copyright © 2006-2021 - UFRN - sigaa-1.sigaa-1