PPGCCM PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO FUNDAÇÃO UNIVERSIDADE FEDERAL DO ABC Phone: 11 4996-8337 http://propg.ufabc.edu.br/ppgccm

Banca de QUALIFICAÇÃO: LAURA DAMACENO DE ALMEIDA

Uma banca de QUALIFICAÇÃO de MESTRADO foi cadastrada pelo programa.
STUDENT : LAURA DAMACENO DE ALMEIDA
DATE: 10/05/2024
TIME: 14:00
LOCAL: Detecção de Traços de Personalidade Big Five com Base em Postagens Textuais Curtas
TITLE:

Detecção de Traços de Personalidade Big Five com Base em Postagens Textuais Curtas


PAGES: 74
BIG AREA: Ciências Exatas e da Terra
AREA: Ciência da Computação
SUMMARY:

A personalidade descreve o comportamento das pessoas e pode influenciar suas escolhas e tomadas de decisão. Uma das métricas mais consolidadas para traços de personalidade é o Big Five. Poucos trabalhos foram produzidos para detecção dos mesmos a partir de textos em português compartilhados no Twitter, atual X. O objetivo do presente trabalho consiste na identificação da melhor abordagem de classificação do traço de personalidade em perfis de usuários do Twitter com base nas últimas 60 postagens textuais em português. O primeiro passo da pesquisa foi construir uma base de dados com tweets em português e o respectivo traço de personalidade dominante, dado que um tal conjunto não estava disponível. A base foi elaborada a partir da coleta de dados de 54 voluntários, cujos traços de personalidade foram calculados usando um instrumento validado em múltiplos idiomas, incluindo o português, e um total de 2121 tweets coletados. A partir disso, algumas análises estatísticas e textuais foram realizadas, com o objetivo de verificar a coerência dos dados obtidos em relação ao que a literatura científica diz sobre cada traço. Essa coerência foi constatada e a base obtida foi usada no treinamento de sete modelos de aprendizado de máquina, considerando-se cenários com e sem balanceamento das amostras. Nos experimentos preliminares realizados, os algoritmos de aprendizado de máquina apresentaram métricas superiores e diferenças estaticamente significativas com a utilização de técnicas de balanceamento de classes, todavia não foi detectada diferença estatística significativa entre as técnicas de balanceamento. Destaca-se, contudo, que o algoritmo que se sobressaiu foi o Extra Trees em conjunto com TF-IDF Unigram e a aplicação de técnicas de balanceamento.


COMMITTEE MEMBERS:
Presidente - Interno ao Programa - 2976815 - DENISE HIDEKO GOYA
Membro Titular - Examinador(a) Interno ao Programa - 1918407 - DEBORA MARIA ROSSI DE MEDEIROS
Membro Titular - Examinador(a) Externo à Instituição - IVANDRÉ PARABONI - USP
Membro Suplente - Examinador(a) Interno ao Programa - 3008222 - PAULO HENRIQUE PISANI
Membro Suplente - Examinador(a) Externo à Instituição - CHARLES HENRIQUE PORTO FERREIRA
Notícia cadastrada em: 02/04/2024 13:54
SIGAA | UFABC - Núcleo de Tecnologia da Informação - ||||| | Copyright © 2006-2024 - UFRN - sigaa-2.ufabc.int.br.sigaa-2-prod