PPGCCM PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO FUNDAÇÃO UNIVERSIDADE FEDERAL DO ABC Telefone/Ramal: 11 4996-8337 http://propg.ufabc.edu.br/ppgccm

Banca de QUALIFICAÇÃO: PATRICIA DIAS DOS SANTOS

Uma banca de QUALIFICAÇÃO de DOUTORADO foi cadastrada pelo programa.
DISCENTE : PATRICIA DIAS DOS SANTOS
DATA : 24/11/2022
HORA: 10:00
LOCAL: por participação remota em https://conferenciaweb.rnp.br/webconf/denise-11
TÍTULO:

Detecção de Posicionamento e Rotulação Automática de Usuários do Twitter em Temas Polarizados e Politicamente Controversos


PÁGINAS: 110
RESUMO:

A detecção de posicionamento é um problema de pesquisa relacionado à análise de redes sociais, processamento de linguagem natural, aprendizagem de máquina e recuperação de informação. Ela tem por objetivo determinar a posição de uma pessoa a partir de um texto que ela produz, em relação a um tema ou assunto explicitamente especificado no texto, ou apenas implícito. Classificações de posicionamento comumente incluem os rótulos Favorável, Contrário e Neutro. 

O posicionamento das pessoas em torno de questões sociais e políticas é muitas vezes realizado via mensagens postadas nas mídias sociais. Porém, prever esse posicionamento apenas com a ajuda de rotulações manuais pode ser uma tarefa desafiadora. Como o volume de postagens de mídia social é muito grande para ser analisado manualmente, são necessários métodos computacionais para identificar o posicionamento. Nessa tese pretende-se obter três contribuições principais: a elaboração de um método de detecção de posicionamento e rotulação automática de usuários do Twitter, a criação de um corpus rotulado para detecção de posicionamento utilizando retweets sobre temas politicamente controversos e polarizados, e finalmente, a avaliação da qualidade do método, bem como da distribuição dos dados no corpus gerado. 

Verificou-se que existem poucos corpora em português cujos dados são anotados com rótulos de posicionamento. Uma vez que dados anotados não estão prontamente disponíveis, nós criamos nosso próprio conjunto de dados: um corpus criado a partir de 13,4 milhões de retweets coletados durante 22 semanas sobre a CPI da Covid-19. A partir da aplicação do modelo foi possível rotular mais de 740 mil usuários, com mínima intervenção humana. Análises estatísticas do corpus gerado mostraram que a distribuição final de rótulos entre retweets contrários e favoráveis é relativamente similar, porém, os usuários contrários, apesar de estarem em menor número, fazem em média muito mais retweets que a sua contraparte. Outra observação interessante é que a proporção de usuários/retweets contrários e favoráveis variava muito a cada semana.



MEMBROS DA BANCA:
Presidente - Interno ao Programa - 2976815 - DENISE HIDEKO GOYA
Membro Titular - Examinador(a) Externo ao Programa - 1545036 - CLAUDIO LUIS DE CAMARGO PENTEADO
Membro Titular - Examinador(a) Externo ao Programa - 1849928 - CARLOS DA SILVA DOS SANTOS
Membro Suplente - Examinador(a) Externo à Instituição - KARIN BECKER - UFRGS
Membro Suplente - Examinador(a) Externo à Instituição - JULIO CESAR SOARES DOS REIS - UFV
Notícia cadastrada em: 07/11/2022 07:45
SIGAA | UFABC - Núcleo de Tecnologia da Informação - ||||| | Copyright © 2006-2024 - UFRN - sigaa-1.ufabc.int.br.sigaa-1-prod