PPGCCM PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO FUNDAÇÃO UNIVERSIDADE FEDERAL DO ABC Telefone/Ramal: 11 4996-8337 http://propg.ufabc.edu.br/ppgccm

Banca de DEFESA: RAFAEL DI CESARE GIANNELLA

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE : RAFAEL DI CESARE GIANNELLA
DATA : 09/12/2019
HORA: 14:00
LOCAL: sala 301, 3º andar, Bloco B, Campus SA da Fundação Universidade Federal do ABC, localizada na Avenida dos Estados, 5001, Santa Terezinha, Santo André, SP
TÍTULO:

Avaliação de Algoritmos Fonéticos para Melhoria de Busca em Texto de Mídias Sociais


PÁGINAS: 90
RESUMO:

A recente disseminação de redes sociais mudou radicalmente o uso que as pessoas fazem da Internet. Essas ferramentas permitem que você escreva e divulgue informações de maneira simples e imediata. Textos de mídia social têm várias propriedades que os tornam diferentes dos textos tradicionais, devido à natureza das conversas em redes sociais, postadas em tempo real. Os textos não são estruturados e são apresentados em vários formatos e escritos por pessoas diferentes em muitos idiomas e estilos. Além disso, os erros de digitação e as gírias de bate-papo se tornaram cada vez mais comuns em sites de redes sociais como o Facebook e o Twitter.

Nesse ambiente dinâmico e veloz, não é raro que muitas mensagens apresentem problemas de digitação. Os textos incorretos muitas vezes não prejudicam a comunicação entre os interlocutores, pois possíveis erros podem ser rapidamente corrigidos posteriormente e os termos incorretos normalmente possuem alguma similaridade fonética que permite superar essas falhas. Apesar de não interferir de forma decisiva nos diálogos, quando se usa dos dados do Twitter para realização de análises de mídias sociais, os termos incorretamente grafados podem reduzir a quantidade de registros obtidos por algoritmos clássicos de busca. Esse cenário tende a diminuir o volume do banco de dados usado para análise e, consequentemente, diminuir o índice de precisão dos estudos realizados.

Um algoritmo fonético é um algoritmo de busca por similaridade que transforma uma palavra de entrada em um código fonético que indica aproximadamente a maneira como o termo é pronunciado em um idioma particular. Dessa forma, algoritmos fonéticos podem ter papel importante na melhora da busca de palavras em dados não estruturados e ruidosos, como os provenientes de redes sociais.


Neste trabalho estudamos o impacto da utilização de algoritmos fonéticos
em operações de busca em bancos de dados textuais não-estruturados e de grande volume, provenientes de mídias sociais. Também propomos métodos de avaliação considerando variações de algoritmos fonéticos e outras categorias de algoritmos por busca de similaridade de texto.


MEMBROS DA BANCA:
Presidente - Interno ao Programa - 1675532 - MARCIO KATSUMI OIKAWA
Membro Titular - Examinador(a) Externo ao Programa - 1811648 - JOAO MARCELO BOROVINA JOSKO
Membro Titular - Examinador(a) Externo à Instituição - LUCIANO VIEIRA DE ARAUJO - USP
Membro Suplente - Examinador(a) Interno ao Programa - 2376122 - THIAGO FERREIRA COVOES
Membro Suplente - Examinador(a) Externo ao Programa - 1849928 - CARLOS DA SILVA DOS SANTOS
Notícia cadastrada em: 13/11/2019 16:31
SIGAA | UFABC - Núcleo de Tecnologia da Informação - ||||| | Copyright © 2006-2024 - UFRN - sigaa-1.ufabc.int.br.sigaa-1-prod