PPGCCM PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO FUNDAÇÃO UNIVERSIDADE FEDERAL DO ABC Telefone/Ramal: Não informado http://propg.ufabc.edu.br/ppgccm

Banca de QUALIFICAÇÃO: LUCAS KENZO KUROKAWA

Uma banca de QUALIFICAÇÃO de MESTRADO foi cadastrada pelo programa.
DISCENTE : LUCAS KENZO KUROKAWA
DATA : 13/06/2022
HORA: 19:00
LOCAL: Google Meet
TÍTULO:

Supervisão Fraca para Reconhecimento de Entidades Nomeadas em Domínio Jurídico Brasileiro


PÁGINAS: 61
RESUMO:

O uso dos modelos modernos de aprendizado de máquina em aplicações reais é limitado
principalmente pela falta de dados anotados. Esses modelos requerem uma quantidade
considerável de dados anotados, que raramente estão disponíveis. Essa indisponibilidade
ocorre por se tratar de uma tarefa muito específica, onde os dados nunca foram anotados
ou até foram anotados, mas que não podem ser disponibilizados devido ao seu conteúdo.
Assim, o comum é recorrer a anotação manual de dados, que para domínios específicos
demanda um especialista de domínio (Subject-Matter Expert (SME)). Este método consiste
no SME analisar cada dado individualmente e realizar a anotação, o que é um processo
lento e repetitivo. Desta forma, a supervisão fraca tem ganhado relevância como uma
forma de otimizar este processo. Ela consiste no SME criar um conjunto de funções de
rotulagem programáveis que votam em rótulos para cada dado. Esses votos são agregados
por um modelo probabilístico chamado Label Model, gerando a base de dados anotados.
Esta base de dados é utilizada para treinamento de um End Model que executa a tarefa
nas aplicações reais. No caso do domínio jurídico, com o crescimento da digitalização dos
processos, temos muitos dados não anotados disponíveis para serem anotados. Com a
anotação desses dados, viabiliza-se a criação de diversas ferramentas de IA para aplicações
reais, visando a modernização de processos que ainda consistem em trabalhos manuais
repetitivos. Uma ferramenta que foi criada a partir de anotação manual e que já está
disponível é o reconhecedor de entidades nomeadas jurídicas chamado LeNER-Br. Ela
identifica entidades de jurisprudência (menções a outros casos jurídicos) e de legislação
(referências a leis), além de entidades de pessoa, tempo, local e organização. Por fim, a
proposta deste trabalho é verificar que simular a anotação do conjunto de dados LeNER-Br,
com uso da supervisão fraca, nos permite alcançar desempenho competitivo quanto a
F1-score, em comparação com a anotação manual.


MEMBROS DA BANCA:
Presidente - Interno ao Programa - 334.489.048-48 - THIAGO FERREIRA COVOES - NÃO INFORMADO
Membro Titular - Examinador(a) Interno ao Programa - 3008017 - DENIS GUSTAVO FANTINATO
Membro Titular - Examinador(a) Externo à Instituição - NÁDIA FÉLIX FELIPE DA SILVA - UFG
Membro Suplente - Examinador(a) Externo ao Programa - 2364326 - ALEXANDRE DONIZETI ALVES
Membro Suplente - Examinador(a) Externo à Instituição - ANDERSON DA SILVA SOARES - UFG
Notícia cadastrada em: 10/05/2022 21:06
SIGAA | UFABC - Núcleo de Tecnologia da Informação - ||||| | Copyright © 2006-2022 - UFRN - sigaa-1.ufabc.int.br.sigaa-1-prod