PPGCCM PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO FUNDAÇÃO UNIVERSIDADE FEDERAL DO ABC Telefone/Ramal: 11 4996-8337 http://propg.ufabc.edu.br/ppgccm

Banca de QUALIFICAÇÃO: PEDRO HENRIQUE PARREIRA

Uma banca de QUALIFICAÇÃO de DOUTORADO foi cadastrada pelo programa.
DISCENTE : PEDRO HENRIQUE PARREIRA
DATA : 30/11/2022
HORA: 14:00
LOCAL: meet.google.com/hzd-nhqj-oxw
TÍTULO:

Classificação em fluxo de dados sob latência intermediária


PÁGINAS: 65
RESUMO:

Os avanços tecnológicos das últimas décadas popularizaram diversos dispositivos que são capazes de gerar dados de forma contínua. Os celulares, por exemplo, são dispositivos capazes de coletar e transmitir dados ao longo do tempo e que se tornaram acessíveis para o grande público. Um dos resultados obtidos por esses avanços tecnológicos foi o enorme incremento na geração de dados. Este cenário favoreceu o aumento do número de fluxos de dados existentes. Os fluxos de dados são caracterizados pela contínua chegada de dados, em massiva quantidade e em alta taxa de chegada desses dados. Existe um fenômeno que pode ocorrer ao longo de um fluxo de dados que é caracterizada pela mudança na distribuição dos dados. Este fenômeno é denominado de \emph{mudança de conceito} e é bastante presente em aplicações reais de fluxo de dados. Por exemplo, os hábitos de compra de um determinado consumidor podem mudar ao longo do tempo por diferentes motivos. Estas características presentes nos fluxos de dados são bastante desafiadoras para os algoritmos tradicionais de aprendizagem de máquina, os quais normalmente assumem que os dados estão acessíveis a qualquer momento e que estão em um ambiente estacionário. Estes desafios impulsionaram o aumento no interesse por mineração de fluxo de dados, incluindo o desenvolvimento de algoritmos de classificação para fluxo de dados. Alguns destes algoritmos de classificação para fluxo de dados possuem mecanismos internos para lidar com a \emph{mudança de conceito}. Estes algoritmos de classificação para fluxo de dados foram exaustivamente avaliados pela comunidade com diversos conjuntos de dados reais e artificiais. Todavia, a maior parte destas avaliações assumem que os rótulos das instâncias são disponibilizados de maneira imediata após a predição, isto é, sem qualquer atraso. Este cenário é denominado de \emph{latência nula}, e é bastante otimista na maior parte das aplicações reais de fluxo de dados. Em diversas aplicações reais de fluxo de dados existe um intervalo de tempo entre a disponibilização da instância e do seu respectivo rótulo. Por exemplo, no problema de predizer se irá chover na próxima semana. Neste caso, o rótulo verdadeiro, ou seja, se choveu de fato ou não, só será disponibilizado no fim da próxima semana. Este cenário, em que existe um intervalo de tempo entre a disponibilização da instância e do seu respectivo rótulo, é denominado de \emph{latência intermediária}. A grande maioria dos algoritmos de classificação existentes para fluxos de dados assumem o cenário de \emph{latência nula}. No cenário de \emph{latência nula}, diante da ocorrência do fenômeno de \emph{mudança de conceito}, os algoritmos de classificação para fluxos de dados terão acesso imediato às instâncias e aos seus respectivos rótulos para se adaptarem. Deste modo, os algoritmos de classificação existentes para fluxos de dados são capazes de restaurarem seu poder preditivo diante da ocorrência do fenômeno de \emph{mudança de conceito} considerando o cenário de \emph{latência nula}. Todavia, o desempenho preditivo de tais algoritmos de classificação é bastante reduzido quando é considerado o cenário de \emph{latência intermediária}. Apesar de ser bastante comum em aplicações reais de fluxos de dados, existem ainda poucos trabalhos em fluxos de dados que consideram o cenário de \emph{latência intermediária}. Diante de tais desafios, esta tese propõe o desenvolvimento de algoritmos de classificação para fluxos de dados que considerem o cenário de \emph{latência intermediária}. É esperado que os algoritmos de classificação propostos obtenham desempenho preditivo superiores aos algoritmos de classificação existentes para o cenário de \emph{latência intermediária}.


MEMBROS DA BANCA:
Presidente - Interno ao Programa - 1673092 - RONALDO CRISTIANO PRATI
Membro Titular - Examinador(a) Interno ao Programa - 3008222 - PAULO HENRIQUE PISANI
Membro Titular - Examinador(a) Externo à Instituição - VINICIUS MOURÃO ALVES DE SOUZA - PUCPR
Membro Suplente - Examinador(a) Interno ao Programa - 1722875 - DAVID CORREA MARTINS JUNIOR
Notícia cadastrada em: 20/10/2022 16:39
SIGAA | UFABC - Núcleo de Tecnologia da Informação - ||||| | Copyright © 2006-2024 - UFRN - sigaa-1.ufabc.int.br.sigaa-1-prod