PPGCCM PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO FUNDAÇÃO UNIVERSIDADE FEDERAL DO ABC Phone: 11 4996-8337 http://propg.ufabc.edu.br/ppgccm

Banca de QUALIFICAÇÃO: RAPHAEL SOARES COSTA

Uma banca de QUALIFICAÇÃO de MESTRADO foi cadastrada pelo programa.
DISCENTE : RAPHAEL SOARES COSTA
DATA : 15/06/2020
HORA: 14:00
LOCAL: por participação remota
TÍTULO:
Heuristic Acceleration in Reinforcement Learning in Multiple Domains using OpenAI Gym

PÁGINAS: 60
GRANDE ÁREA: Ciências Exatas e da Terra
ÁREA: Ciência da Computação
SUBÁREA: Teoria da Computação
ESPECIALIDADE: Computabilidade e Modelos de Computação
RESUMO:

Reinforcement Learning, is a subcategory of machine learning that is gaining more and more prominence in solving complex problems, when the agent is not aware of a domain. So through trial and error the agent, I acquired knowledge of the problem. And only with reinforcement learning, it may not meet the need to solve a complex problem, requiring some complement to perform the task. Therefore, with the use of heuristics, it aims to accelerate the resolution of the problem, proposing the acceleration of agent learning.


MEMBROS DA BANCA:
Presidente - Interno ao Programa - 2078059 - LUIZ ANTONIO CELIBERTO JUNIOR
Membro Titular - Examinador(a) Interno ao Programa - 1672965 - EDSON PINHEIRO PIMENTEL
Membro Titular - Examinador(a) Externo à Instituição - REINALDO AUGUSTO DA COSTA BIANCHI - FEI
Membro Suplente - Examinador(a) Interno ao Programa - 1762339 - WAGNER TANAKA BOTELHO
Membro Suplente - Examinador(a) Interno ao Programa - 1722875 - DAVID CORREA MARTINS JUNIOR
Notícia cadastrada em: 01/06/2020 20:49
SIGAA | UFABC - Núcleo de Tecnologia da Informação - ||||| | Copyright © 2006-2024 - UFRN - sigaa-1.ufabc.int.br.sigaa-1-prod