Banca de QUALIFICAÇÃO: RAPHAEL SOARES COSTA
Uma banca de QUALIFICAÇÃO de MESTRADO foi cadastrada pelo programa.
DISCENTE : RAPHAEL SOARES COSTA
DATA : 15/06/2020
HORA: 14:00
LOCAL: por participação remota
TÍTULO:
Aceleração por Heurística no Aprendizado por Reforço em Multiplos Domínios usando OpenAI Gym
PÁGINAS: 60
RESUMO:
O Aprendizado por Reforço, é uma subcategoria do aprendizado de máquina que vem ganhando cada vez mais destaque na resolução de problemas complexos, quando o agente não tem conhecimento de um domínio. Assim atravês de tentativa e erro o agente, adquiri o conhecimento do problema. E somente com o aprendizado por reforço, pode não atender a necessidade de resolução de um problema complexo, fazendo necessidade de algum complemento para a realização da tarefa. Sendo assim, com o uso de heurística visa acelerar a resolução do problema, propondo a aceleração do aprendizado do agente.
MEMBROS DA BANCA:
Presidente - Interno ao Programa - 2078059 - LUIZ ANTONIO CELIBERTO JUNIOR
Membro Titular - Examinador(a) Interno ao Programa - 1672965 - EDSON PINHEIRO PIMENTEL
Membro Titular - Examinador(a) Externo à Instituição - REINALDO AUGUSTO DA COSTA BIANCHI - FEI
Membro Suplente - Examinador(a) Interno ao Programa - 1762339 - WAGNER TANAKA BOTELHO
Membro Suplente - Examinador(a) Interno ao Programa - 1722875 - DAVID CORREA MARTINS JUNIOR