Aprendizagem por Entidade com Aprendizado Profundo por Reforço: Um
Estudo sobre Diferentes Abstrações de Entrada
Aprendizado profundo por reforço é um algoritmo que apresentou soluções
promissoras para vários problemas historicamente exibidos por
aprendizado por reforço. Esses avanços são objeto de diversos estudos
recentes. Eles consideram, por exemplo, a possibilidade de extração
automática de informação relevante a partir do ambiente, e desempenhar
de forma consistente usando dados de maiores dimensões de ambientes
complexos, como entidades presentes nesse ambiente. Para este trabalho,
a plataforma ViZDoom vai ser usada para comparar a eficiência de
aprendizado de distintas propostas de entrada: uma aprendendo a partir
de imagens de entrada cruas e a outra utilizando dados mais
estruturados, identificando entidades na cena. O método do aprendizado
por currículo adotado para treinamento vai aumentar gradualmente a
complexidade do ambiente, validando a performance do algoritmos a cada
etapa. Este trabalho procura contribuir com um estudo comparativo da
eficiência de aprendizado demonstrada pelos agentes quando apresentados
a dados com diferentes níveis de abstração, aprendendo a partir de um
ambiente dinâmico com desafios sempre crescentes em dificuldade.