Estudo Sobre o Uso de Redes Generativas Adversárias para Transformação de Contornos em Imagens e Síntese de Imagens
As áreas de processamento de imagens, computação gráfica e visão computacional recentemente viram avanços significativos em diversas aplicações, muitos dos quais se devem a técnicas baseadas em Redes Adversárias Generativas (Generative Adversarial Networks - GANs). Dentre essas aplicações, podemos ressaltar a super-resolução, transformação de domínio, transferência de estilo, restauração de fotos, e síntese de imagens, dentre outras. Neste trabalho estudamos o uso de GANs em aplicações de transformações de contornos em imagens e síntese de imagens de faces. A primeira aplicação envolve transformar esboços de carros em imagens realistas, e esboços de personagens de desenho em uma versão colorida e texturizada. Analisamos e discutimos o uso das arquiteturas Pix2Pix e CycleGAN nessa tarefa, experimentando com diferentes configurações de parâmetros como melhorar a imagem sintetizada. Na aplicação de síntese, inspirados por trabalhos de manipulação de imagens, exploramos como gerar imagens sintéticas de faces humanas utilizando GANs condicionais como autoencoders, de forma que gerem vetores latentes que permitam a manipulação das imagens diretamente no espaço latente das características. Testamos diversas combinações de geradores, discriminadores, funções de loss e técnicas de treinamento para entender quais elementos contribuem na melhoria da imagem sintetizada.