Faceswap como Tecnologia de Língua De Sinais para Tradução Português-Libras
A Língua Brasileira de Sinais (Libras), reconhecida a partir da Lei nº 10.436/02 e regulamentada pelo Decreto nº 5.626/05, constitui o principal marcador cultural e identitário das comunidades surdas. Trata-se de uma língua natural, isto é, surge da interação de um grupo cultural e seus estudos em níveis fonológicos e morfológicos são tão complexos quanto os encontrados nas línguas orais. Atualmente, além da figura dos tradutores e intérpretes de Libras-Português (Tilsp) humanos, ao buscar por soluções no âmbito da tradução automática se recorre, frequentemente, ao uso de avatares como suporte neste contexto, porém, enfrentam desafios relacionados à consistência estética e à fidelidade expressiva. Neste contexto, o objetivo geral desta pesquisa exploratória é investigar o uso de FaceSwap como tecnologia de língua de sinais em contextos Libras-Português, buscando evidenciar seu potencial para articular tradução automática a partir da geração de vídeos com inteligência artificial. Para isso, além de uma revisão sistemática de literatura, esta pesquisa utilizou um conjunto de dados composto por 24 vídeos de participantes surdos e ouvintes. Foram estabelecidos quatro requisitos para a experimentação: (i) uma abordagem trans/interdisciplinar que integre conhecimentos de linguística, tecnologia e educação; (ii) o uso de um dataset específico em Libras; (iii) a aplicação de uma metodologia que dispense anotações textuais intermediárias, ampliando o volume de dados utilizáveis; e (iv) a geração de vídeos com alto grau de fotorrealismo, que preservem a identidade visual e os traços expressivos dos sinalizadores. Os resultados obtidos na prototipação e nos experimentos indicam que o uso do SimSwap permite gerar vídeos sintéticos com fidelidade perceptual adequada, demonstrando o potencial de tal abordagem para apoiar processos tradutórios na área de línguas de sinais. Entre os desafios, destacam-se dificuldades na manipulação de imagens de participantes com barba ou acessórios (por exemplo, óculos), que podem comprometer a integridade visual dos vídeos. Por outro lado, a tecnologia mostrou-se vantajosa ao possibilitar a manutenção da identidade visual, evitando a necessidade de regravações integrais após ajustes pontuais, principalmente quando os participantes apresentam semelhança física. Conclui-se, portanto, que essa tecnologia de língua sinais pode ser utilizada para benefício das comunidades surdas, contribuindo para a garantia do seu direito linguístico.