A comparative study of sign language recognition methods
Línguas de sinais utilizam de movimentos de mão e braços em combinação com expressões faciais e posturas corporais para transmitir idéias. Esta forma de comunicação é a principal utilizada por pessoas com deficiência auditiva em suas comunicadades, porém, grande parte da sociedade não compreende esse tipo de comunicação. Devido à essa falta de comunicação, pessoas com deficiência auditiva têm dificuldade de alcançar uma educação superior e fazer parte da força de trabalho especializada. No campo da ciência da computação, abordagens anteriores tratam reconhecimento de línguas de sinais como um problema de classificação de imagens ou de classificação de sequências. Entretanto, esses estudos propõe uma solução limitada pra o problema de entender e traduzir línguas de sinais. Para integrar tais sistemas efetivamente na sociedade é necessaŕio que existam abordagem para aquisição dos sinais porque, em um caso de aplicação real, o sistema terá que lidar com diferentes ambientes e condições de iluminação que não estão presentes em imagens processadas usadas na classificação. Neste trabalho, apresentamos um estudo comparativo de aquisição (detecção, rastreio e segmentação) e classificação de imagens de línguas de sinais. Para auxiliar no estudo, criamos uma arquitetura de reconhecimento de línguas de sinais modular e coletamos duas bases de dados: uma contendo vídeos para rastreio de mão e outra contendo 91 configurações da Lingua Brasileira de Sinais (LIBRAS). Além disso, nós comparamos os métodos das diferentes tarefas da arquitetura utilizando mais de 10 outras bases de dados disponíveis gratuitamente. Nossos experimentos mostram que a tarefa de aqusição de imagens de língua de sinais processadas em diferentes ambientes é muito mais complexa do que a tarefa de classificação e dependendo do ambiente no qual o sistema for aplicado, a acquisição pode ser realizada com métodos simples. Este estudo pode contribuir para uma percepção útil do campo e métodos para futuras pesquisas na área. As bases de dados coletadas preenchem uma lacuna no campo e podem ser utilizadas para testes de novos algoritmos. Além disso, a arquitetura proposta acelera a prototipação e testes de novos sistemas.