Transformadores de Visão para Previsão Densa
Neste estudo, procedeu-se à exploração da aplicação de técnicas avançadas de Inteligência Artificial, enfatizando-se particularmente o uso de Transformadores de Visão (TVs) e redes neurais convolucionais, com o objetivo de incrementar a eficiência dos sistemas destinados à segurança pública e ao monitoramento inteligente. A pesquisa focou-se principalmente na conversão de imagens do espectro RGB para HSV, com a finalidade de otimizar a detecção de indivíduos, objetos e veículos em imagens de baixa resolução. Para tal, foi empregado o extenso banco de dados MIX 6, que abriga aproximadamente 1,4 milhões de imagens e representa um dos maiores acervos disponíveis para o treinamento de estimativas de profundidade monocular. A metodologia proposta passou por um processo de refinamento, que incluiu otimização multiobjetivo e ajuste fino em conjuntos de dados de menor escala. Esta abordagem mostrou-se notavelmente versátil, evidenciando potencial para aplicabilidade em uma diversidade de contextos práticos, desde a supervisão de ambientes urbanos inteligentes até inovações no setor agropecuário, como o monitoramento avançado de culturas e a identificação eficaz de pragas. O estudo enfrentou e superou desafios pertinentes à incorporação de heurísticas específicas pelos TVs e à reconstrução eficiente de representações de características em diversas resoluções. Os resultados obtidos representam uma contribuição significativa para os campos da engenharia elétrica e da inteligência artificial, com implicações diretas na otimização de processos de automação e na ampliação da eficácia dos sistemas de monitoramento voltados à segurança pública, evidenciando a efetividade da conversão de RGB para HSV na melhoria da precisão de detecção em cenários de baixa resolução.