Transformadores de Visão para Previsão Densa: Uma abordagem inovadora em Segurança Pública e Inteligência de Monitoramento
Neste estudo, abordamos a aplicação de técnicas avançadas de Inteligência Artificial, focando em redes neurais convolucionais e Transformadores de Visão (TVs), para aprimorar sistemas de segurança pública e monitoramento inteligente. Investigamos a representação inversa de profundidade e uma nova função de perda de correspondência de gradiente, utilizando o extenso conjunto de metadados MIX 6 com cerca de 1,4 milhões de imagens, um dos maiores compilados para treinamento de estimativa de profundidade monocular. O método proposto foi refinado através de otimização multiobjetivo e ajuste fino em conjuntos menores, destacando sua versatilidade em aplicações práticas que vão desde a monitorização de cidades inteligentes até o agronegócio, onde pode revolucionar o monitoramento de cultivos e identificação de pragas. Enfrentamos os desafios de assimilação de heurísticas específicas pelos TVs e a reconstrução eficiente de representações de características em múltiplas resoluções, contribuindo significativamente para o campo da engenharia elétrica e inteligência artificial, com implicações diretas na automação de processos e no aprimoramento de sistemas de monitoramento para a segurança pública e além.