Neural Autonomous UAV (NAV): Aprendizado por Reforço Profundo para Controle Autônomo de Drones e Evasão de Colisões em Serviços de Entregas Aéreas
Com o avanço das tecnologias 5G e 6G, os drones têm assumido um papel fundamental em diversas áreas, como agricultura, logística, monitoramento e aplicações militares. Essa crescente utilização demanda métodos eficazes para controle desses agentes, evitando colisões em ambientes de alta densidade. Este artigo propõe um modelo de aprendizado por reforço baseado na técnica Proximal Policy Optimization (PPO), denominado Neural Autonomous UAV (NAV), destinado ao controle de voo e à prevenção de colisões em cenários de entrega com alta densidade de drones. A proposta envolve a integraçao de um framework para Machine Learning no simulador 3D FluteSim, ambos baseados na plataforma Unity, para o desenvolvimento do modelo. O desenvolvimento é dividido em duas etapas: (1) treinamento em ambiente controlado com progressão de tarefas seguindo a abordagem de aprendizado curricular, visando otimizar o aprendizado; e (2) inferência em um ambiente de 0,81 km², utilizando distribuição de Poisson para lançamento de drones. O modelo é comparado a métodos geométricos consolidados na literatura e os resultados demonstram que o modelo NAV alcançou uma taxa de colisão de 1.77%, representando uma redução de 75.71% em comparação aos métodos SingleDrone - melhor métodos geométricos analisados. Além do desempenho superior, observa-se que o modelo mantém uma alta capacidade de adaptação em ambientes densos, consolidando-se como uma abordagem promissora para prevenção de colisões em drones. Assim, este trabalho contribui para o avanço das técnicas de Machine Learning aplicadas ao controle autônomo de drones em ambientes urbanos.