Reclassificação de poses de docking proteína-ligante utilizando gGaph neural networks com mapa de contato proteína-ligante.
O processo de identificação de novas moléculas ou compostos que possam ser utilizados como fármacos para o tratamento de doenças é conhecido como Drug discovery. Esse processo pode envolver várias etapas, incluindo a identificação de alvos terapêuticos, triagem de compostos, otimização de moléculas e testes pré-clínicos. A pesquisa na área do docking proteína-ligante, explora possíveis posições de ligação do ligante em um alvo molecular específico e também tenta predizer a afinidade dessa ligação. Os softwares de acoplamento molecular, por mais eficazes que sejam, apresentam consideráveis limitações como: falta de confiança na capacidade das funções de pontuação de fornecerem energias de ligação precisas. Isso decorre do fato de que alguns termos de interação intermolecular são dificilmente previstos com precisão, como por exemplo o efeito de solvatação e a mudança de entropia. Além disso, algumas interações intermoleculares raramente são consideradas nas funções de pontuação, apesar de terem sido comprovadas como significativas. A contribuição principal esperada deste projeto de mestrado é desenvolver uma ferramenta para reclassificar poses de docking geradas por ferramentas de docking. Até o momento, construímos um conjunto de 284 complexos proteína-ligante extraído do PDBbind e realizamos cálculos de docking, usando AutoDock Vina. Em seguida, selecionamos as dez primeiras poses de cada uma e realizamos a análise de contato com o software BINANA. Utilizando as informações de contato, a representação dos complexos proteína-ligante é realizada de forma que sejam excluídos os átomos de proteína cuja distância mínima aos átomos do ligante seja superior a 4 Å. Cada pose e seu receptor são mapeados como um mapa de contato e depois transformados em um grafo bipartido com descritores que são rotulados como classe positiva ou negativa de acordo com uma combinação de RMSD e contatos nativos. O modelo de redes neurais utilizado foi Graph Attention Neural Network. Essa qualificação apresenta a implementação do modelo até o momento e os resultados parciais.