Aplicação de Deep Learning para Aprimorar a Avaliação Morfológica de Embriões em Fertilização in vitro
O processo de seleção de embriões na fertilização in vitro é uma etapa determinante para o sucesso do tratamento. Tal processo enfrenta desafios devido a natureza subjetiva da seleção de embriões, que depende de avaliações morfológicas por embriologistas. Essas avaliações muitas vezes sofrem com a variabilidade do observador, impactando a viabilidade do embrião, previsões e sucesso de implantação. Avanços recentes em inteligência artificial, especialmente redes neurais convolucionais, oferecem soluções promissoras para aumentar a objetividade e confiabilidade dessas avaliações. Este estudo propôs o uso de redes neurais convolucionais como base para modelos de classificação, aplicando a técnica de transferência de aprendizado com pesos pré-treinados na base de imagens ImageNet. Foram consideradas as arquiteturas ResNet-50, ResNet-101, ResNet-152V2 e VGG-19 para classificar a viabilidade de embriões no processo de fertilização in vitro, com o objetivo de padronizar o processo de seleção embrionária. Para isso, foram utilizadas imagens fornecidas pela clínica de Medicina Reprodutiva Nilo Frantz no intuito de integrar nas práticas clínicas de fertilização in vitro a utilização de inteligência artificial, que ainda está em seus estágios iniciais. Um total de 755 imagens disponibilizadas foi dividido em conjuntos de treino, validação e teste, nas proporções de 80%, 10% e 10%, respectivamente, aos quais os modelos foram submetidos. A regurlarização L2 (Ridge), aplicada às quatro camadas de classificação, foi testada em três amplitudes (0.001, 0.01 e 0.1). Os resultados demonstraram que, entre as doze configurações treinadas, quatro se destacaram: Modelo 1 (ResNet-50 com L2 = 0.001), Modelo 2 (ResNet-50 com L2 = 0.01), Modelo 4 (ResNet-101 com L2 = 0.001) e Modelo 10 (VGG-19 com L2 = 0.001). Todos os quatro modelos apresentaram AUC-ROC e AUC-PR superiores a 90%, com destaque para os Modelos 1 (98% e 96%) e 4 (96% e 94%). As métricas de Recall, Precisão e Acurácia também foram analisadas, sendo que esses dois modelos obtiveram os melhores resultados, com menor dispersão entre as doze configurações testadas. Reconhece-se, no entanto, que limitações relacionadas ao reduzido tamanho do banco de imagens disponível impactam a capacidade de aprendizagem e generalização dos modelos. Ainda assim, os resultados dessas configurações mostraram-se promissores, inclusive para a personalização de modelos de classificação em cenários com pequenas bases de treinamento em clínicas de fertilização in vitro.