Aprendizado de máquina como metodologia de estudo em óxidos de alta entropia
Óxidos de alta entropia (HEOs) são uma classe emergente de materiais com diversas aplicações, por exemplo, conversão de energia e tecnologias de armazenamento, que ganharam interesse significativo devido à sua estrutura única, estequiometria complexa e efeito sinérgico relacionado à alta entropia. Apesar do crescente número de estudos relatados relacionados aos HEOs nos últimos anos, ainda faltam explicações contundentes sobre suas propriedades estruturais, atividades eletroquímicas e os efeitos relacionados à alta entropia. No presente trabalho é proposto uma nova metodologia de estudo sobre a formação de fases estáveis de HEOs baseada em aprendizado de máquina. Inicialmente dados de HEOs estáveis de fase única e suas composições foram minerados manualmente da literatura, assim como também alguns testes utilizando “large languague models” (LLMs) estão em andamento. Uma vez coletados os dados brutos a etapa de “feature engineering” foi realizada com base em descritores baseados em propriedades físicas, químicas e termodinâmicas dos átomos e dos óxidos que compõem o sistema; sempre se valendo de um esquema de cinco operações aritméticas para a vetorização. Descritores são uma ferramenta de orientação para descrever a estabilidade de soluções sólidas monofásicas sendo identificado como crucial para prever sistemas recém-projetados com precisão. Ao todo foram geradas mais de 250 “features” que passaram por diferentes métodos de seleção para os modelos treinados, a saber: eliminação de “features” com alta correlação de Pearson, “Permutation Feature Importance” e “Exaustive Features Selection”. Foram treinados quatro modelos de aprendizado de máquina, duas arquiteturas de redes neurais artificiais diretas (“Multi Layer Percepton” e “Extreme Learning Machine”) e duas arquiteturas de árvore de decisão (“Random Forest” e “Gradient Boosting”). Uma vez treinados os modelos, a próxima etapa realizada foi um estudo de análise combinatória de cátions que permitiu reduzir o espaço de combinações possíveis de composições para as previsões dos modelos treinados e também possibilitou um aumento nas chances de êxito, uma vez que se considerou a natureza dos cátions que podem ou não ser fixados em determinados grupos de combinações. A análise combinatória foi também útil no sentido de considerar somente os átomos disponíveis no laboratório. Por fim, um estudo de síntese de materiais com a estrutura cristalina fluorita foi realizado e uma versão adaptada do método de síntese hidrotermal foi executada, mais que isso, a difração de raios X foi utilizada nas amostras sintetizadas para verificar se a fase fluorita prevista pelos modelos foi alcançada. Os resultados teóricos obtidos foram modelos com acurácias próximas de 90% com intervalos de confiança com limite inferior próximos de 75%. Mais que isso, as “features” selecionadas pelos modelos representam de fato grandezas importantes para a estabilização de fases de HEOs conforme a literatura (exemplo: raio atômico, eletronegatividade, entalpia, etc...), conferindo significado físico aos modelos. Em relação à parte experimental, duas composições sugeridas pelos modelos como fluorita foram ineditamente sintetizadas: (Ce,La,Nd,Mg,Zn)O e (Ce,La,Nd,Mg,Al)O. O padrão de difração de raios X confirmou a fase fluorita em ambos os casos. O fato de que essas duas tentativas de síntese por meio dessa metodologia aqui proposta foram as únicas tentativas de síntese executadas e já foram exitosas confere ainda mais credibilidade à proposição central de que o aprendizado de máquina pode embasar estudos em óxidos de alta entropia.