Usando Processamento de Linguagem Natural para Extrair Dados sobre Reação de Redução de CO2 a partir da Literatura Científica
Nos últimos 70 anos, as emissões de CO2 na atmosfera terrestre aumentaram drasticamente, elevando
a temperatura do planeta em 1ºC. Modelos climáticos projetam que essa elevação pode ainda atigir
2,1 à 2,5ºC até 2100. Uma alternativa para mitigar esse problema a conversão de dióxido de carbono
em compostos que possam ser utilizados como matéria-prima química e combustíveis, criando um ciclo
fechado de CO2. No entanto, esse processo deve ser mediado por um catalisador que seja estável, seletivo,
ativo e facilmente acessível para ser economicamente viável. É compreensível e desejável, portanto, que o
tema reação de redução de CO2 (CO2RR, do inglês CO2 reduction reaction) venha sendo abordado por
diversos grupos de pesquisa, com mais de 16.000 artigos já publicados. No entanto, toda essa literatura
dificulta uma revisão manual e abrangente de estruturas e métodos utilizados. Baseado nisso, utilizamos
processamento de linguagem natural (NLP, do inglês natural language processing) para analisar os dados
já publicados sobre esse tema na literatura científica. Criamos um código próprio para processar e separar
as frases de acordo com as seções de onde foram extraídas. Com essas amostras, criamos um modelo para
classificar novas frases ou frases não identificadas em "resumo", "introdução", "metodologia", "resultados
e discussão"e "conclusões". Em seguida, usamos o texto limpo para gerar modelos de word embeddings e
avaliamos sua qualidade com base em sua capacidade de agrupar termos comuns na literatura CO2RR.
Finalmente, utilizamos expressões regulares para extrair informações sobre a composição de materiais,
eletrólitos e algumas métricas importantes reportadas na literatura em nosso corpus, a eficiência faradaíca
(FE, do inglês faradaic efficiency) e o potencial aplicado. Descobrimos que Ni é um dos elementos mais
comuns em catalisadores para CO2RR, estando em terceiro lugar junto com Cu e Ag, e encontramos um
liga à base de Cu com uma FE extremamente baixa para metano. Nós planejamos ampliar os dados
coletados, para que possamos criar um banco de dados abrangente que possa ser usado para revisar esse
campo de modo a orientar pesquisas futuras, fornecendo informações sobre materiais e abordagens que
parecem promissoras.