Alinhamento Cultural de LLMs no Contexto Brasileiro: Análise Comparativa entre Modelos Nacionais e Internacionais
Este trabalho traz uma abordagem de metrificação de alinhamento cultural dos grandes modelos de linguagem (LLMs, do inglês Large Language Models) no contexto português brasileiro. O estudo realiza uma análise comparativa entre diversos modelos de LLMs especializados em português brasileiro e os LLMs mais conhecidos e utilizados, treinados majoritariamente com textos em língua inglesa. Para isso, são utilizadas as seis dimensões culturais do modelo de Hofstede, aplicando 24 perguntas para os modelos e solicitando que eles criassem uma persona brasileira corporativa para responder às perguntas, de modo que fosse possível comparar as respostas do modelo com as de uma pessoa real. A avaliação foi baseada em métricas como o RMSE e a distância euclidiana. Os resultados mostram que, apesar da disparidade entre os investimentos e a capacidade computacional, o Sabiá 3.1 trouxe resultados mais próximos com os valores culturais brasileiros, sendo um forte indicativo de que o uso de dados locais pode favorecer o alinhamento cultural em LLMs.