Identificação de Cliques em Redes de Colaboração Científica: um algoritmo baseado em grafos cordais
O presente trabalho propõe um algoritmo para identificar cliques em redes de colaboração científica baseado em grafos cordais, em que os vértices são representados pelos coautores, as arestas pela coautoria e o peso de cada aresta é a quantidade de publicações existentes para cada par de vértices. Enumerar todas as possíveis combinações de um pesquisador em uma rede de coautoria, é um problema difícil, à medida que aumenta o tamanho do grupo de coautores e a quantidade de coautores com quem esse pesquisador publicou ao longo de sua vida acadêmica. O algoritmo proposto visa identificar todas as cliques de coautores relevantes, ou seja, que publicaram juntos pelo menos uma vez e sem duplicidade de cliques, permitindo analisar o comportamento das colaborações em coautoria centradas em indivíduos e também a hierarquia da colaboração acadêmica. Uma das possíveis aplicações do algoritmo e que foi abordada nesse trabalho, é mensurar a longevidade (tempo) e o tamanho da coautoria (número de coautores), possibilitando a análise dos caminhares dos pesquisadores.
Realizamos experimentos utilizando a base DBLP e os resultados obtidos revelam que grupos menores têm longevidade maior quando comparados aos grupos maiores, para todos os tipos de publicações. Utilizamos duas medidas para o cálculo da longevidade: (1) considerando a diferença do ano da última publicação e o ano da primeira publicação; e, (2) considerando apenas a quantidade de anos em que houveram as publicações. Nenhum grupo com mais de 13 coautores publicaram juntos por mais de 10 anos. O maior tamanho de grupo é de 449 coautores e ocorreu uma única vez, para uma publicação em periódico e a maior longevidade é de um grupo de dois coautores, com 55 anos e 41 anos, para os cálculos da longevidade (1) e (2), respectivamente.
Em relação à hierarquia das cliques, para os casos observados prevaleceu que cliques do coração foram influenciadoras das cliques filhas, pois tiveram a primeira publicação antes. Em relação às cliques do coração com maior quantidade de cliques relevantes, o cenário é de que cliques do coração são consequências da colaboração em coautoria, ou seja, grupos maiores de coautores que ao longo do tempo foram diminuindo originando novos grupos de coautores menores.
Este trabalho contribui (i) com um algoritmo inédito que permite analisar o comportamento dos pesquisadores ao longo do tempo; e (ii) a caracterização inédita dos caminhares (em função da longevidade e tamanho), permitindo observar o atuar de cada pesquisador não de forma isolada/independente, mas de forma grupal/dependente da interação colaborativa e social, como a ciência é percebida nos dias de hoje.