Abordagens Computacionais para Análise de Dados Estruturados em Sistemática Biológica e Biogeografia
As ciências biológicas utilizam grafos acíclicos conectados - ou árvores - para apresentar as relações evolutivas e a história biogeográfica. A base das árvores pode ser evidências genéticas, moleculares, morfológicas, geológicas, comportamentais ou geográficas. Em estudos com grande quantidade de informação , especialmente quando se trata de muitos grupos biológicos diferentes ou de história biogeográfica complexa, o processamento manual de dados torna-se inviável e custoso (em termos de tempo e dinheiro). Além disso, os resultados podem apresentar muitos erros. Os biólogos evolucionistas já têm seus métodos para processar seus dados. No entanto, a aplicação desses métodos manualmente em grandes conjuntos de dados provou não ser prática, o que é um fardo significativo diante de uma maior compreensão dos dados disponíveis. Apesar da disponibilidade de algumas abordagens para processamento de dados estruturados, elas são desatualizadas ou difíceis de usar (como ferramentas computacionais de linha de comando). Esta tese se concentra em entender a própria base da filosofia da ciência da computação no contexto de problemas biológicos e evolutivos, para então, com base nesse entendimento, facilitar o trabalho dos biólogos evolutivos automatizando o fluxo de trabalho que seguem, em vez de alterá-lo. Aqui, apresentamos quatro abordagens computacionais, três das quais estão preocupadas com a construção de uma matriz MRP combinada usando árvores de entrada em formato de parênteses. Essas abordagens são denominadas: "Generating combined MRP-matrices", "Generating Topographic-Units MRP-matrix" e "Generating Combined Areagram MRP-matrix". Enquanto o quarto, denominado "interactive Phylogenetic trees Comparison (iPhyloC)", utiliza a visualização de informações para facilitar a comparação de árvores filogenéticas. Nós encapsulamos todas as abordagens computacionais desta tese em frameworks web-based e de fácil utilização disponíveis gratuitamente. Desenvolvemos as quatro abordagens em estreita colaboração com especialistas do domínio. Os resultados dos testes de todas as abordagens mostram que são confiáveis, fáceis de usar e fornecem resultados corretos. Eles de fato ajudam os biólogos evolutivos a se concentrarem em obter resultados a partir dos dados disponíveis, em vez de gastar tempo processando os dados.