PPGCCM PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO FUNDAÇÃO UNIVERSIDADE FEDERAL DO ABC Telefone/Ramal: Não informado http://propg.ufabc.edu.br/ppgccm

Banca de DEFESA: PEDRO HENRIQUE DI FRANCIA ROSSO

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE : PEDRO HENRIQUE DI FRANCIA ROSSO
DATA : 16/07/2021
HORA: 15:00
LOCAL: Online via Google Meet
TÍTULO:

OCFTL: uma biblioteca de tolerância a falhas para MPI independente de implementação


PÁGINAS: 80
RESUMO:

Tolerância a falhas (TF) é uma preocupação comum em ambientes de Computação de Alta Desempenho (CAD). Seria de se esperar que, quando se trata de Message Passing Interface (MPI) (uma ferramenta para CAD de suma importância), TF seria um problema resolvido. Contudo, o cenário para TF e MPI é complexo. Embora TF seja efetivamente uma realidade nesses ambientes, geralmente é “feita à mão”. As poucas exceções disponíveis vinculam os usuários MPI a implementações MPI específicas. Este trabalho propõe OCFTL, uma Biblioteca de TF que não é dependente de nenhuma implementação MPI específica para ser usada no OmpCluster. OCFTL é capaz de detectar falhas com apenas um atraso de 50 ms (com baixa sobrecarga de CPU). Também fornece detecção de falha em caso de falso positivo, reparo do comunicador MPI e pode isolar os usuários do comportamento não especificado de operações MPI na presença de falhas. Resultados experimentais indicam bom potencial para melhorar a confiabilidade do sistema e a execução de fluxos de trabalho científicos.


MEMBROS DA BANCA:
Presidente - Interno ao Programa - 3008052 - EMILIO DE CAMARGO FRANCESQUINI
Membro Titular - Examinador(a) Interno ao Programa - 1676329 - RAPHAEL YOKOINGAWA DE CAMARGO
Membro Titular - Examinador(a) Externo à Instituição - DANIEL DE ANGELIS CORDEIRO - USP
Membro Suplente - Examinador(a) Externo ao Programa - 3009301 - VLADIMIR EMILIANO MOREIRA ROCHA
Membro Suplente - Examinador(a) Externo à Instituição - ALFREDO GOLDMAN VEL LEJBMAN - USP
Notícia cadastrada em: 24/06/2021 17:03
SIGAA | UFABC - Núcleo de Tecnologia da Informação - ||||| | Copyright © 2006-2021 - UFRN - sigaa-1.sigaa-1