PPGCCM PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO FUNDAÇÃO UNIVERSIDADE FEDERAL DO ABC Telefone/Ramal: Não informado http://propg.ufabc.edu.br/ppgccm

Banca de DEFESA: DANILO CARASTAN DOS SANTOS

Uma banca de DEFESA de DOUTORADO foi cadastrada pelo programa.
DISCENTE : DANILO CARASTAN DOS SANTOS
DATA : 27/11/2019
HORA: 14:00
LOCAL: Santo André
TÍTULO:
Aprendizagem Sobre Heurísticas Simples para Escalonamento Online de Tarefas Paralelas

PÁGINAS: 101
RESUMO:
As plataformas de Computação de Alto Desempenho (do Inglês High Performance Computing, HPC) estão crescendo em tamanho e complexidade. De uma maneira adversa, a demanda de energia de tais plataformas também cresceu rapidamente, supercomputadores atuais exigem energia na escala de uma usina inteira. Em um esforço para fazer um uso mais responsável de tal poder computacional, pesquisadores estão dedicando uma grande quantidade de esforço para elaborar algoritmos e técnicas para melhorar diferentes aspectos de desempenho, tais como escalonamento e gerenciamento de recursos. Contudo, mantenedores de plataformas HPC ainda relutam em implementar métodos de estado-da-arte e a maioria deles revertem para heurísticas simples, como a EASY Backfilling, que é baseada em um ordenamento ingênuo First-Come-First-Served (FCFS). Os métodos mais recentes são muitas vezes complexos e obscuros e a simplicidade e a transparência da EASY Backfilling são importantes demais para serem sacrificadas.
 
Em um primeiro momento, exploramos técnicas de Aprendizado de Máquina (do Inglês Machine Learning, ML) para aprender heurísticas de escalonamento on-line de tarefas paralelas. Usando simulações e um modelo de geração de workload, conseguimos determinar as características de aplicações HPC (tarefas) que levam a uma redução no slowdown médio de tarefas em uma fila de execução. Modelando essas características usando uma função não linear e aplicando essa função para selecionar a próxima tarefa em uma fila de execução melhorou o slowdown médio das tarefas de workloads sintéticos. Quando aplicadas em traces de execução reais de plataformas HPC altamente distintas, essas funções continuaram a resultar em melhorias de desempenho, atestando a capacidade de generalização das heurísticas obtidas.
 
Em um segundo momento, usando simulações e traces de execução de plataformas HPC reais, realizamos uma análise completa dos resultados acumulados de quatro heurísticas de escalonamento simples (incluindo a EASY Backfilling). Também avaliamos outros efeitos, como a relação entre o tamanho das tarefas e o slowdown, a distribuição de valores de slowdown e o número de tarefas escalonados por meio de backfilling, para cada plataforma HPC e heurística de escalonamento. Mostramos evidências experimentais de que só podemos ganhar substituindo a EASY Backfilling pela política Smallest estimated Area First (SAF) com backfilling, pois ela oferece melhorias no desempenho em até 80% na métrica de slowdown, mantendo a simplicidade e a transparência da EASY Backfilling. SAF reduz o número de tarefas com valores de slowdown muito grandes e, com a inclusão de um mecanismo de limiar simples, garantimos que não ocorra inanição de tarefas.
 
No geral, obtivemos as seguintes observações: (i) heurísticas de escalonamento simples e eficientes na forma de uma função não-linear das características das tarefas podem ser aprendidas automaticamente, embora seja subjetivo concluir sobre se o raciocínio por trás das decisões de escalonamento dessas heurísticas é claro ou não. (ii) A área (tempo estimado de processamento multiplicado pelo número de processadores) das tarefas parece ser uma propriedade bastante importante para boas heurísticas de escalonamento de tarefas paralelas, uma vez que muitas das heurísticas (notadamente a SAF) que alcançaram bons desempenhos têm a área da tarefa como entrada. (iii) O mecanismo de backfilling parece sempre ajudar no aumento do desempenho, embora não supere uma melhor ordenação da fila de espera das tarefas, como a ordenação realizada pela SAF.

MEMBROS DA BANCA:
Membro Titular - Examinador(a) Interno ao Programa - 1676329 - RAPHAEL YOKOINGAWA DE CAMARGO
Membro Titular - Examinador(a) Externo à Instituição - SARITA MAZZINI BRUSCHI - USP
Membro Titular - Examinador(a) Externo à Instituição - DENIS TRYSTAM
Presidente - Externo à Instituição - ALFREDO GOLDMAN VEL LEJBMAN - USP
Membro Suplente - Examinador(a) Externo à Instituição - MARTIN SCHULZ
Membro Suplente - Examinador(a) Externo à Instituição - ÉRIC GAUSSIER
Notícia cadastrada em: 11/10/2019 07:54
SIGAA | UFABC - Núcleo de Tecnologia da Informação - ||||| | Copyright © 2006-2021 - UFRN - sigaa-2.sigaa-2