Eu vou configurar e ajustar o gerenciador de carga de trabalho slurm no seu cluster Linux
Sobre este Serviço
Slurm é o padrão da indústria para gerenciadores de carga de trabalho em clusters HPC. Configurá-lo corretamente desde o início evita meses de falhas nos jobs, contenção de recursos e confusão na fila.
Já configurei Slurm em clusters que variam de 4 nós em laboratórios de pesquisa a sistemas nacionais de supercomputação com 600 nós, sob o programa NSM da Índia.
O que entrego:
slurm.conf configurado para seu hardware e carga de trabalho, partições, QOS e configurações de prioridade
aplicação de cgroup para isolamento de memória e CPU
configuração do banco de dados de contabilidade (slurmdbd)
submissão de jobs de teste e verificação
documentação de cada decisão de configuração
Compatível com: Rocky Linux, AlmaLinux, CentOS, Ubuntu
Compatível com: OpenHPC, Warewulf, xCAT, bare metal
Antes de pedir: compartilhe a quantidade de nós, o sistema operacional e quais cargas de trabalho você pretende rodar. Vou confirmar o pacote adequado em até 2 horas.
Servidor:
Outros
Sistema operacional:
Linux

