Skip to main content

Gestion de travaux avec Slurm

Sur pratiquement tous les supercalculateurs les calculs s'effectuent par l'intermédiaire d'un gestionnaire de travaux qui gère une file d'attente de travaux et les ressources disponibles.

Le gestionnaire de travaux installé sur toutes les machines MesoNET est Slurm.

caution

Rappel : Il est strictement interdit de calculer directement sur les nœuds login!

Au lieu d'exécuter directement son programme, l'utilisateur soumet donc des scripts à Slurm. Ces scripts spécifient les ressources demandées - quel(s) machine(s) pour combien de temps? - et les commandes à exécuter sur la (les) machine(s) allouée(s).

Il est donc très important que les ressources demandées soient adéquates pour le code à executer.

Slurm fournit une vingtaine de commandes, des fichiers de configuration et des gestionnaires de services. Heureusement, il suffit de connaître un petit nombre de commandes et d'options pour la plupart des cas d'utilisation. Ce document fournit les éléments nécessaires pour écrire et soumettre des scripts Slurm adaptés à vos besoins et pour surveiller et gérer vos travaux.

info

Chaque machine MesoNET est configurée différemment. Il se peut que le comportement de certaines commandes décrites ici soit différent sur la machine que vous utilisez. L'objectif de ce document est de fournir une introduction générale à Slurm.

Une cheat sheet Slurm est disponible ici (pdf, 2 pages).