Organisation des partitions

Depuis le 25 juillet 2022, une nouvelle organisation des partitions a intervenu dans EXPLOR. La nouvelle organisation est représentée ci-dessous:

Screenshot1

Attention

L’allocation générale dans la partition inclut désormais les nœuds de l’ancienne partition freeXXX. Si vous ne sélectionnez aucun nœud spécial, il est possible que votre JOB soit terminé en raison de la priorité des JOBS dans les nœuds MyXXX. Pour éviter cette situation, envisagez de sélectionner les nœuds appropriés en excluant les nœuds privés. Pour savoir comment procéder, veuillez vérifier les informations dans l’élément (4.3 et 5).


Tableau des associations

Partition Hostname # noeuds #CPU Mémoire (Gb) FEATURE
debug cna[01] 1 64 118

BROADWELL,OPA,INTEL

std cna[02...64] 55 32 118

BROADWELL,OPA,INTEL

std cnb[01...62] 35 32 118

BROADWELL,OPA,INTEL

std cnc[01...64] 59 32 182

SKYLAKE,OPA,INTEL

std cnd[01...12] 11 16 54

IVY,IB,INTEL

std cne[01...16] 16 8 118

BROADWELL,INTEL,HF

std cnf[01...08] 7 8 86

SKYLAKE,OPA,INTEL,HF

std cng[01...12] 9 40 182

CASCADELAKE,OPA,INTEL

std cnh[01...02] 2 8 758

CASCADELAKE,OPA,INTEL,HF

std cni[01...16] 16 40 354

CASCADELAKE,IB,INTEL

std cni[16...32] 16 40 182

CASCADELAKE,IB,INTEL

std cnj[01...64] 64 48 246

EPYC3,IB,AMD

std cnk[01...08] 8 8 182

CASCADELAKE,IB,INTEL,HF

std cnl[01...04] 4 24 241

EPYC4,IB,AMD

std cnl[05...18] 14 32 500

EPYC4,IB,AMD

gpu gpb[01...06] 6 32 118

BROADWELL,OPA,P1000,INTEL

gpu gpc[01...04] 4 32 54

BROADWELL,OPA,GTX1080TI,INTEL

gpu gpd[01...03] 3 24 86

CASCADELAKE,OPA,T4,INTEL

gpu gpe[01...02] 2 40 182

CASCADELAKE,IB,RTX6000,INTEL

gpu gpf[01] 1 32 118

CASCADELAKE,L40,INTEL

myXXX --- -- -- -- --

Tableau des associations myXXX

Partition Hostname # noeuds #CPU Mémoire (Gb) Preemption
mysky cnc[53-64] 12 32 182 Oui
myhf cnf[01-07] 7 8 86 Oui
mycas cng[01-02,04-05,07-12] 9 40 182 Oui
mylhf cnh[01-02] 2 8 758 Oui
mylemta cni[01-16] 16 40 354 Oui
mystdcas cni[16-24,29-32] 8 40 182 Oui
mystdepyc cnj[01-64] 64 48 246 Non
myhfcas cnk[01-08] 8 8 182 Oui
mylpct cnl[02-04] 3 24 241 Oui
mygeo cnl[05-18] 14 32 500 Non
myt4 gpd[01-03] 3 24 86 Oui
myrtx6000 gpe[01-02] 2 40 182 Oui
mylpctgpu gpf[01] 1 32 118 Oui

Note

Les hostname des noueds cnXX correspondent aux CPU et gpXX aux GPU.

Les instructions de soumission

(1) Toutes les soumissions doivent contenir toujours

#SBATCH --account=MY_GROUP

ou

#SBATCH -A MY_GROUP


(1.1) Information spéciale – Soumission MyXXX avec une association de projet différente

Pour utiliser une association de projet différente pour ceux qui ont de nombreux projets, veuillez supprimer de votre script l’option #SBATCH -A/--account et ajouter à l’extérieur avec la ligne de commande.

%sbatch --account MY_GROUP my_subm_scrit.slurm

ou

%sbatch -A MY_GROUP my_subm_scrit.slurm

MY_GROUP: devrait être votre identifiant de projet, vous pouvez le vérifier dans l’invite de votre terminal

[<utilisateur>@vm-<MY_GROUP> ~]


(2) En général, les cas où vous n’êtes pas obligé d’avoir une machine spéciale

Attention

L’allocation générale dans la partition inclut désormais les nœuds de l’ancienne partition freeXXX. Si vous ne sélectionnez aucun nœud spécial, il est possible que votre JOB soit terminé en raison de la priorité des JOBS dans les nœuds MyXXX. Pour éviter cette situation, envisagez de sélectionner les nœuds appropriés en excluant les nœuds privés. Pour savoir comment procéder, veuillez vérifier les informations dans l’élément (4).

Important

Les partitions privés MyXXX non preemptables sont: mystdepyc (cnj[01-64]) et mygeo(cnl[05-18]).

(2.1) tout type des machines dans std

#SBATCH --account=MY_GROUP

#SBATCH --partition=std

#SBATCH --job-name=Test

#SBATCH --nodes=1

#SBATCH --ntasks=4

ou

#SBATCH -A MY_GROUP

#SBATCH -p std

#SBATCH -J Test

#SBATCH -N 1

#SBATCH -n 4


(2.2) tout type des machines dans gpu

#SBATCH --account=MY_GROUP

#SBATCH --partition=gpu

#SBATCH --job-name=Test

#SBATCH --nodes=1

#SBATCH --ntasks=1

#SBATCH --gres=gpu:2

ou

#SBATCH -A MY_GROUP

#SBATCH -p gpu

#SBATCH -J Test

#SBATCH -N 1

#SBATCH -n 1

#SBATCH --gres=gpu:2


(3) Matériel Hébergé – continue comme avant

Les partitions mystdcasXXX seront désormais accessibles par une seule partition mystdcas

(mystdcaslemta, mystdcasijl, mystdcascrm2) ==> mystdcas

#SBATCH --account=MY_GROUP

#SBATCH --partition=mycas

#SBATCH --job-name=Test

#SBATCH --nodes=1

#SBATCH --ntasks=4

ou

#SBATCH -A MY_GROUP

#SBATCH -p mycas

#SBATCH -J Test

#SBATCH -N 1

#SBATCH -n 4


(4) Sélection précise des nœuds

La sélection des nœuds spécifiques se fait à travers les caractéristiques (FEATURES) présentées dans le tableau d’association ci-dessus. Voir les exemples ci-dessous:

#SBATCH --constraint=SOMETHING_FROM_FEATURES


(4.1) Sélection de nœuds de l’ancienne partition sky

#SBATCH --account=MY_GROUP

#SBATCH --partition=std

#SBATCH --constraint=SKYLAKE,OPA,INTEL

#SBATCH --job-name=Test

#SBATCH --nodes=1

#SBATCH --ntasks=4

ou

#SBATCH -A MY_GROUP

#SBATCH -p std

#SBATCH -C SKYLAKE,OPA,INTEL

#SBATCH -J Test

#SBATCH -N 1

#SBATCH -n 4


Screenshot3

(4.2) Sélection de nœuds de l’ancienne partition

#SBATCH --account=MY_GROUP

#SBATCH --partition=gpu

#SBATCH --constraint=BROADWELL,OPA,P100,INTEL

#SBATCH --job-name=Test

#SBATCH --nodes=1

#SBATCH --ntasks=1

#SBATCH --gres=gpu:2

ou

#SBATCH -A MY_GROUP

#SBATCH -p gpu

#SBATCH -C BROADWELL,OPA,P100,INTEL

#SBATCH -J Test

#SBATCH -N 1

#SBATCH -n 1

#SBATCH --gres=gpu:2


Screenshot4

(4.3) Suppression de tous les nœuds de l’ancien freeXXX/MyXXX machines et en sélectionnant tous les autres anciens nœuds (std, sky, ivy, hf)

#SBATCH --account=MY_GROUP

#SBATCH --partition=std

#SBATCH --constraint=NOPREEMPT

#SBATCH --job-name=Test

#SBATCH --nodes=1

#SBATCH --ntasks=4

ou

#SBATCH -A MY_GROUP

#SBATCH -p std

#SBATCH -C NOPREEMPT

#SBATCH -J Test

#SBATCH -N 1

#SBATCH -n 4

Screenshot5

(5) Restart/Requeue preempted JOBS

Ce n’est pas une fonctionnalité pour les JOBS qui se terminent par une erreur. Il s’agit d’une fonctionnalité pour les JOBS qui peut avoir été supprimée de l’exécution par la règle . Si vous souhaitez soumettre à toutes les machines de la partition STD, même si sur certaines machines votre JOB peut être supprimé pour donner la préférence à un autre avec une priorité plus élevée, il est possible d’utiliser la fonctionnalité de remise du JOB dans la file d’attente (--requeue)

#SBATCH --account=MY_GROUP

#SBATCH --partition=std

#SBATCH --requeue

#SBATCH --job-name=Test

#SBATCH --nodes=1

#SBATCH --ntasks=4