Questions Fréquentes (FAQ)
Général
En mentionnant l’utilisation d’EXPLOR dans vos communications :
* Les ressources en calcul ont été fournies en partie par le Mésocentre EXPLOR hébergé par l’Université de Lorraine *
* High Performance Computing resources were partially provided by the EXPLOR centre hosted by the Université of Lorraine *
En envoyant une information à explor-contact@univ-lorraine.fr.
Connexion
Vous pouvez vous connecter à votre compte utilisateur EXPLOR en utilisant SSH ou X2GO (-ssh; -x2go)
En cas de problème de connexion, merci d’adresser un mail décrivant votre problème à explor-support@univ-lorraine.fr.
X2Go est un logiciel qui permet d'accéder à distance à votre frontale d'accès EXPLOR de manière graphique (bureau) via une connexion ssh. Il est disponible en tant que client sous Windows, Linux et MacOS. Pour plus d'informations, vous pouvez vous réferrer au site http://wiki.x2go.org/doku.php/download:start.
Il existe deux possibilités pour transférer vos données. Elles sont détaillées sur la page suivante
vm-XXX ?Afin de garantir la confidentialité des utilisateurs, serveurs virtuels, projets et ressources, les comptes utilisateurs et les projets ont été anonymisés.
Depuis votre environnement de travail (frontale d'accès), vous avez accès à internet. Par contre, les nœuds de calcul ne peuvent communiquer avec l'extérieur d'EXPLOR.
Chaque projet dispose de son environnement propre (et anonymisé), accessible via une machine virtuelle dédiée (frontale d'accès). Les paramètres de connexion sont donc différents pour chaque projet.
Les procédures relatives au transfert de données entre deux projets sont expliquées à la page suivante.
Un mode opératoire vous sera adressé à l'installation de vos serveurs qui vous expliquera comment accéder à vos serveurs sous SLURM.
Utilisation des ressources
Depuis votre environnement, vous pourrez utiliser le gestionnaire de travaux SLURM pour soumettre vos travaux. Merci de consulter la documentation mis à votre disposition à Exemple de scripts de soumission.
Par une réservation du nœud à travers la commande salloc Par exemple, si vous voulez demander un nœud de la partition std pendant 1 heure taper : salloc -N1 -p std -t 1 : 00 : 00 srun –pty bash
En fonction du type de travaux et de vos besoins en ressources (CPU, mémoire, GPU, etc), vous serez amené à préférer une partition ou une autre. L'ensemble des partitions est décrit à la page: Tableau des associations.
De manière générale :
- les noeuds de l'ancien partition hf (cne[01-16]) sont réservés aux travaux séquentielles ou peu parallèles (1 à 8 cœurs maximum).
- les partitions gpu sont adaptés aux travaux nécessitant des GPUs.
En cas de doute, vous pouvez envoyer un mail au support à l’adresse explor-support@univ-lorraine.fr.
Le temps de calcul maximal qui peut vous être alloué dépend de la partition et du nombre de nœuds que vous choississez.
Voir Ressources de calcul disponibles.
Nous vous conseillons de spécifier au mieux votre demande afin de permettre au gestionnaire SLURM d'optimiser l'utilisation des ressources.
La commande squeue va vous donner le statut de votre job (dernière colonne « REASON »). Votre job en attente peut être en statut :
- Ressources : votre job va bientôt démarrer, SLURM est en train de réserver la ressource nécessaire à son exécution
- Priority : un ou plusieurs autres job sont avant vous dans la file d'attente
- QOSGrpJobsLimit : des limites sont associés à chaque partition, projet ou utilisateur en fonction des ressources demandées.
Ces limites sont définies à Limitations en durée et en ressources d'un job.
Votre job changera de statut lorsque ces limites ne seront plus atteintes.
L'option --start de la commande squeue peut vous donner une estimation de l'heure à laquelle SLURM pense que votre job démarrera.
Dans votre fichier de soumission SLURM, les paramètres que vous avez spécifiés (partition, nombre de nœuds, temps de calcul, etc.) sont incorrects.
Vous pouvez consulter la documentation technique Ressources de calcul et soumission de job pour vérifier la compatibilité de vos paramètres.
Invalid qos specification signifie que vous avez demandé une ressource à laquelle vous n’avez pas accès.
Pour plus d'informations, vous pouvez visiter Limitations en durée et en ressources d'un job.
La commande module permet de charger dans l'environnement utilisateur des logiciels, des compilateurs, etc. Pour plus d'informations sur l'utilisation de la commande module, vous pouvez vous réferrer à la page suivante).
Plusieurs versions de python sont installées dans EXPLOR. Elles sont accessibles via la commande 'module' :
- python2 via la commande
module load anaconda/2 - python3 via la commande
module load anaconda/3 - les versions spécifiques optimisées par Intel, via les commandes
module load python/versionX/intel
Dans votre script de soumission, il faut tout d'abord choisir une partition possédant des GPUs, puis préciser le nombre de GPUs requis en renseignant l'option –gres de la commande sbatch (ex. : --gres=gpu:2 pour demande 2 GPUs).