############################################################# # Commandes modules ############################################################# !Pour chercher un module qu'on ne connait pas sa version et/ou mpi/compilateur $ module spider ! module spider indiquera comment afiner la recherche du module ou comment le charger $ module load ############################################################# # # # Commandes surveillance jobs SLURM # # # ############################################################# # Commande sinfo sinfo -Nel scontrol show partition scontrol show job # Permet de filtrer le detail des ressources de GPU sinfo -Ne -p gpu --format "%.15N %.4c %.7m %G" # Pour regarder l’utilisation dans le temps sreport cluster UserUtilizationByAccount user=$USER start=2024-12-01 -t hours # pour recuperer l'historique des calculs sacct -u $USER --format=JobID,JobName,partition,node,alloccpus,state,elapsed,maxrss,totalcpu,start,end -S 2024-12-01 sacct -u qco77 --format=JobID,JobName,partition,node,alloccpus,state,elapsed,maxrss,totalcpu,start,end -S 2025-03-25 sacct -j --format=partition,node,alloccpus,state,elapsed,maxrss,totalcpu,start,end # pour un job en cours ou terminé sacct -j $JobID # pour avoir plus de details d'un job en cours scontrol show job $JobID # pour suivre la file d'attente des jobs en cours (PD: Pending R: Running, ...) # tous les utilisateurs squeue -o "%.8i %.9P %.8j %.5u %.5a %.5t %.16V %.16S %.16M %.16L %.16e %.2D %.4C %.13q %R %f # Ses propres jobs squeue -u $USER -o "%.8i %.9P %.8j %.5u %.5a %.5t %.16V %.16S %.16M %.16L %.16e %.2D %.4C %.13q %R %f # creation alias .bashrc alias squeue='squeue -o "%.8i %.9P %.8j %.5u %.5a %.5t %.16V %.16S %.16M %.16L %.16e %.2D %.4C %.13q %R %f"' # recuperer JobID sacct -u $USER --format=JobID,state --starttime=2025-01-22 --noheader | grep COMPLETED | egrep -v ".0|bat|ext" | awk '{print $1}' > job_$USER.out # analyse efficience calcul for i in $(cat job_dro29.out); do seff $i; done | egrep "Job ID|Memory Efficiency" # Utilisation cluster instantanée # CPUS(A/I/O/T) Allocate/Idle/Other/Total sinfo -o "%C" # Utilisation par partition qstat -q # Commande pour rapporter l'utilisation du CPU # Sur toutes les CPUs du noeud mpstat -P ALL # Pour avoir la moyenne (5 mesures) mpstat 1 5 **************