s.l.u.r.m

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
s.l.u.r.m [2024/03/06 10:55]
admin [2.2. Gestión de Trabajo]
s.l.u.r.m [2024/03/07 21:18] (current)
admin [2. Parámetros básicos de comandos]
Line 25: Line 25:
  
 ===== 1. Comandos básicos de Slurm ===== ===== 1. Comandos básicos de Slurm =====
 +
 +A continuación se muestran los comandos básicos utilizados para realizar la mayoría de las operaciones básicas con SLURM:
  
 ^Comando^Descripción| ^Comando^Descripción|
Line 32: Line 34:
 |srun|Ejecutar un trabajo interactivo| |srun|Ejecutar un trabajo interactivo|
 |scancel|Eliminar un trabajo| |scancel|Eliminar un trabajo|
-|scontrol|Ver información más detallada de trabajos, colas y particiones.| 
-|sacct|Ver a nivel de sistema la utilización de recursos de trabajos completados.| 
  
  
 ===== 2. Parámetros básicos de comandos ===== ===== 2. Parámetros básicos de comandos =====
 +
 +Existen [[https://​slurm.schedmd.com/​man_index.html|páginas de manual]] para todos los comandos de Slurm, las cuales contienen información más detallada. El parámetro ''​--help''​ además proporciona un breve resumen de las opciones de cada comando. A continuación se muestra el resumen de los parámetros que más se suelen utilizar en SLURM por cada comando básico:
 +
  
 ==== 2.1. Envío de Trabajo (srun y sbatch) ==== ==== 2.1. Envío de Trabajo (srun y sbatch) ====
Line 45: Line 48:
 |-c, –cpus-per-task=<​cpus>​|Número de CPUs (hilos) requeridas por tarea. El valor especificado aquí es el número "​mínimo"​ de CPU que se asignará a su trabajo. Si hay CPU adicionales disponibles en un nodo más allá de lo solicitado, su trabajo recibirá esas CPU hasta que otros trabajos las necesiten. El valor predeterminado es 1 CPU. Intentar usar más CPU de las que se le asignaron dará como resultado que sus procesos adicionales se turnen en la misma CPU (ralentizando su trabajo).| |-c, –cpus-per-task=<​cpus>​|Número de CPUs (hilos) requeridas por tarea. El valor especificado aquí es el número "​mínimo"​ de CPU que se asignará a su trabajo. Si hay CPU adicionales disponibles en un nodo más allá de lo solicitado, su trabajo recibirá esas CPU hasta que otros trabajos las necesiten. El valor predeterminado es 1 CPU. Intentar usar más CPU de las que se le asignaron dará como resultado que sus procesos adicionales se turnen en la misma CPU (ralentizando su trabajo).|
 |-J <​name>,​ –jobname=<​name>​|Especificar un nombre a tu trabajo| |-J <​name>,​ –jobname=<​name>​|Especificar un nombre a tu trabajo|
-|–error\\ -e|Archivo en el que se desea almacenar ​mensajes ​de error de trabajo| +|-o <​STDOUT_log>, ​output=<​STDOUT_log>​|Archivo en el que se desea almacenar ​la salida del trabajo. Usted puede especificar %j como parte del nombre ​de archivo ​de registro para indicar la ID del trabajo ​(como ejemplo, "#​SBATCH -o ouptut_%j.o"​ redirigiría la salida a "​output_123456.o"​).
-|–export=<name[=value]>|Exportar variables ​de entorno identificadas+|-e <​STDERR_log>, ​error=<STDERR_log>|Archivo en el que se desea almacenar mensajes ​de error de trabajo. Funciona exactamente igual que "​-o"​.
-|–input=<name>|Archivo desde el cual leer los datos de entrada ​del trabajo| +|-t, time=<days-hours:​minutes:​seconds\\ (ej. –time=08:​00:​00)|Permite ajustar ​el límite ​de tiempo ​del trabajo| 
-|–output=<name> \\ -<​name>​|Archivo en el que se desea almacenar la salida del trabajo+|–array=<índices> \\  \\ (ej. –array=1-80)|Envía una lista (arreglo) de trabajos idénticos. Solo aplica para sbatch.| 
-|–time=<time> \\ (ej. "time=08:​00:​00"​)|Permite ajustar ​el límite ​de tiempo del trabajo|+|–export=<name[=value]\\ (ej. –export=ALL)|Exportar variables de entorno identificadas
 +|–nodes=<nodos>​|Cantidad de nodos de cómputo a utilizar| 
 +|–account=<​cuenta> \\ (ej. –account=dsmith)|Asignar ​el nombre ​de cuenta para monitorear el trabajo|
  
  
  • s.l.u.r.m.1709736918.txt.bz2
  • Last modified: 2024/03/06 10:55
  • by admin