Differences

This shows you the differences between two versions of the page.

--- s.l.u.r.m [2024/03/06 10:55]
admin [2.2. Gestión de Trabajo]
+++ s.l.u.r.m [2024/03/07 21:18] (current)
admin [2. Parámetros básicos de comandos]
@@ Line 25: / Line 25: @@
 ===== 1. Comandos básicos de Slurm =====
+A continuación se muestran los comandos básicos utilizados para realizar la mayoría de las operaciones básicas con SLURM:
 ^Comando^Descripción|
@@ Line 32: / Line 34: @@
 |srun|Ejecutar un trabajo interactivo|
 |scancel|Eliminar un trabajo|
-|scontrol|Ver información más detallada de trabajos, colas y particiones.|
-|sacct|Ver a nivel de sistema la utilización de recursos de trabajos completados.|
 ===== 2. Parámetros básicos de comandos =====
+Existen [[https://slurm.schedmd.com/man_index.html|páginas de manual]] para todos los comandos de Slurm, las cuales contienen información más detallada. El parámetro ''--help'' además proporciona un breve resumen de las opciones de cada comando. A continuación se muestra el resumen de los parámetros que más se suelen utilizar en SLURM por cada comando básico:
 ==== 2.1. Envío de Trabajo (srun y sbatch) ====
@@ Line 45: / Line 48: @@
 |-c, –cpus-per-task=<cpus>|Número de CPUs (hilos) requeridas por tarea. El valor especificado aquí es el número "mínimo" de CPU que se asignará a su trabajo. Si hay CPU adicionales disponibles en un nodo más allá de lo solicitado, su trabajo recibirá esas CPU hasta que otros trabajos las necesiten. El valor predeterminado es 1 CPU. Intentar usar más CPU de las que se le asignaron dará como resultado que sus procesos adicionales se turnen en la misma CPU (ralentizando su trabajo).|
 |-J <name>, –jobname=<name>|Especificar un nombre a tu trabajo|
-|–error= \\ -e|Archivo en el que se desea almacenar mensajes de error de trabajo|
+|-o <STDOUT_log>, –output=<STDOUT_log>|Archivo en el que se desea almacenar la salida del trabajo. Usted puede especificar %j como parte del nombre de archivo de registro para indicar la ID del trabajo (como ejemplo, "#SBATCH -o ouptut_%j.o" redirigiría la salida a "output_123456.o").|
-|–export=<name[=value]>|Exportar variables de entorno identificadas|
+|-e <STDERR_log>, –error=<STDERR_log>|Archivo en el que se desea almacenar mensajes de error de trabajo. Funciona exactamente igual que "-o".|
-|–input=<name>|Archivo desde el cual leer los datos de entrada del trabajo|
+|-t, –time=<days-hours:minutes:seconds> \\ (ej. –time=08:00:00)|Permite ajustar el límite de tiempo del trabajo|
-|–output=<name> \\ -o <name>|Archivo en el que se desea almacenar la salida del trabajo|
+|–array=<índices> \\  \\ (ej. –array=1-80)|Envía una lista (arreglo) de trabajos idénticos. Solo aplica para sbatch.|
-|–time=<time> \\ (ej. "–time=08:00:00")|Permite ajustar el límite de tiempo del trabajo|
+|–export=<name[=value]> \\ (ej. –export=ALL)|Exportar variables de entorno identificadas|
+|–nodes=<nodos>|Cantidad de nodos de cómputo a utilizar|
+|–account=<cuenta> \\ (ej. –account=dsmith)|Asignar el nombre de cuenta para monitorear el trabajo|