Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
s.l.u.r.m [2024/03/06 11:20] admin [2.1. Envío de Trabajo (srun y sbatch)] |
s.l.u.r.m [2024/03/07 21:18] (current) admin [2. Parámetros básicos de comandos] |
||
---|---|---|---|
Line 25: | Line 25: | ||
===== 1. Comandos básicos de Slurm ===== | ===== 1. Comandos básicos de Slurm ===== | ||
+ | |||
+ | A continuación se muestran los comandos básicos utilizados para realizar la mayoría de las operaciones básicas con SLURM: | ||
^Comando^Descripción| | ^Comando^Descripción| | ||
Line 32: | Line 34: | ||
|srun|Ejecutar un trabajo interactivo| | |srun|Ejecutar un trabajo interactivo| | ||
|scancel|Eliminar un trabajo| | |scancel|Eliminar un trabajo| | ||
- | |scontrol|Ver información más detallada de trabajos, colas y particiones.| | ||
- | |sacct|Ver a nivel de sistema la utilización de recursos de trabajos completados.| | ||
===== 2. Parámetros básicos de comandos ===== | ===== 2. Parámetros básicos de comandos ===== | ||
+ | |||
+ | Existen [[https://slurm.schedmd.com/man_index.html|páginas de manual]] para todos los comandos de Slurm, las cuales contienen información más detallada. El parámetro ''--help'' además proporciona un breve resumen de las opciones de cada comando. A continuación se muestra el resumen de los parámetros que más se suelen utilizar en SLURM por cada comando básico: | ||
+ | |||
==== 2.1. Envío de Trabajo (srun y sbatch) ==== | ==== 2.1. Envío de Trabajo (srun y sbatch) ==== | ||
Line 45: | Line 48: | ||
|-c, –cpus-per-task=<cpus>|Número de CPUs (hilos) requeridas por tarea. El valor especificado aquí es el número "mínimo" de CPU que se asignará a su trabajo. Si hay CPU adicionales disponibles en un nodo más allá de lo solicitado, su trabajo recibirá esas CPU hasta que otros trabajos las necesiten. El valor predeterminado es 1 CPU. Intentar usar más CPU de las que se le asignaron dará como resultado que sus procesos adicionales se turnen en la misma CPU (ralentizando su trabajo).| | |-c, –cpus-per-task=<cpus>|Número de CPUs (hilos) requeridas por tarea. El valor especificado aquí es el número "mínimo" de CPU que se asignará a su trabajo. Si hay CPU adicionales disponibles en un nodo más allá de lo solicitado, su trabajo recibirá esas CPU hasta que otros trabajos las necesiten. El valor predeterminado es 1 CPU. Intentar usar más CPU de las que se le asignaron dará como resultado que sus procesos adicionales se turnen en la misma CPU (ralentizando su trabajo).| | ||
|-J <name>, –jobname=<name>|Especificar un nombre a tu trabajo| | |-J <name>, –jobname=<name>|Especificar un nombre a tu trabajo| | ||
- | |-o <STDOUT_log>, --output=<STDOUT_log>|Archivo en el que se desea almacenar la salida del trabajo. Usted puede especificar %j como parte del nombre de archivo de registro para indicar la ID del trabajo (como ejemplo, "#SBATCH -o ouptut_%j.o" redirigiría la salida a "output_123456.o").| | + | |-o <STDOUT_log>, –output=<STDOUT_log>|Archivo en el que se desea almacenar la salida del trabajo. Usted puede especificar %j como parte del nombre de archivo de registro para indicar la ID del trabajo (como ejemplo, "#SBATCH -o ouptut_%j.o" redirigiría la salida a "output_123456.o").| |
- | |-e <STDERR_log>, --error=<STDERR_log>|Archivo en el que se desea almacenar mensajes de error de trabajo. Funciona exactamente igual que "-o".| | + | |-e <STDERR_log>, –error=<STDERR_log>|Archivo en el que se desea almacenar mensajes de error de trabajo. Funciona exactamente igual que "-o".| |
- | |–time=<days-hours:minutes:seconds> \\ (ej. –time=08:00:00)|Permite ajustar el límite de tiempo del trabajo| | + | |-t, –time=<days-hours:minutes:seconds> \\ (ej. –time=08:00:00)|Permite ajustar el límite de tiempo del trabajo| |
|–array=<índices> \\ \\ (ej. –array=1-80)|Envía una lista (arreglo) de trabajos idénticos. Solo aplica para sbatch.| | |–array=<índices> \\ \\ (ej. –array=1-80)|Envía una lista (arreglo) de trabajos idénticos. Solo aplica para sbatch.| | ||
|–export=<name[=value]> \\ (ej. –export=ALL)|Exportar variables de entorno identificadas| | |–export=<name[=value]> \\ (ej. –export=ALL)|Exportar variables de entorno identificadas| |