Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
slurm [2020/09/17 13:06] admin |
slurm [2020/09/17 13:19] (current) admin [Trabajando con SLURM] |
||
---|---|---|---|
Line 1: | Line 1: | ||
+ | ====== SLURM 19.04 ====== | ||
+ | |||
+ | Conceptos básicos | ||
+ | |||
+ | Jobs | ||
+ | |||
+ | Particiones | ||
+ | |||
+ | Task | ||
+ | |||
+ | Comandos básicos | ||
+ | |||
+ | Consultar cola | ||
+ | |||
+ | Enviar un programa | ||
+ | |||
+ | Cancelar un trabajo | ||
+ | |||
+ | ===== Trabajando con SLURM ===== | ||
+ | |||
+ | **Simple usage for soroban** | ||
+ | |||
+ | 0. Note. | ||
+ | |||
+ | '-p intel' (equivalent long option: '–partition=intel') is required for soroban. | ||
+ | |||
+ | 1. Save below as text file (e.g. my_first_slurm.sh). | ||
+ | |||
+ | <code> | ||
+ | #!/bin/bash | ||
+ | #SBATCH --job-name=example # Nombre para el trabajo a ejecutar en el cluster | ||
+ | #SBATCH --partition=intel | ||
+ | #SBATCH --output=example_%j.out | ||
+ | #SBATCH --error=example_%j.err | ||
+ | |||
+ | ls -lh | ||
+ | pwd | ||
+ | </code> | ||
+ | |||
+ | 2. Submit it as SLURM job. | ||
+ | |||
+ | sbatch (e.g. sbatch my_first_slurm.sh) | ||
+ | |||
+ | 3. Check progress. | ||
+ | |||
+ | squeue | ||
+ | |||
+ | **Ejecutando un programa con openMPI , usando un script base para SLURM:** | ||
+ | <code> | ||
+ | #!/bin/bash | ||
+ | #SBATCH --job-name=example # Nombre para el trabajo a ejecutar en el cluster | ||
+ | #SBATCH --partition=intel | ||
+ | #SBATCH -n 32 # Debe de ser un número múltiplo de 16, número de procesos | ||
+ | #SBATCH --ntasks-per-node=16 # máximo por nodo | ||
+ | #SBATCH --output=example_%j.out | ||
+ | #SBATCH --error=example_%j.err | ||
+ | #SBATCH --mail-user=username@ufrontera.cl #correo para notificacion | ||
+ | #SBATCH --mail-type=ALL | ||
+ | |||
+ | srun ./mpi_programa | ||
+ | </code> | ||
+ | |||
+ | |||
===== 4. Ejemplo básico 3 ===== | ===== 4. Ejemplo básico 3 ===== | ||
Line 6: | Line 69: | ||
#!/bin/bash | #!/bin/bash | ||
- | #SBATCH -J R-NOMBRE-SIMULACION # reemplazar por el nombre de tu simulacion | + | #SBATCH -J R-NOMBRE-SIMULACION |
#SBATCH -a 1-11%3 | #SBATCH -a 1-11%3 | ||
- | #SBATCH --nodes=1 #numero de nodos a utilizar | + | #SBATCH --nodes=1 |
- | #SBATCH --tasks-per-node=1 " numero de tareas por nodo | + | #SBATCH --tasks-per-node=1 |
- | #SBATCH --mem=100G #cantidad de memoria requerida para la simulacion | + | #SBATCH --mem=100G |
- | #SBATCH --partition=intel #particion o cola donde enviaras el trabajo/simulacion | + | #SBATCH --partition=intel |
- | module load R/3.6.1 #modulo o programa que necesitas para tu simulación | + | module load R/3.6.1 |
cmds=( | cmds=( | ||
Line 28: | Line 91: | ||
<code> | <code> | ||
- | chmod x ejemplo3.sh | + | chmod +x ejemplo3.sh |
</code> | </code> | ||
Line 66: | Line 129: | ||
==== Useful reference pages ==== | ==== Useful reference pages ==== | ||
- | [[https://doku.lrz.de/display/PUBLIC/Running parallel jobs on the Linux-Cluster#RunningparalleljobsontheLinux-Cluster-Step1:Editajobscript|https://doku.lrz.de/display/PUBLIC/Running parallel jobs on the Linux-Cluster#RunningparalleljobsontheLinux-Cluster-Step1:Editajobscript]] | + | [[https://doku.lrz.de/display/PUBLIC/Running+parallel+jobs+on+the+Linux-Cluster#RunningparalleljobsontheLinux-Cluster-Step1:Editajobscript|https://doku.lrz.de/display/PUBLIC/Running+parallel+jobs+on+the+Linux-Cluster#RunningparalleljobsontheLinux-Cluster-Step1:Editajobscript]] |
=== About job array === | === About job array === |