Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
slurm [2020/05/19 03:08] mickey |
slurm [2020/09/17 13:06] admin |
||
---|---|---|---|
Line 1: | Line 1: | ||
- | ====== SLURM ====== | ||
- | |||
- | Conceptos básicos | ||
- | |||
- | Jobs | ||
- | |||
- | Particiones | ||
- | |||
- | Task | ||
- | |||
- | Comandos básicos | ||
- | |||
- | Consultar cola | ||
- | |||
- | Enviar un programa | ||
- | |||
- | Cancelar un trabajo | ||
- | |||
- | ===== Trabajando con SLURM ===== | ||
- | |||
- | **Simple usage for soroban** | ||
- | |||
- | 0. Note. | ||
- | |||
- | '-p intel' (equivalent long option: '--partition=intel') is required for soroban. | ||
- | |||
- | 1. Save below as text file (e.g. my_first_slurm.sh). | ||
- | <code> | ||
- | #!/bin/bash | ||
- | #SBATCH --job-name=example # Nombre para el trabajo a ejecutar en el cluster | ||
- | #SBATCH --partition=intel | ||
- | #SBATCH --output=example_%j.out | ||
- | #SBATCH --error=example_%j.err | ||
- | |||
- | ls -lh | ||
- | pwd | ||
- | </code> | ||
- | |||
- | 2. Submit it as SLURM job. | ||
- | |||
- | sbatch <filename> (e.g. sbatch my_first_slurm.sh) | ||
- | |||
- | 3. Check progress. | ||
- | |||
- | squeue | ||
- | |||
- | **Ejecutando un programa con openMPI , usando un script base para SLURM:** | ||
- | <code> | ||
- | #!/bin/bash | ||
- | #SBATCH --job-name=example # Nombre para el trabajo a ejecutar en el cluster | ||
- | #SBATCH --partition=troquil | ||
- | #SBATCH -n 32 # Debe de ser un número múltiplo de 16 | ||
- | #SBATCH --ntasks-per-node=16 # máximo por blade | ||
- | #SBATCH --output=example_%j.out | ||
- | #SBATCH --error=example_%j.err | ||
- | #SBATCH --mail-user=username@ufrontera.cl | ||
- | #SBATCH --mail-type=ALL | ||
- | |||
- | srun ./mpi_programa | ||
- | </code> | ||
- | |||
- | |||
===== 4. Ejemplo básico 3 ===== | ===== 4. Ejemplo básico 3 ===== | ||
Line 68: | Line 6: | ||
#!/bin/bash | #!/bin/bash | ||
- | #SBATCH -J R-NOMBRE-SIMULACION | + | #SBATCH -J R-NOMBRE-SIMULACION # reemplazar por el nombre de tu simulacion |
#SBATCH -a 1-11%3 | #SBATCH -a 1-11%3 | ||
- | #SBATCH --nodes=1 | + | #SBATCH --nodes=1 #numero de nodos a utilizar |
- | #SBATCH --tasks-per-node=1 | + | #SBATCH --tasks-per-node=1 " numero de tareas por nodo |
- | #SBATCH --mem=100G | + | #SBATCH --mem=100G #cantidad de memoria requerida para la simulacion |
- | #SBATCH --partition=intel | + | #SBATCH --partition=intel #particion o cola donde enviaras el trabajo/simulacion |
- | module load R/3.6.1 | + | module load R/3.6.1 #modulo o programa que necesitas para tu simulación |
cmds=( | cmds=( | ||
Line 90: | Line 28: | ||
<code> | <code> | ||
- | chmod +x ejemplo2.sh | + | chmod x ejemplo3.sh |
</code> | </code> | ||
<code> | <code> | ||
- | sbatch ejemplo2.sh | + | sbatch ejemplo3.sh |
</code> | </code> | ||
Line 128: | Line 66: | ||
==== Useful reference pages ==== | ==== Useful reference pages ==== | ||
- | [[https://doku.lrz.de/display/PUBLIC/Running+parallel+jobs+on+the+Linux-Cluster#RunningparalleljobsontheLinux-Cluster-Step1:Editajobscript|https://doku.lrz.de/display/PUBLIC/Running+parallel+jobs+on+the+Linux-Cluster#RunningparalleljobsontheLinux-Cluster-Step1:Editajobscript]] | + | [[https://doku.lrz.de/display/PUBLIC/Running parallel jobs on the Linux-Cluster#RunningparalleljobsontheLinux-Cluster-Step1:Editajobscript|https://doku.lrz.de/display/PUBLIC/Running parallel jobs on the Linux-Cluster#RunningparalleljobsontheLinux-Cluster-Step1:Editajobscript]] |
=== About job array === | === About job array === |