slurm

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Last revision Both sides next revision
slurm [2020/09/17 13:06]
admin
slurm [2020/09/17 13:18]
admin
Line 1: Line 1:
 +====== SLURM 19.04 ======
 +
 +Conceptos básicos
 +
 +Jobs
 +
 +Particiones
 +
 +Task
 +
 +Comandos básicos
 +
 +Consultar cola
 +
 +Enviar un programa
 +
 +Cancelar un trabajo
 +
 +===== Trabajando con SLURM =====
 +
 +**Simple usage for soroban**
 +
 +0. Note.
 +
 +'-p intel' (equivalent long option: '​–partition=intel'​) is required for soroban.
 +
 +1. Save below as text file (e.g. my_first_slurm.sh).
 +
 +<​code>​
 +#!/bin/bash
 +#SBATCH --job-name=example ​     # Nombre para el trabajo a ejecutar en el cluster
 +#SBATCH --partition=intel ​      # Nombre de la cola
 +#SBATCH --output=example_%j.out # Salida de la simulacion
 +#SBATCH --error=example_%j.err ​ # Registro de errores durante la simulacion
 +
 +ls -lh
 +pwd
 +</​code>​
 +
 +2. Submit it as SLURM job.
 +
 +sbatch (e.g. sbatch my_first_slurm.sh)
 +
 +3. Check progress.
 +
 +squeue
 +
 +**Ejecutando un programa con openMPI , usando un script base para SLURM:**
 +<​code>​
 +#!/bin/bash
 +#SBATCH --job-name=example ​               # Nombre para el trabajo a ejecutar en el cluster
 +#SBATCH --partition=intel ​                # Nombre la COLA/​PARTICION donde enviaras las simulaciones
 +#SBATCH -n 48                             # Debe de ser un número múltiplo de 24, idealmente para usar todos los cores de una CPU.
 +#SBATCH --ntasks-per-node=24 ​             # Numero de tareas por nodo
 +#SBATCH --output=example_%j.out ​          # Salidas de la simulación
 +#SBATCH --error=example_%j.err ​           # Errores durante la simulacion
 +#SBATCH --mail-user=username@ufrontera.cl # correo para notificar de inicio/​termino o problemas de la simulacion
 +#SBATCH --mail-type=ALL ​                  #
 +
 +srun ./​mpi_programa ​                      #​comando y programa mpi a ejecuta, reemplazar por el programa correspondiente
 +</​code>​
 +
 ===== 4. Ejemplo básico 3 ===== ===== 4. Ejemplo básico 3 =====
  
Line 6: Line 68:
 #!/bin/bash #!/bin/bash
  
-#SBATCH -J R-NOMBRE-SIMULACION ​# reemplazar por el nombre de tu simulacion+#SBATCH -J R-NOMBRE-SIMULACION
 #SBATCH -a 1-11%3 #SBATCH -a 1-11%3
-#SBATCH --nodes=1 ​  #numero de nodos a utilizar +#SBATCH --nodes=1 
-#SBATCH --tasks-per-node=1 ​  " numero de tareas por nodo +#SBATCH --tasks-per-node=1 
-#SBATCH --mem=100G ​  #cantidad de memoria requerida para la simulacion +#SBATCH --mem=100G 
-#SBATCH --partition=intel ​    #particion o cola donde enviaras el trabajo/​simulacion+#SBATCH --partition=intel
  
-module load R/​3.6.1 ​    #modulo o programa que necesitas para tu simulación+module load R/3.6.1
  
 cmds=( cmds=(
Line 28: Line 90:
  
 <​code>​ <​code>​
-chmod  x ejemplo3.sh+chmod +x ejemplo3.sh
 </​code>​ </​code>​
  
Line 66: Line 128:
 ==== Useful reference pages ==== ==== Useful reference pages ====
  
-[[https://​doku.lrz.de/​display/​PUBLIC/​Running parallel jobs on the Linux-Cluster#​RunningparalleljobsontheLinux-Cluster-Step1:​Editajobscript|https://​doku.lrz.de/​display/​PUBLIC/​Running parallel jobs on the Linux-Cluster#​RunningparalleljobsontheLinux-Cluster-Step1:​Editajobscript]]+[[https://​doku.lrz.de/​display/​PUBLIC/​Running+parallel+jobs+on+the+Linux-Cluster#​RunningparalleljobsontheLinux-Cluster-Step1:​Editajobscript|https://​doku.lrz.de/​display/​PUBLIC/​Running+parallel+jobs+on+the+Linux-Cluster#​RunningparalleljobsontheLinux-Cluster-Step1:​Editajobscript]]
  
 === About job array === === About job array ===
  • slurm.txt
  • Last modified: 2020/09/17 13:19
  • by admin