Array job 중 하나를 고르고 싶은데 그대로 job id를 입력하면 안된다. 예를 들어 job id가 546317_2이고 srun을 통해 nvidia-smi를 실행하고 싶을 때 아래처럼 하면 오류가 생긴다.
[example@example.com ~]$ srun --jobid=546317_2 nvidia-smi
srun: error: Slurm job 546317 has expired
srun: Check SLURM_JOB_ID environment variable. Expired or invalid job 546317
Array job id가 546317_2인 것을 그대로 사용해서 srun 명령어를 실행할 수 없다. 언더스코어가 붙어 있는 job id와 진짜 job id는 다르다. 언더스코어는 array job notation이며 이를 통해 진짜 job id를 알아내서 srun을 실행해야한다.
scontrol show job 546317_2 | grep JobId
이후 나온 job id를 통해 srun을 실행한다.