0%

Linux slurm 作业提交系统

slurm作业提交系统常用命令

查看有哪些分区 sinfo命令

1
2
3
4
5
$ sinfo
PARTITION AVAIL TIMELIMIT NODES STATE NODELIST
arm up infinite 9 idle taishan-arm-cpu[01-09]
gpu up infinite 8 idle sugon-gpu[01-08]
cpu up infinite 10 idle x86-cpu[01-10]

指定节点跑程序srun

比如这里我有一个test.py的文件,内容如下:

1
2
3
4
5
6
#!/usr/bin/env python

import time
for i in range(10):
time.sleep(1)
print(i)

执行如下命令:

1
srun -p cpu -w x86-cpu01 python ./test.py 

slurm最基本的命令是srun,比如上面一行的参数如下:

  • -p:指定分区PARTITION
  • -w:指定NODELIST

查看自己任务squeue

squeue -u +用户

1
2
3
~> squeue -u name
JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON)
32236 cpu test.py name R 2:08 1 x86-cpu01
处无为之事,行不言之教;作而弗始,生而弗有,为而弗恃,功成不居!

欢迎关注我的其它发布渠道