how do I use the Torque to submit and manager my jobs in Shenma cluster ?

(1)熟悉shenma 环境变量管理工具module

(2)熟悉神马上计算队列相关信息

(3)学会编写job.pbs脚本,可参考网页上作业运行版块集群使用手册内的pbs脚本版块

(4)提交作业

qsub job.pbs

(5)查看监控作业:qstat

qstat option Description
-u user_list Displays jobs for users listed in user_list
-a Displays all jobs
-r Displays running jobs
-f   jobid Displays the full listing of jobs (returns excessive detail)
-n  jobid  Displays nodes allocated to jobs

checkjob -v jobid  查看作业相关信息及节点信息

(6)删除任务

qdel jobid

qdel jobid1 jobid2 jobid3….

qdel -W time jobid 一段时间后删除任务

qselect -u $USER|cut –d ‘.’-f 1 | xargs qdel 删除用户所有的任务

qselect -u $USER -s R | cut –d ‘.’-f 1|xargs qdel删除用户所有运行的任务

qselect -u $USER -s Q | cut –d ‘.’-f 1 |xargs qdel 删除用户所有等待的任务

(7)查看任务在相应计算节点上的运行情况

参考常见问题版块的“用户如何查看已经提交运行作业的cpu,内存等情况

(8)提交任务的整个流程:

job_qsub

Tips:

(1)提交和管理任务的更多帮助信息,请参考torque管理手册中的Submitting and managing jobs chapter

(2)关于torque的更多命令,请参考toeque管理手册中的Commands overview appendix