Ubuntu20.04安装Torque-6.1.2单机版(踩坑篇)
說明:PBS排隊系統原先是在Centos7安裝使用很順利,但是有客戶需求在Ubuntu20.04上使用,著手在Ubuntu20.04安裝上安裝的時候發現很多報錯,并不能順利安裝,網上查找到的教程,有的說是讓放棄轉slurm,有的是換源安裝,但是安裝好的版本很低,有許多bug,不是很好用。經過自己慢慢摸索之后,改了部分配置以及源碼之后,能夠順利安裝,再次記錄一下踩坑心得,與大家一起分享學習。如有問題,歡迎大家來撩。
一、安裝包下載
筆者使用的安裝包版本為torque-6.1.2,點擊下面的連接可以直接下載源碼安裝包。
http://wpfilebase.s3.amazonaws.com/torque/torque-6.1.2.tar.gz
二、更改主機hosts文件
使用下面命令查看自己本機的IP地址
ifconfig查看結果如下,紅色框為本機IP地址
?使用下面命令查看本機主機名
hostname?查看結果如下圖所示,fz即為筆者主機名。
打開hosts文件,在紅框位置添加紅框內容,前面為本機IP地址,后面為本機主機名
三、編譯與安裝
1、上傳安裝包至目標機器
筆者使用xshell連接之后,使用xftp工具進行文件傳輸至指定目錄,筆者使用的目錄為/home/fz/package
2、解壓安裝包
mkdir /home/fz/package cd /home/fz/package tar -zxvf torque-6.1.2.tar.gz cd torque-6.1.2/3、安裝必要的庫文件
sudo apt-get install make gcc g++ libxml2-dev zlib1g-dev libboost-all-dev libssl-dev -y4、配置編譯
./configure --prefix=/opt/torque/6.1.2 --with-scp--with-default-server=fz --disable-gcc-warnings配置結束之后如下圖所示,會提示準備make,但是別著急,需要修改代碼,不然會報錯。
?5、更改req.cpp文件
vim ./src/lib/Libattr/req.cpp使用上面的命令打開req.cpp文件,更改將1057行的'\0'改為"\0",如下圖所示
?6、開始編譯
輸入下面命令進行編譯
make -j64 CFLAGS='-fpermissive'7、開始安裝
使用一下命令進行安裝
sudo make install8、生成安裝包
sudo make packages9、服務配置
sudo cp contrib/init.d/{pbs_{server,sched,mom},trqauthd} /etc/init.d/ sudo cp contrib/systemd/{pbs_{server,sched,mom},trqauthd}.service /etc/systemd/system/10、Torque環境變量設置
sudo su // 進入root用戶 TORQUE=/opt/torque/6.1.2 echo "TORQUE=$TORQUE" >> /etc/profile echo "export PATH=\$PATH:$TORQUE/bin:$TORQUE/sbin" >> /etc/profile source /etc/profile exit // 退出root用戶11、啟動pbs服務
vim ./torque.setup更改第一行中的sh為bash,更改結束如下圖所示
啟動服務
sudo ./torque.setup fz?過程中需要輸入y繼續執行。
使用以下命令查看已啟動的服務,并且將該啟動的服務進程殺掉,如下圖所示
ps -e | grep trqauthd ps -e | grep pbs?12、編輯pbs_sched文件
vim /etc/init.d/pbs_sched將里面的. /etc/rc.d/init.d/functions改為. /lib/lsb/init-functions
然后將里面的status和daemon都改為start_daemon即可
13、再次啟動pbs服務
for i in trqauthd pbs_server pbs_mom pbs_sched; do sudo service $i start; done14、指定計算節點
sudo vim /var/spool/torque/server_priv/nodes fz np=8 //添加本行信息,注意等號前后不要有空格 fz是主機名 np是cpu核心數,可以通過lscpu來查看sudo vim /var/spool/torque/mom_priv/config pbsserver fz //添加這兩行信息 fz是主機名 logevent 25515、重啟服務
sudo su for i in trqauthd pbs_server pbs_sched pbs_mom ; do service $i restart; done exit16、檢查PBS的信息
ps -e | grep pbs結果如下
?17、創建隊列的默認信息
qmgr -c 'create queue fz' qmgr -c 'set queue fz queue_type= execution' qmgr -c 'set queue fz started= true' qmgr -c 'set queue fz enabled= true' qmgr -c 'set queue fz resources_default.walltime= 240:00:00' qmgr -c 'set queue fz resources_default.nodes= 1' qmgr -c 'set server default_queue= fz' qmgr -c 'set server scheduling=true'注:如果提示找不到qmgr命令重啟一個終端試一試(qmgr: command not found)
18、提交測試任務
輸入qnodes會出現一下信息,說明初步安裝成功
?再提交一個任務
echo sleep 120 | qsub在輸入qstat -an可以查看任務詳情,如下圖所示:
?四、設置PBS服務開機自啟
1、編輯rc-local.service文件
sudo vim /lib/systemd/system/rc-local.service打開rc-local.service文件之后在最后添加如下代碼
[Install] WantedBy=multi-user.target Alias=rc-local.service添加成功之后如下圖所示
?2、創建并保存rc.local文件
sudo vim /etc/rc.local打開rc.local文件之后添加如下代碼
#!/bin/sh systemctl start pbs_server.service systemctl start trqauthd systemctl start pbs_sched.service systemctl start pbs_mom.service3、賦予rc.local可執行權限
sudo chmod +x /etc/rc.local4、為rc-local.service添加軟鏈接
sudo ln -s /lib/systemd/system/rc-local.service /etc/systemd/system/5、使rc-local.service生效并啟動
sudo systemctl enable rc-local sudo systemctl start rc-local.service #啟動服務 # sudo systemctl stop rc-local.service #暫停服務 # sudo systemctl status rc-local.service #查看狀態 # sudo systemctl daemon-reload # 重新加載自啟服務參考文章:
[已放棄]<s>單機ubuntu編譯安裝PBS torque</s>
Centos 7, Torque 單節點部署
Ubuntu 18.04 單機安裝torque
至此Ubuntu20.04 上的PBS安裝就此告一段落了,如果大家在安裝過程中出現了問題,可以在回看文中修改的關鍵信息,按照上述步驟就會成功,如還有問題歡迎私信交流!
總結
以上是生活随笔為你收集整理的Ubuntu20.04安装Torque-6.1.2单机版(踩坑篇)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python调用函数指定次数_扣丁学堂P
- 下一篇: 上海计算机一级选择题库及答案,2016年