torque安装笔记
?
最近做計算中心的網(wǎng)絡管理員,學習了高性能計算作業(yè)提交系統(tǒng)
?
現(xiàn)在單位又進來了27臺pc電腦,正好驗證一下學習效果。
?
廢話少說,下面開始講解如何安裝一個作業(yè)提交作業(yè)系統(tǒng)
?
以有名的開源軟件torque為例,主要分以下步驟。
?
?
(部分地址失效:要腳本的請留言)
?
配置網(wǎng)絡:
機器第一啟動全部采用網(wǎng)絡啟動
?
我采用單位的高性能計算服務器主機做為dhcp服務器
由dhcp服務器做啟動控制服務器
dhcp服務器的配置如下
?
dhcp.conf
?
由 pxelinux控制進入Linux系統(tǒng)
修改為固定IP:
進入yast2
根據(jù)dhcp固定IP,修改網(wǎng)卡為固定IP,增加默認路由和DNS
?
?
修改機器名:
?
進入yast2 修改機器名為 pcserver,pc01,pc02.......pc26 ? ? ? ? ? ? ?//如果有更多機器,請參照此 所有機器修改完畢后修改/etc/hosts ? ? ? ? ? ? ? ? ? ? ? ? ? ? //內(nèi)容如下,...表示省略。 .............................................................................. 192.168.2.40 ? ?pcserver 192.168.2.40 ? ?pcserver.rcac.xhu.edu.cn 192.168.2.41 ? ?pc01 ? ? pc01.rcac.xhu.edu.cn ... ... 192.168.2.65 ? ?pc25 ? ? pc25.rcac.xhu.edu.cn ..................................................................................
?
安裝ssh:
chkconfig -add sshd service sshd start配置無密碼訪問:
1: 將下面的文件放入 /etc/profile.d/ , ssh-auto-keygen.sh ssh-auto-keygen.csh用ssh 登入系統(tǒng),此處假定用戶為root 自動生成/home/root/authorized_keys2文件 2: 重復上面的步驟,在每個機器上生成root用戶的authorized_keys2文件 3:收集所有機器的authorized_keys2文件內(nèi)容 ...................................................................................................................................................... pcserver:~/.ssh # cat?authorized_keys2 > /tmp/newfile pcserver:~/.ssh #?ssh pc01 pc01:~ #??cd .ssh && cp pcserver:/tmp/newfile /tmp && cat?authorized_keys2 >> /tmp/newfile pc01:~/.ssh?#?ssh pc02 ... ... pc25:~ #cd .ssh && cp pc24 :/tmp/newfile /tmp && cat?authorized_keys2 >> /tmp/newfile pc26:~ #cd .ssh && cp pc25:/tmp/newfile /tmp && cat?authorized_keys2 >> /tmp/newfile pc26:~ #cd /tmp &&?mv newfile?authorized_keys2 4:收集knownhosts 在pcserver上執(zhí)行 ssh pc01 exit ssh pc02 exit ... ... ssh pc25 exit ... exit ssh pcserver 收集knownhosts 5. 拷貝收集到的knownhosts和authorized_keys2文件到所有root用戶.ssh目錄 注意:以上步驟中登錄機器需要輸入yes和密碼,authorized_keys2文件和knownhosts文件在用戶目錄的.ssh目錄中。
下載torque:
下載地址 ?http://www.clusterresources.com/downloads/torque/torque-2.4.3.tar.gz安裝 torque管理結(jié)點:
在pcserver上安裝torque 編譯 .......................................................................... cd /tmp tar xzvf?torque-2.4.3.tar.gz cd torque-2.4.3 mkdir build cd build ../configure --prefix=/opt/torque make make install ........................................................................... 設(shè)置環(huán)境變量 .......................................................................... vi /etc/profile.local #for torque PATH=$PATH:/opt/torque/bin:/opt/torque/sbin export PATH MANPATH=$MANPATH:/opt/torque/man export MANPATH ........................................................................... 配置服務器 ............................................................................. ./torque.setup root ? ? ? ? ? ? ? ? ? ? ?//root用戶做管理 cd /var/spool/torque/server_priv vi nodes ........................ pcserver pc01 pc02 ... ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? //nodes內(nèi)容 pc25 pc26 ........................ cd /var/spool/torque/mom_priv vi config ................................. $pbsserver pcserver $logevent 255 ? ? ? ? ? ? ? ? ? ? ? ? ? ?//config內(nèi)容 ................................. 啟動服務: ............................................................................ pbs_mom -c /var/spool/torque/mom_priv/config qterm -t quick pbs_server pbs_sched .............................................................................安裝torque計算結(jié)點:
?
在服務器編譯目錄生成計算結(jié)點包(注意:如果客戶機與服務器機硬件不同,請重新在客戶機編譯) make pakages?
將上一步?make pakages 生成的torque-package-mom-linux-i686.sh 和?torque-package-clients-linux-i686.sh 拷貝到計算結(jié)點上 運行 ./torque-package-mom-linux-i686.sh --install ./torque-package-clients-linux-i686.sh --install libtool --finish /opt/torque/lib 設(shè)置環(huán)境變量 .......................................................................... vi /etc/profile.local #for torque PATH=$PATH:/opt/torque/bin:/opt/torque/sbin export PATH MANPATH=$MANPATH:/opt/torque/man export MANPATH ........................................................................... 檢查服務器名字 cd /var/spool/torque/ less servername 修改配置 cd /var/spool/torque/mom_priv vi config ................................... $pbsserver pcserver $logevent 255 ................................... 運行pbs_mom /usr/local/sbin/pbs_mom -c /var/spool/torque/mom_priv/config安裝所有其他計算結(jié)點
新建一個文件:install_clients,內(nèi)容如下:
........................................................................................
#!/bin/sh mount node8:/softwareBAK/temp /mnt ? ? ? ? ? ? ?//node8為共享了nfs的dhcp服務器,temp中是剛才的make package文件。 cd /mnt ./torque-package-clients-linux-i686.sh --install ./torque-package-mom-linux-i686.sh --install scp pcserver:/etc/profile.local /etc libtool --finish /opt/torque/lib cd /var/spool/torque/mom_priv scp pcserver:/var/spool/torque/mom_priv/config . /opt/torque/sbin/pbs_mom -c config .......................................................................................... chmod +x install_clients 拷貝到其他結(jié)點 ................................................. scp?install_clients pc01:/tmp scp?install_clients pc02:/tmp ... scp?install_clients pc26:/tmp ............................................... 在所有結(jié)點上運行安裝。 .................................. ssh pc01 cd /tmp ./install_clients exit? ssh pc02 cd /tmp ./install_clients ... ... ... ssh pc26 cd /tmp ./install_clients .......................................測試安裝成功與否:
登錄pcserverpcserver:~ #?echo “sleep?30”?|qsub
pcserver:~ #?echo “sleep?30”?|qsub
pcserver:~ #?echo “sleep?30”?|qsub
pcserver:~ #?qstat
最后的配置
pcserver:~ # qmgr -c "set server submit_hosts=pcserver" ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
pcserver:/home/torque-2.4.3 #cp contrib/init.d/suse.pbs_mom /etc/init.d/pbs_server
pcserver:/home/torque-2.4.3 #cp contrib/init.d/suse.pbs_mom /etc/init.d/pbs_mom
pcserver:/home/torque-2.4.3 #cp contrib/init.d/suse.pbs_sched /etc/init.d/pbs_sched
pcserver:/home/torque-2.4.3 #chkconfig -add pbs_server
pcserver:/home/torque-2.4.3 #chkconfig -add pbs_mom
pcserver:/home/torque-2.4.3 #chkconfig -add pbs_sched
pcserver:/home/torque-2.4.3 #chkconfig -e
?
修改pbs_server pbs_mom pbs_sched 為 on
?
本文參考:
?
torque安裝:http://www.91linux.com/html/article/guanli/20090617/17161.html
?
torque主頁:http://www.clusterresources.com/
?
?
總結(jié)
以上是生活随笔為你收集整理的torque安装笔记的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Bash Shell学习笔记二
- 下一篇: 曝刘强东生子后已立刻回国工作 此前大提基