Linux 让进程在后台可靠运行的几种方法
場景
思考三個問題:
- 想讓進程在斷開連接后依然保持運行?
- 如果該進程已經(jīng)開始運行了該如何補救?
- 如果有大量這類需求如何簡化操作?
我們經(jīng)常會碰到這樣的問題,用 telnet/ssh 登錄了遠程的 Linux 服務器,運行了一些耗時較長的任務, 結果卻由于網(wǎng)絡的不穩(wěn)定導致任務中途失敗。如何讓命令提交后不受本地關閉終端窗口、網(wǎng)絡斷開連接的干擾呢?
下面舉了一些例子, 我們可以針對不同的場景選擇不同的方式來處理這個問題。
nohup/setsid/& 場景
如果只是臨時有一個命令需要長時間運行,什么方法能最簡便的保證它在后臺穩(wěn)定運行呢?
我們知道,當用戶注銷logout或者網(wǎng)絡斷開時,終端會收到 HUP(hangup)信號從而關閉其所有子進程。
因此,我們的解決辦法就有兩種途徑:
要么讓進程忽略 HUP 信號,
要么讓進程運行在新的會話里從而成為不屬于此終端的子進程。
1. nohup
nohup 無疑是我們首先想到的辦法。顧名思義,nohup 的用途就是讓提交的命令忽略 hangup 信號。
nohup 的使用是十分方便的,只需在要處理的命令前加上 nohup 即可,標準輸出和標準錯誤缺省會被重定向到 nohup.out 文件中。
一般我們可在結尾加上”&”來將命令同時放入后臺運行,也可用”>filename 2>&1“來更改缺省的重定向文件名。
案例:
[xgj@entel2 ~]$ cd shells/ [xgj@entel2 shells]$ nohup ping 10.45.7.197 & [1] 14692 ------> 對應的pid [xgj@entel2 shells]$ nohup: ignoring input and appending output to `nohup.out'[xgj@entel2 shells]$ ll total 12 -rw------- 1 xgj xgj 407 Jan 16 14:14 nohup.out ----->默認的文件名 -rw-rw-r-- 1 xgj xgj 231 Jan 16 12:32 permissions.txt -rwxrwxr-x 1 xgj xgj 420 Jan 16 12:14 sys_info.sh [xgj@entel2 shells]$ ps -ef |grep 14692|grep -v grep -->查找進程,排除grep xgj 14692 12646 0 14:14 pts/8 00:00:00 ping 10.45.7.197 [xgj@entel2 shells]$2.setsid
nohup 無疑能通過忽略 HUP 信號來使我們的進程避免中途被中斷,但如果我們換個角度思考,如果我們的進程不屬于接受 HUP 信號的終端的子進程,那么自然也就不會受到 HUP 信號的影響了。setsid 就能幫助我們做到這一點。
案例:
[xgj@entel2 shells]$ setsid ping 10.45.7.197值得注意的是,上例中我們的進程 ID(PID)為15390,而它的父 ID(PPID)為1(即為 init 進程 ID),并不是當前終端的進程 ID。請將此例與nohup 例中的父 ID 做比較。
3.&
這里還有一個關于 subshell 的小技巧。我們知道,將一個或多個命名包含在“()”中就能讓這些命令在子 shell 中運行中,從而擴展出很多有趣的功能,我們現(xiàn)在要討論的就是其中之一。
當我們將”&”也放入“()”內(nèi)之后,我們就會發(fā)現(xiàn)所提交的作業(yè)并不在作業(yè)列表中,也就是說,是無法通過jobs來查看的。讓我們來看看為什么這樣就能躲過 HUP 信號的影響吧。
[xgj@entel2 shells]$ (ping 10.45.7.197&) .......[xgj@entel2 ~]$ ps -ef|grep 10.45.7.197 xgj 15787 1 0 14:27 pts/8 00:00:00 ping 10.45.7.197 xgj 15808 15236 0 14:27 pts/9 00:00:00 grep 10.45.7.197從上例中可以看出,新提交的進程的父 ID(PPID)為1(init 進程的 PID),并不是當前終端的進程 ID。因此并不屬于當前終端的子進程,從而也就不會受到當前終端的 HUP 信號的影響了。
disown
我們已經(jīng)知道,如果事先在命令前加上 nohup 或者 setsid 就可以避免 HUP 信號的影響。但是如果我們未加任何處理就已經(jīng)提交了命令,該如何補救才能讓它避免 HUP 信號的影響呢?
這時想加 nohup 或者 setsid 已經(jīng)為時已晚,只能通過作業(yè)調(diào)度和 disown 來解決這個問題了。
我們可以用如下方式來達成我們的目的。
靈活運用 CTRL-z
在我們的日常工作中,我們可以用 CTRL-z 來將當前進程掛起到后臺暫停運行,執(zhí)行一些別的操作,
然后再用 fg 來將掛起的進程重新放回前臺(也可用 bg 來將掛起的進程放在后臺)繼續(xù)運行。
這樣我們就可以在一個終端內(nèi)靈活切換運行多個任務,這一點在調(diào)試代碼時尤為有用。因為將代碼編輯器掛起到后臺再重新放回時,光標定位仍然停留在上次掛起時的位置,避免了重新定位的麻煩。
[xgj@entel2 shells]$ ping 10.45.7.197 PING 10.45.7.197 (10.45.7.197) 56(84) bytes of data. 64 bytes from 10.45.7.197: icmp_seq=1 ttl=64 time=0.241 ms 64 bytes from 10.45.7.197: icmp_seq=2 ttl=64 time=0.210 ms 64 bytes from 10.45.7.197: icmp_seq=3 ttl=64 time=0.209 ms ^Z ----->Ctrl+z 將當前進程掛起到后臺暫停運行 [1]+ Stopped ping 10.45.7.197 [xgj@entel2 shells]$ jobs --->查看(只能在當前會話查看) [1]+ Stopped ping 10.45.7.197 [xgj@entel2 shells]$ fg --->將掛起的進程重新放回前臺 ping 10.45.7.197 64 bytes from 10.45.7.197: icmp_seq=4 ttl=64 time=0.214 ms 64 bytes from 10.45.7.197: icmp_seq=5 ttl=64 time=0.143 ms 64 bytes from 10.45.7.197: icmp_seq=6 ttl=64 time=0.211 ms 64 bytes from 10.45.7.197: icmp_seq=7 ttl=64 time=0.214 ms ^C ---> Ctrl +c 結束 --- 10.45.7.197 ping statistics --- 7 packets transmitted, 7 received, 0% packet loss, time 11267ms rtt min/avg/max/mdev = 0.143/0.206/0.241/0.027 ms [xgj@entel2 shells]$- 用disown -h jobspec來使某個作業(yè)忽略HUP信號。
- 用disown -ah 來使所有的作業(yè)都忽略HUP信號。
- 用disown -rh 來使正在運行的作業(yè)忽略HUP信號。
需要注意的是,當使用過 disown 之后,會將把目標作業(yè)從作業(yè)列表中移除,我們將不能再使用jobs來查看它,但是依然能夠用ps -ef查找到它。
但是還有一個問題,這種方法的操作對象是作業(yè),如果我們在運行命令時在結尾加了”&”來使它成為一個作業(yè)并在后臺運行,那么就萬事大吉了,我們可以通過jobs命令來得到所有作業(yè)的列表。
但是如果并沒有把當前命令作為作業(yè)來運行,如何才能得到它的作業(yè)號呢?答案就是用 CTRL-z(按住Ctrl鍵的同時按住z鍵)了!
CTRL-z 的用途就是將當前進程掛起Suspend,然后我們就可以用jobs命令來查詢它的作業(yè)號,再用bg jobspec來將它放入后臺并繼續(xù)運行。
需要注意的是,如果掛起會影響當前進程的運行結果,請慎用此方法。
disown 示例1
(如果提交命令時已經(jīng)用“&”將命令放入后臺運行,則可以直接使用“disown”)
[xgj@entel2 shells]$ cp -r testLargeFile largeFile & [1] 4825 [xgj@entel2 shells]$ jobs [1]+ Running cp -i -r testLargeFile largeFile & [xgj@entel2 shells]$ disown -h %1 [xgj@entel2 shells]$ ps -ef |grep largeFile root 4825 968 1 09:46 pts/4 00:00:00 cp -i -r testLargeFile largeFile root 4853 968 0 09:46 pts/4 00:00:00 grep largeFile [xgj@entel2 shells]$ logoutdisown 示例2
(如果提交命令時未使用“&”將命令放入后臺運行,可使用 CTRL-z 和“bg”將其放入后臺,再使用“disown”)
[xgj@entel2 shells]$ cp -r testLargeFile largeFile2 [1]+ Stopped cp -i -r testLargeFile largeFile2 [xgj@entel2 shells]$ bg %1 [1]+ cp -i -r testLargeFile largeFile2 & [xgj@entel2 shells]$ jobs [1]+ Running cp -i -r testLargeFile largeFile2 & [xgj@entel2 shells]$ disown -h %1 [xgj@entel2 shells]$ ps -ef |grep largeFile2 root 5790 5577 1 10:04 pts/3 00:00:00 cp -i -r testLargeFile largeFile2 root 5824 5577 0 10:05 pts/3 00:00:00 grep largeFile2 [xgj@entel2 shells]$screen
我們已經(jīng)知道了如何讓進程免受 HUP 信號的影響,但是如果有大量這種命令需要在穩(wěn)定的后臺里運行,如何避免對每條命令都做這樣的操作呢?
此時最方便的方法就是 screen 了。簡單的說,screen 提供了 ANSI/VT100 的終端模擬器,使它能夠在一個真實終端下運行多個全屏的偽終端。screen 的參數(shù)很多,具有很強大的功能,我們在此僅介紹其常用功能以及簡要分析一下為什么使用 screen 能夠避免 HUP 信號的影響。
使用 screen 很方便,有以下幾個常用選項:
- 用screen -dmS session name來建立一個處于斷開模式下的會話(并指定其會話名)。
- 用screen -list 來列出所有會話。
- 用screen -r session name來重新連接指定會話。
- 用快捷鍵CTRL-a d 來暫時斷開當前會話。
案例
[xgj@entel2 shells]$ screen -dmS Urumchi [xgj@entel2 shells]$ screen -list There is a screen on:12842.Urumchi (Detached) 1 Socket in /tmp/screens/S-root. [xgj@entel2 shells]$ screen -r Urumchi當我們用“-r”連接到 screen 會話后,我們就可以在這個偽終端里面為所欲為,再也不用擔心 HUP 信號會對我們的進程造成影響,也不用給每個命令前都加上“nohup”或者“setsid”了。這是為什么呢?讓我來看一下下面兩個例子吧。
我們可以看出,未使用 screen 時我們所處的 bash 是 sshd 的子進程,當 ssh 斷開連接時,HUP 信號自然會影響到它下面的所有子進程(包括我們新建立的 ping 進程)。
而使用了 screen 后就不同了,此時 bash 是 screen 的子進程,而 screen 是 init(PID為1)的子進程。那么當 ssh 斷開連接時,HUP 信號自然不會影響到 screen 下面的子進程了。
總結
我們可以根據(jù)不同的場景來選擇不同的方案。
nohup/setsid 無疑是臨時需要時最方便的方法,disown 能幫助我們來事后補救當前已經(jīng)在運行了的作業(yè),而 screen 則是在大批量操作時不二的選擇了。
總結
以上是生活随笔為你收集整理的Linux 让进程在后台可靠运行的几种方法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Linux 备份及恢复 Linux 文件
- 下一篇: Linux 精通Linux的“kill”