Linux守护进程设计规范及python实现
http://blog.csdn.net/mr_jj_lian/article/details/7252222
守護進程
守護進程是生存期長的一種進程。它們獨立于控制終端并且周期性的執(zhí)行某種任務或等待處理某些發(fā)生的事件。他們常常在系統引導裝入時啟動,在系統關閉時終止。unix系統有很多守護進程,大多數服務器都是用守護進程實現的。比如,網絡服務inetd、Web服務http等。同時,守護進程完成許多系統任務。比如,作業(yè)規(guī)劃進程crond、打印進程lqd等。
這里主要說明守護進程的進程結構,以及如何編寫守護進程程序。因為守護進程沒有控制終端,所以我們還要介紹在守護進程運行時錯誤輸出的方法。
守護進程及其特性
守護進程最重要的特性是后臺運行。在這一點上,DOS下的常駐內存程序TSR與之相似。
其次,守護進程必須與其運行前的環(huán)境隔離開來。這些環(huán)境包括未關閉的文件描述符、控制終端、會話和進程組、工作目錄以及文件創(chuàng)建掩碼等。這些環(huán)境通常是守護進程從執(zhí)行它的父進程(特別是shell)中繼承下來的。
最后,守護進程的啟動方式有其特殊之處。它可以在系統啟動時從啟動腳本/etc/rc.d中啟動,可以由inetd守護進程啟動,可以有作業(yè)規(guī)劃進程crond啟動,還可以由用戶終端(通常是shell)執(zhí)行。
總之,除開這些特殊性以外,守護進程與普通進程基本上沒有什么區(qū)別。因此,編寫守護進程實際上是把一個普通進程按照上述的守護進程的特性改造成為守護進程。如果大家對進程的認識比較深入,就對守護進程容易理解和編程了。
首先我們來察看一些常用的系統守護進程,看一下他們和幾個概念:進程組、控制終端和對話期有什么聯系。p s命令打印系統中各個進程的狀態(tài)。該命令有多個選擇項,有關細節(jié)請參考系統手冊。為了察看所需的信息,執(zhí)行:
ps –axj
PPID PID PGID SID TTY TPGID STAT UID TIME COMMAND
0 1 0 0 ? -1 S 0 0:04 init
1 2 1 1 ? -1 SW 0 0:00 [keventd]
1 3 1 1 ? -1 SW 0 0:00 [kapm-idled]
0 4 1 1 ? -1 SWN 0 0:00 [ksoftirqd_CPU0]
0 5 1 1 ? -1 SW 0 0:00 [kswapd]
0 6 1 1 ? -1 SW 0 0:00 [kreclaimd]
0 7 1 1 ? -1 SW 0 0:00 [bdflush]
0 8 1 1 ? -1 SW 0 0:00 [kupdated]
1 9 1 1 ? -1 SW< 0 0:00 [mdrecoveryd]
1 17 1 1 ? -1 SW 0 0:02 [kjournald]
1 92 1 1 ? -1 SW 0 0:00 [khubd]
1 573 573 573 ? -1 S 0 0:03 syslogd -r -x
1 578 578 578 ? -1 S 0 0:00 klogd -2
1 598 598 598 ? -1 S 32 0:00 portmap
進程號為1、2的這些進程非常特殊,存在于系統的整個生命期中。它們沒有父進程ID ,沒有組進程ID ,也沒有對話期ID 。syslogd 守護進程可用于任何為操作人員記錄系統消息的程序中。可以在一臺實際的控制臺上打印這些消息,也可將它們寫到一個文件中。sendmail 是標準郵遞守護進程。update 程序定期將內核緩存中的內容寫到硬盤上(通常是每隔30 秒)。為了做到這一點,該程序每隔30 秒調用sync(2 )函數一次。cron 守護進程在指定的日期和時間執(zhí)行指定的命令。許多系統管理任務是由cron 定期地使相關程序執(zhí)行而得以實現的。inetd進程監(jiān)聽系統的網絡界面,以輸入對各種網絡服務器的請求。最后一個守護進程,lpd 處理對系統提出的各個打印請求。
注意,所有守護進程都以超級用戶(用戶ID為0)的優(yōu)先權運行。沒有一個守護進程具有控制終端,終端名稱設置為問號(?)、終端前臺進程組ID設置為-1。缺少控制終端是守護進程調用了setsid的結果。除update以外的所有守護進程都是進程組的首進程,對話期的首進程,而且是這些進程組和對話期中的唯一進程。最后,應當引起注意的是所有這些守護進程的父進程都是init進程。
在接觸實際編程前,我們來看看編寫守護進程要碰到的概念:進程組合會話期。
進程組
每個進程除了有一進程ID之外,還屬于一個進程組(在討論信號時就會涉及進程組)進程組是一個或多個進程的集合。每個進程有一個唯一的進程組ID。進程組ID類似于進程ID——它是一個正整數,并可存放在pid_t數據類型中。
每個進程組有一個組長進程。組長進程的標識是,其進程組ID等于其進程ID,進程組組長可以創(chuàng)建一個進程組,創(chuàng)建該組中的進程,然后終止,只要在某個進程組中有一個進程存在,則該進程就存在,這與其組長進程是否終止無關。從進程組創(chuàng)建開始到其中最后一個進程離開為止的時間區(qū)間稱為進程組的生命期。某個進程組中的最后一個進程可以終止,也可以參加另一進程組。
前面已經提到進程調用setgid可以參加一個現存的組或者創(chuàng)建一個新進程組(setsid也可以創(chuàng)建一個新的進程組,后面將用到)
會話期
會話期(session)是一個或多個進程組的集合。其中,在一個會話期中有3個進程組,通常是有shell的管道線將幾個進程編成一組的。
下面說明有關會話期和進程組的一些特性:
一個會話期可以有一個單獨的控制終端(controlling terminal),這一般是我們在其上登錄的終端設備(終端登錄)或偽終端設備(網絡登錄),但這個控制終端并不是必需的。
建立與控制終端連接的會話期首進程,被稱之為控制進程(contronlling process)。以及一個會話期中的幾個進程組可被分為一個前臺進程組(foreground process group)以及一個或幾個后臺進程組(background process group)
如果一個會話期有一個控制終端,則它有一個前臺進程組,其他進程組為后臺進程組。無論何時鍵入中斷鍵(常常是delete或ctrl-c)或退出鍵(通常是ctrl-/),就會造成將中斷信號或退出信號送至前途進程組的所有進程。
守護進程的編程規(guī)則
在不同Unix環(huán)境下,守護進程的具體編程細節(jié)并不一致。但所幸的是,守護進程的編程原則其實都一樣,區(qū)別僅在于具體的實現細節(jié)不同,這個原則就是要滿足守護進程的特性。編程規(guī)則如下:
1、在后臺運行
為避免掛起控制終端,要將daemon放入后臺執(zhí)行,其方法是,在進程中調用fork使父進程終止,讓daemon在子進程中后臺執(zhí)行。具體就是調用f o r k ,然后使父進程e x i t 。這樣做實現了下面幾點:
第一,如果該精靈進程是由一條簡單s h e l l 命令起動的,那么使父進程終止使得s h e l l 認為這條命令已經執(zhí)行完成。
第二,子進程繼承了父進程的進程組I D ,但具有一個新的進程I D ,這就保證了子進程不是一個進程組的首進程。這對于下面就要做的s e t s i d 調用是必要的前提條件。
2、脫離控制終端,登錄會話和進程組
登錄會話可以包含多個進程組,這些進程組共享一個控制終端,這個控制終端通常是創(chuàng)建進程的登錄終端、控制終端,登錄會話和進程組通常是從父進程繼承下來的。我們的目的就是要擺脫它們,使之不受它們的影響。
其方法是在第一點的基礎上,調用setsid()使進程成為會話組長:
需要說明的是,當進程是會話組長時,setsid()調用會失敗,但第一點已經保證進程不是會話組長。setsid()調用成功后,進程成為新的會話組長和新的進程組長,并與原來的登錄會話和進程組脫離,由于會話過程對控制終端的獨占性,進程同時與控制終端脫離。
具體是操作就是:
(a )成為新對話期的首進程
(b )成為一個新進程組的首進程
(c )沒有控制終端。
3、禁止進程重新打開控制終端
現在,進程已經成為無終端的會話組長,但它可以重新申請打開一個控制終端。可以通過使進程不再成為會話組長來禁止進程重新打開控制終端:
4、關閉打開的文件描述符
進程從創(chuàng)建它的父進程那里繼承了打開的文件描述符。如不關閉,將會浪費系統資源,造成進程所在地文件系統無法卸下以及無法預料的錯誤。一般來說,必要的是關閉0、1、2三個文件描述符,即標準輸入、標準輸出、標準錯誤。因為我們一般希望守護進程自己有一套信息輸出、輸入的體系,而不是把所有的東西都發(fā)送到終端屏幕上。調用fclose();
5、改變當前工作目錄
將當前工作目錄更改為根目錄。從父進程繼承過來的當前工作目錄可能在一個裝配的文件系統中。因為精靈進程通常在系統再引導之前是一直存在的,所以如果精靈進程的當前工作目錄在一個裝配文件系統中,那么該文件系統就不能被拆卸。
另外,某些精靈進程可能會把當前工作目錄更改到某個指定位置,在此位置做它們的工作。例如,行式打印機假脫機精靈進程常常將其工作目錄更改到它們的s p o o l 目錄上。
可以調用chdir(“目錄”);
6、重設文件創(chuàng)建掩碼
將文件方式創(chuàng)建屏蔽字設置為0 。由繼承得來的文件方式創(chuàng)建屏蔽字可能會拒絕設置某些許可權。例如,若精靈進程要創(chuàng)建一個組可讀、寫的文件,而繼承的文件方式創(chuàng)建屏蔽字,屏蔽了這兩種許可權,則所要求的組可讀、寫就不能起作用。
7、處理SIGCHLD 信號
處理SIGCHLD信號并不是必需的。但對于某些進程,特別是服務器進程往往在請求到來時生產子進程出來請求。如果父進程不等待子進程結束,子進程將成為僵尸進程,(zombie)而仍占用系統資源。如果父進程等待子進程結束,將增加父進程的負擔,影響服務器進程的并發(fā)性能。在系統V下可以簡單的將SIGCHLD信號的操作設為SIG-IGN:
signal(SIGCHLD,SIG_IGN);
這樣,內核在子進程結束時不會產生僵尸進程,這一點與BSD4不同,在BSD4下必須顯示等 待子進程結束才能釋放僵尸進程。
守護進程實例
守護進程實例包括兩部分:主程序test.c和初始化程序init.c。主程序每隔一分鐘向/tmp
目錄中的日志test.log 報告運行狀態(tài)。初始化程序中的init_daemon 函數負責生成守護進程
void make_daemon(void)
{
pid_t pid;
FILE * lockfd;
sigset_t sighup;
int i;
extern pid_t getsid(pid_t);
pid = fork();//第一個子進程生成
if (pid < 0) {
printinfo("fork error!",INFOERROR);
exit(FAILEXIT);
}else if (pid > 0) {
printinfo("fork 1 ok! ", INFOSCREEN);
exit(OKEXIT);//退出父進程,擺脫shell的控制
}
pid = getpid();//獲得子進程自身的id
lockfd = fopen(PIDFILE, "w");//以下是將pid寫入文件
if (lockfd != NULL) {
fprintf(lockfd, "%d/n", pid);
fclose(lockfd);
}//寫入pid
if (getsid(0) != pid) {//創(chuàng)建新的會話期
if (setsid() < 0) {
printinfo("backupdaemon setsid error!",INFOERROR);
perror("setsid");
}
}
if(pid=fork()){//再次生成子進程,這時候是孫子進程
exit(0);//退出上一代進程
}else if(pid<0){
exit(1);
}
close(1);//關閉文件
close(2);
chdir(rundir);//改變運行的目錄
umask(022);//改變文件權限
}
守護進程的錯誤輸出
守護進程不屬于任何終端,所以當需要輸出某些信息時,它無法像一般程序那樣將信息直接輸出到標準輸出和標準錯誤輸出中。我們很大時候也不希望每個守護進程將它自己的出錯消息寫到一個單獨的文件中。因為對于系統管理人員而言,要記住哪一個守護進程寫到哪一個記錄文件中,并定期的檢查這些文件,他一定會為此感到頭疼的。所以,我們需要有一個集中的守護進程出錯記錄機制。目前很多系統都引入了syslog記錄進程來實現這一目的。
自伯克利開發(fā)了BSD syslog并廣泛應用以來,BSD syslog 機制被大多數守護進程所使用。我們下面介紹BSD syslog 的用法。有三種方法產生記錄消息:
1 內核例程可以調用log函數。任何一個用戶進程通過打開和讀/dev/klog設備就可以讀取這些消息。因為我們無意編寫內核中的例程,所以不再進一步說明此函數。
2 大多數用戶進程(守護進程)調用syslog函數以產生記錄消息。我們將在下面說明其調用序列。這使消息發(fā)送至Unix域數據報套接口/dev/log。
3 在此主機上,或通過TCP/IP網絡連接到此主機的某一其他主機上的一個用戶進程可將記錄消息發(fā)向UDP端口514。
注意:syslog 函數并不產生這些UDP數據報——它們要求產生此記錄消息的進程具有顯式的網絡編程。
通常,syslog守護進程讀取三種格式的記錄消息。此守護進程在啟動時讀一個配置文件。一般來說,其文件名為/etc/syslog.conf,該文件決定了不同種類的消息應送向何處。例如,緊急消息可被送向系統管理員(若已登錄),并在控制臺上顯示,而警告消息則可記錄到一個文件中。該機制提供了syslog函數,其調用格式如下
#include?
void openlog (char*ident,int option ,int facility);
void syslog(int priority,char*format,……)
void closelog();
調用openlog是可選擇的。如果不調用openlog,則在第一次調用syslog時,自動調用openlog。調用closelog也是可選擇的,它只是關閉被用于與syslog守護進程通信的描述符。調用openlog 使我們可以指定一個ident,以后, 此ident 將被加至每則記錄消息中。ident 一般是程序的名稱(例如 ,cron ,inetd 等)。option 有4種可能:
LOG_CONS 若日志消息不能通過Unix域數據報發(fā)送至syslog,則將該消息寫至控制臺。
LOG_NDELAY1 立即打開Unix域數據報套接口至syslog守護進程,而不要等到記錄第一消息。通常,在記錄第一條消息之前,該套接口不打開。
LOG_PERROR 除將日志消息發(fā)送給syslog 外,還將它至標準出錯。此選項僅由4.3BSDReno及以后版本支持。
LOG_PID 每條消息都包含進程ID。此選項可供對每個請求都fork一個子進程的守護進程使用。
在openlog中設置facility參數的目的是讓配置文件可以說明,來自不同設施的消息以不同的方式進行處理。如果不調用openlog,或者以facility 為0來調用它,那么在調用syslog 時,可將facility作為priority參數的一個部分進行說明。調用syslog產生一個記錄消息。其priority參數是facility和level的組合,它們可選取的值分別列于下面。level值按優(yōu)先級從高級到最低按序排列
python版本:
1. 調用fork()以便父進程可以退出,這樣就將控制權歸還給運行你程序的命令行或shell程序。需要這一步以便保證新進程不是一個進程組頭領進程(process group leader)。下一步,‘setsid()’,會因為你是進程組頭領進程而失敗。
2. 調用‘setsid()’ 以便成為一個進程組和會話組的頭領進程。由于一個控制終端與一個會話相關聯,而且這個新會話還沒有獲得一個控制終端,我們的進程沒有控制終端,這對于守護程序來說是一件好事。?
3. 再次調用‘fork()’所以父進程(會話組頭領進程)可以退出。這意味著我們,一個非會話組頭領進程永遠不能重新獲得控制終端。
4. 調用‘chdir("/")’確認我們的進程不保持任何目錄于使用狀態(tài)。不做這個會導致系統管理員不能卸裝(umount)一個文件系統,因為它是我們的當前工作目錄。 [類似的,我們可以改變當前目錄至對于守護程序運行重要的文件所在目錄]?
5. 調用‘umask(0)’以便我們擁有對于我們寫的任何東西的完全控制。我們不知道我們繼承了什么樣的umask。 [這一步是可選的](譯者注:這里指步驟5,因為守護程序不一定需要寫文件)
6. 調用‘close()’關閉文件描述符0,1和2。這樣我們釋放了從父進程繼承的標準輸入,標準輸出,和標準錯誤輸出。我們沒辦法知道這些文描述符符可能已經被重定向去哪里。注意到許多守護程序使用‘sysconf()’來確認‘_SC_OPEN_MAX’的限制。‘_SC_OPEN_MAX’告訴你每個進程能夠打開的最多文件數。然后使用一個循環(huán),守護程序可以關閉所有可能的文件描述符。你必須決定你需要做這個或不做。如果你認為有可能有打開的文件描述符,你需要關閉它們,因為系統有一個同時打開文件數的限制。?
7. 為標準輸入,標準輸出和標準錯誤輸出建立新的文件描述符。即使你不打算使用它們,打開著它們不失為一個好主意。準確操作這些描述符是基于各自愛好;比如說,如果你有一個日志文件,你可能希望把它作為標準輸出和標準錯誤輸出打開,而把‘/dev/null’作為標準輸入打開;作為替代方法,你可以將‘/dev/console’作為標準錯誤輸出和/或標準輸出打開,而‘/dev/null’作為標準輸入,或者任何其它對你的守護程序有意義的結合方法。(譯者注:一般使用dup2函數原子化關閉和復制文件描述符。
def createDaemon():?? ?
??????? import os
?? ??? ?
?? ???? # create - fork 1
??????? try:
??????????????? if os.fork() > 0:?
??????????????????????? os._exit(0)
??????? except OSError, error:
??????????????? print 'fork #1 failed: %d (%s)' % (error.errno, error.strerror)
?? ???????? os._exit(1)
?? ??
?? ???? # it separates the son from the father
??????? os.chdir('/')
??????? os.setsid()
??????? os.umask(0)
?? ??
?? ???? # create - fork 2
??????? try:
??????????????? pid = os.fork()
?? ???????? if pid > 0:
?? ???????????? print 'Daemon PID %d' % pid
?? ???????????? os._exit(0)
??????? except OSError, error:
?? ???????? print 'fork #2 failed: %d (%s)' % (error.errno, error.strerror)
?? ???????? os._exit(1)
?? ??
??????? funzioneDemo() # function demo
?? ??? ?
def funzioneDemo():
?? ??
??????? import time
?? ??
??????? fd = open('/tmp/demone.log', 'w')
??????? while True:
??????????????? fd.write(time.ctime()+'\n')
?? ???????? fd.flush()
?? ???????? time.sleep(2)
??????? fd.close()
?? ??? ?
if __name__ == '__main__':
?? ??
??????? createDaemon()
轉自http://blog.csdn.net/dysj4099/article/details/18219411
由于需要為OpenStack中的虛擬機設計監(jiān)控Agent,因此需要一個穩(wěn)妥、可靠并簡單的守護進程實現作為基礎框架,故研究了一下Linux系統中的守護進程。
首先,守護進程是一類在后臺執(zhí)行,生命周期較長的進程,它一般隨系統啟動運行,在系統關閉的時候停止。翻譯了一下《Advanced Programming in The Unix Environment? Section》的第13.3小節(jié),此小節(jié)是一個關于守護進程的設計規(guī)范,羅列了守護進程設計實現的幾大原則:
?
翻譯《AdvancedProgrammingin The Unix Environment》Section 13.3 Page 583
?
守護進程編碼規(guī)范:
????????本小節(jié)將介紹一些守護進程的基本編碼規(guī)范,這些規(guī)范將阻止守護進程與當前環(huán)境產生一些不必要的交互。本節(jié)將通過一個函數daemonize實現這些規(guī)范。
?
1.???? 首先要做的被稱為?umask,這一步驟會將文件創(chuàng)建掩碼重置為0。這一步的原因是守護進程繼承(inherited)得到的文件掩碼有可能會拒絕某些特定的文件操作權限。如果守護進程想要創(chuàng)建文件,那有可能它需要設置特定的文件操作權限。例如,如果守護進程想要創(chuàng)建允許組讀和寫(group-readand group-write)權限的文件,但繼承得到的文件創(chuàng)建掩碼屏蔽了這個權限,則創(chuàng)建操作不會成功。
2.????調用?fork?并使父進程退出(exit)。這一步驟的目的在于。首先,如果守護進程是通過一個簡單的shell命令建立的,那么在父進程終止的時候shell會認為命令已經結束了繼而結束守護進程。其次,子進程繼承得到父進程的groupID同時也獲得了一個新的進程號,所以我們必須得保證子進程不能擔任groupleader的角色,這是下一步setsid?操作的前提。
注:此步驟是使得進程在后臺運行。
3.????調用?setsid?創(chuàng)建一個新的會話。有三個步驟將會執(zhí)行:(a)進程將成為這個新會話的sessionleader角色,(b)此進程將會成為一個新的進程組的groupleader,(c)此進程將不會有控制終端。
注:此步驟將使得進程脫離控制終端、登錄會話以及進程組。
·?????在基于SystemV的系統中,有建議再一次調用fork?并使父進程退出。而新產生的進程將會成為真正的守護進程。這一步驟將保證守護進程不是一個sessionleader,進而阻止它獲取一個控制終端。或者另一種阻止守護進程獲取控制終端的方案是任意時刻打開一個終端設備的時候確保指定O_NOCTTY。
注:此步驟將禁止進程重新打開控制終端。
4.????將當前的工作目錄切換到系統根目錄下。因為從父進程集成來的當前工作目錄可能是一個被掛載的文件系統。因為守護進程通常是直到系統重啟的時候才會退出,如果守護進程的工作目錄在一個掛載的文件系統上,那么這個文件系統就不能被卸載(unmounted)。
·????? 有的守護進程可能會將當前的工作目錄切換到一些特定的路徑,在這些路徑下它們將完成它們的工作。例如,lineprinter spoolingdaemons 通常將工作目錄切換為spool目錄。
5.????一些不必要的文件描述符將會被關閉。這個步驟將阻止守護進程保持從父進程集成到的任何已經打開的文件描述符(也可能是shell或其他進程)。我們可以使用?open_max?函數或?getrlimit?函數來查找當前優(yōu)先級最高的文件描述符并關閉此描述符之下的所有其他描述符。
注:保持打開的描述符將會占用系統資源并可能使某些文件不能被卸載。
6.????有一些守護進程將打開文件描述符0, 1, 2 指向?/dev/null?,這樣一來所有試圖從標準輸入、輸出及錯誤讀取守護進程信息的操作都不能成功。因為守護進程當前已經不與任何終端設備相關聯,沒有地方顯示其輸出或接受用戶的輸入。即使守護進程是從一個交互式session創(chuàng)建的,守護進程也將運行在后臺,任何終端的登錄與終止將不會影響守護進程。如果有其他用戶通過當前的終端登錄,我們也不希望守護進程的輸出出現在終端上,并且該用戶的任何輸入也不會被守護進程接收。
?
總結起來就是:
1) 第一次fork將會創(chuàng)建父-子進程,同時使得父進程退出保證守護進程能夠運行在后臺。
2) 通過setsid步驟使得進程與控制終端、登錄會話以及進程組脫離。
3) 第二次fork將確保進程重新打開控制終端,并且產生子-孫進程,而子進程退出后孫進程將成為真正的守護進程。
4) 其他還有一些諸如工作目錄設置、關閉文件描述符、設置文件創(chuàng)建掩碼之類的操作。
?
最后看一個python實現的例子,代碼來自:http://www.jejik.com/articles/2007/02/a_simple_unix_linux_daemon_in_python/
[python]? view plain copy
Daemon.daemonize()方法就是執(zhí)行了上述的步驟。如果需要使用此守護進程類,請繼承Daemon類并自行實現run方法。
[python]? view plain copy參考資料:
http://www.jejik.com/articles/2007/02/a_simple_unix_linux_daemon_in_python/
http://www.zhouxiongzhi.net/tech/double-fork-when-creating-daemon/
http://blog.163.com/yungang_z/blog/static/175153133201232462140622/
總結
以上是生活随笔為你收集整理的Linux守护进程设计规范及python实现的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深度学习中的 Batch_Size,以及
- 下一篇: FreeRTOS-CortexM4-相关