如何編寫python的daemon程序
以前把守護進程與后臺任務搞混了,后面看了文章才知道這兩者的區別,寫此文表達自己對守護進程的理解.
1:什么是守護進程?所謂守護進程是一種是 Linux 的一種長期運行的后臺服務進程,httpd、named、sshd 等服務都是以守護進程 Daemon 方式運行的,通常服務名稱以字母d結尾,也就是 Daemon 第一個字母.
無需控制終端(不需要與用戶交互) 在后臺運行 生命周期比較長,一般是隨系統啟動和關閉 2:守護進程必要性通常我們執行任務時是在前臺執行,占領了當前終端,此時無法進行操作,就算我們添加了 &符號,將程序放到后臺,但也就因為終端斷網等問題,導致程序中斷。
所要知道的是:在目前的linux上,有了systemd這個服務,這個服務管理工具可以方便我們寫在后臺運行的程序,甚至可以代替這種守護進程。通過把寫服務的配置文件,讓systemd監控我們的程序,可以隨系統啟動而運行,可以設定啟動條件,及其的方便。
3:進程組$ ps -o pid,pgid,ppid,comm | cat PID PGID PPID COMMAND10179 10179 10177 bash10263 10263 10179 ps10264 10263 10179 cat bash:進程和進程組ID都是 10179,父進程其實是 sshd(10177) ps:進程和進程組ID都是 10263,父進程是 bash(10179),因為是在 Shell 上執行的命令 cat:進程組 ID 與 ps 的進程組 ID 相同,父進程同樣是 bash(10179) 4:會話組
多個進程構成一個進程組,而會話組是由多個進程組構建而。而進程組又被稱為job,會話有前臺作業,也會有后臺作業;一個會話可以有一個控制終端,當控制終端有輸入和輸出時都會傳遞給前臺進程組,比如Ctrl + Z。會話的意義在于能將多個作業通過一個終端控制,一個前臺操作,其它后臺運行。
那么如何編寫守護進程呢?其實編寫守護進程很簡單,只需要遵循一下幾點即可
1:創建子進程,父進程退出PPID PID PGID SID TTY TPGID STAT UID TIME COMMAND 0 49 49 49 pts/2 70 Ss 0 0:00 /bin/bash 49 70 70 49 pts/2 70 R+ 0 0:00 _ ps axjf 0 17 17 17 pts/1 68 Ss 0 0:00 /bin/bash 17 68 68 17 pts/1 68 S+ 0 0:00 _ python hello.py 68 69 68 17 pts/1 68 S+ 0 0:00 _ python hello.py 0 1 1 1 pts/0 1 Ss+ 0 0:00 /bin/bash
進程 fork 后,父進程退出。這么做的原因有 2 點:
如果守護進程是通過 Shell 啟動,父進程退出,Shell 就會認為任務執行完畢,這時子進程由 init 收養子進程繼承父進程的進程組 ID,保證了子進程不是進程組組長,因為后邊調用setsid()要求必須不是進程組長PGID就是進程所屬的Group的Leader的PID,如果PGID=PID,那么該進程是Group Leader
2、子進程創建新會話調用setsid()創建一個新的會話,并成為新會話組長。這個步驟主要是要與繼承父進程的會話、進程組、終端脫離關系。
那么問題來了,為什么進程組組長無法調用setsid()呢?
對于進程組長來說,進程組 ID 已經和 PID 相同了,如果它被允許調用setsid()的話,它的進程組 ID 會保持不變,會出現:
1:進程組長屬于新的會話;
2:老的進程組成員屬于舊的會話。
這樣情況變成了一個進程組的成員屬于不同的會話,Linux想要禁止這種情況的發生。
3、禁止子進程重新打開終端此刻子進程是會話組長,為了防止子進程重新打開終端,再次 fork 后退出父進程,也就是此子進程。這時子進程 2 不再是會話組長,無法再打開終端。其實這一步驟不是必須的,不過加上這一步驟會顯得更加嚴謹。
4、設置當前目錄為根目錄如果守護進程的當前工作目錄是/usr/home目錄,那么管理員在卸載/usr分區時會報錯的。為了避免這個問題,可以調用chdir()函數將工作目錄設置為根目錄/。
5、設置文件權限掩碼文件權限掩碼是指屏蔽掉文件權限中的對應位。由于使用 fork()函數新建的子進程繼承了父進程的文件權限掩碼,這就給該子進程使用文件帶來了諸多的麻煩。因此,把文件權限掩碼設置為 0,可以大大增強該守護進程的靈活性。通常使用方法是umask(0)。
6、關閉文件描述符子進程會繼承已經打開的文件,它們占用系統資源,且可能導致所在文件系統無法卸載。此時守護進程與終端脫離,常說的輸入、輸出、錯誤描述符也應該關閉,畢竟這個時候也不會使用終端了。
守護進程的出錯處理由于守護進程脫離了終端,不能將錯誤信息輸出到控制終端,即使 gdb 也無法正常調試。常用的方法是使用 syslog 服務,將錯誤信息輸入到/var/log/messages中。
syslog 是 Linux 中的系統日志管理服務,通過守護進程 syslogd 來維護。該守護進程在啟動時會讀一個配置文件/etc/syslog.conf。該文件決定了不同種類的消息會發送向何處。
代碼展示import osimport sysdef daemonize(pid_file=None): pid = os.fork() if pid: sys.exit(0) os.setsid() _pid = os.fork() if _pid: sys.exit(0) os.umask(0) os.chdir(’/’) sys.stdout.flush() sys.stderr.flush() with open(’/dev/null’) as read_null, open(’/dev/null’,’w’) as write_null: os.dup2(read_null.fileno(), sys.stdin.fileno()) os.dup2(write_null.fileno(), sys.stdout.fileno()) os.dup2(write_null.fileno(), sys.stderr.fileno()) if pid_file: with open(pid_file,’w+’) as f: f.write(str(os.getpid()))if __name__ == '__main__': daemonize(’test.txt’)
關于os.dup2這個函數
os.dup2() 方法用于將一個文件描述符 fd 復制到另一個 fd2。Unix, Windows 上可用。
>>> import os>>> f = open('hello.txt','a')>>> os.dup2(f.fileno(),1)>>> f.close()>>> print('hello world')>>> print('changed')cat hello.txt1hello worldchanged附加話題
為什么服務器端常常fork兩次呢?
因為這是為了避免產生僵尸進程。
當我們只fork()一次后,存在父進程和子進程。這時有兩種方法來避免產生僵尸進程:
父進程調用waitpid()等函數來接收子進程退出狀態。 父進程先結束,子進程則自動托管到Init進程(pid = 1)。目前先考慮子進程先于父進程結束的情況:
若父進程未處理子進程退出狀態,在父進程退出前,子進程一直處于僵尸進程狀態。 若父進程調用waitpid()(這里使用阻塞調用確保子進程先于父進程結束)來等待子進程結束,將會使父進程在調用waitpid()后進入睡眠狀態,只有子進程結束父進程的waitpid()才會返回。 如果存在子進程結束,但父進程還未執行到waitpid()的情況,那么這段時期子進程也將處于僵尸進程狀態。由此,可以看出父進程與子進程有父子關系,除非保證父進程先于子進程結束或者保證父進程在子進程結束前執行waitpid(),子進程均有機會成為僵尸進程。那么如何使父進程更方便地創建不會成為僵尸進程的子進程呢?這就要用兩次fork()了。
父進程一次fork()后產生一個子進程隨后立即執行waitpid(子進程pid, NULL, 0)來等待子進程結束,然后子進程fork()后產生孫子進程隨后立即exit(0)。這樣子進程順利終止(父進程僅僅給子進程收尸,并不需要子進程的返回值),然后父進程繼續執行。這時的孫子進程由于失去了它的父進程(即是父進程的子進程),將被轉交給Init進程托管。于是父進程與孫子進程無繼承關系了,它們的父進程均為Init,Init進程在其子進程結束時會自動收尸,這樣也就不會產生僵尸進程了。
以上就是如何編寫python的daemon程序的詳細內容,更多關于python的daemon程序的資料請關注好吧啦網其它相關文章!
相關文章: