PHP內核探索 —— Apache模塊介紹
Apache是目前世界上使用最為廣泛的一種Web Server,它以跨平臺、高效和穩定而聞名。按照去年官方統計的數據,Apache服務器的裝機量占該市場60%以上的份額。尤其是在X(Unix/Linux)平臺上,Apache是最常見的選擇。其它的Web Server產品,比如IIS,只能運行在Windows平臺上,是基于微軟.Net架構技術的不二選擇。
Apache支持許多特性,大部分通過模塊擴展實現。常見的模塊包括mod_auth(權限驗證)、mod_ssl(SSL和TLS支持) mod_rewrite(URL重寫)等。一些通用的語言也支持以Apache模塊的方式與Apache集成。 如Perl,Python,Tcl,和PHP等。
Apache并不是沒有缺點,它最為詬病的一點就是變得越來越重,被普遍認為是重量級的WebServer。所以,近年來又涌現出了很多輕量級的替代產品,比如lighttpd,nginx等等,這些WebServer的優點是運行效率很高,但缺點也很明顯,成熟度往往要低于Apache,通常只能用于某些特定場合。
Apache組件邏輯圖Apache是基于模塊化設計的,總體上看起來代碼的可讀性高于php的代碼,它的核心代碼并不多,大多數的功能都被分散到各個模塊中,各個模塊在系統啟動的時候按需載入。你如果想要閱讀Apache的源代碼,建議你直接從main.c文件讀起,系統最主要的處理邏輯都包含在里面。
MPM(Multi -Processing Modules,多重處理模塊)是Apache的核心組件之一,Apache通過MPM來使用操作系統的資源,對進程和線程池進行管理。Apache為了能夠獲得最好的運行性能,針對不同的平臺(Unix/Linux、Window)做了優化,為不同的平臺提供了不同的MPM,用戶可以根據實際情況進行選擇,其中最常使用的MPM有prefork和worker兩種。至于您的服務器正以哪種方式運行,取決于安裝Apache過程中指定的MPM編譯參數,在X系統上默認的編譯參數為prefork。由于大多數的Unix都不支持真正的線程,所以采用了預派生子進程(prefork)方式,像Windows或者Solaris這些支持線程的平臺,基于多進程多線程混合的worker模式是一種不錯的選擇。對此感興趣的同學可以閱讀有關資料,此處不再多講。Apache中還有一個重要的組件就是APR(Apache portable Runtime Library),即Apache可移植運行庫,它是一個對操作系統調用的抽象庫,用來實現Apache內部組件對操作系統的使用,提高系統的可移植性。Apache對于php的解析,就是通過眾多Module中的php Module來完成的。
當PHP需要在Apache服務器下運行時,一般來說,它可以mod_php5模塊的形式集成, 此時mod_php5模塊的作用是接收Apache傳遞過來的PHP文件請求,并處理這些請求, 然后將處理后的結果返回給Apache。如果我們在Apache啟動前在其配置文件中配置好了PHP模塊(mod_php5), PHP模塊通過注冊apache2的ap_hook_post_config掛鉤,在Apache啟動的時候啟動此模塊以接受PHP文件的請求。
除了這種啟動時的加載方式,Apache的模塊可以在運行的時候動態裝載, 這意味著對服務器可以進行功能擴展而不需要重新對源代碼進行編譯,甚至根本不需要停止服務器。 我們所需要做的僅僅是給服務器發送信號HUP或者AP_SIG_GRACEFUL通知服務器重新載入模塊。 但是在動態加載之前,我們需要將模塊編譯成為動態鏈接庫。此時的動態加載就是加載動態鏈接庫。 Apache中對動態鏈接庫的處理是通過模塊mod_so來完成的,因此mod_so模塊不能被動態加載, 它只能被靜態編譯進Apache的核心。這意味著它是隨著Apache一起啟動的。
Apache是如何加載模塊的呢?我們以前面提到的mod_php5模塊為例。 首先我們需要在Apache的配置文件httpd.conf中添加一行:
LoadModule php5_module modules/mod_php5.so
這里我們使用了LoadModule命令,該命令的第一個參數是模塊的名稱,名稱可以在模塊實現的源碼中找到。 第二個選項是該模塊所處的路徑。如果需要在服務器運行時加載模塊, 可以通過發送信號HUP或者AP_SIG_GRACEFUL給服務器,一旦接受到該信號,Apache將重新裝載模塊, 而不需要重新啟動服務器。
在配置文件中添加了所上所示的指令后,Apache在加載模塊時會根據模塊名查找模塊并加載, 對于每一個模塊,Apache必須保證其文件名是以“mod_”開始的,如PHP的mod_php5.c。 如果命名格式不對,Apache將認為此模塊不合法。Apache的每一個模塊都是以module結構體的形式存在, module結構的name屬性在最后是通過宏STANDARD20_MODULE_STUFF以__FILE__體現。 關于這點可以在后面介紹mod_php5模塊時有看到。這也就決定了我們的文件名和模塊名是相同的。 通過之前指令中指定的路徑找到相關的動態鏈接庫文件后,Apache通過內部的函數獲取動態鏈接庫中的內容, 并將模塊的內容加載到內存中的指定變量中。
在真正激活模塊之前,Apache會檢查所加載的模塊是否為真正的Apache模塊, 這個檢測是通過檢查module結構體中的magic字段實現的。 而magic字段是通過宏STANDARD20_MODULE_STUFF體現,在這個宏中magic的值為MODULE_MAGIC_COOKIE, MODULE_MAGIC_COOKIE定義如下:
#define MODULE_MAGIC_COOKIE 0x41503232UL /* 'AP22' */
最后Apache會調用相關函數(ap_add_loaded_module)將模塊激活, 此處的激活就是將模塊放入相應的鏈表中(ap_top_modules鏈表: ap_top_modules鏈表用來保存Apache中所有的被激活的模塊,包括默認的激活模塊和激活的第三方模塊。)
相關文章: