学习《apache源代码全景分析》之摘录
一、大綱
? ?1.Web服務器概述
? ?2.Apache體系結構
? ?3.配置文件管理
? ?4.Apache模塊化體系結構
? ?5.多任務并發處理
? ?6.網絡連接
? ?7.過濾器
? ?8.存儲段和存儲段組
? ?9.常用過濾器
二、摘錄內容
? ? 2.1 一個有用的Web服務器通常會更復雜,它們還會包含以下一些額外功能:
? ? ? ? a) 完整地實現HTTP/0.9、HTTP/1.0及HTTP/1.1協議支持。
? ? ? ? b) 能夠處理并發請求,支持多進程或多線程。
? ? ? ? c) 提供開發接口,允許開發人員自行增加額外的功能。
? ? ? ? d) 服務器安全機制的實現。
? ? ? ? e) 動態內容生成,允許服務器通過CGI、腳本語言(比如perl)和服務器端(包含SSI)生成動態的Web頁面。
? ? ? ? f) 支持虛擬主機
? ? ? ? g) 支持代理功能
? ? ? ? h) 允許根據MIME類型協商選擇合適的返回資源。
? ? 2.2 緩存
? ? ? ? 2.2.1 Expires
? ? ? ? ? ? ? ? ?Expires字段聲明了一個網頁或URL地址不再被瀏覽器緩存的時間,一旦超過了這個時間,瀏覽器都應該聯系原始服務器。
? ? ? ? 2.2.2 Cache-Control
? ? ? ? 2.2.3 Last-Modified
? ? ? ? ? ? ? ? ?Last-Modified和Etag是條件請求(Conditional Request)相關的兩個字段。如果一個緩存收到了針對一個頁面的請求,它發送一個驗證請求詢問服務器頁面是否已經更改,在HTTP頭里面帶上"ETag"和"If Modify Since"頭。服務器根據這些信息判斷是否更新了信息,如果沒有更新,就返回HTTP 304(NotModify);如果更新了,就返回HTTP 200和更新的頁面內容,并且攜帶更新的"ETag"和“LastModified”。
? ? 2.3 訪問控制和安全
? ? ? ? ? 認證(Authentication)、授權(Authorization)及賬戶確認(Accounting)三者合起來稱為AAA模塊。
? ? ? ? ? 認證包括兩種:基本認證和摘要認證。
? ? ? ? ? 對資源的訪問可能限制在特定的域,瀏覽器所在機器的網絡、地址或特定的用戶及用戶組。Apache通過解析全局的及局部配置文件來決定用戶對特定資源的訪問權限。如果管理員允許,Web內容提供者還可以通過本地配置文件.htaccess限制對他們的文檔的訪問。
? ? ? ? ? 一般來說,服務器端的腳本分為兩類:嵌入在HTML中的腳本和完全獨立生成HTML的腳本。
? ? ? ? ? 純腳本生成HTML的例子最主要的就是CGI程序和Java Servlets兩種。CGI程序通常是C、C++或Perl等程序,Java Servlets則是使用Java程序編寫的。
? ? ? 2.4 Apache 2.0.45版本的目錄結構
? ? ? ? ? ?
? ? ? ? ? ? ?整個Apache核心功能包括請求處理、協議處理等功能,實現文件全部包含在server目錄中,server目錄中又包含一個稱之為mpm的目錄。在1.3版本中,Apache僅僅支持準備創建進程的一種并發方式,這是一直為人所詬病的地方。在2.0以上的版本中,Apache推出了多種進程并發模型,包括線程池、預創建等,這些都被稱之為多進程處理模塊(MPM)。它們之間既相互獨立,又能相互替換。這些模塊統統保存在mpm目錄中,每一種并發模型對應一個.c文件。
? ? ? ? ? ? ?另外一個重要的目錄就是modules,顧名思義,其中保存著Apache中的所有模塊。每個模塊占有一個目錄,比如AAA認證模塊為aaa,代理模塊名稱為proxy。
? ? ? ? ? ? ? include目錄包含了Apache中必需的頭文件,其中包含一些極其重要的頭文件,比如http_main.h、http_protocol.h、http_request.h等。
? ? ? ? ? ? ? srclib目錄中包含了Apache開發和運行所需要的基礎庫,主要包括apr_util、apr和pcre。apr_util和apr屬于APR基礎庫,pcre則主要是Perl兼容正則表達式庫。
? ? ? ? ? ? ? ?os目錄中包含了各個操作系統中所特有的內容。
? ? ? ? ? ? ? ?docs目錄中包含了Apache提供的文檔。
? ? ? ? ? ? ? ?test目錄中包含了很多APR庫實用的測試函數。
? ? ? ? 2.5 Apache層次結構
? ? ? ? ? ? ? 整個Apache可以被劃分為四個大的層次:可移植運行庫層(APR)、Apache核心功能層(Apache CORE)、Apache可選功能層(Apache Optional Module)及Apache第三方支持庫。
? ? ? ? ? ? ??
? ? ? ? ? ? ? 如上圖所示,加上操作系統層,整個Apache可以被分隔為五層,各層次的功能如下:
? ? ? ? ? ? 2.5.1 操作系統支持層
? ? ? ? ? ? ? ? ? ? Apache歸根結底是建立在操作系統的普通的應用程序上的,因此,很多時候必須使用操作系統本身提供的底層功能,比如進程和線程、進程和線程間的通信、網絡套接字通信、文件操作等。
? ? ? ? ? ? 2.5.2 可移植運行庫層
? ? ? ? ? ? ? ? ? ? ?APR的任務就是屏蔽底層的操作系統API細節,對于所有的操作系統,提供一個完全相同的函數接口,這樣,Apache開發者就不必顧慮操作系統細節,而只要開發上層功能即可。
? ? ? ? ? ? ? ? ?
? ? ? ? ? ? 2.5.3 核心功能層
? ? ? ? ? ? ? ? ? ? 核心功能層主要包括兩大部分:Apache核心程序和Apache核心模塊。
? ? ? ? ? ? ? ? ? ? Apache的核心程序主要用于實現Apache作為HTTP服務器的基本功能,包括:
? ? ? ? ? ? ? ? ? ? a) 啟動和停止Apache? ? ? ? ? ? ? ? ? ? ? ? ?b)處理配置文件(config.c)
? ? ? ? ? ? ? ? ? ? c)接受和處理HTTP連接? ? ? ? ? ? ? ? ? ? ? ?d)讀取HTTP請求并對請求進行處理
? ? ? ? ? ? ? ? ? ? e)處理HTTP協議
? ? ? ? ? ? ? ? ?Apache中大部分模塊都是可選擇的,這些模塊的缺失至多影響Apache功能的完整性,并不影響運行,比如mod_ssl、mod_alias等。但是有兩個模塊則是必需的,即mod_core和mod_so.前者負責處理配置文件中的大部分配置指令,并根據這些指令運行Apache,而后者則負責動態加載其余的模塊,缺少了該模塊,其余的模塊就無法使用。這兩個模塊都必須靜態 編譯。
? ? ? ? ? ? ? ? ? ? ? ?MPM,即多進程處理模塊。盡管MPM也是可選擇的,但它通常負責處理Apache中的并發模型,或者是Prefork,或者是線程池(ThreadPool),或者是Worker模型等。
? ? ? ? ? ? ? ? ? ? ? ?Apache核心(第三層)主要有以下兩個作用
? ? ? ? ? ? ? ? ? ? ? ?2.5.4.1 基本的HTTP服務功能
? ? ? ? ? ? ? ? ? ? ? ?2.5.4.2 Apache Module API
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 每一個請求都會被劃分為多個不同的階段去處理,Apache中稱之為"掛鉤"。每個模塊如果要對某個階段進行必要的處理,則它只要實現該掛鉤即可。在每一階段,模塊可以通過返回OK或DECLINE來表示是否要完成該步驟的任務。
? ? ? ? ? ? ?2.5.4 可選功能層。
? ? ? ? ? ? ?2.5.5 第三方支持庫
? ? ? ? ? ? ? ? ? ? ?在Apache的一些模塊中會使用到第三方的開發庫,比如mod_ssl就使用了OpenSSL,mod_perl則使用了Perl開發庫。
? ? ? ? 2.6 Apache核心功能層
? ? ? ? ? ? ?2.6.1 核心與可選模塊的關系
? ? ? ? ? ? ? ? ? ? ? Apache核心與Apache模塊之間的關系是調用和被調用的關系,所有的模塊都直接與核心進行交互,如下圖:
? ? ? ? ? ? ? ? ? ? ? ?
? ? ? ? ? ? ? ? ? ? ? 在處理的過程中,核心并不會去關心誰是核心模塊,誰是可選模塊,它們都是一視同仁地被調用。核心模塊和非核心模塊的唯一區別就是加載的時間不同。
? ? ? ? ? ? ? ?2.6.2 核心組件
? ? ? ? ? ? ? ? ? ? ? ? 包括下面幾大部分:
? ? ? ? ? ? ? ? ? ? ? ? ?a) 配置文件組件(HTTP_CONFIG)? ? ? ? ? ? ? ? b)進程并發處理組件(MPM)
? ? ? ? ? ? ? ? ? ? ? ? ?c)連接處理組件(HTTP_CONNECTION)? ? ? ? d)HTTP協議處理組件(HTTP_PROTOCOL)
? ? ? ? ? ? ? ? ? ? ? ? ?e)HTTP請求處理組件(HTTP_REQUEST)? ? ? ?f)HTTP核心組件(HTTP_CORE)
? ? ? ? ? ? ? ? ? ? ? ? ?g)核心模塊組件(MOD_CORE)
? ? ? ? ? ? ? ? ? ? ?Apache核心組件之間的相互關系如下圖描述:
? ? ? ? ? ? ? ? ? ? ?
? ? ? ? ? ? ? ? ? ? 2.6.2.1 main
? ? ? ? ? ? ? ? ? ? ? ? main.c是整個Apache的入口,它內部包含了main()函數,該函數的功能包含下面幾個部分:
? ? ? ? ? ? ? ? ? ? ? ? a)命令行處理? ? ? ? ? ? ? ? ? ?
? ? ? ? ? ? ? ? ? ? ? ? b) 配置文件處理(讀取配置文件時Apache啟動后首要任務,函數中配置文件最終處理為配置樹結構)? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? c) 構建虛擬主機信息 (main函數將根據虛擬主機配置構建相應的虛擬主機,最終形成一系列的server_rec結構鏈表)
? ? ? ? ? ? ? ? ? ? ? ? ?d)進入主循環(在主循環中,Apache所做的事情就是執行MPM模塊。MPM將產生多個進程或多個線程偵聽指定端口,并處理該端口上的連接。當MPM執行失敗的時候,main函數才會執行下一次循環).
? ? ? ? ? ? ? ? ? ? 2.6.2.2 HTTP配置文件組件(HTTP_CONFIG)
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? HTTP_CONFIG組件主要位于http_config.h和config.c中,它的主要作用是對配置文件進行解析、處理和保存。
? ? ? ? ? ? ? ? ? ? 2.6.2.3 進程并發處理組件(MPM)
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?MPM組件主要位于mpm目錄下的各個文件中,比如Prefork MPM對應的就是prefork.c。MPM負責為Apache系統提供可靠、穩定、高效的進程和線程的并發處理。任何時候,Apache中只能有一個MPM在運行,而且MPM必須在編譯的時候指定,不允許動態加載。
? ? ? ? ? ? ? ? ? ?2.6.2.4 HTTP連接處理組件(HTTP_CONNECTION)
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? HTTP_CONNECTION組件主要位于http_connection.h和connection.c中。該組件主要負責處理與HTTP連接相關的事情。
? ? ? ? ? ? ? ? ? ?2.6.2.5 HTTP協議處理組件(HTTP_PROTOCOL)
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?HTTP_PROTOCOL組件主要位于http_protocol.h和http_protocol.c中,主要負責處理HTTP/11.0及HTTP/1.1協議的解析,比如解析http請求頭、生成返回給客戶端的響應包等。
? ? ? ? ? ? ? ? ? ?2.6.2.6 HTTP請求處理組件(HTTP_REQUEST)
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?HTTP_REQUEST組件主要位于http_request.h、http_request.c及request.c三個文件中。與請求相關的函數全部定義在http_request.h中,函數實現則分散在兩個.c中。
? ? ? ? ? ? ? ? ? ? ? ? a)請求的總入口函數ap_process_request及請求終止函數
? ? ? ? ? ? ? ? ? ? ? ? b)請求本身屬性相關的操作
? ? ? ? ? ? ? ? ? ? ? ? c)子請求相關的操作
? ? ? ? ? ? ? ? ? ? ? ? ? ?組件中提供的與子請求相關的函數包括:
? ? ? ? ? ? ? ? ? ? ? ? ? ?ap_sub_req_lookup_uri、ap_sub_req_lookup_file、ap_sub_req_lookup_dirent
? ? ? ? ? ? ? ? ? ? ? ? ? ?ap_sub_req_method_uri、ap_run_sub_req、ap_destroy_sub_req
? ? ? ? ? ? ? ? ? ? ? ? d)重定向請求操作
? ? ? ? ? ? ? ? ? ? ? ? ? ?在Apache處理請求的過程中,任何時候,當前請求都可能被重定向,比如請求處理發生錯誤,或者請求被rewrite等。組件中提供的與重定向相關的函數包括以下幾點:
? ? ? ? ? ? ? ? ? ? ? ? ? ? ?ap_internal_redirect、ap_internal_redirect_handler、ap_internal_fast_redirect
? ? ? ? ? ? ? ? ? ? ? ? e)請求掛鉤聲明
? ? ? ? ? ? ? ? ? ? ? ? ? ? ?組件中另外一項重要的工作就是聲明請求處理階段所需要使用的各種掛鉤,包括create_request、translate_name、map_to_storage、check_user_id等
? ? ? ? ? ? ? ? ? ? ? ? ?f)請求相關的配置處理??
? ? ? ? ? ? ? ? ?2.6.2.7 HTTP核心組件(HTTP_CORE)
? ? ? ? ? ? ? ? ? ? ? ? ?此HTTP_CORE模塊位于文件http_core.h和http_core.c中,主要是將與HTTP協議相關的內容從原來的核心模塊中提取出來的。在2.x的設計中,設計者已經開始考慮將Apache設計為一個通用的服務器框架,而不僅僅是一個HTTP Web服務器,以后它也可以支持FTP等協議。因此,有必要將http協議的處理從核心中剝離出來。?
? ? ? ? ? ? ? ? ?2.6.2.8 核心模塊組件(MOD_CORE)
? ? ? ? ? ? ? ? ? ? ? ? ? 核心模塊(MOD_CORE)由mod_core.h和core.c組成,該模塊的主要任務就是對核心需要的指令進行比較,比如<Directory>、<Location>、DocumentRoot等。該模塊在HTTP_CONFIG中被調用。
? ? ? ? ? ? ? ? ?2.6.2.9 其余模塊? ? ??
? ? ? ? ? ? ? ? ? ? ? ? ? ?除了上面提及的組件之外,還有一些相對重要的組件,包括日志處理組件、虛擬主機處理組件,以及過濾器模塊組件。日志處理組件就是進行日志記錄,該組件包括http_log.h和log.c。虛擬主機處理組件則為Apache提供虛擬主機支持。過濾器模塊組件則是更加重要的組件,它是HTTP數據在核心內部傳輸的重要機制。
? ? ? ?2.7 Apache運行流程
? ? ? ? ? ? ?Apache的運行流程可以細分為三個大的階段:
? ? ? ? ? ? ? a) Apache啟動過程? ? ? ? ? ? ? b) 接受客戶端連接,并處理該連接? ?c) 從連接中讀取請求數據,處理客戶端的一次請求
? ? ? ?2.7.1 Apache啟動過程
? ? ? ? ? ? ? ?Apache的啟動包括兩個階段:高權限啟動階段和低權限運行階段。
? ? ? ? ? ? ? 2.7.1.1 初始化系統所需要的資源
? ? ? ? ? ? ? ? ? ? ?在啟動的最后階段,Apache將通過調用ap_mpm_run函數將控制權交給MPM模塊。只有MPM模塊執行失敗或執行完畢的時候,執行權才會從MPM返回到主程序中。MPM是Apache服務器和操作系統之間的接口,它的目的只有一個,就是充分利用操作系統的特性,對服務器的并發效率進行最大的優化。
? ? ? ? ? ? ? ?一旦權限從Apache主程序交給MPM,MPM將生成一定數目的進程或線程,偵聽指定的端口,并等待接受客戶端的連接。一旦接收到客戶端請求,Apache將進入連接和請求處理階段。Apache在接受和處理來自客戶端的連接時,會以普通用戶的權限去處理,而不會采用系統級別的權限。
? ? ? ? 2.7.2 HTTP連接處理
? ? ? ? ? ? ? ?對于連接處理,最主要的任務就是調用預先定義好的連接處理掛鉤process_connection。任何模塊如果要處理連接,都可以實現該掛鉤。一旦某個模塊實現了該掛鉤,那么在連接處理的過程中它們將會被調用。
? ? ? ? ? ? ? ? 在連接處理的過程中,通過調用ap_read_request函數進入請求讀取過程,然后調用ap_process_request對該請求進行處理。
? ? ? ? 2.7.3 請求報文讀取
? ? ? ? ? ? ? ? 一旦接收到客戶端的連接,連接數據將被讀取出來,然后HTTP_PROTOCOL模塊將開始對該報文進行解析,請求的解析包括三部分:
? ? ? ? ? ? ? ? ?a) HTTP請求頭,比如"GET index.html HTTP/1.1";
? ? ? ? ? ? ? ? ?b) HTTP請求域,比如"Accept:*/*"等;
? ? ? ? ? ? ? ? ?c) HTTP請求體,對于一些特殊的請求(比如POST方法),它一般會在報文體重保存數據。
? ? ? ? ? ? ? ? ?所有輸入處理過濾器組成輸入過濾器鏈表,在請求報文從網絡中讀取之后,它就直接進入了過濾器鏈表中,然后每個過濾器對其進行處理,并將其傳遞給下一個過濾器,直到最后一個過濾器,如下圖所示:
? ? ? ? ? ? ? ??
? ? ? ? ? ? ? ? 在所有的過濾器處理完畢后,我們得到的就是一個最終的處理后的請求報文。此時請求處理模塊HTTP_REQUEST將對該請求做更進一步的處理。
? ? ? ? ? 2.7.4 請求處理
? ? ? ? ? ? ? ? 對于HTTP報文,Apache調用ap_process_request函數對請求進行實質的處理。Apache中的請求處理包括三個大的階段:請求解析階段、安全處理階段、請求準備階段。
? ? ? ? ? ? ? ? ?2.7.4.1 請求解析階段
? ? ? ? ? ? ? ? ? ? a) 通常情況下,瀏覽器會自動轉換請求 地址欄中的一些特殊字符,如空格轉換為%和十六進制的組合就是"%20"(比如空格式"%20"),因此對于服務器而言,它就要將"%xx"格式的字符串重新還原為原來的字符串。整個URL的轉義由函數ap_unescape_url()完成。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ?該階段并不是一個必需的階段,如果請求是一個代理請求或請求結構的parsed_uri.path沒有賦值,那么該階段將不會被處理。
? ? ? ? ? ? ? ? ? ? ? ? ? b)從URL中剔除/../和/./字符
? ? ? ? ? ? ? ? ? ? ? ? ? URL中所有的/../和/./字符串都在這一階段調用ap_getparents()函數并被剔除,該階段必需被執行。
? ? ? ? ? ? ? ? ? ? ? ? ? c)首次讀取URL相關配置信息
? ? ? ? ? ? ? ? ? ? ? ? ? ? 一旦第二步處理完畢后,只包含絕對路徑的URL就生成完畢,此時Apache將調用ap_location_walk從配置系統中查找與該URL關聯的配置信息。在請求處理的后續階段中,比如用戶授權驗證,權限控制等都需要依賴于讀取的配置信息。如果當前請求是一個內部重定向請求或子請求,那么該請求的配置信息可能有很大一部分或全部繼承自父請求。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ?URL關聯的配置信息需要讀取兩次,此處是第一次讀取。完整的配置信息時兩次讀取信息的最終疊加。
? ? ? ? ? ? ? ? ? ? ? ? ? ?d) URL名稱轉換(translate_name)
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 該階段主要用于對URL進行轉換。比如Alias指令用于將某個URL映射到另外一個特定的URL中;而mod_writer模塊則用于對URL的完全重寫。另外,代理請求可能需要在請求的URL之前添加上proxy:://。如果某個模塊需要對URL進行修改,那么都可以在這一階段實現。
? ? ? ? ? ? ? ? ? ? ? ? ? ?e)map_to_storage
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?使用這個掛鉤的原因在于如果所提供的數據不是動態生成的,而是位于磁盤上的文件,那么服務器可能要執行更加嚴格的安全檢查。
? ? ? ? ? ? ? ? ? ? ? ? ? ?f) 二次URL相關配置文件讀取
? ? ? ? 2.8 主程序main
? ? ? ? ? ? ?2.8.1 主程序概要
? ? ? ? ? ? ? ? ? 2.8.1.1 讀取Apache的配置文件
? ? ? ? ? ? ? ? ? 2.8.1.2 檢查啟動Apache的指令行參數
? ? ? ? ? ? ? ? ? 2.8.1.3 虛擬主機的設置
? ? ? ? ? ? ? ? ? ? ? ? ? ?main函數的內部函數調用如下圖:
? ? ? ? ? ? ? ? ? ? ? ?
? ? ? ? ? ? ? ? ? ? ?AP_MONCONTROL主要用于打開和關閉代碼剖析。
apr_app_initialize(&argc, &argv, NULL);? ? ? ? ? ? ? ? ? ? ? ?任何一個應用程序如果要使用APR庫進行二次開發,那么它首先要完成的任務是對APR庫進行必要的初始化。Apache從某個角度而言,它僅僅也是APR庫的普通的使用者,因此它也不能例外。apr_app_initialize負責對APR庫進行必要的初始化工作,代碼如下:
process=create_process(argc, argv); pglobal=process->pool; pconf = process->pconf; ap_server_argv0 = process->short_name;? ? ? ? ? ? ? ? ? ? ? ? ?由于Apache通常是通過指令行進行啟動的,因此指令行的相關信息(指令數目argc及指令行字符串argv)都非常重要。對Apache而言,指令信息不僅主程序要使用,而且在一些子進程程序中也要使用,以此這就存在指令行信息傳遞的問題。一種最簡單的方法就是使用全局變量。不過引用全局變量不是一個好的辦法,如果用得少還可以忍受,如果使用的地方很多,則在每一個使用的文件頭部都需要使用"extern xxxx"。
? ? ? ? ? ? ? ? ? ? ? ? ? Apache把所有的指令行相關的信息都包裝在process_rec結構中,代碼如下:
struct process_rec {apr_pool_t *pool;apr_pool_t *pconf;int argc;const char *const *argv;const char * short_name; };? ? ? ? ? ? ? ? ? ? ? ? ? short_name則是應用程序的縮略名稱。pool和pconf則分別是全局內存池和配置相關內存池。一旦定義了該結構,就可以不使用全局變量。任何函數或過程如果需要對應的指令行信息,只需對process_rec進行初始化,然后直接傳遞給函數即可。
? ? ? ? ? ? ? ? ? ? ? ? ? 創建一個process_rec結構可通過create_process函數完成。
apr_pool_create(&pcommands, pglobal); apr_pool_tag(pcommands, "pcommands"); ap_server_pre_read_config = apr_array_make(pcommands, 1, sizeof(char *)); ap_server_post_read_config=apr_array_make(pcommands, 1, sizeof(char *)); ap_server_config_defines = apr_array_make(pcommands, 1, sizeof(char *));? ? ? ? ? ? ? ? ? ? ? ? ? ?Apache中的指令分為兩大類:指令行中的指令及配置文件中的指令。而對于指令行中的指令又包括兩種:讀取配置文件之前必須處理的指令和讀取配置文件后必須處理的指令。前者是防止指令行中的指令被覆蓋,而后者則相反。一旦命令行被解析完畢后,這兩種特殊的指令將被保存起來,以便在合適的時候執行。如果不保存,這些指令將會丟失。保存可使用如下數組數據結構:
error = ap_setup_prelinked_modules(process); if (error) {ap_log_error(APLOG_MARK, APLOG_STARTUP|APLOG_EMERG, 0, NULL, "%s: %s", ap_server_argv0, error);destroy_and_exit_process(process, 1); }? ? ? ? ? ? ? ? ? ? ? ? ? ?ap_setup_prelinked_modules用于將所有預鏈接的模塊加入到加載模塊鏈表中。模塊只有加入到加載模塊鏈表中才能稱之為活動模塊,然后才能被Apache核心調用,否則該模塊仍然處于非活動狀態。
ap_run_rewrite_args(process); //主要是為MPM模塊設置的它允許MPM對命令行中的傳入參數進行重寫。 apr_getopt_init(&opt, pcommands, process->argc, process->argv); while((rv = apr_getopt(opt, AP_SERVER_BASEARGS, &c, &optarg)) == APR_SUCCESS) {char **new;switch(c) {case 'c':new = (char **)apr_array_push(ap_server_post_read_config);*new = apr_pstrdup(pcommands, optarg);break;case 'C':new = (char **)apr_array_push(ap_server_pre_read_config);*new = apr_pstrdup(pcommands, optarg);break;? ? ? ? ? ? ? ? ? ? ? ? ? ? -C選項指定了在讀取配置文件之前必須先處理directive的配置指令。而-c指令則指定了在讀取配置文件之后,才能再處理directive的配置指令。-c中的指令保存到ap_server_post_read_config數組中,而-C中的指令則保存到ap_server_pre_read_config中。
case 'd':def_server_root = optarg;break;? ? ? ? ? ? ? ? ? ? ? ? ? ? ?-d serverroot選項將ServerRoot指令設置初始值為serverroot。它可以被配置文件中的ServerRoot指令所覆蓋。其默認值為/usr/local/apache2.
case 'D':new = (char **)apr_array_push(ap_server_config_defines);if (strcmp(optarg, "DUMP_VHOSTS") == 0) configtestonly = 1;if (strcmp(optarg, "DUMP_MODULES") == 0)configtestonly = 1;break;? ? ? ? ? ? ? ? ? ? ? ? ? ? ? -D parameter選項用于設置參數parameter,它配合配置文件中的<IfDefine>段,用于在服務器啟動和重新啟動時,有條件地跳過或處理某些命令。
case 'e':if (strcasecmp(optarg, "emerg") == 0) {ap_default_loglevel=APLOG_EMERG;}...break;? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? -e level選項咋服務器啟動時,設置日志的LogLevel為level。
case 'E':temp_error_log = apr_pstrdup(process->pool, optarg);break;? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?-E file選項用于將服務器啟動過程中的出錯信息發送到文件file。
case 'X':new = (char **)apr_array_push(ap_server_config_defines);*new = "DEBUG";break;? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? -X 選項指定當前Apache以調試模式運行。
case 'f':confname = optarg;break;? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?-f config選項在啟動中使用config作為配置文件。如果config不以"/"開頭,則它是相對于ServerRoot的路徑。其默認值為conf/httpd.conf。
case 'v':printf("Server version:%s\n", ap_get_server_version());printf("Server built: %s\n", ap_get_server_built());destroy_and_exit_process(process, 0);? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?-v 選項只是簡單地顯示httpd的版本,然后退出。
case 'V':show_compile_settings();destroy_and_exit_process(process, 0);? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? -V 選項用于顯示httpd和APR/APR-Util的版本和編譯參數,然后退出。
case 'l':ap_show_directives();destroy_and_exit_process(process, 0);? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?-l 選項用于輸出一個靜態編譯在服務器中的模塊列表。它不會列出使用LoadModule指令動態加載的模塊。
case 'L':ap_show_directives();destroy_and_exit_process(process, 0);? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?-L選項輸出一個指令的列表,并包含了各指令的有效參數和使用區域。
case 't':configtestonly = 1;break;? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? -t 選項意味著僅對配置文件執行語法檢查。程序在語法解析檢查結束后立即退出,或者返回"0"(OK),或者返回非0的值(Error)。如果還指定了"-D DUMP_VHOSTS", 則會顯示虛擬主機配置的詳細信息。
case 'S':configtestonly = 1;new = (char **)apr_array_push(ap_server_config_defines);*new = "DUMP_VHOSTS";break;? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?-S顯示從配置文件中讀取并解析的設置結果(目前僅顯示虛擬主機的設置)。
case 'M':configtestonly = 1;new = (char **)apr_array_push(ap_server_config_defines);*new = "DUMP_MODULES";break;? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? -M 輸出一個已經啟用的模塊列表,包括靜態編譯在服務器中的模塊和作為DSO動態加載的模塊。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?主程序中對于Window所需要的-K、-n及-w選項并沒有處理,這些選項由于只有MPM才會使用到,因此它們在MPM中被處理,處理由rewrite_args掛鉤觸發。
/* bad cmdline option? then we die */ if (rv != APR_EOF || opt->ind < opt->argc) {usage(process); } apr_pool_create(&plog, pglobal); apr_pool_tag(plog, "plog"); apr_pool_create(&ptemp, pconf); apr_pool_tag(ptemp, "ptemp");? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? Apache中使用的所有內存資源都是基于內存池的概念而分配的,所有的內存池之間形成內存池樹的概念。層次越深的內存池它的生存周期就越短,反之,舉例根節點越近,它的生存周期就越長。所有節點的根節點是全局內存池pglobal,在啟動的時候被分配,除此之外,在啟動的時候還需要一個臨時內存池----ptemp.
ap_server_root = def_server_root; if (temp_error_log) {ap_replace_stderr_log(process->pool, temp_error_log); }? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?一般情況下,如果沒有指定日志輸出文件,就是用標準的輸出設備stderr。如果在啟動Apache的時候通過-E選項指定了日志文件,那么,此時必須使用ap_replace_stderr_log進行輸出日志文件替換。
if (ap_run_pre_config(pconf, plog, ptemp)!= OK) {destroy_and_exit_process(process, 1); }rv = ap_process_config_tree(server_conf, ap_conftree, process->pconf,ptemp); if (rv == OK) {ap_fixup_virtual_hosts(pconf, server_conf);ap_fini_vhost_config(pconf, server_conf);apr_hook_sort_all();if (configtestonly) {ap_run_test_config(pconf, server_conf);ap_log_error(APLOG_MARK, APLOG_STARTUP, 0, NULL, "Syntax OK");destroy_and_exit_process(process, 0);} }? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?在main.c中,配置文件在Apache啟動或重啟的時候總是會被讀取兩次,一次是在主循環執行之前被讀取,正如上面代碼中所讀取的一樣,另外以此是在主循環中被讀取。之所以要讀取兩次,主要基于以下兩個目的:
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?a) 預檢查配置文件中可能出現的語法問題,確保在真正處理的時候配置文件是完整無誤的。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?b) 第一次讀取文件會生成在第二次讀取文件時所需要的字段。比如,當讀取配置文件的時候會需要錯誤日志指令,但是它在存儲段配置文件中,所以需要讀取一次這個文件,發現錯誤日志的正確配置,然后就可以在第二次讀取配置文件的時候啟動服務器,代碼如下:
signal_server = APR_RETRIEVE_OPTIONAL_FN(ap_signal_server); if (signal_server) {int exit_status;if (signal_server(&exit_status, pconf) != 0) {destroy_and_exit_process(process, exit_status);} }/* If our config failed, deal with that here.*/ if (rv != OK) {destroy_and_exit_process(process, 1); }apr_pool_clear(plog);if (ap_run_open_logs(pconf, plog, ptemp, server_conf) != OK) {destroy_and_exit_process(process, 1); }if (ap_run_post_config(pconf, plog, ptemp, server_conf) != OK) {destroy_and_exit_process(process, 1); }apr_pool_destroy(ptemp);? ? ? ? ? ? ? ? ? ? ? ?整個配置穩健的完整讀取過程分為三個部分:
? ? ? ? ? ? ? ? ? ? ? ?a) 讀取配置文件前的準備工作
? ? ? ? ? ? ? ? ? ? ? ? b) 實際的配置文件讀取? ?
? ? ? ? ? ? ? ? ? ? ? ? ? ? ?實際文件的讀取通過ap_process_config_tree函數完成。
? ? ? ? ? ? ? ? ? ? ? ? c) 讀取配置文件后的處理
? ? ? ? ? ? ? ? ? ? ? ? ? ? ?與pre_config掛鉤對應的是post_config掛鉤。該掛鉤在每次讀取配置文件之后被調用。掛鉤是大多數模塊執行服務器端初始化的地方。如果某個模塊由于某種原因需要啟動分離的進程,就應該在這個階段來完成,代碼如下:
for(;;) {apr_hook_deregister_all();apr_pool_clear(pconf);for(mod = ap_prelinked_modules; *mod != NULL; mod++) {ap_register_hooks(*mod, pconf);}ap_conftree=NULL;apr_pool_create(&ptemp, pconf);apr_pool_tag(ptemp, "ptemp");ap_server_root = def_server_root;server_conf = ap_read_config(process, ptemp, confname, &ap_conftree);if (!server_conf) {destroy_and_exit_process(process, 1);}if (ap_run_pre_config(pconf, plog, ptemp) != OK) {ap_log_error(APLOG_MARK, APLOG_STARTUP|APLOG_ERR, 0, NULL, "Pre-configuration failed");destroy_and_exit_process(process, 1);}if (ap_process_config_tree(server_conf, ap_conftree, process->pconf, ptemp) != OK) {destroy_and_exit_process(process, 1);}ap_fixup_virtual_hosts(pconf, server_conf);ap_fini_vhost_config(pconf, server_conf);apr_hook_sort_all();apr_pool_clear(plog);if (ap_run_open_logs(pconf, plog, ptemp, server_conf) !+ OK) {ap_log_error(APLOG_MARK, APLOG_STARTUP | APLOG_ERR, 0, NULL, "Unable to open logs");destroy_and_exit_process(process, 1);}if (ap_run_post_config(pconf, plog, ptemp, server_conf) != OK) {ap_log_error(APLOG_MARK, APLOG_STARTUP | APLOG_ERR, 0, NULL, "Configuration Failed");destroy_and_exit_process(process, 1);}apr_pool_destroy(ptemp);apr_pool_lock(pconf, 1);ap_run_optional_fn_retrieve();if (ap_mpm_run(pconf, plog, server_conf)) break;apr_pool_lock(pconf, 0);}apr_pool_lock(pconf, 0);destroy_and_exit_process(process, 0);return 0; }? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 準備就緒后,Apache就進入了主循環for(;;),循環中主進程所做的事情包括以下幾點:
? ? ? ? ? ? ? ? ? ? ? ? ?a) 掛鉤注冊
? ? ? ? ? ? ? ? ? ? ? ? ?b) 二次配置文件讀取
? ? ? ? ? ? ? ? ? ? ? ? ?c) 導出注冊所有的可選函數
? ? ? ? ? ? ? ? ? ? ? ? ?d) ap_mpm_run
? ? ? ? ? ? ? ? ? ? ? ? ? ? ?主進程最重要的任務就是對ap_mpm_run的調用。一旦調用ap_mpm_run,主進程將進入多進程并發處理模塊。在該模塊中將會啟動多個進程或多個線程,然后偵聽客戶端的連接請求,一旦接收到請求,就繼而進入請求處理模塊。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 如果ap_mpm_run在執行中發生錯誤,則返回1,否則返回0.
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 當ap_mpm_run退出的時候,整個主進程也就相應地執行結束了。
? ? ?
-f config選項在啟動中使用config作為配置文件。如果config不以"/"開頭,則它是相對于ServerRoot的路徑。其默認值為conf/httpd.conf。?三、第3章
? ? ? ? 配置文件管理
? ? ? ? 3.1 Apache配置系統
? ? ? ? ? ? ?在Apache中通過MPM模塊來實現進程/線程的并發處理。在此過程中,可以通過指令來控制系統中允許同時運行的進程的數目及每個進程允許產生的線程的數目。前者由ServerLimit指令控制,后者則由ThreadsPerChild指令控制。比如:
? ? ? ? ? ? ThreadsPerChild? ? 25
? ? ? ? ? ? ServerLimit? ? ? ? ? ? ?16
? ? ? ? ? ? ?那么,Apache是什么時候讀取這些指令的?它是怎么讀取的?讀取之后這些指令保存在哪兒?以什么方式保存的?這些指令最終是如何影響Apache的行為的?
? ? ? ? ? ? ? 從整體上描述Apache配置系統,它應該包含三個主要部分:
? ? ? ? ? ? ? a) 配置文件。通常情況下,配置系統會指定一些固定的文件作為配置文件,比如目前最主要的配置文件就是httpd.conf。
? ? ? ? ? ? ? ? ? b)配置指令。配置系統必須能夠決定各個指令的含義,這樣,配置系統才能夠正確地對其進行解釋和處理。配置正確的指令或默認的值,或者由管理員進行修改;而解釋配置指令則由Apache的核心及各個模塊來處理。
? ? ? ? ? ? ? ? ? c)配置信息的保存和讀取。
? ? ? ? ? ? ? Apache在處理了配置信息之后,將這些信息按照一定的數據結構進行保存。在Apache的運行過程中,任何時候需要的配置信息可直接從內存中讀取即可。
? ? ? ? ? ? ?3.2 配置文件
? ? ? ? ? ? ? ? ?3.2.1 配置文件類
? ? ? ? ? ? ? ? ? ? ? 在Apache 2.0中涉及的配置文件包括以下三種:
? ? ? ? ? ? ? ? ? ? ? ?3.2.1.1 httpd.conf
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 通常,當服務器啟動的時候,該文件被讀取處理一次,同時在每次重新啟動的時候又會被處理一次,因此對配置文件的任何修改都要等待到服務器重啟后才能生效。
? ? ? ? ? ? ? ? ? ? ? ?3.2.1.2 .htaccess
? ? ? ? ? ? ? ? ? ? ? ?3.2.1.3 access.conf和srm.conf
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? access.conf用于配置服務器的訪問權限,控制不同用戶和計算機的訪問限制。srm.conf是服務器的資源映射文件,告訴服務器各種文件的MIME類型,以及如何支持這些文件。
? ? ? ? ? ? ? ? ?3.2.2 配置文件處理時機
? ? ? ? ? ? ? ? ? ? ? ?3.2.2.1 在Apache中,我們將啟動的命令行也會進行抽象,視為文件來處理。
? ? ? ? ? ? ? ? ? ? ? ?3.2.2.2 當Apache啟動初始化的時候,httpd.conf將第一次被讀取,然后被處理。
? ? ? ? ? ? ? ? ? ? ? ?3.2.2.3 在Apache的主循環中,每次啟動或重啟后,Apache都會重新讀取配置文件httpd.conf。
? ? ? ? ? ? ? ? ? ? ? ?3.2.2.4 當處理特定請求的時候,如果允許使用.htaccess,接收到請求后,它將讀取.htaccess中的配置信息,然后與httpd.conf中的配置信息進行合并,并生成最終的針對請求的配置信息。
? ? ? ? ? ? ? ? ? ?
? ? ? ? 圖3-3 演示了整個配置文件在Apache中所處的位置
? ? ? ? ? ?
? ? ? ? ? ? ? 不管是對配置文件還是命令行參數,Apache最終都一樣對待。當Apache啟動的時候,這些配置文件將被讀取并被解析。Apache的運行將依賴于這些配置信息,不過任何時候配置信息的修改都不會立即生效。由于只有服務器剛啟動的時候才會讀取配置信息,因此修改后的配置信息只有當服務器重新啟動的時候才會生效。經過處理之后,內部配置數據結構將被生成,然后這些數據結構將被保存到配置庫中。
? ? ? ? ? ? ? ? 3.3 指令相關概念
? ? ? ? ? ? ? ? ? ? ? 3.3.1 指令概述
? ? ? ? ? ? ? ? ? ? ? ? ? ?Apache的指令可以分為兩種:簡單指令及配置段指令。配置段指令都是被包含在"<...>"中的指令,比如<Directory>...</Directory>。配置段指令總是會包含其余的指令。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 當進行指令處理的時候,Apache將逐行地讀取這些配置指令,如果某行不是空行(即不匹配正則表達式"^[\t]*$"),同時也不是一個注釋行(不匹配正則表達式"^[\t]*#.*$"),那么Apache將該行的第一個單詞視為指令字,后面的單詞全部算作參數。如果某行以"\"結尾,則下一行是上一行的繼續。
? ? ? ? ? ? ? ? ? ? ? ?3.3.2 指令參數
? ? ? ? ? ? ? ? ? ? ? ? ? ?3.3.2.1 參數類型
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?一般指令名稱后面可以跟一個或多個用空格分開的參數。如果參數中由空格,則必須用雙引號括起來,用方括號"[]"括起來的是可選的參數。如果一個參數可以取多個值,則各個可能的值用"|"分開。使用可變參數個數的指令以"..."結尾,以示最后一個參數可以重復。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ?a) URL
? ? ? ? ? ? ? ? ? ? ? ? ? ? ?b)URL-path
? ? ? ? ? ? ? ? ? ? ? ? ? ? ?c)file-path
? ? ? ? ? ? ? ? ? ? ? ? ? ? ?d)directory-path
? ? ? ? ? ? ? ? ? ? ? ? ? ? ?e)filename
? ? ? ? ? ? ? ? ? ? ? ? ? ? ?f)regex? ?正則表達式,是對文本匹配模式的描述。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ?g)extension
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?一般是指filename中最后一個"."號后面的部分。但是,Apache可以辨認多個文件后綴,如果filename含有多個".",則第一個"."后面由每個"."分隔開的部分都是此文件的后綴。比如filename,file.html.en有兩個后綴.html和.en。zai Apache指令中指定extension時,可以有也可以沒有前導的".",而且不區分大小寫。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ?h)MIME-type
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 一種用一個主格式類型和一個副格式類型并用斜杠分隔的描述文件格式的方法,如text/html、img/jpeg等。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ?i) env-variable
? ? ? ? ? ? ? ? ? ? ?3.3.3 指令上下文
? ? ? ? ? ? ? ? ? ? ? ? ? ? ?配置文件中的各個指令的作用范圍是不一樣的,可以分為主配置、虛擬主機配置,局部指令,以及條件指令。默認情況下,配置文件中的指令是作用于整個服務器的,比如ServerRoot和TimeOut指令。有些指令只是針對某個特定的目錄,文件或URL地址。還有一些指令我們稱之為"條件指令",它們并不是針對某個目錄,而是在特定的條件下才會產生效果,比如<IfDefine>、<IfModule>及<IfVersion>等。
? ? ? ? ? ? ? ? ? ? ? ? 3.3.3.1 文件系統容器
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?<Directory>和<Files>指令與其相應的正則表達式版本(<DirectoryMatch>和<FilesMatch>)一起作用于文件系統的特定部分,<Directory>配置段中的指令作用于指定的文件系統目錄及其所有子目錄,.htaccess文件可以達到同樣的效果。下例中,/var/web/dir1及其所有子目錄被允許進行目錄索引。
<Directory /var/web/dir1>Options +Indexes </Directory>? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? <Files>配置段中包含的指令總是應用于特定的文件,而無論這個文件實際存在于哪個目錄,指定的文件可以是普通的文件名稱。下例中的配置指令如果出現在配置穩健的主服務器段,則會拒絕對位于任何目錄下的private.html的訪問。
<Files private.html>Order allow,denyDeny from all </Files>? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? <Files>和<Directory>段的組合可作用于文件系統中特定目錄下的特定文件。下例中的配置會拒絕對/var/web/dir1/private.html、/var/web/dir1/subdir2/private.html等任何/var/web/dir1/目錄下private.html的訪問。
<Directory /var/web/dir1><Files private.html>Order allow,denyDeny from all</Files> </Directory>? ? ? ? ? ? ? ? ? ? ? ? 3.3.3.2 網絡空間容器
? ? ? ? ? ? ? ? ? ? ? ? ? ? <Location>指令與其相應的正則表達式版本(<LocationMatch>)一起作用于網絡空間的特定部分。
? ? ? ? ? ? ? ? ? ? ? ? ? ? 下例中的配置會拒絕對任何以"/private"開頭的URL路徑的訪問,比如:
? ? ? ? ? ? ? ? ? ? ? ? ? ? ?http://yoursite.example.com/private、
? ? ? ? ? ? ? ? ? ? ? ? ? ? ?http://yoursite.example.com/private123、
? ? ? ? ? ? ? ? ? ? ? ? ? ? ?http://yoursite.example.com/private/dir/file.html等所有以"/private"開頭的URL路徑。
<Location /private>Order Allow,DenyDeny from all </Location>? ? ? ? ? ? ? ? ? ? ? ? ? ? ?<Location>指令與文件系統無關,下例演示了如何將特定的URL映射到Apache內部的處理器mod_status,而并不要求文件系統中確實存在server-status文件。
<Location /server-status>SetHandler server-status </Location>? ? ? ? ? ? ? ? ? ? ? ? ? ? <Directory>、<Files>和<Location>指令可以使用類似C標準庫中fnmatch的外殼通配符。符號"*"匹配任何字符串,"?"匹配任何單個的字符,"[seq]"匹配seq序列中的任何字符,符號"/"不為任何通配符所匹配,所以不能顯示使用。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 下例使用非正則表達式的通配符來改變所有用戶目錄的配置:
<Directory /home/*/public_html>Options Indexes </Directory>? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?下例使用正則表達式一次性拒絕對多種圖形文件的訪問:
<FilesMatch \.(?i:gif|jpe?g|png)$?Order allow,denyDeny from all </FilesMatch>? ? ? ? ? ? ? ? ? ? ?3.3.3.3 條件上下文
? ? ? ? ? ? ? ? ? ? ? ? ? ? ?Apache中允許設定的某些指令在特定的條件下才產生效果。這三種上下文主要是指<IfDefine>、<IfModule>及<IfVersion>。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? <IfDefine>容器中的指令只有在httpd命令行中設定了特定的參數后才有效。下例中,只有當服務器用httpd -DClosedForNow方式啟動時,所有的請求才會被重定向到另一個站點。
<IfDefine ClosedForNow>Redirect / http://otherserver.example.com/ </IfDefine>? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 下例中,MimeMagicFiles指令僅當mod_mime_magic模塊啟用時才有效。
<IfModule mod_mime_magic.c>MimeMagicFile conf/magic </IfModule>? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? <IfVersion>指令只有當正在執行服務器版本和指定的版本要求相符時才有效。這個模塊被設計用于測試套件,以及在一個存在多個不同httpd版本的大型網絡中需要分別針對不同版本使用不同配置的情況:
<IfVersion >= 2.1>#僅在版本高于2.1.0版的時候才生效 </IfVersion>? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? <IfDefine>、<IfModule>、<IfVersion>都可以在條件前加一個"!"以實現條件的否定,而且都可以嵌套以實現更復雜的配置。
? ? ? ? ? ? ? ? ?3.3.3.4 上下文嵌套關系
? ? ? ? ? ? ? ? ? ?
? ? ? ? ? ? ? ? ? ?如上圖,包含范圍大小依次為<VirtualHost>、<Directory>或<Location>、<Files>及<Limit>。
? ? ? ? ? ? ? ? ? ?各種上下文在嵌套中必須遵循下面的嵌套規則。
? ? ? ? ? ? ? ? ? ? ? a) <Directory>配置段不允許出現在<Limit>、<Location>、<Files>,以及其余的<Directory>配置段之間。
? ? ? ? ? ? ? ? ? ? ? b) <Location>配置段不允許出現在<Limit>、<Directory>、<Files>,以及其余的<Location>配置段之間。
? ? ? ? ? ? ? ? ? ? ? c) <Files>配置段不允許出現在<Limit>、<Directory>、<Location>,以及其余的<Files>配置段之間,只能出現在全局配置或<Direcotry>配置段中。
? ? ? ? ? ? ? ? ? ? ? d) <Directory>和<Location>配置段不允許出現在.htaccess文件中,但是<Files>則允許出現。
? ? ? ? ? ? ? ? ? ? ? 3.3.3.5 上下文合并和繼承
? ? ? ? ? ? ? ? ? ? ? ? ? Apache中允許同一個指令在多個地方出現,但是這會導致一個問題,即到底以哪個指令的配置為最終結果呢?Apache中有兩種處理方式:完全覆蓋和繼承合并。對于所有的配置段,各個配置段會按照特定的順序依次生效,這種生效次序會對配置指令的處理結果產生重大的影響,生效的順序依次為:
? ? ? ? ? ? ? ? ? ? ? ? ? 除了<Directory>,每個組都按照它們在配置文件中出現的順序依次被處理,而<Directory>配置段,會按照字典順序由短到長被依次處理。例如,<Directory /var/web/dir>會優先于<Directory /var/web/dir/subdir>被處理。如果有多個指向同一個目錄的<Directory>段,則按他們在配置文件中的順序被依次處理。
? ? ? ? ? ? ? ? ? ? ? ? ? ?而各個配置段相同指令之間的覆蓋繼承關系如下:
? ? ? ? ? ? ? ? ? ? ? ? ? ? a)如果兩個指令位于同一個層次,則后面的指令將覆蓋前面的指令。
? ? ? ? ? ? ? ? ? ? ? ? ? ? b)指令的作用域越小,則它的優先級別越高。
? ? ? ? ? ? ? ? ? ? ? ? ? ?在下面這個更具體的例子中,無論在<Directory>段中加了多少訪問限制,由于<Location>段將會被最后處理,從而會允許不加限制地訪問服務器,可見合并的順序是很重要的,千萬小心!
<Location />Order deny,allowAllow from all </Location>#Woops! This <Directory> section wiil have no effect <Directory />Order allow,denyAllow from allDeny from badguy.example.com </Directory>? ? ? ? ? ? ? ? ? 3.3.3.6 指令位置
? ? ? ? ? ? ? ? ? ? ? ? ?Apache中提供了指令位置字段的概念來控制一個指令所允許出現的上下文位置。位置字段主要用于控制各個指令在配置文件中允許出現的位置,其中包括三種:頂層位置、目錄區和虛擬主機區。如果服務器發現一個指令出現在不允許出現的地方,比如LoadModule只允許出現在頂層位置,但發現其在<Directory>中出現,服務器將報錯,同時打印出錯信息退出。
? ? ? ? ? ? ? ? ? ? ? ? ? 對于指令位置字段,Apache中提供了下面幾個控制選項:
#define OR_NONE 0 #define OR_LIMIT 1 #define OR_OPTIONS 2 #define OR_FILEINFO 4 #define OR_AUTHCFG 8 #define OR_INDEXES 16 #define OR_UNSET 32 #define ACCESS_CONF 64 #define RSRC_CONF 128 #define EXEC_ON_READ 256 #define OR_ALL (OR_LIMIT|OR_OPTIONS|OR_FILEINFO|OR_AUTHCFG|OR_INDEXES)? ? ? ? ? ? ? ? ? ? ? ? ? ?a)? 普通配置文件位置選項? ? ? ? ? ? ? ?
? ? ? ? ? ? ? ?這三個標志通常在指定指令的時候就必須預先設置好,而不能通過配置文件進行配置。比如<Directory>,其指定的時候為:
AP_INIT_RAW_ARGS("<Directory",dirsection, NULL,RSRC_CONF, "Container for directives affecting resources located in the specified ""directories"),? ? ? ? ? ? ? ? ? ? ? ? ? <Directory>指令只允許出現在<Directory>和<Location>指令之外。
? ? ? ? ? ? ? ? ? ? 而另一個指令AllowOverride則只允許出現在<Directory>和<Location>之內,因此它的標志位為ACCESS_CONF:
AP_INIT_RAW_ARGS("AllowOverride", set_override, NULL, ACCESS_CONF, "Controls what groups of directives can be configured by per-directory ""config files"),? ? ? ? ? ? ? ? ? ? ? 如果一個指令既可以出現在<Directory>和<Location>之內,也可以出現在<Directory>和<Location>指令之外,那么它的標志位將被設置為ACCESS_CONF|RSRC_CONF:
AP_INIT_TAKE1("HostnameLookups", set_hostname_lookups, NULL, ACCESS_CONF|RSRC_CONF,"\"on\" to enable, \"off\" to disable reverse DNS lookups, or \"double\" to ""enable double-reverse DNS lookups"),? ? ? ? ? ? ? ? ? ? ? ? ? ? b) 目錄級別位置選項
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 除了上面三個用于對配置文件進行控制的選項外,Apache中還允許控制目錄及.htaccess文件中出現的指令,這些由AllowOverride控制。該指令僅允許存在于<Directory>配置段中,而且是是不包含正則表達式的<Directory>配置段。在<Location>、<DirectoryMatch>、<Files>配置段中都是無效的。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (1) 如果AllowOverride指令被設置為None,那么.htaccess文件將被完全忽略。事實上,服務器根本不會讀取.htaccess文件。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(2) 當此指令設置為All時,所有具有".htaccess"作用域的指令都允許出現在.htaccess文件中。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(3)除此之外,AllowOverride后的參數還允許是下面的指令類型:
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? AuthConfig、FileInfo、Indexes、Limit(允許使用控制主機訪問的指令(Allow、Deny、Order)、Options[=Option,...]、OR_NONE、OR_LIMIT、OR_OPTIONS、OR_FILEINFO、OR_AUTHCFG、OR_INDEXS、OR_ALL、OR_UNSET
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 指令的位置記錄在指令描述數據結構command_rec中,使用req_override進行記錄,目前在配置文件中,對于<Directory>標簽外部的部分, req_override狀態為:
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?RSRC_CONF|OR_OPTIONS|OR_FILEINFO|OR_INDEXS
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 而在<Directory>標簽內部的部分,狀態為:
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ACCESS_CONF|OR_LIMIT|OR_OPTIONS|OR_FILEINFO|OR_AUTHCFG|OR_INDEXS
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
? ? ? ? ? ? ? ? ? ? ? ?c) Options選項
? ? ? ? ? ? ? ? ? ? ? ? ? 在這些指令中,Options指令是一個特殊的指令,Options指令控制了在特定目錄中將使用哪些服務器特性。option可以為None,在這種情況下,將不啟用任何額外特性,或者設置為以下選項中的一個或多個。
? ? ? ? ? ? ? ? ? ? ? ? ? ? All、ExecCGI(允許使用mod_cgi執行cgi腳本)、FollowSymLinks、Includes、IncludesNOEXEC、Indexes、MultiViews、SymLinkslfOwnerMatch
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? Apache中定義了一系列的選項宏與之對應如下:
#define OPT_NONE 0 #define OPT_INDEXES 1 #define OPT_INCLUDES 2 #define OPT_SYM_LINKS 4 #define OPT_EXECCGI 8 #define OPT_UNSET 16 #define OPT_INCNOEXEC 32 #define OPT_SYM_OWNER 64 #define OPT_MULTI 128 #define OPT_ALL (OPT_INDEXES|OPT_INCLUDES|OPT_SYM_LINKS|OPT_EXECCGI)? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? Options指令的處理由函數set_allow_opts完成,該函數定義在core.c中。
? ? ? ? ? ? ? ? ? ? ? ? d) 上下文檢查
? ? ? ? ? ? ? ? ? ? ? ? ? ? 在使用指定的過程中,一個重要的內容就是對指令的上下文進行檢測,判斷其是否在合法的范圍內。指令的上下文信息都保存在數據結構cmd_parms中。不過最有用也是最簡單的判斷方法是通過函數ap_check_cmd_context,該函數定義在http_config.h中。
? ? ? ? ? ? ? ? ? ? ? ? ? ?為了明確表示指令的作用上下文,Apache在http_config.h中定義了相關的常量來進行描述,代碼如下:
#define NOT_IN_VIRTUALHOST 0x01 //當前的指令不允許出現在<VirtualHost>配置段中 #define NOT_IN_LIMIT 0x02 #define NOT_IN_DIRECTORY 0x04 #define NOT_IN_LOCATION 0x08 #define NOT_IN_FILES 0x10 #define NOT_IN_DIR_LOC_FILE (NOT_IN_DIRECTORY|NOT_IN_LOCATION|NOT_IN_FILES) #define GLOBAL_ONLY (NOT_IN_VIRUTALHOST|NOT_IN_LIMIT|NOT_IN_DIR_LOC_FILE)? ? ? ? ? ? ? ? ? ? ? ? ? ? 如果我們不允許某個指令出現在<VirtualHost>中,則可以用如下代碼示例:
static const char *my_conf(cmd_parms *cmd, void *cfg, ...) {const char *err_msg;errmsg = ap_check_cmd_context(cmd, NOT_IN_VIRTUALHOST);if (errmsg != NULL) return errmsg;/*OK, not in a <VirtualHost>;go ahead and process the directive */return NULL; }? ? ? ? ? ? ? ? ? ? ? ?ap_check_cmd_context函數返回非空字符串,則意味著指令的出現位置發生了錯誤。我們來看一下Apache是如何檢測指令的上下文的,代碼如下:
AP_DECLARE(const char *)ap_check_cmd_context(cmd_parms *cmd, unsigned forbidden) {const char *gt = (cmd->cmd->name[0] == '<' && cmd->cmd->name[strlen(cmd->cmd->name)-1] != '>') ? ">" : "";const ap_directive_t *found;if ((forbiddern & NOT_IN_VIRTUALHOST) && cmd->server->is_virtual) {return apr_pstrcat(cmd->pool, cmd->cmd->name, gt, "cannot occur within <VirutalHost> section", NULL);} AP_DECLARE(const char *) ap_check_cmd_context(cmd_parms *cmd, unsigned forbidden) {const char *gt = (cmd->cmd->name[0] == '<'&& cmd->cmd->name[strlen(cmd->cmd->name)-1] != '>') ? ">" :"";const ap_directive_t *found;if ((forbidden & NOT_IN_VIRTUALHOST) && cmd->server->is_virtual) {return apr_pstrcat(cmd->pool, cmd->cmd->name, gt, "cannot occur within <VirtualHost> section", NULL);}? ? ? ? ? ? ? ? ? ? ? ? ?如果指令出現在<VirtualHost>中,則該指令描述結構中的虛擬主機成員變量將不為空。不過此時并不能判斷該指令一定就是虛擬主機成員,因此,如果指令是全局指令,則指令的server也不為空。只有is_virtual為ture時才能完全斷定指令一定是出現在<VirtualHost>中,如果指令的上下文是NOT_IN_VIRTUALHOST,但指令卻出現在<VirtualHost>中,則意味著指令的位置發生了錯誤。
if ((forbidden & NOT_IN_LIMIT) && cmd->limited != -1) {return apr_pstrcat(cmd->pool, cmd->cmd->name, gt, "cannot occur within <Limit> section", NULL); }? ? ? ? ? ? ? ? ? ? ? ? 判斷當前指令是否在<Limit>中,只需要判斷指令的limited是否被設置,如果該成員被設置,則意味著指令一定在<Limit>中,否則不是。
if ((forbidden & NOT_IN_DIR_LOC_FILE) == NOT_IN_DIR_LOC_FILE) {if (cmd->path != NULL) {return apr_pstrcat(cmd->pool, cmd->cmd->name, gt, "cannot occur within <Directory/Location/Files> ""section", NULL);}if (cmd->cmd->req_override & EXEC_ON_READ) {/* EXEC_ON_READ must be NOT_IN_DIR_LOC_FILE, if not, it will* (deliberately) segfault below in the individual tests ...*/return NULL;} }? ? ? ? ? ? ? ? ? ? ? ? ?判斷當前指令是否位于<Directory>、<Location>及<File>中,只要判斷當前指令的工作路徑path是否被設置,如果被設置,則意味著當前指令肯定出現在這三個配置段中的某一個,否則不是。另外,位于<Directory>等配置段中的指令一定不允許是EXEC_ON_READ類型,代碼如下:
if (((forbidden & NOT_IN_DIRECTORY) && ((found = find_parent(cmd->directive, "<Directory"))|| (found = find_parent(cmd->directive, "<DirectoryMatch"))))|| ((forbidden & NOT_IN_LOCATION)&& ((found = find_parent(cmd->directive, "<Location"))|| (found = find_parent(cmd->directive, "<LocationMatch"))))|| ((forbidden & NOT_IN_FILES)&& ((found = find_parent(cmd->directive, "<FilesMatch"))))) {return apr_pstrcat(cmd->pool, cmd->cmd->name, gt, "cannot occur within ", found->directive, "> section", NULL);}return NULL; }? ? ? ? ? ? ? ? ? ? ? ? ? ?如果當前指令的上下文為NOT_IN_DIRECTORY、NOT_IN_LOCATION或NOT_IN_FILES,此時需要檢查當前指令的所有父節點中是否為<Directory>、<DirectoryMatch>等指令,而不僅僅是檢查當前指令的直接父節點,通過find_parent則可以查找當前節點的所有父節點。
? ? ? ? 3.3.4 指令參數類型
? ? ? ? ? ? ? ?Apache中提供了12中類型的指令,這些類型是與實際的配置文件中指令處理相一致的。每種指令都大同小異,惟一的區別就在于其處理的參數的數目及在將指令傳遞給指令實現函數之前,服務器如何解釋這些參數的方式。
? ? ? ? ? ? ? ?Apache中對于指令類型的定義是通過枚舉類型cmd_how來實現的,cmd_how定義如下:
enum cmd_how {RAW_ARGS,TAKE1,TAKE2,ITERATE,ITERATE2,FLAG,NO_ARGS,TAKE12,TAKE3,TAKE23,TAKE123,TAKE13,TAKE_ARGV };? ? ? ? ? ? ? 對于各種指令,服務器的處理方法如下:
? ? ? ? ? ? ?a) TAKE_ARGV? 這種類型的處理函數會將指令參數作為argc/argv的格式進行處理。
const char *(*take_argv) (cmd_parms *parms, void *mconfig, int argc, char *const argv[]);? ? ? ? ? ? ?b)RAW_ARGS
const char *func(cmd_parms *parms, void *mconfig, char *args);? ? ? ? ? ? ?c) TAKE1
const char *func(cmd_parms* parms, void *mconfig, const char *first);? ? ? ? ? ? ? d) ITERATE
? ? ? ? ? ? ? ? 該類型指令屬于迭代類型。這種指令允許傳入多個參數,不過一次只能處理一個,服務器必須遍歷處理它們。每次遍歷處理的過程又與TAKE1類型執行相同。
const char *func(cmd_parms* parms, void *mconfig, const char *first);? ? ? ? ? ? ? ?e)TAKE2, TAKE12
const char *two_args_func(cmd_parms *parms, void *mconfig, const char *first, const char *second);? ? ? ? ? ? ? ? f) ITERATE2
const char *(*take2) (cmd_parms *parms, void *mconfig, const char *w, const char *w2);? ? ? ? ? ? ? ? g) TAKE3, TAKE23,TAKE13,TAKE123
const char *three_args_func(cmd_parms *parms, void *mconfig, const char *first, const char *second, const char *third);? ? ? ? ? ? ? ? ?h) NO_ARGS
const char *no_args_func(cmd_parms *parms, void *mconfig);? ? ? ? ? ? ? ? ? i) FLAG
const char *flag_args_func(cmd_parms* parms, void *mconfig, int flag);? ? ? ? ? ? ? ?不管是什么指令,其對應的處理函數都是以兩個參數開始的:cmd_parms *parms和void *mconfig。cmd_parms結構用來存儲處理配置指令時所需要的輔助內容。當處理任何配置信息文件的時候,該結構都將被創建。Apache核心通過它將各種需要的參數傳遞給處理函數。另一個參數void *mconfig表示針對指令位置的配置記錄,基于所遇到的指令位置的不同,該配置記錄可以是服務器配置記錄,也可以是目錄配置記錄。
----------------------------------------------------------------------------------------------------------
1.command_rec結構定義:
/* *The command record structure,Each modules can define a table of these *to define the directives it will implement. */ typedef struct command_struct command_rec; struct command_struct {/* Name of this command */const char *name;/* The function to be called when this directive is parsed */cmd_func func;/* Extra data, for functions which implement multiple commands... */void *cmd_data;/* What overrides need to be allowed to enable this command. */int req_override;/* What the command expects as arguments*/enum cmd_how args_how;/* 'usage' message, in case of syntax errors */const char *errmsg; };? 2.? Apache中定義了12種指令,為此Apache中也定義了相應的配置處理指令。Apache中定義的12個處理宏定義如下:
? ? ?
? ? 3.Apache總是從讀取配置文件如httpd.conf開始的。所有的指令讀取后最終要保存到內存中。在內存中使用結構ap_directive_t記錄各個指令,該數據結構定義在文件util_cfgtree.h中:
struct ap_directive_t {const char *directive; //標識該指令的名稱const char *args; //該指令所對應的參數,如果參數超過一個,它們之間使用空格隔開。struct ap_directive_t *next;struct ap_directive_t *first_child;struct ap_directive_t *parent;void *data;const char *filename; //用于記錄指令所在的文件。int line_num; };?4.整個Apache配置文件處理的概要流程
? ?
?5.Apache的完整配置文件處理過程
? ?
? 6.配置文件讀取
? ??
? ? 抽象配置文件在Apache中使用ap_configfile_t結構進行描述,該結構定義在httpd_config.h中:
typedef struct ap_configfile_t ap_configfile_t; struct ap_configfile_t {int (*getch)(void *param); //從抽象配置文件中讀取一個字符的方法void *(*getstr)(void *buf, size_t bufsiz, void *param); //從抽象配置文件中讀取一個字符串int (*close)(void *param); //關閉抽象配置文件void *param; //指針函數需要的參數const char *name; //對于真正的配置文件就是文件名稱unsigned line_number; //當前正在處理的文件行數 };7.? ap_build_config是整個配置處理的核心,調用ap_cfg_getline不停地讀取文件中的每一行,然后調用ap_build_config_sub將其解析為ap_directive_t結構,并將其插入到配置樹的合適位置。
? ? ?ap_build_config_sub成為了配置文件處理的核心。
8.關于模塊化體系結構部分,參考文章:https://blog.csdn.net/zhangge3663/article/details/83343838
9.關于多任務并發處理部分,參考文章:https://blog.csdn.net/zhangge3663/article/details/83343937
10.關于網絡連接部分,參考文章:https://blog.csdn.net/zhangge3663/article/details/83344029
11.關于過濾器部分,參考文章:https://blog.csdn.net/zhangge3663/article/details/83344078
12.關于存儲段和存儲段組,參考文章:https://blog.csdn.net/zhangge3663/article/details/83344115
13.關于常用過濾器部分,參考文章:https://blog.csdn.net/zhangge3663/article/details/83344147
??
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的学习《apache源代码全景分析》之摘录的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 学习“Perl基础教程:正则表达式”之摘
- 下一篇: 学习ModSecrity Handboo