【HTTP协议】超详细的HTTP协议详解
基本介紹
HTTP是一個屬于應用層的面向對象的協議,由于其簡捷、快速的方式,適用于分布式超媒體信息系統。它于1990年提出,經過幾年的使用與發展,得到不斷地完善和擴展。目前在WWW中使用的是HTTP/1.0的第六版,HTTP/1.1的規范化工作正在進行之中,而且HTTP-NG(Next Generation of HTTP)的建議已經提出。
HTTP協議的主要特點可概括如下:
支持客戶/服務器模式。
簡單快速:客戶向服務器請求服務時,只需傳送請求方法和路徑。請求方法常用的有GET、HEAD、POST。每種方法規定了客戶與服務器聯系的類型不同。由于HTTP協議簡單,使得HTTP服務器的程序規模小,因而通信速度很快。
靈活:HTTP允許傳輸任意類型的數據對象。正在傳輸的類型由Content-Type加以標記。
無連接:無連接的含義是限制每次連接只處理一個請求。服務器處理完客戶的請求,并收到客戶的應答后,即斷開連接。采用這種方式可以節省傳輸時間。
無狀態:HTTP協議是無狀態協議。無狀態是指協議對于事務處理沒有記憶能力。缺少狀態意味著如果后續處理需要前面的信息,則它必須重傳,這樣可能導致每次連接傳送的數據量增大。另一方面,在服務器不需要先前信息時它的應答就較快。
HTTP協議詳解 — URL篇
http(超文本傳輸協議)是一個基于請求與響應模式的、無狀態的、應用層的協議,常基于TCP的連接方式,HTTP1.1版本中給出一種持續連接的機制,絕大多數的Web開發,都是構建在HTTP協議之上的Web應用。
HTTP URL (URL是一種特殊類型的URI,包含了用于查找某個資源的足夠的信息)的格式如下:
http://host[":"port][abs_path]- http表示要通過HTTP協議來定位網絡資源;
- host表示合法的Internet主機域名或者IP地址;
- port指定一個端口號,為空則使用缺省端口80;
- abs_path指定請求資源的URI,如果URL中沒有給出abs_path,那么當它作為請求URI時,必須以“/”的形式給出,通常這個工作瀏覽器自動幫我們完成。
例如:
1、輸入:www.guet.edu.cn 瀏覽器自動轉換成:http://www.guet.edu.cn/
2、http:192.168.0.116:8080/index.jsp
HTTP協議詳解—請求行
http請求由三部分組成,分別是:請求行、消息報頭、請求正文
請求行以一個方法符號開頭,以空格分開,后面跟著請求的URI和協議的版本,格式如下:
Method Request-URI HTTP-Version CRLF- Method表示請求方法;
- Request-URI是一個統一資源標識符;
- HTTP-Version表示請求的HTTP協議版本;
- CRLF表示回車和換行(除了作為結尾的CRLF外,不允許出現單獨的CR或LF字符)。
請求方法(所有方法全為大寫)有多種,各個方法的解釋如下:
| GET | 請求獲取Request-URI所標識的資源 |
| POST | 在Request-URI所標識的資源后附加新的數據 |
| HEAD | 請求獲取由Request-URI所標識的資源的響應消息報頭 |
| PUT | 請求服務器存儲一個資源,并用Request-URI作為其標識 |
| DELETE | 請求服務器刪除Request-URI所標識的資源 |
| TRACE | 請求服務器回送收到的請求信息,主要用于測試或診斷 |
| CONNECT | 保留將來使用 |
| OPTIONS | 請求查詢服務器的性能,或者查詢與資源相關的選項和需求 |
舉例:
GET方法:在瀏覽器的地址欄中輸入網址的方式訪問網頁時,瀏覽器采用GET方法向服務器獲取資源
如:GET /form.html HTTP/1.1 (CRLF)
POST方法要求被請求服務器接受附在請求后面的數據,常用于提交表單。
如:POST /reg.jsp HTTP/ (CRLF)
(CRLF) :該CRLF表示消息報頭已經結束,在此之前為消息報頭
user=jeffrey&pwd=1234 :此行以下為提交的數據
HEAD方法與GET方法幾乎是一樣的,對于HEAD請求的回應部分來說,它的HTTP頭部中包含的信息與通過GET請求所得到的信息是相同的。利用這個方法,不必傳輸整個資源內容,就可以得到Request-URI所標識的資源的信息。該方法常用于測試超鏈接的有效性,是否可以訪問,以及最近是否更新。
HTTP協議詳解—狀態行
在接收和解釋請求消息后,服務器返回一個HTTP響應消息。
HTTP響應也是由三個部分組成,分別是:狀態行、消息報頭、響應正文
狀態行格式如下:
HTTP-Version Status-Code Reason-Phrase CRLF- HTTP-Version表示服務器HTTP協議的版本;
- Status-Code表示服務器發回的響應狀態代碼;
- Reason-Phrase表示狀態代碼的文本描述。
狀態代碼有三位數字組成,第一個數字定義了響應的類別,且有五種可能取值:
| 1xx | 指示信息–表示請求已接收,繼續處理 |
| 2xx | 成功–表示請求已被成功接收、理解、接受 |
| 3xx | 重定向–要完成請求必須進行更進一步的操作 |
| 4xx | 客戶端錯誤–請求有語法錯誤或請求無法實現 |
| 5xx | 服務器端錯誤–服務器未能實現合法的請求 |
常見狀態代碼、狀態描述、說明:
| 200 | OK 客戶端請求成功 |
| 400 | Bad Request 客戶端請求有語法錯誤,不能被服務器所理解 |
| 401 | Unauthorized 請求未經授權,這個狀態代碼必須和WWW-Authenticate報頭域一起使用 |
| 403 | Forbidden 服務器收到請求,但是拒絕提供服務 |
| 404 | Not Found 請求資源不存在,eg:輸入了錯誤的URL |
| 500 | Internal Server Error 服務器發生不可預期的錯誤 |
| 503 | Server Unavailable 服務器當前不能處理客戶端的請求,一段時間后可能恢復正常 |
HTTP協議詳解—消息報頭
HTTP消息由客戶端到服務器的請求和服務器到客戶端的響應組成。請求消息和響應消息都是由開始行(對于請求消息,開始行就是請求行,對于響應消息,開始行就是狀態行),消息報頭(可選),空行(只有CRLF的行),消息正文(可選)組成。
HTTP消息報頭包括普通報頭、請求報頭、響應報頭、實體報頭。
每一個報頭域都是由名字+“:”+空格+值 組成,消息報頭域的名字是大小寫無關的。
普通報頭
在普通報頭中,有少數報頭域用于所有的請求和響應消息,但并不用于被傳輸的實體,只用于傳輸的消息。如:
Cache-Control
用于指定緩存指令,緩存指令是單向的(響應中出現的緩存指令在請求中未必會出現),且是獨立的(一個消息的緩存指令不會影響另一個消息處理的緩存機制),HTTP1.0使用的類似的報頭域為Pragma。
請求時的緩存指令包括:no-cache(用于指示請求或響應消息不能緩存)、no-store、max-age、max-stale、min-fresh、only-if-cached
響應時的緩存指令包括:public、private、no-cache、no-store、no-transform、must-revalidate、proxy-revalidate、max-age、s-maxage
response.setHeader("Pragma","no-cache");作用相當于上述代碼,通常兩者合用,這句代碼將在發送的響應消息中設置普通報頭域:Cache-Control:no-cache
Date普通報頭域表示消息產生的日期和時間
Connection普通報頭域允許發送指定連接的選項。例如指定連接是連續,或者指定“close”選項,通知服務器,在響應完成后,關閉連接
請求報頭
請求報頭允許客戶端向服務器端傳遞請求的附加信息以及客戶端自身的信息。
常用的請求報頭
| Accept | Accept請求報頭域用于指定客戶端接受哪些類型的信息。 如:Accept:image/gif,表明客戶端希望接受GIF圖象格式的資源;Accept:text/html,表明客戶端希望接受html文本。 |
| Accept-Charset | Accept-Charset請求報頭域用于指定客戶端接受的字符集。如:Accept-Charset:iso-8859-1,gb2312.如果在請求消息中沒有設置這個域,缺省是任何字符集都可以接受。 |
| Accept-Encoding | Accept-Encoding請求報頭域類似于Accept,但是它是用于指定可接受的內容編碼。如:Accept-Encoding:gzip.deflate.如果請求消息中沒有設置這個域服務器假定客戶端對各種內容編碼都可以接受。 |
| Accept-Language | Accept-Language請求報頭域類似于Accept,但是它是用于指定一種自然語言。如:Accept-Language:zh-cn.如果請求消息中沒有設置這個報頭域,服務器假定客戶端對各種語言都可以接受。 |
| Authorization | Authorization請求報頭域主要用于證明客戶端有權查看某個資源。當瀏覽器訪問一個頁面時,如果收到服務器的響應代碼為401(未授權),可以發送一個包含Authorization請求報頭域的請求,要求服務器對其進行驗證。 |
| Host(發送請求時,該報頭域是必需的) | Host請求報頭域主要用于指定被請求資源的Internet主機和端口號,它通常從HTTP URL中提取出來的,如:我們在瀏覽器中輸入:http://www.guet.edu.cn/index.html,瀏覽器發送的請求消息中,就會包含Host請求報頭域,如下:Host:www.guet.edu.cn,此處使用缺省端口號80,若指定了端口號,則變成:Host:www.guet.edu.cn:指定端口號 |
| User-Agent | 我們上網登陸論壇的時候,往往會看到一些歡迎信息,其中列出了你的操作系統的名稱和版本,你所使用的瀏覽器的名稱和版本,這往往讓很多人感到很神奇,實際上,服務器應用程序就是從User-Agent這個請求報頭域中獲取到這些信息。User-Agent請求報頭域允許客戶端將它的操作系統、瀏覽器和其它屬性告訴服務器。不過,這個報頭域不是必需的,如果我們自己編寫一個瀏覽器,不使用User-Agent請求報頭域,那么服務器端就無法得知我們的信息了。 |
請求報頭舉例:
GET http://client2.cmread.com/cmread/portalapi?contentId=510105670&start=1&count=1&versionCartoon=4 HTTP/1.1 recmd_version: 8.11.0 Host: client2.cmread.com Connection: Keep-Alive Accept-Language:zh-cn Accept-Encoding: gzip User-Agent: okhttp/3.12.1響應報頭
響應報頭允許服務器傳遞不能放在狀態行中的附加響應信息,以及關于服務器的信息和對Request-URI所標識的資源進行下一步訪問的信息。
常用的響應報頭
| Location | Location響應報頭域用于重定向接受者到一個新的位置。Location響應報頭域常用在更換域名的時候。 |
| Server | Server響應報頭域包含了服務器用來處理請求的軟件信息。與User-Agent請求報頭域是相對應的。如:Server:Apache-Coyote/1.1 |
| WWW-Authenticate | WWW-Authenticate響應報頭域必須被包含在401(未授權的)響應消息中,客戶端收到401響應消息時候,并發送Authorization報頭域請求服務器對其進行驗證時,服務端響應報頭就包含該報頭域。如:WWW-Authenticate:Basic realm="Basic Auth Test!" 可以看出服務器對請求資源采用的是基本驗證機制。 |
實體報頭
請求和響應消息都可以傳送一個實體。一個實體由實體報頭域和實體正文組成,但并不是說實體報頭域和實體正文要在一起發送,可以只發送實體報頭域。實體報頭定義了關于實體正文(有無實體正文)和請求所標識的資源的元信息。
常用的實體報頭
| Content-Encoding | Content-Encoding實體報頭域被用作媒體類型的修飾符,它的值指示了已經被應用到實體正文的附加內容的編碼,因而要獲得Content-Type報頭域中所引用的媒體類型,必須采用相應的解碼機制。Content-Encoding這樣用于記錄文檔的壓縮方法,Content-Encoding:gzip |
| Content-Language | Content-Language實體報頭域描述了資源所用的自然語言。沒有設置該域則認為實體內容將提供給所有的語言閱讀者。Content-Language:da |
| Content-Length | Content-Length實體報頭域用于指明實體正文的長度,以字節方式存儲的十進制數字來表示。 |
| Content-Type | Content-Type實體報頭域用語指明發送給接收者的實體正文的媒體類型。如:Content-Type:text/html;charset=ISO-8859-1,Content-Type:text/html;charset=GB2312 |
| Last-Modified | Last-Modified實體報頭域用于指示資源的最后修改日期和時間。 |
| Expires | Expires實體報頭域給出響應過期的日期和時間。為了讓代理服務器或瀏覽器在一段時間以后更新緩存中(再次訪問曾訪問過的頁面時,直接從緩存中加載,縮短響應時間和降低服務器負載)的頁面,我們可以使用Expires實體報頭域指定頁面過期的時間。如:Expires:Thu,15 Sep 2006 16:23:12 GMT |
HTTP1.1的客戶端和緩存必須將其他非法的日期格式(包括0)看作已經過期。為了讓瀏覽器不要緩存頁面,我們也可以利用Expires實體報頭域,設置為0,如:response.setDateHeader("Expires","0");
HTTP協議相關技術補充
基礎
高層協議有:文件傳輸協議FTP、電子郵件傳輸協議SMTP、域名系統服務DNS、網絡新聞傳輸協議NNTP和HTTP協議等
中介有三種:代理(Proxy)、網關(Gateway)和通道(Tunnel)
代理(Proxy):一個中間程序,它可以充當一個服務器,也可以充當一個客戶機,為其它客戶機建立請求。請求是通過可能的翻譯在內部或經過傳遞到其它的服務器中。
一個代理在發送請求信息之前,必須解釋并且如果可能重寫它。代理經常作為通過防火墻的客戶機端的門戶,代理還可以作為一個幫助應用來通過協議處 理沒有被用戶代理完成的請求。
一個代理根據URI的絕對格式來接受請求,重寫全部或部分消息,通過 URI的標識把已格式化過的請求發送到服務器。
網關(Gateway):一個作為其它服務器中間媒介的服務器。與代理不同的是,網關接受請求就好象對被請求的資源來說它就是源服務器;發出請求的客戶機并沒有意識到它在同網關打交道。
網關經常作為通過防火墻的服務器端的門戶,網關還可以作為一個協議翻譯器以便存取那些存儲在非HTTP系統中的資源。
網關是一個接收代理,作為一些其它服務器的上層,并且如果必須的話,可以把請求翻譯給下層的服務器協議。
通道(Tunnel):是作為兩個連接中繼的中介程序。一旦激活,通道便被認為不屬于HTTP通訊,盡管通道可能是被一個HTTP請求初始化的。當被中繼 的連接兩端關閉時,通道便消失。當一個門戶(Portal)必須存在或中介(Intermediary)不能解釋中繼的通訊時通道被經常使用。
一個通道作為不改變消息的兩個連接之間的中繼點。當通訊需要通過一個中介(例如:防火墻等)或者是中介不能識別消息的內容時,通道經常被使用。
常用測試請求
HEAD/Http/1.0發送基本的Http請求
DELETE/Http/1.0發送那些不被允許的請求,比如Delete請求
GET/Http/3.0發送一個非法版本的Http協議請求
GET/JUNK/1.0發送一個不正確規格的Http協議請求
總結
以上是生活随笔為你收集整理的【HTTP协议】超详细的HTTP协议详解的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【插件】IDEA中个人觉得最好的插件,附
- 下一篇: 【HTTP协议】HTTP状态码列表大全