网络编程懒人入门(二):快速理解网络通信协议(下篇)
1、前言
本文上篇《網絡編程懶人入門(一):快速理解網絡通信協議(上篇)》分析了互聯網的總體構思,從下至上,每一層協議的設計思想。基于知識連貫性的考慮,建議您先看完上篇后再來閱讀本文。
本文從設計者的角度看問題,今天我想切換到用戶的角度,看看用戶是如何從上至下,與這些協議互動的。
2、系列文章
本文是系列文章中的第1篇,本系列文章的大綱如下:
?
- 《網絡編程懶人入門(一):快速理解網絡通信協議(上篇)》
- 《網絡編程懶人入門(三):快速理解TCP協議一篇就夠》
3、參考資料
《TCP/IP詳解 - 第11章·UDP:用戶數據報協議》
《TCP/IP詳解 - 第17章·TCP:傳輸控制協議》
《TCP/IP詳解 - 第18章·TCP連接的建立與終止》
《TCP/IP詳解 - 第21章·TCP的超時與重傳》
《通俗易懂-深入理解TCP協議(上):理論基礎》
《通俗易懂-深入理解TCP協議(下):RTT、滑動窗口、擁塞處理》
《理論經典:TCP協議的3次握手與4次揮手過程詳解》
《理論聯系實際:Wireshark抓包分析TCP 3次握手、4次揮手過程》
《計算機網絡通訊協議關系圖(中文珍藏版)》
《高性能網絡編程(一):單臺服務器并發TCP連接數到底可以有多少》
《高性能網絡編程(二):上一個10年,著名的C10K并發連接問題》
《高性能網絡編程(三):下一個10年,是時候考慮C10M并發問題了》
《簡述傳輸層協議TCP和UDP的區別》
《為什么QQ用的是UDP協議而不是TCP協議?》
《移動端即時通訊協議選擇:UDP還是TCP?》
4、一個小結
先對前面的內容,做一個小結(詳見本文上篇《網絡編程懶人入門(一):快速理解網絡通信協議(上篇)》)。
我們已經知道,網絡通信就是交換數據包。電腦A向電腦B發送一個數據包,后者收到了,回復一個數據包,從而實現兩臺電腦之間的通信。
數據包的結構,基本上是下面這樣:
發送這個包,需要知道兩個地址:
?
- * 對方的MAC地址;
- * 對方的IP地址。
有了這兩個地址,數據包才能準確送到接收者手中。但是,前面說過,MAC地址有局限性,如果兩臺電腦不在同一個子網絡,就無法知道對方的MAC地址,必須通過網關(gateway)轉發。
上圖中,1號電腦要向4號電腦發送一個數據包。它先判斷4號電腦是否在同一個子網絡,結果發現不是(后文介紹判斷方法),于是就把這個數據包發到網關A。網關A通過路由協議,發現4號電腦位于子網絡B,又把數據包發給網關B,網關B再轉發到4號電腦。
1號電腦把數據包發到網關A,必須知道網關A的MAC地址。所以,數據包的目標地址,實際上分成兩種情況:
?
| 場景 | 數據包地址 |
| 同一個子網絡 | 對方的MAC地址,對方的IP地址 |
| 非同一個子網絡 | 網關的MAC地址,對方的IP地址 |
發送數據包之前,電腦必須判斷對方是否在同一個子網絡,然后選擇相應的MAC地址。接下來,我們就來看,實際使用中,這個過程是怎么完成的。
?
5、用戶的上網設置
?
5.1靜態IP地址
你買了一臺新電腦,插上網線,開機,這時電腦能夠上網嗎?
通常你必須做一些設置。有時,管理員(或者ISP)會告訴你下面四個參數,你把它們填入操作系統,計算機就能連上網了:
?
- * 本機的IP地址;
- * 子網掩碼;
- * 網關的IP地址;
- * DNS的IP地址。
下圖是Windows系統的設置窗口:
這四個參數缺一不可,后文會解釋為什么需要知道它們才能上網。由于它們是給定的,計算機每次開機,都會分到同樣的IP地址,所以這種情況被稱作"靜態IP地址上網"。但是,這樣的設置很專業,普通用戶望而生畏,而且如果一臺電腦的IP地址保持不變,其他電腦就不能使用這個地址,不夠靈活。出于這兩個原因,大多數用戶使用"動態IP地址上網"。
?
5.2動態IP地址
所謂"動態IP地址",指計算機開機后,會自動分配到一個IP地址,不用人為設定。它使用的協議叫做DHCP協議。
這個協議規定,每一個子網絡中,有一臺計算機負責管理本網絡的所有IP地址,它叫做"DHCP服務器"。新的計算機加入網絡,必須向"DHCP服務器"發送一個"DHCP請求"數據包,申請IP地址和相關的網絡參數。
前面說過,如果兩臺計算機在同一個子網絡,必須知道對方的MAC地址和IP地址,才能發送數據包。但是,新加入的計算機不知道這兩個地址,怎么發送數據包呢?DHCP協議做了一些巧妙的規定。
?
5.3DHCP協議
首先,它是一種應用層協議,建立在UDP協議之上,所以整個數據包是這樣的:
- 1)最前面的"以太網標頭":設置發出方(本機)的MAC地址和接收方(DHCP服務器)的MAC地址。前者就是本機網卡的MAC地址,后者這時不知道,就填入一個廣播地址:FF-FF-FF-FF-FF-FF。
- 2)后面的"IP標頭":設置發出方的IP地址和接收方的IP地址。這時,對于這兩者,本機都不知道。于是,發出方的IP地址就設為0.0.0.0,接收方的IP地址設為255.255.255.255。
- 3)最后的"UDP標頭":設置發出方的端口和接收方的端口。這一部分是DHCP協議規定好的,發出方是68端口,接收方是67端口。
這個數據包構造完成后,就可以發出了。以太網是廣播發送,同一個子網絡的每臺計算機都收到了這個包。因為接收方的MAC地址是FF-FF-FF-FF-FF-FF,看不出是發給誰的,所以每臺收到這個包的計算機,還必須分析這個包的IP地址,才能確定是不是發給自己的。當看到發出方IP地址是0.0.0.0,接收方是255.255.255.255,于是DHCP服務器知道"這個包是發給我的",而其他計算機就可以丟棄這個包。
接下來,DHCP服務器讀出這個包的數據內容,分配好IP地址,發送回去一個"DHCP響應"數據包。這個響應包的結構也是類似的,以太網標頭的MAC地址是雙方的網卡地址,IP標頭的IP地址是DHCP服務器的IP地址(發出方)和255.255.255.255(接收方),UDP標頭的端口是67(發出方)和68(接收方),分配給請求端的IP地址和本網絡的具體參數則包含在Data部分。
新加入的計算機收到這個響應包,于是就知道了自己的IP地址、子網掩碼、網關地址、DNS服務器等等參數。
?
5.4上網設置:小結
這個部分,需要記住的就是一點:不管是"靜態IP地址"還是"動態IP地址",電腦上網的首要步驟,是確定四個參數。
這四個值很重要,值得重復一遍:
?
- * 本機的IP地址;
- * 子網掩碼;
- * 網關的IP地址;
- * DNS的IP地址。
有了這幾個數值,電腦就可以上網"沖浪"了。接下來,我們來看一個實例,當用戶訪問網頁的時候,互聯網協議是怎么運作的。
6、一個實例:訪問網頁
?
6.1本機參數
我們假定,經過上一節的步驟,用戶設置好了自己的網絡參數:
?
- * 本機的IP地址:192.168.1.100;
- * 子網掩碼:255.255.255.0;
- * 網關的IP地址:192.168.1.1;
- * DNS的IP地址:8.8.8.8。
然后他打開瀏覽器,想要訪問Google,在地址欄輸入了網址:www.google.com。
這意味著,瀏覽器要向Google發送一個網頁請求的數據包。
?
6.2DNS協議
我們知道,發送數據包,必須要知道對方的IP地址。但是,現在,我們只知道網址www.google.com,不知道它的IP地址。DNS協議可以幫助我們,將這個網址轉換成IP地址。已知DNS服務器為8.8.8.8,于是我們向這個地址發送一個DNS數據包(53端口)。
然后,DNS服務器做出響應,告訴我們Google的IP地址是172.194.72.105。于是,我們知道了對方的IP地址。
?
6.3子網掩碼
接下來,我們要判斷,這個IP地址是不是在同一個子網絡,這就要用到子網掩碼。
已知子網掩碼是255.255.255.0,本機用它對自己的IP地址192.168.1.100,做一個二進制的AND運算(兩個數位都為1,結果為1,否則為0),計算結果為192.168.1.0;然后對Google的IP地址172.194.72.105也做一個AND運算,計算結果為172.194.72.0。這兩個結果不相等,所以結論是,Google與本機不在同一個子網絡。
因此,我們要向Google發送數據包,必須通過網關192.168.1.1轉發,也就是說,接收方的MAC地址將是網關的MAC地址。
?
6.4應用層協議
瀏覽網頁用的是HTTP協議,它的整個數據包構造是這樣的:
HTTP部分的內容,類似于下面這樣:
| 1 2 3 4 5 6 7 8 9 | GET / HTTP/1.1 Host: [url=http://www.google.com]www.google.com[/url] Connection: keep-alive User-Agent: Mozilla/5.0 (Windows NT 6.1) ...... Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 Accept-Encoding: gzip,deflate,sdch Accept-Language: zh-CN,zh;q=0.8 Accept-Charset: GBK,utf-8;q=0.7,*;q=0.3 Cookie: ... ... |
我們假定這個部分的長度為4960字節,它會被嵌在TCP數據包之中。
?
6.5TCP協議
TCP數據包需要設置端口,接收方(Google)的HTTP端口默認是80,發送方(本機)的端口是一個隨機生成的1024-65535之間的整數,假定為51775。TCP數據包的標頭長度為20字節,加上嵌入HTTP的數據包,總長度變為4980字節。
?
6.6IP協議
然后,TCP數據包再嵌入IP數據包。IP數據包需要設置雙方的IP地址,這是已知的,發送方是192.168.1.100(本機),接收方是172.194.72.105(Google)。IP數據包的標頭長度為20字節,加上嵌入的TCP數據包,總長度變為5000字節。
?
6.7以太網協議
最后,IP數據包嵌入以太網數據包。以太網數據包需要設置雙方的MAC地址,發送方為本機的網卡MAC地址,接收方為網關192.168.1.1的MAC地址(通過ARP協議得到)。
以太網數據包的數據部分,最大長度為1500字節,而現在的IP數據包長度為5000字節。因此,IP數據包必須分割成四個包。因為每個包都有自己的IP標頭(20字節),所以四個包的IP數據包的長度分別為1500、1500、1500、560。
6.8服務器端響應
經過多個網關的轉發,Google的服務器172.194.72.105,收到了這四個以太網數據包。根據IP標頭的序號,Google將四個包拼起來,取出完整的TCP數據包,然后讀出里面的"HTTP請求",接著做出"HTTP響應",再用TCP協議發回來。
本機收到HTTP響應以后,就可以將網頁顯示出來,完成一次網絡通信。
這個例子就到此為止,雖然經過了簡化,但它大致上反映了互聯網協議的整個通信過程。
網易云信,你身邊的即時通訊和音視頻技術專家,了解我們,請戳網易云信官網
想要行業洞察和技術干貨,請關注網易云信博客
本文轉載自52im,作者:JackJiang
與50位技術專家面對面20年技術見證,附贈技術全景圖總結
以上是生活随笔為你收集整理的网络编程懒人入门(二):快速理解网络通信协议(下篇)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 网络编程懒人入门(一):快速理解网络通信
- 下一篇: 网络编程懒人入门(三):快速理解TCP协