网络编程懒人入门(一):快速理解网络通信协议(上篇)
1、寫(xiě)在前面
論壇和群里常會(huì)有技術(shù)同行打算自已開(kāi)發(fā)IM或者消息推送系統(tǒng),很多時(shí)候連基本的網(wǎng)絡(luò)編程理論(如網(wǎng)絡(luò)協(xié)議等)都不了解,就貿(mào)然定方案、寫(xiě)代碼,顯得非常盲目且充滿技術(shù)風(fēng)險(xiǎn)。
即時(shí)通訊網(wǎng)論壇里精心整理了《[通俗易懂]深入理解TCP協(xié)議》、《不為人知的網(wǎng)絡(luò)編程》、《P2P技術(shù)詳解》、《高性能網(wǎng)絡(luò)編程》這幾個(gè)網(wǎng)絡(luò)編程的系列文章,甚至還有圖文并貌+實(shí)戰(zhàn)代碼的《NIO框架入門(mén)》等等。資料雖好,無(wú)奈很多同行或許是時(shí)間緊迫,也或許是心態(tài)浮躁,反正就是沒(méi)辦法靜下心來(lái)仔細(xì)研讀,導(dǎo)致錯(cuò)過(guò)了很多必須掌握的網(wǎng)絡(luò)編程知識(shí)基礎(chǔ)(如果您正打算從零開(kāi)發(fā)移動(dòng)端IM,則建議您從此文開(kāi)始《新手入門(mén)一篇就夠:從零開(kāi)發(fā)移動(dòng)端IM》)。
本次《網(wǎng)絡(luò)編程懶人入門(mén)》系列文章(共3篇),將為大家(尤其是上面說(shuō)的浮躁的開(kāi)發(fā)者同行)提供懶人快速入門(mén),希望在你沒(méi)辦法耐心讀完上面的幾個(gè)系列文章(但還是強(qiáng)烈建議優(yōu)先去讀一讀)的情況還能對(duì)基本的網(wǎng)絡(luò)編程知識(shí)有所了解和掌握,從而對(duì)您的IM系統(tǒng)或消息推系統(tǒng)的技術(shù)選型、方案制定、代碼編寫(xiě)起到理論支撐作用。
本文將從網(wǎng)絡(luò)通信協(xié)議講起,懶人們,動(dòng)起來(lái)^_^ !
2、正文引言
我們每天使用互聯(lián)網(wǎng),你是否想過(guò),它是如何實(shí)現(xiàn)的?
全世界幾十億臺(tái)電腦,連接在一起,兩兩通信。上海的某一塊網(wǎng)卡送出信號(hào),洛杉磯的另一塊網(wǎng)卡居然就收到了,兩者實(shí)際上根本不知道對(duì)方的物理位置,你不覺(jué)得這是很神奇的事情嗎?
互聯(lián)網(wǎng)的核心是一系列協(xié)議,總稱為"互聯(lián)網(wǎng)協(xié)議"(Internet Protocol Suite)。它們對(duì)電腦如何連接和組網(wǎng),做出了詳盡的規(guī)定。理解了這些協(xié)議,就理解了互聯(lián)網(wǎng)的原理。
下面就是我的學(xué)習(xí)筆記。因?yàn)檫@些協(xié)議實(shí)在太復(fù)雜、太龐大,我想整理一個(gè)簡(jiǎn)潔的框架,幫助自己從總體上把握它們。為了保證簡(jiǎn)單易懂,我做了大量的簡(jiǎn)化,有些地方并不全面和精確,但是應(yīng)該能夠說(shuō)清楚互聯(lián)網(wǎng)的原理。
另外,如果您很好奇承載這些網(wǎng)絡(luò)協(xié)議的物理設(shè)備是怎么工作的,可以先看看《網(wǎng)絡(luò)編程懶人入門(mén)(六):史上最通俗的集線器、交換機(jī)、路由器功能原理入門(mén)》。
3、系列文章
本文是系列文章中的第1篇,本系列文章的大綱如下:
?
- 《網(wǎng)絡(luò)編程懶人入門(mén)(二):快速理解網(wǎng)絡(luò)通信協(xié)議(下篇)》
- 《網(wǎng)絡(luò)編程懶人入門(mén)(三):快速理解TCP協(xié)議一篇就夠》
4、參考資料
《TCP/IP詳解 - 第11章·UDP:用戶數(shù)據(jù)報(bào)協(xié)議》
《TCP/IP詳解 - 第17章·TCP:傳輸控制協(xié)議》
《TCP/IP詳解 - 第18章·TCP連接的建立與終止》
《TCP/IP詳解 - 第21章·TCP的超時(shí)與重傳》
《通俗易懂-深入理解TCP協(xié)議(上):理論基礎(chǔ)》
《通俗易懂-深入理解TCP協(xié)議(下):RTT、滑動(dòng)窗口、擁塞處理》
《理論經(jīng)典:TCP協(xié)議的3次握手與4次揮手過(guò)程詳解》
《理論聯(lián)系實(shí)際:Wireshark抓包分析TCP 3次握手、4次揮手過(guò)程》
《計(jì)算機(jī)網(wǎng)絡(luò)通訊協(xié)議關(guān)系圖(中文珍藏版)》
《高性能網(wǎng)絡(luò)編程(一):單臺(tái)服務(wù)器并發(fā)TCP連接數(shù)到底可以有多少》
《高性能網(wǎng)絡(luò)編程(二):上一個(gè)10年,著名的C10K并發(fā)連接問(wèn)題》
《高性能網(wǎng)絡(luò)編程(三):下一個(gè)10年,是時(shí)候考慮C10M并發(fā)問(wèn)題了》
《高性能網(wǎng)絡(luò)編程(四):從C10K到C10M高性能網(wǎng)絡(luò)應(yīng)用的理論探索》
《簡(jiǎn)述傳輸層協(xié)議TCP和UDP的區(qū)別》
《為什么QQ用的是UDP協(xié)議而不是TCP協(xié)議?》
《移動(dòng)端即時(shí)通訊協(xié)議選擇:UDP還是TCP?》5、內(nèi)容概述
?5.1五層模型
互聯(lián)網(wǎng)的實(shí)現(xiàn),分成好幾層。每一層都有自己的功能,就像建筑物一樣,每一層都靠下一層支持。用戶接觸到的,只是最上面的一層,根本沒(méi)有感覺(jué)到下面的層。要理解互聯(lián)網(wǎng),必須從最下層開(kāi)始,自下而上理解每一層的功能。
如何分層有不同的模型,有的模型分七層,有的分四層。我覺(jué)得,把互聯(lián)網(wǎng)分成五層,比較容易解釋:
如上圖所示,最底下的一層叫做"實(shí)體層"(Physical Layer),最上面的一層叫做"應(yīng)用層"(Application Layer),中間的三層(自下而上)分別是"鏈接層"(Link Layer)、"網(wǎng)絡(luò)層"(Network Layer)和"傳輸層"(Transport Layer)。越下面的層,越靠近硬件;越上面的層,越靠近用戶。
它們叫什么名字,其實(shí)并不重要。只需要知道,互聯(lián)網(wǎng)分成若干層就可以了。
?
5.2層與協(xié)議
每一層都是為了完成一種功能。為了實(shí)現(xiàn)這些功能,就需要大家都遵守共同的規(guī)則。大家都遵守的規(guī)則,就叫做"協(xié)議"(protocol)。
互聯(lián)網(wǎng)的每一層,都定義了很多協(xié)議。這些協(xié)議的總稱,就叫做"互聯(lián)網(wǎng)協(xié)議"(Internet Protocol Suite)。它們是互聯(lián)網(wǎng)的核心,下面介紹每一層的功能,主要就是介紹每一層的主要協(xié)議。
6、實(shí)體層
我們從最底下的一層開(kāi)始。
電腦要組網(wǎng),第一件事要干什么?當(dāng)然是先把電腦連起來(lái),可以用光纜、電纜、雙絞線、無(wú)線電波等方式。
這就叫做"實(shí)體層",它就是把電腦連接起來(lái)的物理手段。它主要規(guī)定了網(wǎng)絡(luò)的一些電氣特性,作用是負(fù)責(zé)傳送0和1的電信號(hào)。
7、鏈接層
?
7.1 定義
單純的0和1沒(méi)有任何意義,必須規(guī)定解讀方式:多少個(gè)電信號(hào)算一組?每個(gè)信號(hào)位有何意義?
這就是"鏈接層"的功能,它在"實(shí)體層"的上方,確定了0和1的分組方式。
?
7.2 以太網(wǎng)協(xié)議
早期的時(shí)候,每家公司都有自己的電信號(hào)分組方式。逐漸地,一種叫做"以太網(wǎng)"(Ethernet)的協(xié)議,占據(jù)了主導(dǎo)地位。
以太網(wǎng)規(guī)定,一組電信號(hào)構(gòu)成一個(gè)數(shù)據(jù)包,叫做"幀"(Frame)。每一幀分成兩個(gè)部分:標(biāo)頭(Head)和數(shù)據(jù)(Data)。
“標(biāo)頭"包含數(shù)據(jù)包的一些說(shuō)明項(xiàng),比如發(fā)送者、接受者、數(shù)據(jù)類型等等;"數(shù)據(jù)"則是數(shù)據(jù)包的具體內(nèi)容。
"標(biāo)頭"的長(zhǎng)度,固定為18字節(jié)。"數(shù)據(jù)"的長(zhǎng)度,最短為46字節(jié),最長(zhǎng)為1500字節(jié)。因此,整個(gè)"幀"最短為64字節(jié),最長(zhǎng)為1518字節(jié)。如果數(shù)據(jù)很長(zhǎng),就必須分割成多個(gè)幀進(jìn)行發(fā)送。
?
7.3MAC地址
上面提到,以太網(wǎng)數(shù)據(jù)包的"標(biāo)頭",包含了發(fā)送者和接受者的信息。那么,發(fā)送者和接受者是如何標(biāo)識(shí)呢?
以太網(wǎng)規(guī)定,連入網(wǎng)絡(luò)的所有設(shè)備,都必須具有"網(wǎng)卡"接口。數(shù)據(jù)包必須是從一塊網(wǎng)卡,傳送到另一塊網(wǎng)卡。網(wǎng)卡的地址,就是數(shù)據(jù)包的發(fā)送地址和接收地址,這叫做MAC地址。
每塊網(wǎng)卡出廠的時(shí)候,都有一個(gè)全世界獨(dú)一無(wú)二的MAC地址,長(zhǎng)度是48個(gè)二進(jìn)制位,通常用12個(gè)十六進(jìn)制數(shù)表示。
前6個(gè)十六進(jìn)制數(shù)是廠商編號(hào),后6個(gè)是該廠商的網(wǎng)卡流水號(hào)。有了MAC地址,就可以定位網(wǎng)卡和數(shù)據(jù)包的路徑了。
7.4廣播
定義地址只是第一步,后面還有更多的步驟:
?
1)首先:一塊網(wǎng)卡怎么會(huì)知道另一塊網(wǎng)卡的MAC地址?
回答是有一種ARP協(xié)議,可以解決這個(gè)問(wèn)題。這個(gè)留到后面介紹,這里只需要知道,以太網(wǎng)數(shù)據(jù)包必須知道接收方的MAC地址,然后才能發(fā)送。
2)其次:就算有了MAC地址,系統(tǒng)怎樣才能把數(shù)據(jù)包準(zhǔn)確送到接收方?
回答是以太網(wǎng)采用了一種很"原始"的方式,它不是把數(shù)據(jù)包準(zhǔn)確送到接收方,而是向本網(wǎng)絡(luò)內(nèi)所有計(jì)算機(jī)發(fā)送,讓每臺(tái)計(jì)算機(jī)自己判斷,是否為接收方。
上圖中,1號(hào)計(jì)算機(jī)向2號(hào)計(jì)算機(jī)發(fā)送一個(gè)數(shù)據(jù)包,同一個(gè)子網(wǎng)絡(luò)的3號(hào)、4號(hào)、5號(hào)計(jì)算機(jī)都會(huì)收到這個(gè)包。它們讀取這個(gè)包的"標(biāo)頭",找到接收方的MAC地址,然后與自身的MAC地址相比較,如果兩者相同,就接受這個(gè)包,做進(jìn)一步處理,否則就丟棄這個(gè)包。這種發(fā)送方式就叫做"廣播"(broadcasting)。
有了數(shù)據(jù)包的定義、網(wǎng)卡的MAC地址、廣播的發(fā)送方式,"鏈接層"就可以在多臺(tái)計(jì)算機(jī)之間傳送數(shù)據(jù)了。
8、網(wǎng)絡(luò)層
?
8.1網(wǎng)絡(luò)層的由來(lái)
以太網(wǎng)協(xié)議,依靠MAC地址發(fā)送數(shù)據(jù)。理論上,單單依靠MAC地址,上海的網(wǎng)卡就可以找到洛杉磯的網(wǎng)卡了,技術(shù)上是可以實(shí)現(xiàn)的。
但是,這樣做有一個(gè)重大的缺點(diǎn)。以太網(wǎng)采用廣播方式發(fā)送數(shù)據(jù)包,所有成員人手一"包",不僅效率低,而且局限在發(fā)送者所在的子網(wǎng)絡(luò)。也就是說(shuō),如果兩臺(tái)計(jì)算機(jī)不在同一個(gè)子網(wǎng)絡(luò),廣播是傳不過(guò)去的。這種設(shè)計(jì)是合理的,否則互聯(lián)網(wǎng)上每一臺(tái)計(jì)算機(jī)都會(huì)收到所有包,那會(huì)引起災(zāi)難。
互聯(lián)網(wǎng)是無(wú)數(shù)子網(wǎng)絡(luò)共同組成的一個(gè)巨型網(wǎng)絡(luò),很像想象上海和洛杉磯的電腦會(huì)在同一個(gè)子網(wǎng)絡(luò),這幾乎是不可能的。
因此,必須找到一種方法,能夠區(qū)分哪些MAC地址屬于同一個(gè)子網(wǎng)絡(luò),哪些不是。如果是同一個(gè)子網(wǎng)絡(luò),就采用廣播方式發(fā)送,否則就采用"路由"方式發(fā)送。("路由"的意思,就是指如何向不同的子網(wǎng)絡(luò)分發(fā)數(shù)據(jù)包,這是一個(gè)很大的主題,本文不涉及。)遺憾的是,MAC地址本身無(wú)法做到這一點(diǎn)。它只與廠商有關(guān),與所處網(wǎng)絡(luò)無(wú)關(guān)。
這就導(dǎo)致了"網(wǎng)絡(luò)層"的誕生。它的作用是引進(jìn)一套新的地址,使得我們能夠區(qū)分不同的計(jì)算機(jī)是否屬于同一個(gè)子網(wǎng)絡(luò)。這套地址就叫做"網(wǎng)絡(luò)地址",簡(jiǎn)稱"網(wǎng)址"。
于是,"網(wǎng)絡(luò)層"出現(xiàn)以后,每臺(tái)計(jì)算機(jī)有了兩種地址,一種是MAC地址,另一種是網(wǎng)絡(luò)地址。兩種地址之間沒(méi)有任何聯(lián)系,MAC地址是綁定在網(wǎng)卡上的,網(wǎng)絡(luò)地址則是管理員分配的,它們只是隨機(jī)組合在一起。
網(wǎng)絡(luò)地址幫助我們確定計(jì)算機(jī)所在的子網(wǎng)絡(luò),MAC地址則將數(shù)據(jù)包送到該子網(wǎng)絡(luò)中的目標(biāo)網(wǎng)卡。因此,從邏輯上可以推斷,必定是先處理網(wǎng)絡(luò)地址,然后再處理MAC地址。
?
8.2IP協(xié)議
規(guī)定網(wǎng)絡(luò)地址的協(xié)議,叫做IP協(xié)議。它所定義的地址,就被稱為IP地址。目前,廣泛采用的是IP協(xié)議第四版,簡(jiǎn)稱IPv4。
IPv4這個(gè)版本規(guī)定,網(wǎng)絡(luò)地址由32個(gè)二進(jìn)制位組成:
習(xí)慣上,我們用分成四段的十進(jìn)制數(shù)表示IP地址,從0.0.0.0一直到255.255.255.255。
互聯(lián)網(wǎng)上的每一臺(tái)計(jì)算機(jī),都會(huì)分配到一個(gè)IP地址。這個(gè)地址分成兩個(gè)部分,前一部分代表網(wǎng)絡(luò),后一部分代表主機(jī)。比如,IP地址172.16.254.1,這是一個(gè)32位的地址,假定它的網(wǎng)絡(luò)部分是前24位(172.16.254),那么主機(jī)部分就是后8位(最后的那個(gè)1)。處于同一個(gè)子網(wǎng)絡(luò)的電腦,它們IP地址的網(wǎng)絡(luò)部分必定是相同的,也就是說(shuō)172.16.254.2應(yīng)該與172.16.254.1處在同一個(gè)子網(wǎng)絡(luò)。
但是,問(wèn)題在于單單從IP地址,我們無(wú)法判斷網(wǎng)絡(luò)部分。還是以172.16.254.1為例,它的網(wǎng)絡(luò)部分,到底是前24位,還是前16位,甚至前28位,從IP地址上是看不出來(lái)的。
那么,怎樣才能從IP地址,判斷兩臺(tái)計(jì)算機(jī)是否屬于同一個(gè)子網(wǎng)絡(luò)呢?這就要用到另一個(gè)參數(shù)"子網(wǎng)掩碼"(subnet mask)。
所謂"子網(wǎng)掩碼",就是表示子網(wǎng)絡(luò)特征的一個(gè)參數(shù)。它在形式上等同于IP地址,也是一個(gè)32位二進(jìn)制數(shù)字,它的網(wǎng)絡(luò)部分全部為1,主機(jī)部分全部為0。比如,IP地址172.16.254.1,如果已知網(wǎng)絡(luò)部分是前24位,主機(jī)部分是后8位,那么子網(wǎng)絡(luò)掩碼就是11111111.11111111.11111111.00000000,寫(xiě)成十進(jìn)制就是255.255.255.0。
知道"子網(wǎng)掩碼",我們就能判斷,任意兩個(gè)IP地址是否處在同一個(gè)子網(wǎng)絡(luò)。方法是將兩個(gè)IP地址與子網(wǎng)掩碼分別進(jìn)行AND運(yùn)算(兩個(gè)數(shù)位都為1,運(yùn)算結(jié)果為1,否則為0),然后比較結(jié)果是否相同,如果是的話,就表明它們?cè)谕粋€(gè)子網(wǎng)絡(luò)中,否則就不是。
比如,已知IP地址172.16.254.1和172.16.254.233的子網(wǎng)掩碼都是255.255.255.0,請(qǐng)問(wèn)它們是否在同一個(gè)子網(wǎng)絡(luò)?兩者與子網(wǎng)掩碼分別進(jìn)行AND運(yùn)算,結(jié)果都是172.16.254.0,因此它們?cè)谕粋€(gè)子網(wǎng)絡(luò)。
總結(jié)一下,IP協(xié)議的作用主要有兩個(gè),一個(gè)是為每一臺(tái)計(jì)算機(jī)分配IP地址,另一個(gè)是確定哪些地址在同一個(gè)子網(wǎng)絡(luò)。
?
8.3IP數(shù)據(jù)包
根據(jù)IP協(xié)議發(fā)送的數(shù)據(jù),就叫做IP數(shù)據(jù)包。不難想象,其中必定包括IP地址信息。但是前面說(shuō)過(guò),以太網(wǎng)數(shù)據(jù)包只包含MAC地址,并沒(méi)有IP地址的欄位。那么是否需要修改數(shù)據(jù)定義,再添加一個(gè)欄位呢?
回答是不需要,我們可以把IP數(shù)據(jù)包直接放進(jìn)以太網(wǎng)數(shù)據(jù)包的"數(shù)據(jù)"部分,因此完全不用修改以太網(wǎng)的規(guī)格。這就是互聯(lián)網(wǎng)分層結(jié)構(gòu)的好處:上層的變動(dòng)完全不涉及下層的結(jié)構(gòu)。
具體來(lái)說(shuō),IP數(shù)據(jù)包也分為"標(biāo)頭"和"數(shù)據(jù)"兩個(gè)部分:
"標(biāo)頭"部分主要包括版本、長(zhǎng)度、IP地址等信息,"數(shù)據(jù)"部分則是IP數(shù)據(jù)包的具體內(nèi)容。它放進(jìn)以太網(wǎng)數(shù)據(jù)包后,以太網(wǎng)數(shù)據(jù)包就變成了下面這樣:
IP數(shù)據(jù)包的"標(biāo)頭"部分的長(zhǎng)度為20到60字節(jié),整個(gè)數(shù)據(jù)包的總長(zhǎng)度最大為65,535字節(jié)。因此,理論上,一個(gè)IP數(shù)據(jù)包的"數(shù)據(jù)"部分,最長(zhǎng)為65,515字節(jié)。前面說(shuō)過(guò),以太網(wǎng)數(shù)據(jù)包的"數(shù)據(jù)"部分,最長(zhǎng)只有1500字節(jié)。因此,如果IP數(shù)據(jù)包超過(guò)了1500字節(jié),它就需要分割成幾個(gè)以太網(wǎng)數(shù)據(jù)包,分開(kāi)發(fā)送了。
?
8.4ARP協(xié)議
關(guān)于"網(wǎng)絡(luò)層",還有最后一點(diǎn)需要說(shuō)明。因?yàn)镮P數(shù)據(jù)包是放在以太網(wǎng)數(shù)據(jù)包里發(fā)送的,所以我們必須同時(shí)知道兩個(gè)地址,一個(gè)是對(duì)方的MAC地址,另一個(gè)是對(duì)方的IP地址。通常情況下,對(duì)方的IP地址是已知的(后文會(huì)解釋),但是我們不知道它的MAC地址。
所以,我們需要一種機(jī)制,能夠從IP地址得到MAC地址。
這里又可以分成兩種情況:
?
1)第一種情況:如果兩臺(tái)主機(jī)不在同一個(gè)子網(wǎng)絡(luò),那么事實(shí)上沒(méi)有辦法得到對(duì)方的MAC地址,只能把數(shù)據(jù)包傳送到兩個(gè)子網(wǎng)絡(luò)連接處的"網(wǎng)關(guān)"(gateway),讓網(wǎng)關(guān)去處理;
2)第二種情況:如果兩臺(tái)主機(jī)在同一個(gè)子網(wǎng)絡(luò),那么我們可以用ARP協(xié)議,得到對(duì)方的MAC地址。ARP協(xié)議也是發(fā)出一個(gè)數(shù)據(jù)包(包含在以太網(wǎng)數(shù)據(jù)包中),其中包含它所要查詢主機(jī)的IP地址,在對(duì)方的MAC地址這一欄,填的是FF:FF:FF:FF:FF:FF,表示這是一個(gè)"廣播"地址。它所在子網(wǎng)絡(luò)的每一臺(tái)主機(jī),都會(huì)收到這個(gè)數(shù)據(jù)包,從中取出IP地址,與自身的IP地址進(jìn)行比較。如果兩者相同,都做出回復(fù),向?qū)Ψ綀?bào)告自己的MAC地址,否則就丟棄這個(gè)包。
總之,有了ARP協(xié)議之后,我們就可以得到同一個(gè)子網(wǎng)絡(luò)內(nèi)的主機(jī)MAC地址,可以把數(shù)據(jù)包發(fā)送到任意一臺(tái)主機(jī)之上了。
9、傳輸層
?
9.1傳輸層的由來(lái)
有了MAC地址和IP地址,我們已經(jīng)可以在互聯(lián)網(wǎng)上任意兩臺(tái)主機(jī)上建立通信。
接下來(lái)的問(wèn)題是,同一臺(tái)主機(jī)上有許多程序都需要用到網(wǎng)絡(luò),比如,你一邊瀏覽網(wǎng)頁(yè),一邊與朋友在線聊天。當(dāng)一個(gè)數(shù)據(jù)包從互聯(lián)網(wǎng)上發(fā)來(lái)的時(shí)候,你怎么知道,它是表示網(wǎng)頁(yè)的內(nèi)容,還是表示在線聊天的內(nèi)容?
也就是說(shuō),我們還需要一個(gè)參數(shù),表示這個(gè)數(shù)據(jù)包到底供哪個(gè)程序(進(jìn)程)使用。這個(gè)參數(shù)就叫做"端口"(port),它其實(shí)是每一個(gè)使用網(wǎng)卡的程序的編號(hào)。每個(gè)數(shù)據(jù)包都發(fā)到主機(jī)的特定端口,所以不同的程序就能取到自己所需要的數(shù)據(jù)。
"端口"是0到65535之間的一個(gè)整數(shù),正好16個(gè)二進(jìn)制位。0到1023的端口被系統(tǒng)占用,用戶只能選用大于1023的端口。不管是瀏覽網(wǎng)頁(yè)還是在線聊天,應(yīng)用程序會(huì)隨機(jī)選用一個(gè)端口,然后與服務(wù)器的相應(yīng)端口聯(lián)系。
"傳輸層"的功能,就是建立"端口到端口"的通信。相比之下,"網(wǎng)絡(luò)層"的功能是建立"主機(jī)到主機(jī)"的通信。只要確定主機(jī)和端口,我們就能實(shí)現(xiàn)程序之間的交流。因此,Unix系統(tǒng)就把主機(jī)+端口,叫做"套接字"(socket)。有了它,就可以進(jìn)行網(wǎng)絡(luò)應(yīng)用程序開(kāi)發(fā)了。
?
9.2UDP協(xié)議
現(xiàn)在,我們必須在數(shù)據(jù)包中加入端口信息,這就需要新的協(xié)議。最簡(jiǎn)單的實(shí)現(xiàn)叫做UDP協(xié)議,它的格式幾乎就是在數(shù)據(jù)前面,加上端口號(hào)。
UDP數(shù)據(jù)包,也是由"標(biāo)頭"和"數(shù)據(jù)"兩部分組成:
"標(biāo)頭"部分主要定義了發(fā)出端口和接收端口,"數(shù)據(jù)"部分就是具體的內(nèi)容。然后,把整個(gè)UDP數(shù)據(jù)包放入IP數(shù)據(jù)包的"數(shù)據(jù)"部分,而前面說(shuō)過(guò),IP數(shù)據(jù)包又是放在以太網(wǎng)數(shù)據(jù)包之中的,所以整個(gè)以太網(wǎng)數(shù)據(jù)包現(xiàn)在變成了下面這樣:
UDP數(shù)據(jù)包非常簡(jiǎn)單,"標(biāo)頭"部分一共只有8個(gè)字節(jié),總長(zhǎng)度不超過(guò)65,535字節(jié),正好放進(jìn)一個(gè)IP數(shù)據(jù)包。
?
9.3TCP協(xié)議
UDP協(xié)議的優(yōu)點(diǎn)是比較簡(jiǎn)單,容易實(shí)現(xiàn),但是缺點(diǎn)是可靠性較差,一旦數(shù)據(jù)包發(fā)出,無(wú)法知道對(duì)方是否收到。為了解決這個(gè)問(wèn)題,提高網(wǎng)絡(luò)可靠性,TCP協(xié)議就誕生了。這個(gè)協(xié)議非常復(fù)雜,但可以近似認(rèn)為,它就是有確認(rèn)機(jī)制的UDP協(xié)議,每發(fā)出一個(gè)數(shù)據(jù)包都要求確認(rèn)。如果有一個(gè)數(shù)據(jù)包遺失,就收不到確認(rèn),發(fā)出方就知道有必要重發(fā)這個(gè)數(shù)據(jù)包了。
因此,TCP協(xié)議能夠確保數(shù)據(jù)不會(huì)遺失。它的缺點(diǎn)是過(guò)程復(fù)雜、實(shí)現(xiàn)困難、消耗較多的資源。
TCP數(shù)據(jù)包和UDP數(shù)據(jù)包一樣,都是內(nèi)嵌在IP數(shù)據(jù)包的"數(shù)據(jù)"部分。TCP數(shù)據(jù)包沒(méi)有長(zhǎng)度限制,理論上可以無(wú)限長(zhǎng),但是為了保證網(wǎng)絡(luò)的效率,通常TCP數(shù)據(jù)包的長(zhǎng)度不會(huì)超過(guò)IP數(shù)據(jù)包的長(zhǎng)度,以確保單個(gè)TCP數(shù)據(jù)包不必再分割。
10、應(yīng)用層
應(yīng)用程序收到"傳輸層"的數(shù)據(jù),接下來(lái)就要進(jìn)行解讀。由于互聯(lián)網(wǎng)是開(kāi)放架構(gòu),數(shù)據(jù)來(lái)源五花八門(mén),必須事先規(guī)定好格式,否則根本無(wú)法解讀。"應(yīng)用層"的作用,就是規(guī)定應(yīng)用程序的數(shù)據(jù)格式。
舉例來(lái)說(shuō),TCP協(xié)議可以為各種各樣的程序傳遞數(shù)據(jù),比如Email、WWW、FTP等等。那么,必須有不同協(xié)議規(guī)定電子郵件、網(wǎng)頁(yè)、FTP數(shù)據(jù)的格式,這些應(yīng)用程序協(xié)議就構(gòu)成了"應(yīng)用層"。這是最高的一層,直接面對(duì)用戶。它的數(shù)據(jù)就放在TCP數(shù)據(jù)包的"數(shù)據(jù)"部分。
因此,現(xiàn)在的以太網(wǎng)的數(shù)據(jù)包就變成下面這樣:
?
11、本文小結(jié)
至此,整個(gè)互聯(lián)網(wǎng)的五層結(jié)構(gòu),自下而上全部講完了。這是從系統(tǒng)的角度,解釋互聯(lián)網(wǎng)是如何構(gòu)成的。下一篇《網(wǎng)絡(luò)編程懶人入門(mén)(二):快速理解網(wǎng)絡(luò)通信協(xié)議(下篇)》,我反過(guò)來(lái),從用戶的角度,自上而下看看這個(gè)結(jié)構(gòu)是如何發(fā)揮作用,完成一次網(wǎng)絡(luò)數(shù)據(jù)交換的。敬請(qǐng)期待!
網(wǎng)易云信,你身邊的即時(shí)通訊和音視頻技術(shù)專家,了解我們,請(qǐng)戳網(wǎng)易云信官網(wǎng)
想要行業(yè)洞察和技術(shù)干貨,請(qǐng)關(guān)注網(wǎng)易云信博客
本文轉(zhuǎn)載自52im,作者:JackJiang
總結(jié)
以上是生活随笔為你收集整理的网络编程懒人入门(一):快速理解网络通信协议(上篇)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 移动端IM开发者必读(一):通俗易懂,理
- 下一篇: 网络编程懒人入门(二):快速理解网络通信