网络数据的大小端问题
不同 CPU 中,4 字節整數 1 在內存空間的存儲方式是不同的。4 字節整數 1 可用 2 進制表示如下:
00000000 00000000 00000000 00000001
有些 CPU 以上面的順序存儲到內存,另外一些 CPU 則以倒序存儲,如下所示:
00000001 00000000 00000000 00000000
若不考慮這些就收發數據會發生問題,因為保存順序的不同意味著對接收數據的解析順序也不同。
大端序和小端序
CPU 向內存保存數據的方式有兩種:
- 大端序(Big Endian):高位字節存放到低位地址(高位字節在前)。
- 小端序(Little Endian):高位字節存放到高位地址(低位字節在前)。
僅憑描述很難解釋清楚,不妨來看一個實例。假設在 0x20 號開始的地址中保存 4 字節 int 型數據 0x12345678,大端序 CPU 保存方式如下圖所示:
圖1:整數 0x12345678 的大端序字節表示
對于大端序,最高位字節 0x12 存放到低位地址,最低位字節 0x78 存放到高位地址。小端序的保存方式如下圖所示:
圖2:整數 0x12345678 的小端序字節表示
不同 CPU 保存和解析數據的方式不同(主流的 Intel 系列 CPU 為小端序),小端序系統和大端序系統通信時會發生數據解析錯誤。因此在發送數據前,要將數據轉換為統一的格式——網絡字節序(Network Byte Order)。網絡字節序統一為大端序。
主機 A 先把數據轉換成大端序再進行網絡傳輸,主機 B 收到數據后先轉換為自己的格式再解析。
網絡字節序轉換函數
在《bind()和connect()函數:綁定套接字并建立連接》一節中講解了 sockaddr_in 結構體,其中就用到了網絡字節序轉換函數,如下所示:
htons() 用來將當前主機字節序轉換為網絡字節序,其中h代表主機(host)字節序,n代表網絡(network)字節序,s代表short,htons 是 h、to、n、s 的組合,可以理解為”將 short 型數據從當前主機字節序轉換為網絡字節序“。
常見的網絡字節轉換函數有:
- htons():host to network short,將 short 類型數據從主機字節序轉換為網絡字節序。
- ntohs():network to host short,將 short 類型數據從網絡字節序轉換為主機字節序。
- htonl():host to network long,將 long 類型數據從主機字節序轉換為網絡字節序。
- ntohl():network to host long,將 long 類型數據從網絡字節序轉換為主機字節序。
通常,以s為后綴的函數中,s代表 2 個字節 short,因此用于端口號轉換;以l為后綴的函數中,l代表 4 個字節的 long,因此用于 IP 地址轉換。
舉例說明上述函數的調用過程:
運行結果:
Host ordered port: 0x1234
Network ordered port: 0x3412
Host ordered address: 0x12345678
Network ordered address: 0x78563412
另外需要說明的是,sockaddr_in 中保存 IP 地址的成員為 32 位整數,而我們熟悉的是點分十進制表示法,例如 127.0.0.1,它是一個字符串,因此為了分配 IP 地址,需要將字符串轉換為 4 字節整數。
inet_addr() 函數可以完成這種轉換。inet_addr() 除了將字符串轉換為 32 位整數,同時還進行網絡字節序轉換。請看下面的代碼:
運行結果:
Network ordered integer addr: 0x4030201
Error occured!
從運行結果可以看出,inet_addr() 不僅可以把 IP 地址轉換為 32 位整數,還可以檢測無效 IP 地址。
注意:為 sockaddr_in 成員賦值時需要顯式地將主機字節序轉換為網絡字節序,而通過 write()/send() 發送數據時 TCP 協議會自動轉換為網絡字節序,不需要再調用相應的函數。
總結
以上是生活随笔為你收集整理的网络数据的大小端问题的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mpi由于目标计算机积极拒绝,windo
- 下一篇: css 不规则边角_如何实现带有边角的C