服务器双网卡冗余备份技术的实现
? ? 服務器作為企業信息平臺的核心,其穩定性和安全性至關重要,連接服務器的網絡鏈路是尤為重要的一環。增加熱備份冗余鏈路成為保障服務器鏈路通暢常用的方法之一,此方式可以強化系統網絡鏈路,減少故障率。
本文將以單機和集群兩種環境來解說相關冗余備份的實現原理與過程。
單機環境
下圖為服務器雙網卡接入的基本拓撲圖,為保證網絡設備熱備份,核心設備、服務器接入設備都使用了雙機,配置802.1q Trunk模式互聯,屬同一VTP Domain,并都啟用了STP(Spanning Tree Protocol,生成樹協議),利用STP實現網絡設備、網絡鏈路的切換,將一臺Cisco3550設置為STP根(root)交換機。圖1中標block的端口即STP協商后屏蔽的端口,以避免環路,無數據流量可視為中斷。另外將Cisco2950交換機的終端接入端口設置為PortFast,以加快交換機端口啟用時間。
單機環境下的網絡拓撲
1. 軟件使用原則
服務器接入可以通過使用網卡捆綁軟件實現熱備冗余,對于服務器雙網卡捆綁軟件的選擇可遵循以下幾點原則: 兼容性好,能在不同品牌網卡上使用; 中斷恢復快; 能檢測深層中斷,即能檢測到非直連設備的中斷。
2. 推薦軟件
NIC Express 4.0是一款兼容性較好的捆綁軟件,它能兼容Broadcom、D-Link等常見網卡,但在Intel網卡上安裝會造成大量丟包。
Inter Proset是針對Intel網卡的專用網卡捆綁軟件,但Inter Proset只能在Intel網卡上使用,且不支持深層中斷的檢測。
3. 軟件設置
NIC Express 4.0
使用NIC Express的ELB模式,將網絡檢測這一關鍵參數設置為Status Packet,而不能使用Auto,因為設置為Auto只能檢測到直連部分的中斷情況,而設置為Status Packet可以通過發狀態包,檢測到網絡中的非直連部分的中斷,響應時間更快。其余可使用默認設置。
Inter Proset
使用默認設置即可,另外需要注意: 使用Inter Proset的網卡有隱含的主備關系,即只有主用工作,主用網卡中斷后隱含的主備關系交換,再接回后主備關系不變化。本文所有測試時,都使用2號網卡為主用的情況。
4. 三種測試方式
中斷服務器網線測試
測試方式: 中斷服務器所連網線,再接回,看有無中斷。
測試結論: 使用網卡捆綁軟件后,中斷任意一條網線或接回均不會造成數據傳輸中斷。
中斷交換機間網線測試
測試方式: 采用單一中斷和組合中斷方式測試。
測試結論: 單一或組合中斷②號網線,由于交換機重新協商STP,會中斷50秒左右。
單一或組合中斷⑦號網線,NIC Express 4.0由于可檢測深層中斷,所以不會造成中斷; 而Inter Proset無法檢測到下一級網絡中斷,中斷或接回⑦號網線,都會中斷45秒左右。
交換機斷電測試
測試方式:分別關閉兩臺核心Cisco3550、兩臺服務器接入Cisco2950,再開機,測試中斷情況。
測試結論: 關閉或打開根交換機(核心主用Cisco3550)電源,由于根漂移,STP重新協商,需中斷45秒左右。另外3臺交換機關開機均不會造成數據傳輸中斷。
集群環境
各交換機間的連接同前,服務器則使用兩臺雙網卡服務器和一臺EMC磁盤陣列建立集群。比較之前的連接情況,這種設置集合了STP網絡、雙網卡捆綁、集群這三種冗余措施,給服務器帶來最強有力的不中斷保障。
由于中斷交換機間網線和交換機掉電結果同前,故在此不再贅述。只測試中斷服務器連接的網線測試。
分別中斷群集主備機所連交換機的網線,再接回,測試業務中斷情況。結果是不會造成數據傳輸中斷,對業務無任何影響。
集群環境下需要特別注意的是:
當集群主機兩條線路同時中斷時,將發生集群主備機切換。
較多的集群組會導致群集主備切換時間的增加。集群故障檢測的時間與虛擬服務器的數量成正比,斷定一個虛擬服務器故障需時約30秒,并且這個過程是串行而非并行的。
集群的應用與網卡設置無關,集群主備機使用單塊物理網卡和使用雙物理網卡捆綁出虛擬網卡所得出的結論相同,無論單雙網卡均可實現服務器群集功能。
對服務器雙網卡捆綁出的虛擬網卡進行調整前應該先退出集群(停止節點集群服務→退出節點)。
由于多重冗余多重保護,并非所有故障都會導致業務中斷,系統能正常運行并不代表系統中沒有故障,需要加強檢查監控予以防范。
from:http://blog.sina.com.cn/s/blog_9b7cb5af0102vtnr.html
轉載于:https://blog.51cto.com/xueyue8/1918852
《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀總結
以上是生活随笔為你收集整理的服务器双网卡冗余备份技术的实现的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: RMAN异机恢复步骤及故障处理
- 下一篇: 【Spring】12、Spring Se