架构之美–开放环境下的网络架构
騰訊開放平臺承載著廣泛開發者的夢想,騰訊的網絡平臺正為其保駕護航。如何保障用戶對業務的訪問體驗、如何構建穩定可靠的數據中心及廣域網絡、如何適應云計算的多樣性需求打造云網絡? 騰訊網絡架構經過萌發期到海量的蛻變,其間發生了怎樣的變化?積累了哪些可供業界分享的經驗?
5月16日晚,騰訊大講堂·深圳站《架構之美——開放環境下的網絡架構》活動在騰訊總部騰訊大廈多功能廳舉辦,騰訊網絡架構中心總監馬志強在兩小時的演講中揭開了騰訊網絡架構背后的秘密。
騰訊業務的飛速發展,對網絡等基礎設施提出了海量運營的要求。同時,數量眾多、且型態各異的業務,所要求的網絡服務也各不相同。這些都是對網絡架構提出的巨大挑戰(圖1——網絡架構面對的挑戰)。
圖1——網絡架構面對的挑戰
2010年,騰訊推出了開放平臺,所有平臺開發者及合作伙伴的應用都可以在此平臺上成長和發展,與此同時,這對計算資源及網絡資源提出了更高的要求。經過不斷的探索與總結,最終得出:支撐騰訊開放云平臺的網絡架構,必須要做到以下三點:
在深入探尋如何實現以上三點前,需要先基本了解騰訊網絡架構。
騰訊的網絡架構不是一天構造而成、并具備支撐海量業務能力的,而是隨著業務的成長逐步發展起來的。在不斷發展的十多年期間,隨著業務在種類和容量上爆發式的增長,基礎網絡在技術、容量和架構上也在不斷提升,其提升的步伐甚至大于業務需求的步伐。因為只有這樣,才能打造一個穩健可靠的、服務于公司各項業務的網絡架構平臺。
發展至今,我們已有數十人的運營支撐團隊、數十人的專業設計構架團隊,共支撐超過20萬臺服務器。網絡設備達上萬臺,具備業界領先的5000臺規模計算集群數據中心網絡v3.5,搭建百G總容量的廣域網絡,支撐全國和海外數十個大中型IDC(圖2——網絡平臺構建,與業務共成長)。
圖2——網絡平臺構建,與業務共成長
此網絡架構示意圖(圖3——網絡架構示意圖)中整體展示了我們的網絡架構:從數據中心內部的網絡到用于IDC互聯的城域網絡及廣域網絡,以及與運營商互聯的出口等。
圖3——網絡架構示意圖
盡管現在的網絡架構平臺有了很大的改進和提升,但團隊的努力沒有停留于此。我們繼續在架構和運營上不斷優化提升,從“作坊式定制化的企業型網絡”向“海量計算集群網絡及智能自定義網絡”努力!從“純手工式故障發現排除”向“全面監控智能化網絡”及“運營商級穩定網絡”努力!
網絡基礎設施要健壯強勁
解決早期IDC網絡架構老大難題
早期的IDC網絡架構主要存在四大問題:
面對這四大問題,騰訊團隊重新思考了老版本架構面臨新時代挑戰所存在的弊端、并對下一代網絡產品引入的可行性做了評估之后,參考Google等大牛級架構設計、結合自身產品和企業特點,逐步構建成了具有歷史意義的v3.5 IDC網絡架構版本(圖4——騰訊V3.5數據中心網絡)。同時,CLOS架構理念的引入,讓未來在此版本上持續的scale out也找到了數模依據。
圖4——騰訊V3.5數據中心網絡
網絡,穩定壓倒一切!
如果幾萬臺服務器分布在一個城市的幾十個IDC,上千種業務在約100條萬兆互聯鏈路上產生約700G的跨IDC洪流,每一次故障都會直接影響到用戶,這種后果是非常嚴重的。為保障服務長期穩健運行,騰訊構建了運營商級別的城域和廣域網絡(圖5——運營商級別的城域和廣域網絡)。
圖5——運營商級別的城域和廣域網絡
城域網采用標準化結構,構建承載力強、冗余性高的健壯城域網絡。構建成上T級匯聚能力、百G級站點交互能力,自建大容量、高可靠傳輸系統的城域網。
廣域網主要從架構規整化及能力上大幅提升,就像建造能連接全國范圍IDC的高速鐵路和高速公路一樣,為業務全國分布做好準備。同時,將廣域網監控精細化,使業務看得見、有意識、重協作,同時要想高鐵VIP一等座和普通座的劃分一樣對重點業務流量能夠予以保障,提供差異化服務且使得資源效率高。
讓網絡看得見摸得著
為了保障網絡的穩定可靠,真正實現能夠看得見、管得住、用得好,團隊自主研發了TMP系統(圖6——騰訊自主研發TMP系統),實現了基礎架構海量節點實時監控支持。TMP系統覆蓋騰訊全量基礎設施,如20W+服務器、2W+網絡設備狀態、性能、容量的實時采集與智能分析、1分鐘存活狀態監控、5分鐘性能、容量監控,以及100+IDC、200+外網出口、500+內網專線,從IDC內部服務器到出口、專線FullMesh的5分鐘粒度的全方位網絡質量監控與度量體系。
同時,還具備騰訊基礎設施7*24的運營入口-NOC,每天400w條的海量信息處理和+80%故障處理解決率,覆蓋公司全業務的基礎架構日常運營工作:業務安全防控、流量全局調度、業務質量檢測及演戲預案等系列前瞻性運營工作,為海量業務提供高質量、全緯度的運營服務。
圖6——騰訊自主研發TMP系統
新形態:多租戶接入需求
開放平臺的推出對全套的網絡架構提出了更高的要求,IDC網絡架構必須支持開發者、合作伙伴、自營業務等多種多樣業務的需求。
目前, IDC網絡架構v3.5可提供(圖7——網絡架構V3.5可提供服務):
圖7——網絡架構V3.5可提供服務
與此同時,我們與業界一同進行前沿性研究-SDN/自定義網絡(圖8——騰訊與業界的前沿性研究—SDN),以滿足我們的IDC網絡能夠更加快速地實現業務所需的特性,更加靈活地平滑擴展。
圖8——騰訊與業界的前沿性研究—SDN
用戶網絡覆蓋質量要好
作為業務側,對用戶體驗非常關心,也是網絡架構最關注重點優化的一個方面。
由于業務“內容”在這里,而用戶“眼球”在運營商側,最終用戶的訪問體驗受到很多我們無法掌控的因素所影響。據統計,運營商網絡故障對騰訊的影響占比連年超過70%。
舉個典型的例子,河南境內某處光纜中斷,對我方西安某運營商出口造成中斷,流量丟失40G左右。
所以要改善用戶體驗,為業務提供良好的網絡覆蓋質量,我們在三個方面進行努力:看清、對齊、布局。
看清 – 點、線、面的網絡質量監控
用戶訪問體驗關系到諸多方面,用戶->IDC外網質量,IDC內部網絡質量,IDC間網絡質量,我們在TMP系統中實現全方位立體化的網絡質量監控。
對齊 – 提前與運營商接口規劃信息
運營商省網/城域網、骨干網等都是用戶體驗的關鍵環節,我們必須與運營商省/城公司、集團骨干公司提前對齊規劃信息,確保各個環節都能夠滿足我們的容量和質量要求,其中包括運營商骨干網網絡容量和質量、省網/城域網上聯骨干網帶寬容量和質量、省網/城域網網絡容量和質量等。
布局 – 網絡
在中國的運營商環境中,主力運營商間的互聯互通及長期保持質量都較差,除內容至少復制兩份之外,還有大批用戶在其他運營商網內,在移動互聯網大發展的時候,移動網內的用戶體驗非常關鍵。
所以在網絡布局上,IDC和網絡資源上盡可能多提供多運營商接入環境。采用諸多關鍵技術方案,為業務提供更多的運營商網絡接入環境,并保障安全,例如:
布局 – IDC資源
轉變 “被動接受”的IDC資源布局模式。由于業界的IDC供給速度不足,在業務布局前需考慮是哪里有IDC,這樣會導致業務部署碎片多、交互效率低、對用戶覆蓋質量達不到、需事后推動改善等問題。
要向“用戶體驗為首位”的資源布局思路轉換,為業務提供質量覆蓋良好且穩定的網絡訪問。
要建立好這個模型,我們必須深入了解并長期把脈中國的運營商網絡環境,且深入了解我們的業務需求,而非眉毛胡子一把抓。針對這種情況,我們首先對業務進行了深入研究,將業務對用戶訪問體驗進行分級,如下示例:
另外,對IDC全國用戶的覆蓋質量進行長期追蹤、建立基線,以確保網絡質量保持恒定,而且我們還要有能力推動運營商或自行解決不符合要求的網絡覆蓋質量。
針對這種情況,我們推出類似這樣的模型,使得業務布局最精簡,而且是對用戶覆蓋質量最好的。
通過“看清、對齊、布局”三個方面的改善,我們通過全方位立體的網絡監控體系實時了解用戶的最終體驗情況,與運營商提前主動對齊規劃、主動推動改善優化,并通過IDC和網絡的布局,最終實現用戶訪問質量的長期良好狀態。
總結
關于開放平臺網絡架構
騰訊網絡架構提供高效穩定、安全可靠的通信。IDC網絡架構、城域及廣域網絡、出口網絡、對外互聯網絡等采用運營商級別的設備和技術;網絡架構為開放云平臺提供虛擬化支持、合作伙伴安全隔離等定制化特性,在與業界共同探討更加前言的解決方案,如SDN等;
騰訊網絡和基礎設施具備海量運營的思路和能力。快速的IDC和網絡資源建設供給能力支撐海量運營的監控系統及NOC窗口;
騰訊網絡架構作為基礎設施整體解決方案的一部分將更加給力。深入理解業務需求,結合網絡、平臺系統提供綜合整體解決方案;騰訊網絡架構的優化,獲公司級[2011年重大技術突破獎];
我們在與業界共同努力,積極探索適應互聯網行業新的解決方案。
關于網絡架構發展的一些簡單經驗
業務布局與網絡架構要溝通配合。業務的部署要考慮網絡特點,否則需要練就乾坤大挪移。互聯網業務的特點顯著,需要網絡特別關注,例如map/reduce;
網絡架構的步伐和規劃要適當大于業務短期需求。因為網絡本身龐大而包袱重,要為可能的海量爆發提前做好準備;
網絡要簡單而優雅,掌握“架構之美”的度。不要追求技術極致,要考慮運維能力。
關于業務對騰訊開放平臺網絡的知曉
5月16日21:00,兩個小時的騰訊網絡架構分享圓滿結束!
總結
以上是生活随笔為你收集整理的架构之美–开放环境下的网络架构的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: php获取prepay_id时报错,微信
- 下一篇: 002_2 gtsam/unstable