云网管—云上构建网络自动化体系
簡介:?云網管是基于阿里云網絡多年技術和經驗沉淀打造的云上智能網絡管理運維平臺,提供企業網絡全生命周期管理運維的能力,讓部署更快捷、運維更高效、網絡更透明。
1.背景
云網管是基于阿里云網絡多年技術和經驗沉淀打造的云上智能網絡管理運維平臺,提供企業網絡全生命周期管理運維的能力,讓部署更快捷、運維更高效、網絡更透明。
1.1用戶痛點
?安裝部署難
傳統網管大多都是本地部署,用戶需要負責物理資源規劃、中間件安裝、安裝包部署等等工作,通常需要專業的網絡和IT維護人員數天甚至數周才能部署上線。
集中管理難
網絡設備自有的廠商網管,一般只能提供本地web訪問方式,不能集中管理,更做不到跨廠商管理,無法給用戶提供統一的管理視角,需要多套網管系統之間切換使用。
?網絡擴展難
辦公、零售場所隨著業務的擴展,經常需要全國各地快速開店,目前網絡的交付都是網絡工程師通過console口登錄一臺臺配置下發,效率低下且容易出錯。
2.產品介紹
2.1 網絡管理范圍
如下圖定義網絡管理的全生命周期,傳統的網管系統,對網絡的管理主要針對網絡服役階段,面向的是已上線網元的資源管理和運維監控等,無法做到網絡設備的全生命周期管理。
圖1 網絡管理全生命周期
云網管對網絡的管理是貫穿整個生命周期的,在網絡未上線的時候,可以離線規劃設計,定義網絡架構;在建設交付的時候,將定義好的網絡架構以項目的方式進行實施,整個交付過程流程可控,質量可管;驗收通過后,網絡正式進入服役階段,在該階段網絡的核心訴求是穩定運行、少出故障以及故障發生后的快速定位和故障恢復,云網管的監控、變更、巡檢等模塊確保網絡服役階段的穩定運行直到網絡下線。在整個網絡生命周期中,資源管理確保網絡資源與真實網絡的一致性。
2.2 產品功能介紹
2.2.1 建設交付
- 架構設計
在網絡尚未上線時可以預先進行網絡規劃,網絡架構用于定義網絡組網的互聯規范和技術規格,提供圖形化的架構設計和管理功能,通過圖形化的方式進行組網拓撲的靈活編排,并對各個網絡組件的具體規格進行配置。
如圖通過可視化的方式進行網絡架構設計,定義網絡模塊的數量和連接關系。
圖2 網絡架構設計
結合設計好的網絡規劃和配置規范,自動生成可一鍵導入的標準配置文件。
圖3 配置文件生成
- 建設交付
建設交付是將網絡方案以項目的形式進行設備下發,在每個項目中以工單的形式控制交付過程和保障質量。
圖4 建設交付項目實施
2.2.2 智能運維
- 態勢感知
通過全局視角和分支視角對網絡整體狀態進行實時感知。
健康度: 結合設備告警情況、網絡巡檢狀況、監控覆蓋程度等多維度對網絡狀況進行評分。
動態拓撲: 通過LLDP和MAC掃描技術準實時拓撲更新,設備連接關系、端口信息等實時呈現。
- 一體化監控
一個辦公分支或者門店的網絡,一般是涵蓋了多個層次的網絡,包含多種網絡形態的設備。通常包括接入運營商的網關設備,進行數據轉發的網絡設備(路由器或交換機),提供WLAN的無線設備以及五花八門的終端應用。一套從網到端全鏈路覆蓋的監控方案是必要的,因為往往端側的異常,可能是有線網絡的問題,有線側的故障,會影響下游端側多個終端或應用的使用。
云網管針對有線網絡、無線網絡、終端應用等不同網絡層次的設備,通過主動采集、事件接收、插件部署、主動撥測等多種監控技術,從網關到終端全鏈路監控網絡運行情況。在如下的監控視圖里將交換機上聯口流量、到運營商的出口流量、AP的終端連接數以及終端的監控信息等有線和無線的指標在一個視圖里完成監控。
- 網絡編排
云網管提供可視化的流程編排引擎,用戶通過拖拽的方式將網絡操作的原子能力串聯起來,保障業務下發時的事務完整和安全。
? ?2.單步配置流程可視化下發
- 故障自愈
日常高頻的故障場景,基于云網管的網絡編排能力,可以將告警聯動處理方案,快速實現故障止血和業務恢復。
3.架構介紹
3.1 技術架構
- 協議插件
云網管的協議插件集成了管理網絡所需要的ssh、telnet、netconf、snmp、grpc等協議,支持管理市面常見的商用網絡設備。
協議插件通過加密的安全通道與云端的采集控制實例進行通信,高效執行云端下發的設備操作指令和采集任務,并將數據壓縮后實時反饋給云端進行分析和展示。
協議插件的Agent支持以云網管自有硬件、軟件安裝包、集成SDWAN網關等多種方式輸出。
- 采集控制
采集控制實例在云端部署,在云網管的整體架構中起承上啟下的作用。
調度引擎的工作流程: 1. 接收網絡編排下發的任務,按任務優先級、調度計劃等策略,將任務進行合理拆解和調度。2. 根據設備廠家型號等維度將指令通過模板翻譯映射為操作設備的具體指令。3. 將指令下發到Agent執行,等待接收執行結果 4. 任務執行結果分析和拼裝。
模板管理: 模板分為“用戶模板”和“設備模板”兩類,“用戶模板”只具有業務含義,屏蔽了廠家差異,在網絡編排中直接引用,“設備模板”是細化到廠商、型號粒度,不同的廠商之間都有明顯差異。例如:“ACL策略”的設備模板,思科和華為是不同的指令。
- 網絡編排
網絡編排負責業務模型的統一抽象和定義,網絡編排將原子能力按業務流程進行串連,形成具體的網絡方案。網絡方案通過流程引擎驅動采集控制實例執行每一步的原子操作,以工單的方式控制事務完整和鏈路追蹤。
- 應用
網絡編排以API的形式對應用提供能力和數據接口,應用層實現具體的“資源管理”、“網絡巡檢”、“網絡變更”、“故障恢復”等能力,支持運維人員進行日常的網絡運維、業務配置等工作。
3.2部署架構
云網管SaaS化部署,分鐘級開通云上網管實例,用戶側只用部署探針(硬件版只需要上電和網絡可達)即可。
云網管的計算和存儲資源都是使用的阿里云資源,可以根據規格隨時擴容,基于阿里云ASK集群實現的CI/CD功能,可以隨時迭代上線新功能。
4.總結
云網管致力于為復雜、異構、分支眾多的線下網絡打造一款免部署、易上手、集中管理的SaaS化網絡運維管理平臺。
原文鏈接
本文為阿里云原創內容,未經允許不得轉載。
總結
以上是生活随笔為你收集整理的云网管—云上构建网络自动化体系的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数字营销行业大数据平台云原生升级实战
- 下一篇: 解密万亿参数M6模型预训练背后的分布式框