PMS业务、特性和系统架构
我完成的工作概要
背景:以前PMS只管理接入和核心網的性能采集,U2000網管要求有統一的跨域性能管理系統,因此進行重構和融合。同時,管理容量的提升和競爭分析也要求有更大的管理容量。
任務:
1、對原有的PMS系統進行重構;
2、繼承數通和傳送原有的所有需求,新增支持PTN和VRP 8設備;
3、梳理原來比較混亂的接口,設計統一接口;
4、提出了只報告警、不存數據的TCA任務模式,適應大規模數據采集;
5、遷移到Linux + Oracle架構;
6、針對北向場景,設計了非數據庫運行模式;
7、針對市場需求,進行管理容量提升的專項研究
?
PMS主要特性
1、數十種設備類型的性能采集
2、多種性能數據瀏覽方式:表格、折線圖、柱狀圖
3、提供多種形式的北向接口
4、提供性能數據對比顯示功能
5、提供性能門限告警及瀏覽功能
6、數據轉儲(按時間、按空間)
7、報表功能
8、數據聚合功能
9、雙門限告警,告警抑制
PMS管理容量
獨立網管+數據庫模式:最大的50萬/15分鐘(1GB/天,保存30天)
北向接口+文本模式:最大500萬/15分鐘(10GB/天)
?
PMS系統架構
?
?
?
?
PMS EXE和采集器之間的架構說明
?
支持分布式采集
?
支持數據庫和文本兩種存儲方式
?
多進程架構,不同的設備接口類型通過獨立的采集器完成采集:SNMP采集器、FTP采集器、傳輸設備性能采集器。通過中心的性能管理進程進行集中存儲。由于設備子類型繁多,每個采集器都需要進行復雜的適配。
平臺+插件式的架構模式:平臺部門開發平臺和采集器,下游產品開發數據庫腳本。
SNMP和FTP采集器采用DLL實現。由于PTN和傳送設備的管理接口是私有的,因此由網元管理器自己實現采集。PMS和網元管理器之間采用消息結構進行進程間通訊。
EXE和DLL之間的接口主要包括:
1、運行時接口:同步采集對象元數據;
2、運行時接口:設置采集周期,起始、結束時間,Schedule;
3、靜態編譯接口:數據入庫、寫文件的函數接口;
4、靜態編譯接口:獲取性能指標元數據;
?
PMS EXE和其他子系統之間的架構說明
?
PMS在TOPO注冊消息,從TOPO子系統獲取實體信息。實體信息發生變化時,通知PMS。另外,PMS也會和TOPO定期校驗數據一致性并進行同步。
PMS模擬產生或收集的TCA告警通過消息接口上報給IMAP故障進程。
PMS接收來自北向子系統的性能數據上報請求,并通過XML/CORBA/TXT/TL1方式上報給OSS。
?
和設備的接口
路由器:SNMP/FTP/SFTP
接入設備:SNMP/FTP/SFTP
傳送/城域以太:二進制私有協議/TL1
?
性能閾值告警的概念
接入、數通設備的性能閾值告警由網管計算后模擬產生,支持雙門限。VRP8和PTN設備的性能閾值告警由設備自己產生。
?
PMS的概念模型
實體
指標
閾值(觸發上下限、消除上下限)
指標組
性能采集任務(只產生閾值告警的任務、只儲存數據的任務,或二者兼而有之)
設備側組網拓撲
傳送/PTN:網關網元+非網關網元,IP組網、ECC組網,鏈式組網。
接入:OLT + ONU組網,大量的小設備/單板
路由器:多種組網方式
?
PMS團隊開發模式
對于接入和數通、VRP 8,由CMF完成采集模塊的開發,由各TDT完成數據庫腳本的注冊。由于PTN和傳送設備的設備管理接口是私有二進制的,且網管只能同時和網元建立一個連接,因此由網元管理器完成采集。
DataAdmin是一個獨立的進程,用以管理數據庫模式下的數據生命周期。相關策略有:按剩余空間刪除;按指標組刪除過期數據;數據轉儲。按時間刪除數據的思路是"每天刪除7天前的過期數據"
PMS系統共設計的復雜性
大數據容量
設備類型繁多、接口差異大,3大產品系列分屬3個獨立的產品線開發,實現千差萬別,協調工作量大。
由于設備業務特性差異大,而且原來都已經有性能管理系統,融合難度大,需要仔細權衡、設計技術方案。
溝通的成本高,需要和很多個部門協調,實現一個技術方案的溝通工作量大。
?
PMS管理容量提升方案
針對不同的組網模式、網管硬件配置,有不同的優化方案:
?
1、普通場景:數據庫優化
批量插入、忽略重復數據
字段優化:縮短字段、裁剪無用字段
分區表、分表
分散日志文件和數據文件的物理存儲
優化數據庫表參數(PCTUSED/PCTFREE)
另外,也受益于Oracle的效率
?
2、北向場景:文本存儲
采用非數據庫模式滿足容量需求
統一北向文件格式和設備文件格式差異
?
3、所有場景:通過FTP采集提升性能
單設備批量上傳多周期數據
一個設備設置了相同采集周期的所有實體通過一個文件上報
內存FTP
將計算、告警觸發比較下移到設備實現,由設備主動上報
?
5、特定場景的優化方案
對于PTN、路由器等拓撲形態復雜的場景,采用上層設備代理采集的方案
PMS管理的業務領域和設備類型
傳送:OptiX OSN1500、OSN2500、OSN3500、OSN7500
城域以太交換機:S2300/S3300/S5300
接入:UA5000/MA5600(T)/MA5200(G)/MA5300/MD5500
路由器:NE20/NE40(E)/NE80E/NE5000
PMS采集的主要性能指標
傳送設備:
誤碼率、誤碼秒、抖動、漂移、不可用秒
15分鐘性能、24小時性能,當前性能,歷史性能
不可用時間(UAT)
城域以太交換機/路由器:
基于報文:上行速率、下行速率(基于不同實體:端口、單板、設備、VPN,基于協議:TCP/UDP/ICMP/ARP/單播/廣播/組播),基于不同單位:速率、包數、字節數。非法報文、丟棄報文、轉發報文。
基于設備:網絡設備在線可用性,CPU平均利用率,內存利用率,網絡設備內存池占用容量,網絡設備內存池可用容量,
IGMP, QOS隊列, 鏈路聚合,VLAN
基于測試:
SLA: 測試延時、丟包、抖動,DHCP, DNS, ICMP Echo, FTP, HTTP, Jitter, UDP
接入設備:
OLT及ONU PON端口報文流量統計
OLT及ONU CPU及內存監控與告警
SNMP報文流量統計
以太網端口流量統計表
?
總結
以上是生活随笔為你收集整理的PMS业务、特性和系统架构的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: form表单提交后提示成功信息
- 下一篇: 前端-微信、企业微信JS-SDK实时调试