OpsRamp推出以服务为中心的AIOps和云监控功能
OpsRamp是一個(gè)面向混合企業(yè)的以服務(wù)為中心的AIOps軟件即服務(wù)(SaaS)平臺(tái),最近發(fā)布了新的拓?fù)鋱D、增強(qiáng)的人工智能IT運(yùn)維(AIOps)功能以及針對(duì)云原生工作負(fù)載的監(jiān)控功能。
新版的OpsRamp平臺(tái)為現(xiàn)代IT運(yùn)營(yíng)管理團(tuán)隊(duì)提供了Kubernetes監(jiān)控、智能警報(bào)路由和拓?fù)鋱D。它為混合基礎(chǔ)設(shè)施監(jiān)控和管理提供了更強(qiáng)大的以服務(wù)為中心的環(huán)境,讓企業(yè)IT團(tuán)隊(duì)能夠采用更智能的事件管理機(jī)制,并提供卓越的用戶體驗(yàn)。
OpsRamp產(chǎn)品管理副總裁Mahesh Ramachandran將“以服務(wù)為中心”定義為:
以服務(wù)為中心的觀點(diǎn)將數(shù)字運(yùn)營(yíng)團(tuán)隊(duì)的重心從管理元素轉(zhuǎn)移到管理業(yè)務(wù)服務(wù)。OpsRamp AIOps解決方案旨在通過更快的補(bǔ)救和事件響應(yīng)來滿足服務(wù)可用性和性能需求。這樣可以幫助IT組織將基礎(chǔ)設(shè)施環(huán)境從一系列設(shè)備、資源和配置重新構(gòu)建為一系列業(yè)務(wù)服務(wù),我們認(rèn)為這些服務(wù)更易于管理。它還將傳統(tǒng)IT、DevOps和業(yè)務(wù)目標(biāo)整合并統(tǒng)一為一個(gè)共同愿景。IT像業(yè)務(wù)一樣思考其所需的資源——以服務(wù)為核心。
新版本提供了影響可見性和服務(wù)上下文功能,可發(fā)現(xiàn)混合云和多云IT技術(shù)棧中多級(jí)資源之間的拓?fù)潢P(guān)系。拓?fù)鋱D旨在幫助基礎(chǔ)設(shè)施和運(yùn)營(yíng)團(tuán)隊(duì)了解IT資源對(duì)彼此以及面向最終用戶的IT服務(wù)的影響。OpsRamp的拓?fù)浒l(fā)現(xiàn)功能現(xiàn)在可用于應(yīng)用程序和hypervisor。應(yīng)用程序拓?fù)涔δ芸砂l(fā)現(xiàn)40多種流行的企業(yè)應(yīng)用程序,并在應(yīng)用程序組件和基礎(chǔ)設(shè)施之間建立拓?fù)潢P(guān)系。hypervisor拓?fù)涔δ芸砂l(fā)現(xiàn)VMware vSphere和KVM環(huán)境中的虛擬機(jī)、hypervisor服務(wù)器和集群以及它們之間的關(guān)系。
OpsRamp還增強(qiáng)了服務(wù)地圖功能,提供了新的用戶界面,可以識(shí)別IT服務(wù)中斷背后的底層資源,讓運(yùn)營(yíng)團(tuán)隊(duì)制定正確的恢復(fù)服務(wù)行動(dòng)方案。新版本引入了一些新功能,包括自動(dòng)事件創(chuàng)建和路由、推理模型的增強(qiáng)訓(xùn)練和頻率驅(qū)動(dòng)的警報(bào)升級(jí)。
OpsRamp的OpsQ現(xiàn)在可以使用警報(bào)升級(jí)策略進(jìn)行自動(dòng)事件創(chuàng)建和路由,根據(jù)之前的警報(bào)、事件和通知數(shù)據(jù)自動(dòng)分配事件。機(jī)器學(xué)習(xí)驅(qū)動(dòng)的警報(bào)升級(jí)使用特定的學(xué)習(xí)模式(受讓人組、業(yè)務(wù)影響、緊急程度和優(yōu)先級(jí))為不同類型的警報(bào)路由事件分配。OpsRamp的基于機(jī)器學(xué)習(xí)的推理模型使用歷史警報(bào)數(shù)據(jù)關(guān)聯(lián)由常見原因引起的警報(bào)。OpsQ現(xiàn)在允許使用用戶提供的訓(xùn)練數(shù)據(jù)來增強(qiáng)這些模型。通過這種增強(qiáng)訓(xùn)練,IT運(yùn)營(yíng)團(tuán)隊(duì)可以引導(dǎo)OpsQ識(shí)別日常運(yùn)營(yíng)中不常見的警報(bào)序列,當(dāng)發(fā)生警報(bào)時(shí)能夠識(shí)別出來。要增強(qiáng)模型,用戶可以構(gòu)建電子表格(或使用示例模板),使用預(yù)定義的數(shù)據(jù)(解析器組、類別、子類別、優(yōu)先級(jí)、緊急程度和業(yè)務(wù)影響)將事件升級(jí)到服務(wù)管理。然后將這些數(shù)據(jù)應(yīng)用于OpsRamp的事件管理工具和第三方事件管理集成。
OpsQ支持新的策略,比如根據(jù)最近發(fā)生警報(bào)的頻率來升級(jí)警報(bào)。運(yùn)營(yíng)團(tuán)隊(duì)因此可以過濾掉只是偶爾會(huì)發(fā)生的警報(bào),并升級(jí)反復(fù)發(fā)生的警報(bào)。OpsRamp平臺(tái)提供了多云事件監(jiān)控功能,以及發(fā)現(xiàn)和監(jiān)控支持現(xiàn)代微服務(wù)架構(gòu)的容器基礎(chǔ)設(shè)施的功能。
OpsRamp現(xiàn)在可以在本地和云端(例如Azure Kubernetes Services、Google Kubernetes Engine和Amazon Elastic Container Service for Kubernetes)發(fā)現(xiàn)和監(jiān)控Kubernetes環(huán)境。DevOps團(tuán)隊(duì)可以了解每個(gè)Kubernetes集群的總服務(wù)(每個(gè)集群的節(jié)點(diǎn)和容器、按命名空間劃分的pod)和資源趨勢(shì)(CPU和內(nèi)存利用)。用戶可以監(jiān)控與集群、主機(jī)、NameSpaces、pod和容器的可用性和性能相關(guān)的關(guān)鍵指標(biāo)。在公共云中,事件是重要的運(yùn)維問題通信媒介,而在多云環(huán)境中,事件是信號(hào)的主要來源。OpsRamp現(xiàn)在可以從AWS服務(wù)(如AWS Health、ECS、Redshift、數(shù)據(jù)遷移服務(wù)和CloudWatch)收集、聚合、關(guān)聯(lián)和升級(jí)事件。有了這個(gè)功能,OpsRamp可以對(duì)跨多個(gè)云帳戶的云事件進(jìn)行單點(diǎn)監(jiān)控、管理和修復(fù)。
新的OpsRamp版本還提供了包含補(bǔ)丁合規(guī)性驗(yàn)證的補(bǔ)丁管理功能、綜合事務(wù)和SSL證書監(jiān)控、用于監(jiān)控開源應(yīng)用程序的集成,以及簡(jiǎn)化分類和鏈接的知識(shí)庫(kù)增強(qiáng)。
查看英文原文:https://www.infoq.com/news/2019/02/opsramp-service-centricity-aiops
總結(jié)
以上是生活随笔為你收集整理的OpsRamp推出以服务为中心的AIOps和云监控功能的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 一秒搭建gitbook
- 下一篇: PostgreSQL 优化器代码概览