云时代,运维面临的挑战与机遇
上云,已經(jīng)成為了企業(yè)勢(shì)不可擋的選擇。云計(jì)算所擁有的“軟件定義一切”的特性,推動(dòng)了敏捷彈性、DevOps、智能運(yùn)維和基礎(chǔ)設(shè)施即代碼等自動(dòng)化運(yùn)維趨勢(shì),給企業(yè)研發(fā)運(yùn)維體系的進(jìn)一步升級(jí)帶來(lái)機(jī)會(huì),也給企業(yè)架構(gòu)師與運(yùn)維工程師帶來(lái)了新的挑戰(zhàn)。
企業(yè)上云帶來(lái)哪些好處?
企業(yè)上云最主要的驅(qū)動(dòng)力是在IT成本方面的巨大優(yōu)勢(shì)。云廠商的價(jià)格在逐年下降,這對(duì)很多企業(yè)形成了巨大的誘惑力。一些入門(mén)級(jí)的云服務(wù)器配置,一年的價(jià)格都在千元之內(nèi),中小企業(yè)面對(duì)這樣的低價(jià)很難不動(dòng)心。企業(yè)自己買(mǎi)一個(gè)機(jī)器放在托管機(jī)房,再加上人力維護(hù)成本,花費(fèi)估計(jì)是云服務(wù)器的10倍以上。企業(yè)上云,成本可控力是其巨大動(dòng)力。
其次是隨著云計(jì)算技術(shù)的發(fā)展,各種IaaS、PaaS、SaaS平臺(tái)和應(yīng)用日漸成熟,大小企業(yè)都希望能夠在云技術(shù)方面與時(shí)俱進(jìn),享受到最新的云技術(shù)帶來(lái)的IT優(yōu)勢(shì),在激烈的市場(chǎng)競(jìng)爭(zhēng)當(dāng)中保持科技領(lǐng)先優(yōu)勢(shì)。
企業(yè)上云的成本節(jié)約對(duì)中小企業(yè)效果最明顯,因?yàn)檫@類(lèi)企業(yè)的要求都是一些標(biāo)準(zhǔn)化的需求,比如前后端、中間件、數(shù)據(jù)庫(kù),基本不需要定制的IT框架,現(xiàn)有的云倉(cāng)標(biāo)準(zhǔn)方案就可以解決。但是一旦企業(yè)上了規(guī)模,比如說(shuō)金融行業(yè),銀行、保險(xiǎn)、證券這些大型企業(yè),上云就比較曲折,在初期甚至還會(huì)增加一些IT成本。
上云后,運(yùn)維面臨新挑戰(zhàn)
企業(yè)上云可以享受到標(biāo)準(zhǔn)化的服務(wù),高效、省錢(qián)、省力、安全。但對(duì)于一些有特殊要求的應(yīng)用場(chǎng)景,還需要相關(guān)體系進(jìn)一步完善。
上云后就不是傳統(tǒng)的監(jiān)、管、控的運(yùn)維,面對(duì)更復(fù)雜的運(yùn)維環(huán)境,需要解決以下問(wèn)題。
1、實(shí)現(xiàn)統(tǒng)一運(yùn)維。
上云后面臨的相對(duì)復(fù)雜的環(huán)境,不是傳統(tǒng)意義上的單個(gè)機(jī)房或者一個(gè)IDC,而是一個(gè)多云的環(huán)境,私有云、公有云,還有虛擬化平臺(tái)和未來(lái)的容器平臺(tái)等,不同的平臺(tái)有不同的邏輯,需要用不同的技能進(jìn)行運(yùn)維,導(dǎo)致對(duì)運(yùn)維人員技術(shù)要求比較高。打破不同平臺(tái)之間的差異,用同一種方式對(duì)所有平臺(tái)進(jìn)行運(yùn)維。
2、打破運(yùn)維隔離。
平臺(tái)的對(duì)象監(jiān)控,要避免運(yùn)維孤島,有助于用戶(hù)對(duì)基礎(chǔ)監(jiān)控的全面把控。
3、規(guī)避手工運(yùn)維。
傳統(tǒng)運(yùn)維過(guò)程中存在非常多手工運(yùn)維的操作,這會(huì)導(dǎo)致效率問(wèn)題和安全問(wèn)題。頻繁地登錄服務(wù)器去做一些命令操作,也存在安全隱患。平臺(tái)代替人工去做此類(lèi)重復(fù)勞動(dòng),避免人為的重復(fù)勞動(dòng)和過(guò)多的登錄服務(wù)器。
4、持續(xù)更新知識(shí)庫(kù)。
知識(shí)庫(kù)問(wèn)題更新,故障解決方法。運(yùn)維人員知識(shí)固化,個(gè)人依賴(lài)性強(qiáng),干貨包的分享,降低人員依賴(lài),保證故障妥善解決。
LinkSLA智能運(yùn)維管家如何應(yīng)對(duì)業(yè)務(wù)上云的運(yùn)維問(wèn)題?
? 機(jī)器學(xué)習(xí)
自動(dòng)化運(yùn)維有大量的告警監(jiān)控,如果數(shù)據(jù)量過(guò)大,就會(huì)造成告警無(wú)效。通過(guò)AI學(xué)習(xí),對(duì)歷史數(shù)據(jù)的積累和分析,總結(jié)出它的趨勢(shì),然后通過(guò)自動(dòng)化學(xué)習(xí)的方式和一些數(shù)學(xué)模型,自動(dòng)給指標(biāo)做閾值的調(diào)整。原先的告警是一個(gè)固化的值,但靠固定值不能做到足夠高的準(zhǔn)確率,所以通過(guò)機(jī)器學(xué)習(xí)的方式,自動(dòng)學(xué)習(xí)歷史數(shù)據(jù)的趨勢(shì),達(dá)到自動(dòng)告警。
?自動(dòng)分析故障根因。
首先監(jiān)控指標(biāo)的分析,可以有助于我們快速定位問(wèn)題的根因,其次對(duì)故障類(lèi)型進(jìn)行判斷,分析故障影響的人數(shù)、故障級(jí)別以及歷史故障的推薦,有助于快速解決故障。
LinkSLA針對(duì)運(yùn)維自動(dòng)化這一塊也有比較完整的解決方案。從多年實(shí)踐的角度來(lái)看,在企業(yè)中用到的場(chǎng)景主要有以下這幾點(diǎn):
? 用自動(dòng)化帶動(dòng)標(biāo)準(zhǔn)化通過(guò)自動(dòng)化平臺(tái)的引入,幫助企業(yè)去建立一套標(biāo)準(zhǔn)化的體系,包括它的系統(tǒng)、平臺(tái)等等各種設(shè)置應(yīng)該如何實(shí)現(xiàn)標(biāo)準(zhǔn)化。
? 通過(guò)自動(dòng)化來(lái)實(shí)現(xiàn)系統(tǒng)的自動(dòng)巡檢,自動(dòng)配置管理等等一系列日常的管理。
? 使用自動(dòng)化平臺(tái)幫助企業(yè)進(jìn)行故障的根因分析,甚至故障的自愈。
? 幫助企業(yè)實(shí)現(xiàn)應(yīng)用自動(dòng)化發(fā)布,甚至災(zāi)備切換自動(dòng)化等等。
LinkSLA智能運(yùn)維管家是一個(gè)SaaS的智能運(yùn)維平臺(tái),它有如下特點(diǎn):
1、AI賦能,通過(guò)機(jī)器學(xué)習(xí)算法對(duì)系統(tǒng)時(shí)序性指標(biāo)進(jìn)行異常檢測(cè),提高了告警效率和準(zhǔn)確性
2、All in ONE ,從硬件設(shè)備、操作系統(tǒng)、應(yīng)用組件到業(yè)務(wù)應(yīng)用提供全棧的監(jiān)控。
3、Application View,不僅提供IT基礎(chǔ)架構(gòu)監(jiān)控,還從用戶(hù)業(yè)務(wù)系統(tǒng)視圖來(lái)監(jiān)控其健康度
4、SaaS的架構(gòu)決定平臺(tái)的敏捷交付能力,用戶(hù)開(kāi)箱即用,迅速形成生產(chǎn)力。
- LinkSLA智能運(yùn)維管家的優(yōu)勢(shì)在哪里?
LinkSLA智能運(yùn)維管家不僅是平臺(tái),更是一種服務(wù),為用戶(hù)提供遠(yuǎn)程線上監(jiān)控值守和線下服務(wù)的閉環(huán),這一點(diǎn)是目前友商產(chǎn)品或平臺(tái)做不到的,他們并不能對(duì)用戶(hù)運(yùn)維工作帶來(lái)實(shí)質(zhì)性的幫助,我們提供給用戶(hù)的與其稱(chēng)為運(yùn)維平臺(tái),不如是一種全新的運(yùn)維模式,全天候的平臺(tái)監(jiān)控,全天候的值守和線下服務(wù)閉環(huán)的大運(yùn)維模式,給用戶(hù)運(yùn)維帶來(lái)全新的體驗(yàn)。
總結(jié)
以上是生活随笔為你收集整理的云时代,运维面临的挑战与机遇的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 使用Emulator时的坏习惯
- 下一篇: 利用FFmpeg和OpenGL ES 实