运维与自动化运维发展概括
1、運(yùn)維自動(dòng)化發(fā)展 運(yùn)維學(xué)習(xí)和發(fā)展的一個(gè)線路:
1.搭建服務(wù)(部署并運(yùn)行起來(lái))
2.用好服務(wù)(監(jiān)控、管理、優(yōu)化)
3.自動(dòng)化(服務(wù)直接的關(guān)聯(lián)和協(xié)同工作)
4.產(chǎn)品設(shè)計(jì)(如何設(shè)計(jì)一個(gè)運(yùn)維系統(tǒng))
-----當(dāng)下云計(jì)算的核心競(jìng)爭(zhēng)力是運(yùn)維!
系統(tǒng)架構(gòu)師(偏管理):網(wǎng)絡(luò) 系統(tǒng) 數(shù)據(jù)庫(kù) 開發(fā) 云計(jì)算 自動(dòng)化
運(yùn)維管理 服務(wù)管理 項(xiàng)目管理 測(cè)試 業(yè)務(wù)
-----專注于某一領(lǐng)域
2、運(yùn)維自動(dòng)化發(fā)展 運(yùn)維工作內(nèi)容分類:
監(jiān)控運(yùn)維(7x24運(yùn)維值班、故障處理)
應(yīng)用運(yùn)維(業(yè)務(wù)熟悉、服務(wù)部署、業(yè)務(wù)部署、版本管理、灰度發(fā)布、應(yīng)用監(jiān)控)
安全運(yùn)維(整體的安全方案、規(guī)范、漏洞檢測(cè)、安全防護(hù)等)
系統(tǒng)運(yùn)維(架構(gòu)層面的分布式緩存、分布式文件系統(tǒng)、日志收集、環(huán)境規(guī)劃(測(cè)試、開發(fā)、生產(chǎn))、架構(gòu)設(shè)計(jì)、性能優(yōu)化)
基礎(chǔ)服務(wù)運(yùn)維(包含運(yùn)維開發(fā))(內(nèi)部dns、負(fù)載均衡、系統(tǒng)監(jiān)控、資產(chǎn)管理、運(yùn)維平臺(tái))
基礎(chǔ)設(shè)施運(yùn)維(系統(tǒng)初始化、網(wǎng)絡(luò)維護(hù)、負(fù)責(zé)設(shè)備上下架、巡檢、報(bào)修、硬件監(jiān)控)
3、運(yùn)維自動(dòng)化發(fā)展 標(biāo)準(zhǔn)化:
物理設(shè)備層面:
1.服務(wù)器標(biāo)簽化、設(shè)備負(fù)責(zé)人、設(shè)備采購(gòu)詳情、設(shè)備擺放標(biāo)準(zhǔn)
2.網(wǎng)絡(luò)劃分、遠(yuǎn)程控制卡、網(wǎng)卡端口
3.服務(wù)器機(jī)型、硬盤、內(nèi)存統(tǒng)一。根基業(yè)務(wù)分類
4.資產(chǎn)命名規(guī)范、編號(hào)規(guī)范、類型規(guī)范
5.監(jiān)控標(biāo)準(zhǔn)
操作系統(tǒng)層面:
1.操作系統(tǒng)版本
2.系統(tǒng)初始化(dns、ntp、內(nèi)核參數(shù)調(diào)優(yōu)、rsyslog、主機(jī)名規(guī)范)
3.基礎(chǔ)agent配置(zabbix agent、logstash agent、saltstack minion)
4.系統(tǒng)監(jiān)控標(biāo)準(zhǔn)(cpu、內(nèi)存、硬盤、經(jīng)常)
應(yīng)用服務(wù)層面:
1.web服務(wù)選型(apache、nginx)
2.進(jìn)程啟動(dòng)用戶、端口監(jiān)聽規(guī)范、日志收集規(guī)范(訪問(wèn)日志、錯(cuò)誤日志、運(yùn)行日志)
3.配置管理(配置文件規(guī)范、腳本規(guī)范)
4.架構(gòu)規(guī)范(nginx+keepalievd、lvs+keeplievd)
5.部署規(guī)范(位置、包命名等)
運(yùn)維操作層面:
1.機(jī)房巡檢流程(周期、內(nèi)容、報(bào)修流程)
2.業(yè)務(wù)部署流程(先測(cè)試、后生產(chǎn)、回滾)
3.故障處理流程(緊急處理、故障升級(jí)、重大故障管理)
4.工作日志標(biāo)準(zhǔn)(如何編寫工作日志)
5.業(yè)務(wù)上線流程(1.項(xiàng)目發(fā)起2.系統(tǒng)安裝3.部署應(yīng)用4.解析域名5.測(cè)試6.加監(jiān)控7.備份)
6.業(yè)務(wù)下線流程(誰(shuí)發(fā)起,數(shù)據(jù)如何處理)
7.運(yùn)維安全規(guī)范(密碼復(fù)雜度、更改周期、vpn使用規(guī)范、服務(wù)登錄規(guī)范)
-----目標(biāo):文檔化
?
4.運(yùn)維自動(dòng)化發(fā)展 工具化:
1、shell腳本(功能性(流程)腳本、檢查性、報(bào)表性)
2、開源工具(zabbix、elkstack、saltstack、cobbler)
目標(biāo):1、促進(jìn)標(biāo)準(zhǔn)化的實(shí)施
2、將重復(fù)的操作,簡(jiǎn)單化
3、將多次操作,流程化
4、減少人為操作的低效和降低故障率
工具化和標(biāo)準(zhǔn)化是好基友
痛點(diǎn):
1、至少要ssh到服務(wù)器上執(zhí)行,可能犯錯(cuò)
2、多個(gè)腳本有執(zhí)行順序的時(shí)候,可能犯錯(cuò)
3、權(quán)限不好管理,日志沒法統(tǒng)計(jì)
4、無(wú)法避免手工操作
例子:比如某天我們要對(duì)一臺(tái)數(shù)據(jù)庫(kù)從庫(kù)進(jìn)行版本停機(jī)升級(jí),那么要求進(jìn)行評(píng)估
統(tǒng)計(jì)影響:晚上3點(diǎn)有定時(shí)任務(wù)連接該數(shù)據(jù)庫(kù),做數(shù)據(jù)報(bào)表統(tǒng)計(jì)
1、凌晨3點(diǎn)我們所有系統(tǒng)的定時(shí)任務(wù)有哪些 crontab
2、這些crontab哪些連接我們要停止的從庫(kù)
3、哪些可以停,哪些不能停(修改到主庫(kù)),哪些可以后補(bǔ)
4、這些需要后補(bǔ)的腳本哪個(gè)業(yè)務(wù)、誰(shuí)加的、什么時(shí)候加的
5.運(yùn)維自動(dòng)化發(fā)展 web化
運(yùn)維平臺(tái):
例子:
1、做成web界面
2、權(quán)限控制
3、日志記錄
4、弱化流程
5、不用ssh到服務(wù)器,減少人為操作造成的故障
dns web 管理 bind-DLZ
負(fù)載均衡web管理
job管理平臺(tái)
監(jiān)控平臺(tái) zabbix
操作系統(tǒng)安裝平臺(tái)
6.運(yùn)維自動(dòng)化發(fā)展 服務(wù)化(api化)
dns web 管理 bind-DLZ dns-api
負(fù)載均衡web管理 slb-api
job管理平臺(tái) job-api
監(jiān)控平臺(tái) zabbix zabbix-api
操作系統(tǒng)安裝平臺(tái) cobbler-api
部署平臺(tái) deploy-api
配置管理平臺(tái) saltstack-api
1、調(diào)用cobbler-api安裝操作系統(tǒng)
2、調(diào)用saltstack-api進(jìn)行系統(tǒng)初始化
3、調(diào)用dns-api 解析主機(jī)名
4、調(diào)用zabbix-api該新上線機(jī)器加上監(jiān)控
5、再次調(diào)用saltstack-api部署軟件(nginx-php)
6、調(diào)用deploy-api將當(dāng)前版本代碼部署到服務(wù)器上
7、調(diào)用test-api 測(cè)試當(dāng)前服務(wù)運(yùn)行是否正常
8、調(diào)用slb-api將該節(jié)點(diǎn)加入集群
7.運(yùn)維自動(dòng)化發(fā)展 智能化
智能化的自動(dòng)化擴(kuò)容、縮容、服務(wù)降級(jí)、故障自愈
觸發(fā)機(jī)制-》決策系統(tǒng)(決策樹)-》
1.zabbix觸發(fā)Action
觸發(fā):
1、當(dāng)某個(gè)集群的訪問(wèn)量超過(guò)最大支撐量,比如10000
1.1、cpu使用率達(dá)到xx。內(nèi)存使用率達(dá)到xx
2、當(dāng)持續(xù)5分鐘
3、不是攻擊
4、資源池有可用資源
4.1、當(dāng)前網(wǎng)絡(luò)帶寬使用率
4.2、如果公有云--錢夠不夠
5、當(dāng)前后端服務(wù)支撐量是否超過(guò)閾值,如果超過(guò)應(yīng)該后端先擴(kuò)容
6、數(shù)據(jù)庫(kù)是否可用支撐當(dāng)前并發(fā)
7、當(dāng)前自動(dòng)化擴(kuò)展隊(duì)列,是否有正在擴(kuò)容的節(jié)點(diǎn)
8、其他業(yè)務(wù)相關(guān)的
之前:先判斷buffer是否有最近x小時(shí),已經(jīng)移除的之前創(chuàng)建的虛擬機(jī),并查詢軟件版本是否和當(dāng)前一致,如果一致跳過(guò)2、3、4步驟,如果不一致掉過(guò)2、3步驟
2.openstack 創(chuàng)建虛擬機(jī)
3.saltstack 配置環(huán)境--------》監(jiān)控
4.部署系統(tǒng)部署當(dāng)前代碼
5.測(cè)試服務(wù)是否可用(注意間隔和次數(shù))
6.加入集群
7.通知(短信、郵件)
自動(dòng)化縮容:
1.觸發(fā)條件和決策
2.從集群中移除節(jié)點(diǎn)----》關(guān)閉監(jiān)控--》移除
3.通知
4.移除的節(jié)點(diǎn)存放在buffer里面
5.buffer里面超過(guò)一天的虛擬機(jī),自動(dòng)關(guān)閉,存放于xx區(qū)
6.xx區(qū)的虛擬機(jī)。每七天清理刪除
8. 運(yùn)維自動(dòng)化發(fā)展 基于ITIL的運(yùn)維管理體系
成為一名運(yùn)維經(jīng)理:
技術(shù):
運(yùn)維知識(shí)體系
除了技術(shù):
1.服務(wù)管理 ITIL
2.項(xiàng)目管理 PMP
做人
轉(zhuǎn)載于:https://www.cnblogs.com/guigujun/p/6574731.html
總結(jié)
以上是生活随笔為你收集整理的运维与自动化运维发展概括的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: HTML5 Audio标签API整理(三
- 下一篇: rtpdhw03