故障管理流程与故障管理功能开发的设计
                                                            生活随笔
收集整理的這篇文章主要介紹了
                                故障管理流程与故障管理功能开发的设计
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.                        
                                故障管理流程的設計目標
在最短時間內恢復服務正常運營,滿足SLA要求,將事件對業務運營的負面影響降至最低。故障管理功能的開發需求
故障事件的范圍
故障事件的處理需要有時限管理和故障升級處理
故障模型的定義與使用
對常見故障預定義故障處理模型,故障模型需要包括:故障管理流程圖
故障管理流程中的主要活動
1、故障確認 從各種途徑反饋來的事件中分析、判斷,以確認是否屬于故障(事件管理、web界面、用戶反饋、電子郵件等途徑)。 故障事件需要指定一個負責人,對故障事件的全生命周期的管理負責。 2、故障記錄 所有故障均需要做完整記錄并帶有時間戳。 故障記錄的定義需要包括:- 唯一參考編號
 - 故障類型
 - 故障緊急度
 - 故障影響度
 - 故障優先級
 - 記錄的日期/時間
 - 記錄事件的人員
 - 通知方法
 - 受影響客戶的聯系方法
 - 癥狀描述
 - 故障狀態
 - 相關配置項(應用、主機、機房、服務SLA)
 - 負責故障的支持人員/小組
 - 相關問題/已知錯誤
 - 解決故障采取的活動
 - 解決日期/時間
 - 關閉類型
 - 關閉日期和時間
 
- 硬件->服務器->內存條->插槽松動
 - 軟件->應用服務->OA套件->考勤系統
 
5、初步診斷與處理 應盡量成功解決并關閉故障。 6、故障升級 當故障處理已經超過目標解決時間,或者超出自己處理范圍,必須立即升級故障。
- 職能性升級,在業務應用、系統、網絡等專業分組間升級故障;
 - 管理性升級,當故障性質嚴重、需要引入額外資源或發生故障分配爭議時,必須通知運維負責人。
 
- 應確保恢復措施經過了可靠地驗證測試;
 - 可能需要協調多個小組的恢復活動并與所有參與方保持聯系;
 - 需要將采取的各種措施更新至故障處理記錄中;
 - 問題解決小組應將故障恢復結果反饋給該故障事件負責人,以執行故障關閉操作。
 
- 故障分類,故障初始分類是否正確或需要得到更新;
 - 用戶滿意度調查,對約定比例的故障事件進行;
 - 故障登記,是否完備;
 - 是否屬于重復發生的故障;
 - 正式關閉故障。
 
故障管理流程相關的監控指標(基于故障記錄的統計分析)
以下KPIs指標應得到監視和報告,據以判斷故障管理流程及其運營的效率和效果。- 故障總數量
 - 按產品服務統計的故障數量和百分比
 - 故障數量的同比、環比展示
 - 按各階段細分的故障,如進行中的、已關閉的等
 - 重大故障的數量和百分比
 - 在約定響應時間內處理的故障比例
 - 重開的故障數量和百分比
 - 每個人員處理的故障數量和百分比
 - 按故障模型處理的故障數量和百分比
 
其它故障管理功能需求
- 故障自動關閉功能:啟用該功能后,該故障事件在持續一個指定的時間段后,會自動關閉,并且把故障關閉類型標識為“自動關閉”。
 - 重開故障功能:在一個限定的時間內,故障重復發生,需要重開不久前關閉的故障,繼續按同一故障事件進行維護。
 
總結
以上是生活随笔為你收集整理的故障管理流程与故障管理功能开发的设计的全部內容,希望文章能夠幫你解決所遇到的問題。
                            
                        - 上一篇: rain、rainy、raining的区
 - 下一篇: mysql大于小于索引问题