机房定期巡检报告报告,全面详实,可以参考
機房定期巡檢報告報告,全面詳實,可以參考,一個模板僅供參考,大家還可以補充學習
1.文檔說明
? ? ? 為了保證設備穩定運行,發現設備在運行過程中可能存在的風險,做到防范于未然,組織人員針對目前機房所使用的防火墻及安全設備進行年度的巡檢工作,本文檔為第四季度巡檢報告內容。
2.巡檢內容及操作指導
2.1?硬件部分
2.1.1?機房要求
2.1.1.1機房的衛生狀況,要求清潔,防火墻上沒有灰塵。
2.1.1.2溫度(攝氏?℃)
工作環境溫度0?℃-40℃
工作環境濕度(%)10%?-95%
2.1.2?電源檢查
2.1.2.1電源插頭有無松動。
電源無松動
2.1.2.2電源指示燈顏色:
PWR | 電源 | 綠色常亮 | 電源1工作正常 |
2.1.3?防火墻風扇
2.1.3.1風扇指示燈顏色
FAN | 風扇狀態 | 綠色常亮 | 風扇工作正常 |
2.1.4?指示燈
根據指示燈狀況,可迅速查看某部分出現故障,以及運行情況。
指示燈 | 用途 | 顏色 | 說明 |
STATUS | 系統狀態 | 綠色閃爍 | 正常運行 |
PS | PS狀態 | 綠色常亮 | 電源PS正常供電 |
HA | HA狀態 | 綠色閃爍 | 有一主一備兩臺設備,本設備工作master狀態 |
VPN | VPN狀態 | 綠色常亮 | VPN隧道已連接 |
2.1.5?設備模塊及數據接口檢查:
2.1.5.1接口狀態檢查
檢查模塊安裝是否松動,接口模塊上指示燈是否正常。已接有鏈路的端口link端為綠色常亮,ACT指示燈為黃色閃爍。
Link | Link狀態 | 綠色常亮 | 端口與對端設備通過網線或者光纖連接正常 |
ACT | ACT狀態 | 黃色閃爍 | 端口處于收發狀態 |
2.2?系統部分
2.2.1?軟件版本檢查
在設備上運行show version 查看當前軟件版本,查看當前版本之后的release版本有無嚴重BUG修復,如有與當前運行環境有沖突的軟件BUG,建議用戶升級軟件版本。
?
堡壘機:
數據庫審計:
日志審計:
2.2.2溫度和風扇檢查
2.2.2.1溫度風扇檢查
檢查溫度如有超出標準值并是否處于正常狀態,檢查風扇及機扇環境,及時更換部件。
(config)#?show environment
Both the temperature and fan?are in normal state.
出口防火墻:
出口負載均衡:
數據中心防火墻:
2.2.2.2持續運行時間檢查
在防火墻上執行show version檢查防火墻持續運行時間及上次系統重啟時間。
此參數值可供參考防火墻的運行穩定性。
出口防火墻:
出口負載均衡:
數據中心防火墻:
行為管理:
堡壘機:
日志審計:
2.2.3并發會話檢查
在防火墻上執行命令:show session generic
每個防火墻的并發會話都有一個最值,如果超出最大值說明防火墻并發會話已經達到極限,防火墻成為一性能瓶頸,需要升級到更高檔次防火墻。
會話信息如包含alloc failed說明防火墻會話曾經達到最大值,防火墻會話建立失敗,可能是防火墻性能的問題或曾經出現網絡攻擊現象;
123#?show session generic
VSYS 0, max 200000, alloced 0, deny session 0, free 200000, tunnel 0, alloc failed 0
出口防火墻:
出口負載均衡
數據中心防火墻:
2.2.4?CPU利用率檢查
防火墻的CPU主要任務為執行功能、會話、日志等管理功能,一般情況下CPU利用率不會太高,建議不超過60%。
防火墻CPU統計有1分鐘、5分鐘、15分鐘平均值。
在某一時間段CPU利率較高,屬異常現象,可能有攻擊等情況發生。
CPU利用率持續較高,說明防火墻配置錯誤,需要調整防火墻配置,以降低CPU利用率。
123#?show cpu
Average cpu utilization : 0.2%
current cpu utilization : 2.0%
Last 1 minute?: 0.1%
Last 5 minutes : 0.2%
Last 15 minutes : 0.2%
上網行為管理:
?
堡壘機:
?
數據庫審計:
?
日志審計:
?
2.2.5?內存使用率檢查
在防火墻內執行?show memory?查看內存利用率;
hillstone#?show memory
The percentage of memory utilization: 25%
???total(kB)????used(kB)???free(kB)
???524288???????132793?????391495?
出口防火墻:
出口負載均衡:
數據中心防火墻:
上網行為管理:
堡壘機:
數據庫審計:
日志審計:
2.2.6?日志統計審計
提供了用于監控系統事件和網絡流量的事件日志以及便于系統管理員分析和跟蹤設備各種問題情況。Stoneos的日志信息分為七種,分別是事件(Event)日志信息、告警(Alarm)日志信息、安全(Security)日志信息、配置(Configuration)日志信息、網絡(network)日志信息、流量(Traffic)日志信息和調試(Debug)日志信息。日志信息根據嚴重級別的不同,又可以分為8級別。
日志信息嚴重性級別分類:
?Emergency (緊急)級別0:系統不可用信息。
?Alert(警示)級別1:需要立即處理的信息,如設備受到攻擊燈。
?Critical(關鍵)級別2:危急信息,如硬件出錯。
?Error (錯誤)級別3:錯誤信息。
?Warning(警告)級別4:報警信息。
?Notification (通知)級別5:非錯誤信息,但需要特殊處理。
?Information (信息)級別6:通知信息。
?Debugging(調試)級別7:調試信息,包括正常的使用信息。
查看一些日志信息如下:
show logging?event
show logging alarm
show logging?security
該部分主要涉及出口設備(日志審計類設備主要作用就是保存日志),巡檢防火墻、負載均衡、數據中心防火墻。
防火墻:
負載均衡:
數據中心防火墻:
2.2.7?路由檢查
防火墻在路由模式下工作時,防火墻數據轉發跟系統路由相關,檢查路由設置是否正確。
123#?show ip route
Codes: K - kernel route, C - connected, S - static, I - ISP, R - RIP, O - OSPF,
???????B?- BGP, D - DHCP, P - PPPoE, H - HOST, G - SCVPN, V - VPN, M - IMPORT,
???????>?- selected route, * - FIB route
Routing Table for Virtual Router
==========================================================================
C>* 192.168.1.0/24 is directly connected, ethernet0/0
H>* 192.168.1.1/32 [0/0/1] is local address, ethernet0/0
防火墻:
負載均衡:ISP路由信息過多,無截圖
數據中心防火墻:
2.2.8?查看系統信息
獲得系統的一些信息。
show tech-support
2.2.9其他安全設備
日志審計設備正常運行,配置服務器syslog信息上傳到日志審計設備,保存到設備中,保存日志為180天。并且現場配置查看,能夠查到服務器的日志信息。
堡壘機設備現場正常使用,檢查堡壘機信息,完成堡壘機使用查看,并囑托客戶使用堡壘機運維服務器,在數據中心服務器上,封閉除了堡壘機外的主機訪問服務器高危端口。
數據庫審計,現場查看數據庫日志,配合客戶檢查數據庫日志,并簡單說明數據庫審計設備的使用方式。
上網行為管理,登陸設備,檢查設備使用情況,所有用戶均在配置策略中受設備管控,設備運行無問題,用戶上網行為受管控、受審計,運行正常。
3.巡檢報告
3.1設備基本信息匯總
防火墻設備信息:
3.2設備運行參數
設備運行參數主要有一下幾種類型:
?設備基本狀況:軟件版本、設備運行時間、CPU利用率、內存使用率、HA狀態、會話數、設備板卡溫度、設備電源、設備風扇。
?可靠性檢查:配置檢查、日志記錄情況、策略檢查。
?路由狀態:查看路由表中業務路由。
?保存文件:當前配置文件、備份配置文件、保存log日志。
3.3設備運行情況
3.3.1設備
序號 | 檢查內容 | 情況 | 結果 | 命令 | 備注 |
硬件部分 | |||||
1 | 機房衛生 | 正常 | 正?!?不正?!?/p> | - | 查看機房衛生情況 |
機房環境溫度 | 正常 | 正常■ 不正常□ | - | 查看機房環境溫度 | |
2 | 電源插頭 | 正常 | 正?!?不正常□ | - | 查看電源插頭情況 |
電源指示燈 | 正常 | 正?!?不正?!?/p> | - | 查看電源指示燈情況 | |
3 | 風扇運轉 | 正常 | 正?!?不正常□ | - | 查看風扇運轉情況 |
風扇指示燈 | 正常 | 正常■ 不正常□ | - | 查看風扇指示燈情況 | |
4 | 系統狀態指示燈 | 正常 | 正常■ 不正常□ | - | 查看系統狀態指示燈情況 |
系統告警指示燈 | 正常 | 正?!?不正?!?/p> | - | 查看系統告警知識等情況 | |
HA狀態指示燈 | 正常 | 正常■ 不正常□ | - | 查看HA狀態指示燈情況 | |
VPN狀態指示燈 | 正常 | 正?!?不正常□ | - | 查看VPN狀態指示燈情況 | |
板卡狀態指示燈 | 正常 | 正常■ 不正?!?/p> | - | 查看板卡狀態指示燈情況 | |
系統部分 | |||||
1 | 軟件版本 | 正常 | 正?!?不正?!?/p> | show version | 查看軟件版本 |
2 | 設備溫度 | 正常 | 正?!?不正常□ | show?environment | 查看設備溫度,建議在0-90度之間 |
設備電源 | 正常 | 正常■ 不正?!?/p> | show?environment | 查看設備電源狀態 | |
設備風扇 | 正常 | 正?!?不正?!?/p> | show?environment | 查看設備風扇狀態 | |
設備運行時間 | 正常 | 正?!?不正常□ | show version | 查看設備運行時間 | |
3 | 并發會話數 | 正常 | 正?!?不正?!?/p> | show session generic | 查看設備會話數 |
4 | CPU利用率 | 正常 | 正?!?不正?!?/p> | show cpu | 查看CPU利用率,建議在60%以下 |
5 | 內存使用率 | 正常 | 正常■ 不正?!?/p> | show memory | 查看內存利用率,建議在60%以下 |
6 | 日志統計情況 | 正常 | 正?!?不正?!?/p> | show logging alarm/event/?security | 保存相關日志記錄 |
7 | 路由檢查 | 正常 | 正?!?不正?!?/p> | show ip route | 重要業務路由是否正確 |
8 | 系統信息檢查 | 正常 | 正?!?不正?!?/p> | show tech-support | 查看設備部分信息 |
攻擊防護部分 | |||||
1 | 查看AD配置 | 正常 | 正?!?不正常□ | show??ad zone untrust configuration | 查看設備AD配置是否正常 |
2 | 查看AD記錄 | 正常 | 正?!?不正?!?/p> | show ad zone untrust statistics | 查看設備AD記錄是否正常 |
配置及策略部分 | |||||
1 | 查看配置文件 | 正常 | 正?!?不正常□ | show configuration | 查看當前配置 |
2 | 查看地址薄 | 正常 | 正?!?不正常□ | show adderss | 查看地址薄 |
3 | 查看服務薄 | 正常 | 正?!?不正?!?/p> | show?services | 查看服務薄 |
4 | 查看策略 | 正常 | 正常■ 不正?!?/p> | show?policy | 查看策略配置 |
4.評估
??????現有設備運行穩定,沒有出現軟件硬件故障,可以滿足當前業務的需求。
5.總結和建議
?????現有設備運行穩定,沒有出現軟件硬件故障,可以滿足當前業務的需求。
資料免費送(點擊鏈接下載)
史上最全,數據中心機房標準及規范匯總(下載)數據中心運維管理 | 資料匯總(2017.7.2版本)? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
加入運維管理VIP群(點擊鏈接查看)
《數據中心運維管理》VIP技術交流群會員招募說明
掃描以下二維碼加入學習群
總結
以上是生活随笔為你收集整理的机房定期巡检报告报告,全面详实,可以参考的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 收藏:通信网络基础知识
- 下一篇: 印尼互联网交换中心失火,或由电路短路引发