据中心水冷系统备品备件管理新思路
? 近年來,數據中心單機架功率密度呈上升趨勢,根據數據顯示,單一機柜機架功率密度由2008年的6kW,直線上升至2016年的12kW。2020年,單一機柜機架功率密度可能達到16.5kW。而個別改造案例中,單一機柜機架功率密度更是高達43kW,高功率密度的機架假設為數據中心制冷系統提出了前所未有的高要求。水冷系統冬季通過冷卻塔、板式換熱器利用室外自然冷源進行制冷,全年能效比相比風冷空調更具優勢,在越來越多的大型數據中心得到應用。
典型的數據中心水系統通常由冷凍水、冷卻水系統組成,管路較長,法蘭、閥門、過濾器等管路附件較多,隨著使用年限的增加,水系統故障率隨之升高。面對隨時可能發生的故障,水系統備品備可以說是應急搶修的保障前提。備品備件是指為保障系統正常運行和設備修理要求,儲備、存放于庫房內備用的用于維護系統和設備的可替換單元。
非常用型備品備件儲備
不同企業所需備品備件種類不同,根據現場實際情況,企業需制定生產、訂購、供應、儲備等方面的備品備件管理方案。針對數據中心7X24小時平穩運行的需求,故障處理務必及時有效,備品備件存在種類多、數量大的特點。大型數據中心部分水冷系統管徑超過DN500,管路附件類配品備品備件并不常用,且尺寸、重量較大,出于非常用備品備件自損及庫房空間規劃的考慮,這些非常用型備品備件不會進行現場儲備。
但值得注意的是,這些非常用型備品備件一旦出現故障,很可能直接影響數據中心水系統運行。如果現場沒有儲備,而備品備件的供應周期又長,數據中心就會直接面對制冷中斷的風險。
故障搶修案例分析
故障描述
某大型數據中心機房樓配備5臺冷水機組,故障發生前1#、2#、3#冷水機組運行,單臺負載率均在60%以上。2019年8月16日17:10,1#冷水機組冷卻水自清洗過濾器漏水,冷卻水缺水導致冷水機組停機,系統自動切換至4#冷水機組,切換后3臺冷水機組負載率均在60%以上。但由于5#冷水機組壓縮機故障無法啟動,現1#冷水機組不能啟動,導致制冷系統無冗余,數據中心運行存在巨大風險。數據中心立刻成立專項搶修組,爭取在最短時間內完成故障的恢復。
故障原因
自清洗過濾器是安裝在管路Y型過濾器上的自動清洗排污裝置,Y型過濾器管徑為DN350。自清洗過濾器主要由法蘭盤、不銹鋼內刷(含支架)、過濾網、鋼刷主軸、電機組成,漏水原因為自清洗過濾器運行時間較長,法蘭盤安裝孔處水封腐蝕,且鋼刷主軸磨損嚴重,安裝孔處冷卻水泄露。
雖然備品備件庫儲備了水封,但因自清洗過濾器尺寸較大、故障率低,故并未儲備。因鋼刷主軸磨損嚴重,故單純更換水封無法解決冷卻水泄露的問題。
故障處理
方案一:采購鋼刷主軸進行更換
因自清洗過濾器為定制設備,主軸為異型件,制作周期最少為3-4天,且發生故障臨近下班時間,經電話溝通,主軸的制作最快為第二天上午,這樣,冷機系統處于無冗余備份狀態至少持續4-5天。采用方案一,數據中心將面對前所未有的運行風險。
方案二:利用未啟用水系統鋼刷主軸進行更換
除冷凍水、冷卻水在用主管路,該數據中心還配備水環加熱管路,且并沒有啟用。可利用管路上的自清洗過濾器鋼刷主軸進行更換。但自清洗過濾器為鑄鐵材質,自重較大,常規拆卸電機、法蘭盤及鋼刷主軸需要約2小時,故拆卸及安裝將耗時約4小時,且因自清洗過濾器較重,安裝過程極易造成水封變形,可能導致再次漏水,如故障搶修失敗,故障恢復時間將會延長。采用方案二,該數據中心亦將面對較長時間的運行風險。
故障分析
方案一風險過高,方案二雖然利用了閑置備品備件,但依然不能在短時間內完成故障搶修。
搶修組成員均認為方案一和方案二效果都不能達到短時間完成搶修的目的,并總結關鍵點如下:
(1)自清洗過濾器泄露點為鋼刷主軸與法蘭盤的安裝孔.
(2)自清洗過濾器重量大是拆裝工作耗時較長的主要原因.
(3)自清洗過濾器利用內部鋼刷、排污開關定時啟動,達到控制水質的目的。
針對以上三個關鍵點,搶修組提出了幾點疑問:
(1)不更換鋼刷主軸和水封,而是完全堵住安裝孔,是否可以解決漏水問題。
(2)自清洗過濾器更換是否可以減少工作量。
(3)1#自清洗過濾器不起作用,是否會對系統水質產生影響。
針對以上三點疑問,搶修組經過討論,最終得到答案:
(1)完全堵住安裝孔,可以解決漏水問題。
(2)工作量可降低至拆卸法蘭盤、鋼刷主軸及不銹鋼內刷(含支架)。
(3)1#冷水機組運行時,可加大另外兩臺冷水機組自清洗過濾器的排污量,不影響系統水質。
綜上,搶修組總結得出方案三:
拆除1#自清洗過濾器法蘭盤,并將鋼刷主軸、不銹鋼內刷(含支架)拆除,臨時利用一款鐵板焊死安裝孔,再安裝回Y型過濾器。
故障處理
(1)17:10—17:30
搶修組對現場故障做出評估,最終確定方案三。
(2)17:30—18:45
搶修組借調其他機房樓人員力量,關閉1#自清洗過濾器前后閥門,完成拆卸。
(3)18:45—19:00
搶修組現場利用一小塊鐵板將安裝孔焊死。
(4)19:00—19:30
搶修組安裝1#自清洗過濾器的法蘭盤。
(5)19:30—20:00
搶修組打開1#自清洗過濾器前后閥門進行注水,觀察1#自清洗過濾器前后壓力恢復正常,安裝孔無泄漏現象。
至此,從搶修方案制定至故障處理完成,歷經約2小時30分鐘,2#、3#、4#冷水機組正常運行,1#冷水機組作為備機,該數據中心機房樓恢復N+1備份機制,運行風險消除。
“非全尺寸”備品備件管理新思路
“非全尺寸”備品備件的靈感來源于汽車的非全尺寸備胎。
非全尺寸備胎的優點
作為汽車設計領域的技術難點,備胎槽的大小會受到后懸架結構、排氣管布置、油箱位置以及后備廂上層設計的綜合制約。簡單來說,非全尺寸備胎胎寬小很多,后備廂地板下的空間就可以被壓縮,地板上的行李裝載空間就會更大。同時,鑒于備胎在現實用車過程中的使用率并不高,所以很多車企就壓縮了備胎,從而換取更大的后備廂儲物空間。
“非全尺寸”備品備件的特點
與非全尺寸備胎原理類似,“非全尺寸”備品備件特點鮮明:
(1)成本更低
與更換整套自清洗過濾器相比,焊接鐵板的法蘭盤顯然成本更低。
(2)搶修時間更短
更換自清洗過濾器法蘭盤,免除了拆卸未啟用水系統法蘭盤、鋼刷主軸的步驟,大大節省了搶修時間。
(3)占用空間更小
可以想象,對比一整套自清洗過濾器,單獨的一塊法蘭盤顯然占用空間更小。
(4)功能性下降
安裝焊死安裝孔的法蘭盤,自清洗過濾器不再具有清洗及排污功能。
“非全尺寸”備品備件管理的特點
“非全尺寸”備品備件的管理具有如下特點:
(1)備品備件采購成本更低
“非全尺寸”備品備件成本更低,且具有臨時應急搶修的作用,“全尺寸”備品備件可待“非全尺寸”備品備件使用后另行采購,降低了備品備件初期采購成本。
(2)備品備件庫空間進一步壓縮
因“非全尺寸”備品備件尺寸的優勢,數據中心在進行備品備件庫規劃時可壓縮“全尺寸”備品備件的儲存空間。
(3)備品備件應急性更加突出
因“非全尺寸”備品備件更換時間更短,應急搶修工作時效性更高。
結論
本文從一起數據中水冷系統故障搶修案例分析出發,提出了一種數據中心備品備件管理新思路,得出了以下結論:
1.“非全尺寸”備品備件的采購降低了備品備件采購成本、備品備件庫空間需求,提高了故障搶修的時效性。
2.“非全尺寸”備品備件只作為應急搶修用,搶修完成后仍需采購“全尺寸”備品備件進行更換,保證備品備件功能性的完整。
3.“非全尺寸”備品備件管理為各類型企業備品備件管理的提供了新思路。
資料免費送(點擊鏈接下載)
史上最全,數據中心機房標準及規范匯總(下載)數據中心運維管理 | 資料匯總(2017.7.2版本)? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
加入運維管理VIP群(點擊鏈接查看)
《數據中心運維管理》VIP技術交流群會員招募說明
掃描以下二維碼加入學習群
總結
以上是生活随笔為你收集整理的据中心水冷系统备品备件管理新思路的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 太赞了!华为《Linux中文手册》火了,
- 下一篇: 如何利用传感器控制数据中心能耗