数据中心大火波及360万网站,或因UPS故障,3月10日晚法国斯特拉斯堡
導語 歐洲云計算巨頭OVH 在全球擁有 27 個數據中心,其中 15 個位于歐洲,其位于法國斯特拉斯堡的機房昨日發生嚴重火災。
法國斯特拉斯堡的機房發生嚴重火災
歐洲云計算巨頭 OVH 位于法國斯特拉斯堡的機房昨日發生嚴重火災,該區域總共有 4 個數據中心 (Strasbourg Data Center),發生起火的 SBG2 數據中心被完全燒毀,另有一個數據中心 SBG1 的建筑物部分受損,SBG3 因受到消防保護暫未受影響,以及 SBG4 確認沒有受到波及。不過出于安全起見,OVH 位于斯特拉斯堡的全部數據中心暫時關閉了服務。
OVH 在全球擁有 27 個數據中心,其中 15 個位于歐洲。昨天這場災難被認為已導致超過 350 萬個網站下線,而這一切發生在 OVH 啟動了首次公開募股 (IPO) 計劃兩天后。
Rust 旗下的游戲工作室 Facepunch Studios 證實,他們的數據已在這場大火中全部丟失,即使數據中心重新上線后,也無法恢復任何數據。
數據中心設備眾多,功率大、耗電量大;機房線纜多、布線復雜,這些都是數據中心容發生火災隱患的原因。
電氣火災串火快、煙氣有毒,危害極大。電氣絕緣老化擊穿是引起的電氣火災最常見原因,這種可通過電氣火災探測系統或及早期火災探測系統進行發現預警。而直流屏/UPS/高壓直流等配置電池組的系統設備存在蓄電池短路、熱失控等原因引起的火災,這種可通過電池監控系統對每節電池的電壓、內阻、溫度實時監控進行提早發現和預防。另外機房日常清潔管理對火災防控也至關重要,機房發生火災一定是存在嚴重管理缺陷的!
一、數據中心起火常見原因
1、UPS系統及后備蓄電池組引發火災
電池著火后,煙霧迅速蔓延整個機房(嚴格意義來說UPS電池不能和機房的設備在一起,但是很多單位因經費和空間限制而放在了一起),即使是不在一個機房,因通道連通,煙霧也會迅速占領機房。UPS電容、低壓電容老化也是設備火災的重要因素。
2、負載過大
機房內設備不能滿足用戶需求,在機房加設備輕而易舉,但是線纜的負載不是輕易改造的,這樣就造成線纜負載大,過熱引起火災。
3、空調設備引起的火災
空調設備是機房不可缺少的設備,而空調的電加熱、電加濕器又常常會引起火災。如電加熱器在風機損壞或風機關掉后,電加熱器的熱量沒及時散發出去,使周圍溫度劇烈上升而造成火災。電加濕器在水蒸發完后得不到及時補充,也會造成火災。
4、老舊設備不及時更換
特別是線纜長時間高負載運行,再不及時更換線纜,很容易使線纜絕緣層高溫熔化,短路引起火災。
5、高溫、多雷雨天氣
除了常見的電氣火災之外,在高溫、多雷雨天氣等情況下也可能引起機房起火。雷電放電時所產生的電磁效應,能產生高達數十萬伏,甚至數十萬伏的沖擊電壓,足以燒毀電力線路和設備,引發絕緣擊穿,發生短路引發火災。雷電放電時所產生的熱效應、靜電感應及電磁感應都可能引發火災。
6、火災蔓延至機房
數據中心其他位置起火蔓延至機房。另外還要注意的是,火災不一定只是在機房里引發的,它可能來自數據中心的其他區域。由于機房與其他建筑之間的距離較近,或與其他用途房間同在一幢建筑中,在其他建筑或其他用途房間起火時,火勢通過機房外部的圍護結構、門窗及通風管道蔓延至機房引起機房內火災。
二、如何防范數據中心火災
1、選用冷通道系統,提升數據中心散熱能力
為了解決企業數據中心機房設備發熱密度高,電力能耗大,機房和機柜空間不足,存在局部熱島冷熱空氣直接混合等問題,滿足數據中心的散熱需求,減少冷量的浪費,數據中心使用冷通道系統不僅能在很大程度上提升數據中心的散熱能力,而且可以充分利用機房與機柜空間。
2、防火材料的使用能減小、延緩火災的危害
針對機房外火源引起火災的情況,在設計數據中心時,要考慮墻壁和天花板的隔熱性能,使用防火材料。當火災從其他地方產生時,在一定程度上有助于減小或延緩火災的危害。
3、可靠的電力保障與高效節能的冷卻系統
電力成本占數據中心整個支出成本的50%-70%,其中一半是機器設備散熱需要的空調費。數據中心設備運行時的最佳溫度為22℃,上下浮動不能超2℃。在基準溫度情況下,溫度每升高10℃計算機的可靠性就下降25%,這就需要在選址和冷卻系統上下功夫。
4、火災偵測和預警系統
一套有效的火災偵測和預警系統也是非常必要的,所以需要在數據中心里面使用高敏感度的偵測設備。當機房出現冒第一縷煙的時候就能夠偵測到,而不是等到整個機柜都燃燒起來之后才發現。
5、建立火災應急預案
對值班人員進行火災事故演練,一旦發生火災值班人員不會慌了手腳,可以按此前演練進行操作,將損失降到最低。
6、及時配備環境監控系統
要能夠對消防信號干接點、消防主機、空調機、電路負載等進行實時監控,一有異常及時告警。及時處置,防患于未然。
? ? 此外,提高對機房可靠性、可用性、安全性等方面的認識也很重要,既要重視信息系統安全,又要重視機房的運行維護管理,重視對計算機硬件、軟件及網絡設備的維護。要樹立大局意識和憂患意識,對機房設施安全的重要性給予足夠的重視。
資料免費送(點擊鏈接下載)
史上最全,數據中心機房標準及規范匯總(下載)數據中心運維管理 | 資料匯總(2017.7.2版本)? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
加入運維管理VIP群(點擊鏈接查看)
《數據中心運維管理》VIP技術交流群會員招募說明
掃描以下二維碼加入學習群
總結
以上是生活随笔為你收集整理的数据中心大火波及360万网站,或因UPS故障,3月10日晚法国斯特拉斯堡的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何利用传感器控制数据中心能耗
- 下一篇: 如何保护数据中心免受电子腐蚀和突然故障的