近日,維諦(Vertiv,原艾默生網(wǎng)絡能源)主辦的“思無界·設享V來—2018設計院專家高端論壇”在北京隆重召開。論壇以“關鍵技術成就可靠與節(jié)能的完美平衡”為主題,來自權威設計院的技術大咖及維諦(Vertiv)的產品技術專家,針對數(shù)據(jù)中心的發(fā)展趨勢,從技術應用、規(guī)劃設計以及供配電、熱管理關鍵系統(tǒng)的選擇等維度呈獻了多個精彩的技術報告,并分享了維諦(Vertiv)的科技創(chuàng)新成果及大量成功實踐。
一直以來供配電系統(tǒng)作為數(shù)據(jù)中心基礎設施主要組成部分,它的高可靠、高可用性、高節(jié)能性能高可維護性在數(shù)據(jù)中心行業(yè)備受關注,因此對于數(shù)據(jù)中心供配電技術的研究也從未中斷。當前圍繞數(shù)據(jù)中心供配電技術、產品、應用和整體解決方案也逐漸向標準化、系統(tǒng)化的方向發(fā)展,選擇綠色的、經濟的、高效的、可用性高的供配電系統(tǒng)已經成為數(shù)據(jù)中心建設和運維行業(yè)的共識。
中國科學院計算所高級工程師李成章先生
對此,中國科學院計算所高級工程師李成章在《數(shù)據(jù)中心供配電系統(tǒng)的可用性分級管理》的演講中,深入探討了高性價比的數(shù)據(jù)中心供配電解決方案追求的核心價值,并指出要根據(jù)數(shù)據(jù)中心的不同用戶對可靠性、效率、成本的不同業(yè)務需求來選擇最適合的UPS產品及其對應的供配電系統(tǒng)的可用性級別和架構,從而獲得最佳的TCO。
誘發(fā)數(shù)據(jù)中心供配電系統(tǒng)故障的幾大因素
在造成數(shù)據(jù)中心癱瘓的原因中,以因供配電系統(tǒng)的產品選型和設計架構的”考慮欠妥”所誘發(fā)的電氣癱瘓的危害性最大。相關的統(tǒng)計資料顯示,它存在如下幾種典型的故障隱患:
(1)因UPS供電系統(tǒng)的產品或可用性級別的”選配欠妥”所誘發(fā)的故障占29%;
(2)因人為操作“失誤”所誘發(fā)的故障占24%(例:2017年5月,因托管機房的工程師對UPS供配系統(tǒng)的輸入開關執(zhí)行”誤關斷”操作而致使某國外航空公司的幾乎所有的IT設備進入”宕機癱瘓”的事故);
(3)因未考慮到發(fā)電機帶電容性負載的帶載能力會“變弱“以及因階躍性負載的“負載突增量過大”等原因所誘發(fā)的發(fā)電機“自動關機”的故障占10%;
(4)因氣候及自然災害所誘發(fā)的故障占12%(例:2017年12月,國外某機場因電力電纜的火災所造成的長達十余小時的大面積停電事故)。
顯而易見,能否消除掉上述的、足以對供配電系統(tǒng)的安全運行造成“致命危害”的故障隱患是能否確保該數(shù)據(jù)中心機房能長期可靠地運行的關鍵所在,以便為在后期的機房的日常運維操作過程中,能夠及時地發(fā)現(xiàn)和規(guī)避這些風險、確保它能獲得令人滿意的可用性(99.99%∽99.999%)奠定下堅實的技術基礎。根據(jù)GB50174—2017數(shù)據(jù)中心設計規(guī)范的要求,對于負責向IT/網(wǎng)絡等關鍵設備供電的供配電系統(tǒng)而言,它所允許的瞬間供電中斷時間應小于10ms。
通過對近年來發(fā)生在數(shù)據(jù)中心供配電系統(tǒng)中的多起事故的分析發(fā)現(xiàn):同工頻機UPS供配電系統(tǒng)相比,導致傳統(tǒng)高頻機UPS和模塊化UPS供配電系統(tǒng)的故障率增高的重要誘因是:因為它們的抗瞬態(tài)輸入過壓保護的能力“變差“所致。通過在用戶現(xiàn)場所捕捉到的輸入故障波形以及在所搭建的故障模擬平臺上所檢測到數(shù)據(jù)可見:因“輸入瞬態(tài)過壓”而致使傳統(tǒng)高頻機和模塊化UPS的典型故障類型有:因電池組異常放電所誘發(fā)的電池組使用壽命縮短;在UPS供配電系統(tǒng)的輸出端發(fā)生輸出閃斷或“被損環(huán)”的事故。其故障高發(fā)期是:
(a)當10KV高壓因故發(fā)生停電/閃斷事故時或位于這些UPS供電系統(tǒng)上游側的大容量ATS開關因故需執(zhí)行切換操作的瞬間。在此期間,在UPS的輸入端出現(xiàn)“輸入瞬態(tài)過壓”故障的幾率很高;
(b)為降低生產成本和充分利用廉價電能(注:夜間谷期電價僅為白天峰期電價的1/3左右),高能耗企業(yè)可能會采用夜間生產、白天停工的生產管理體制。對于地處鄰近高能耗企業(yè)的數(shù)據(jù)中心而言,極易在高能耗企業(yè)“突然抽閘”的瞬間,在它的市電輸入電網(wǎng)上誘發(fā)出”瞬態(tài)輸入高壓”。在此條件下,易發(fā)生電池組異常放電故障,從而造成電池組使用壽命縮短,增加后期運維成本。
李成章在演講中以某數(shù)據(jù)中心的供配電系統(tǒng)故障為例,指出在該數(shù)據(jù)中心的運行中,因故遇到10KV高壓電網(wǎng)發(fā)生停電幾分鐘的電力事故,導致運行僅1年多的3*300KVA高頻UPS并機系統(tǒng)發(fā)生故障:UPS并機系統(tǒng)輸出“閃斷”,并長期停留在交流旁路上。與此同時,位于同一機房中的已運行十幾年的另外兩套3*800KVA工頻機UPS并機系統(tǒng)卻一直正常地運行著。由此不難看出:此次事故就是因傳統(tǒng)高頻機UPS抗“瞬態(tài)輸入過壓”的保護能力”變差”所誘發(fā)出的故障,給該數(shù)據(jù)中心所需的應持續(xù)穩(wěn)定運行帶來負面影響。
“電池組異常放電”的故障案例:對于同時配置有工頻機UPS和傳統(tǒng)高頻機UPS的某數(shù)據(jù)中心而言,在其運行中,常發(fā)現(xiàn):對于它的4*500KVA高頻機UPS供電系統(tǒng)而言,在每天的早上的7∽8點期間,易發(fā)生”電池異常放電”現(xiàn)象。與此同時,對于位于同一10KV供電網(wǎng)下運行的4*400KVA工頻機UPS供電系統(tǒng),它卻繼續(xù)正常運行,從未發(fā)生過”電池組異常放電”的現(xiàn)象。
除此之外,李成章還舉例指出:隨著模塊化UPS內部所并聯(lián)的電源模塊的數(shù)量的不斷地增多(例:從傳統(tǒng)高頻塔式機的內置2-3個功率模塊增加到傳統(tǒng)模塊化UPS的內置10-20個電源模塊),它的“內部環(huán)流”必然會隨之而增大。由此所帶的新故障現(xiàn)象是:當用戶在因故對這種模塊化UPS執(zhí)行停電維修操作之后(例:對機柜前面板上的“通風過濾罩”執(zhí)行除塵清洗操作),再重新執(zhí)行開機操作時,易發(fā)生UPS輸出閃斷或電源模塊”被損壞”的事故。
高性價比的高頻UPS產品應具備的運行特性
由于高頻UPS電源具有效率高、體積小、重量輕以及輸入功率因數(shù)達到0.99以上、輸入電流的諧波含量小于5%、對市電電網(wǎng)的污染小等優(yōu)點而日益受到用戶的青睞。近年來,隨著UPS制備技術的進步和發(fā)展,為提高它的可維護性,高頻UPS逐步走向高智能模塊化,可通過增減UPS機柜內的小功率電源模塊數(shù)量的多少來滿足用戶對其功率輸出及可維護性的要求。這樣一來,它不僅具有極大的彈性,而且只要冗余允許還可以在線進行維護,實現(xiàn)”零維修時間”的操作功能。然而,對于部分高頻UPS的生產和開發(fā)企業(yè)來說,由于存在只重視追求更高的效率和更低的制備成本的傾向,不夠重視應采取必要的技術措施來消除傳統(tǒng)高頻機UPS和模塊化UPS因抗瞬態(tài)輸入過壓保護能力”變差”所帶來的故障率相對偏高的現(xiàn)象。
近年來,維諦(vertiv)公司遵循”不妥協(xié)的可靠性”的設計思念,通過在傳統(tǒng)高頻機UPS的整流器中增配”抗輸入過壓”保護部件的技術措施。這樣一來,在確保它能獲得”高效率”優(yōu)點的前提下,還收到能大幅度地提高UPS可靠性以及將高頻機UPS的輸入功率因數(shù)(PF)從傳統(tǒng)的電容性調控到所期望的電感性。在此基礎上,開發(fā)出創(chuàng)新型的高性價比的UPS產品。
李成章指出,高性價比的高頻機UPS應該具有效率高(≧97%)、可靠性高(具有很強的抗輸入過壓保護能力,UPS單機內部環(huán)流=0)、輸入PF呈現(xiàn)電感性、高可維護性(例:易于對機內的”老化.濾波電容”執(zhí)行現(xiàn)場的更換操作)等特點。只有具備這些特性,才能更好的保障數(shù)據(jù)中心的安全高效運行。在此背景下,不僅能為數(shù)據(jù)中心的供配電系統(tǒng)獲得令人滿意的高可用性奠定下堅實的技術基礎。而且,還有十分利于降低它的Capex和Opex。
數(shù)據(jù)中心供配電系統(tǒng)的”可用性分級管理”
確保數(shù)據(jù)中心安全無疑是整個信息系統(tǒng)安全運行的前提保障,對此,李成章表示,電癱瘓、熱癱瘓、網(wǎng)絡安全已然成為當今數(shù)據(jù)中心所面臨的三大故障隱患,如何避免及做好提前措施也成為備受關注的焦點。
同時,李成章基于全新的現(xiàn)場故障分析能力和實踐工作經驗,重點闡釋了供配電系統(tǒng)的”分級可用性”的設計與規(guī)劃。在對金融、交通,BAT及教育、商業(yè)等具有代表性用戶的業(yè)務特點、允許業(yè)務中斷的容忍度、IT系統(tǒng)及空調系統(tǒng)對供電系統(tǒng)的可用性的不同級別需求、IT/網(wǎng)絡的機柜功率密度的高低對MDC(微模塊)的設計架構的影響等進行全面分析后,李成章指出,采用“可用性分級管理”的設計理念的最終目標是:在充分滿足用戶的不同業(yè)務需求的前提下,制定和選用具有TCO最低運行特性的供配電系統(tǒng)的設計方案。
為進一步闡釋供配電系統(tǒng)分級可用性理念的重要意義,李成章以金融用戶和BAT用戶的供配電系統(tǒng)需求為例進行了說明。他表示,金融行業(yè)(集中處理)與BAT行業(yè)(分布式處理)對數(shù)據(jù)處理、存儲和分享性數(shù)據(jù)傳送的要求具有很大差異,前者要求數(shù)據(jù)應具有極高的完整性、一致性和高時效性。為此,其供配電系統(tǒng)的建設標準應采用帶物理隔離運行特性的A級標準。李成章同時指出,即使在金融行業(yè)用戶中,由于總行、省市分行及縣級支行等機構級別的不同,其供配電系統(tǒng)的可用性級別也應不相同,在建設上也有所區(qū)別。
李成章最后表示,只有“根據(jù)用戶對實際運行業(yè)務的不同需求來決定所選用的可用性級別的最適合的架構+最適合的UPS產品”才是最能恰如所需地滿足用戶需求的完美設計方案。顯然,只有這樣才能更好地為數(shù)據(jù)中心的用戶提供最具有實用價值的服務和支持。