據新華社電,近期暴雨侵襲全國,21個省份遭遇洪澇災害,已致33人死亡、14人失蹤。昨日6時,河北省氣象台繼續發布暴雨藍色預警,預計承德中南部、唐山、秦皇島、廊坊等多地區有大雨,局部有暴雨,為防止城市內澇、中小河流洪水和山洪地質災害,提醒相關部門及廣大群眾做好防御工作。顯然,進入盛夏極端多變性的天氣,已向人們拉響了預警。
面對多變性天氣,企業IT機房和數據中心同樣面臨管理、安全等多方面考驗。而隨著信息化技術迅猛發展,中國已經成為全球數據中心。4月17日,亞馬遜Cloud Drive雲存儲河北廊坊數據中心提前完工,該項目總投資98億元,將為亞馬遜購物網站提供數據存儲和雲計算服務;6月6日,戴爾宣布其在成都的全球運營基地正式投產,占地面積達3萬平方米,總產能可達每年700萬台(戴爾台式機產品),助力戴爾為本地和歐洲及美國等海外客戶提供產品和服務,而如此龐大的生產流程,背後的英雄卻是數據中心。
IT機房和數據中心對企業業務發展尤為重要,由於國內氣候環境的多變性,為IT運維管理帶來了巨大挑戰。夏季機房,IT經理不僅要解決機房溫度濕度、保障服務器設備穩定運行及確保數據安全等問題,還要承受降低企業總體擁有成本的壓力。
我們知道大多數機房都建有制冷系統,來保證內部溫度在22℃的安全線以內。但是,夏季持續性高溫會多引發系統、硬件異常工作,甚至是癱瘓罷工,且機房和數據中心的內部溫度比平均水平每升高10度,數據中心“融化”的風險就會提高5%。如何確保機房或數據中心在高溫多雨天氣下安全、穩定的運維,成為眾多IT經理當下迫切希望解決的問題。
作為企業的CIO或IT管理者如何解決這些“熱”煩惱、“雨”擔憂,不妨從以下幾方面著手做起。
強化數據中心制冷系統
數據中心,支撐整個企業IT系統正常運轉的後台架構,其包含計算、存儲、網絡等多種高性能、高密度硬件設備。如服務器、存儲設備在作為動力源同時也成為熱源的生產者,再加之夏季溫度一再攀升,IT經理不得不采取措施,強化制冷系統,確保內部溫度在安全線以內。
第一,結合企業自身數據中心架構布局,建設可隨負荷變化的管理制冷系統。在滿負載工作情況下,可提供足夠的冷量和風量;不滿負荷情況下,制冷系統可提供恰當的風量,在保證精確調節同時,也能更好的綠色節能,節約成本。
第二,根據數據中心不同密度區域,采用不同的制冷形式。例如,可在刀片服務器高密度區域采用水冷機櫃等。
第三,可選用氣流送風技術,但要做到非常均勻的送風,實際操作則具有一定難度,在此不建議中小企業采用。
小結:數據中心制冷系統強化,需CIO依據內部設施布局進行慎重建設。
選擇合適的服務器設備
除了通過強化數據中心制冷系統外,從硬件基礎設施出發同樣能做到節能降耗、平台正常運轉功效。面對極端環境或特殊應用的需求,設備生產商精益求精,針對高溫環境推出耐高溫服務器或自帶降溫技術設備的整體解決方案,例如戴爾PowerEdge服務器就可在-5℃到45℃之間正常運行。
戴爾為了確保企業數據中心的服務器、存儲等設備能夠在高溫環境正常運行,降低額外的維護和基礎設施成本,在研制耐高溫服務器同時,為企業數據中心打造新風冷卻解決方案。借助該解決方案組合不僅具備高散熱能力和可靠性等優勢,還使得方案中的服務器、存儲和網絡設備允許在更高溫度條件下安全、穩定的運行,避免因高溫宕機“罷工”現象。
小結:IT機房或數據中心擁有良好的服務器、存儲設備不僅能降低IT故障率,更重要的是降低了企業TCO。
建立設備實時監控機制
企業IT機房設備(服務器、存儲、交換機等)絕大部分是24×7小時運行,面對高溫、多雨季節,企業應建立設備實時監控機制。監控機制包括兩部分:員工實時檢查和網絡實時監測。
企業部署相關員工對服務器設備運行數據進行按日分析,並整理出服務器工作日志,以便第一時間處理異常現象;同時對服務器機房進行按日檢查,避免人為諸如機房亂堆放雜物、有灰塵等情況干擾服務器正常運行。另一方面,企業選擇一套服務器監控解決方案,對服務器進行實時監控,一旦出現宕機、存儲硬盤受損及時發出警報,第一時間安排相關技術人員進行整修。
服務器、存儲提供商在保障產品品質外,還會為其定制或添加多功能工具和軟件,以應對企業多方面需求。而戴爾作為中國服務器第一大提供商,在產品日常維護方面更是行業第一。戴爾12G服務器內置硬件診斷工具Diagnostics,且無需依賴操作系統,若診斷出硬件不能正常工作,會自動發出警報;同時,戴爾為用戶提供OpenMange Essentials系統管理軟件,提供免代理監控服務。
除戴爾服務器外,IBM、HP、華為等服務器均有類似診斷工具或管理軟件。
小結:人無遠慮,必有近憂。企業亦如此,單純依靠人工進行設備實時監控,必將投入大量人力物力。因此,選擇成套的服務器監控解決方案才是最佳監控措施。
制定災難備份修復方案
夏季機房突發情況有許多,諸如機房斷電、服務器宕機、存儲硬盤損壞等等,為保證機房正常運行,防患於未然,企業在夏季做好相應的災備措施具有重大意義。
既然設備故障問題(服務器宕機等)不可避免, IT經理就需在購買設備時與相關IT專家進行討論,分析企業可能會出現故障的情況,並將這些情況分析結果形成意見,制定一套災備修復方案,以減少因故障而帶來的損失。具體方案有:
加強設備維護檢查,制定設備在夏季運行方案;儲備或協調後備應急水源及燃料,保證在斷電、斷水情況發生時有足夠的備用資源;以主動措施應對被動狀況,例如儲備應急冰塊、購置通風用軸流風機、水噴淋措施等。
小結:做好災備修復方案對企業來講至關重要,不僅保證了平台正常運行,還進一步確保了數據的安全性。
做好防水、防雷安全措施
IT機房或數據中心做好上述幾點就萬無一失了嗎?答案顯然是否定的,企業機房還需做好防水、防雷等安全措施。
機房內擺放著大量的精密、貴重計算機及網絡設備,其均具備高密度、高速度、低電壓和低功耗等特性,不僅怕水,還對各種諸如雷電過電壓、電力系統操作過電壓、靜電放電、電磁輻射等電磁干擾非常敏感。如果防護措施不力,企業隨時可能遭受重大損失。
夏季多雨,機房更應防止漏水事故發生。IT經理可直接通過降低機房空調供水管道的壓強來解決漏水隱患。通過對機房專用空調加濕器的供水系統的分析,專家認為機房專用空調加濕罐補水時並不需要過高的供水壓力,相反降低了機房空調供水管道的壓強,可使供水管道中的閥門、接頭、彎頭、管壁所承受的壓力降低,安全系數提高,有利於機房空調安全供水的實現。
有雨必有雷。為了保護建築物和建築物內各項電子網絡設備不受雷電損害或使雷擊損害降低到最低程度,應從整體防雷的角度來進行防雷措施的設計。IT機房主要應從UPS電源系統防雷保護、通訊系統的防雷與過電壓保護及防雷器的安裝與接線著手做起。
小結:盡管IT機房在建設之初已經做過防水、防雷、防震等突發災難措施,但在夏季多雨時節,仍需做好檢查和防御措施,防患於未然。
隨著大數據崛起、雲計算漸成企業寵兒,各類計算越來越依賴數據中心;業務的多樣化,也對IT機房的設備管理、運維以及安全等多方面提出了更高要求。面對故障多發期,夏季對機房和數據中心來講均是一個嚴峻的考驗。因此,IT經理做好夏季機房故障防御措施十分重要。
寫在最後
面對夏季對機房多方面影響,IT經理除了采取一定有效措施防御故障發生外,更希望在保證平台正常運維下降低企業TCO,來提升整體能效。據DataCenterUsersGroup調查顯示,數據中心能效已迅速成為業界優先考慮事項。絕大多數受調查者認為,數據中心在制冷設備(49%)、服務器(46%)、電源設備(39%)和存儲設備(21%)等方面存在巨大的能效改善機會。由此可見,企業迫切降低投入、運維等成本。而最直接、最有效做到這一點的方案就是,企業在為機房采購設備時,從一開始就選擇具備低能耗、耐高溫等特性設備或成套解決方案,不僅可以有效減少故障率,亦能夠降低企業整體擁有成本。