數(shù)據(jù)中心經(jīng)歷了多次變革,從最早作為計算機/大型機運行環(huán)境,到互聯(lián)網(wǎng)時代作為帶寬入口,再到現(xiàn)在成為智慧星球云計算引擎。數(shù)據(jù)中心的應用需求也在不斷演變,最初關注溫濕度和動力等可用性可靠性指標,后來把數(shù)據(jù)中心進行業(yè)務分區(qū),分為業(yè)務網(wǎng)、管理網(wǎng),再到現(xiàn)在要求數(shù)據(jù)中心融合地理位置、土建、機房、服務器,形成綜合的云計算平臺。數(shù)據(jù)中心逐漸從配套的邊緣走向業(yè)務的核心,開始成為最終用戶ICT建設的關注焦點。
傳統(tǒng)數(shù)據(jù)中心建設的項目性規(guī)劃、設計、實施、驗收的方法無法滿足云計算彈性、廉價、可管控的技術要求。已有多個數(shù)據(jù)中心建成后根本滿足不了業(yè)務發(fā)展和ICT技術發(fā)展的需求,導致需要不斷重新建設;另一方面,正在建設中的數(shù)據(jù)中心的能耗、造價、工期總在不斷變動,過程難以控制;甚至,已投入運營的數(shù)據(jù)中心,由于運行狀態(tài)無法獲取,常常發(fā)生服務器要上線,卻不知要放在哪臺機架上的情況,由于對耗能、耗水、人工投入、設備可用性狀態(tài)不清晰,傳統(tǒng)數(shù)據(jù)中心運維長期處于盲目而低效的狀態(tài)。隨著數(shù)據(jù)中心走向業(yè)務核心,以土建為視角的傳統(tǒng)數(shù)據(jù)中心建設方式必須改變。
建設思想革新:計算機架構代替土建工程
領先的ICT企業(yè)都在反思數(shù)據(jù)中心建設問題,探索數(shù)據(jù)中心建設新模式。騰訊和中興通訊研究國內(nèi)外經(jīng)驗,通過集裝箱、SOHOMO等模式的嘗試和摸索,不約而同地發(fā)起了數(shù)據(jù)中心產(chǎn)品化的進程。中興通訊通過對數(shù)據(jù)中心進行生命周期和KPI管理,發(fā)展出微模塊數(shù)據(jù)中心的產(chǎn)品形態(tài)——把末端結構系統(tǒng)、制冷系統(tǒng)、配電系統(tǒng)、管控系統(tǒng)組合成為一個產(chǎn)品,并和土建、消防、水電、網(wǎng)絡形成標準接口。從計算機架構的視角出發(fā),用產(chǎn)品研發(fā)的方法和流程,通過系統(tǒng)級的組合優(yōu)化和分拆拼裝方式去做數(shù)據(jù)中心產(chǎn)品。從此數(shù)據(jù)中心建設不再是機房裝修,而可以被整體視為計算機機框(機箱、電源、風扇、CMM管理單板)的組裝。通過樣機試制和系統(tǒng)測試的方式,平衡性能和可靠性,壓縮前期工程設計的過多的冗余量;通過工廠預制和現(xiàn)場拼裝,平衡模塊化和靈活性,減少前期工程實施中在安裝和調試環(huán)節(jié)人工、材料的浪費,并增加對物理土建和服務器設備的適配靈活性。
2013年,在廣東聯(lián)通的支持下,在深圳坪山新區(qū),騰訊、中興通訊和廣東聯(lián)通共同打造了亞洲最大的微模塊數(shù)據(jù)中心,一起完成了數(shù)據(jù)中心的劃時代變革。在15000米2、12000kVA的容量下,歷時4個多月,建成可用性達到Tier3+、30%負載率PUE1.5左右,可容納85000多臺服務器和交換機單板的數(shù)據(jù)中心。
本質為去工程化、節(jié)能、智能化
坪山數(shù)據(jù)中心完全由微模塊組成,一期建設20個微模塊,二期建設40多個微模塊。整個項目從裝修進場到完工,僅花了4個多月的時間,其中二期40個微模塊從進場安裝到通過測試驗證只用了45天,充分體現(xiàn)了微模塊易復制、部署速度快的優(yōu)勢?焖俨渴鸬年P鍵在于去工程化的設計,去工程化就是要壓縮物料數(shù)量、壓縮工序、優(yōu)化作業(yè)編排、嚴格工程指導,通過這些標準化的工作,來提升效率。在系統(tǒng)測試過程中,中興通訊一位結構工程經(jīng)理在對樣機的去工程化測試報告評審中提出多個優(yōu)化的設計。比如就底座調平這一工序,采取了優(yōu)化設計后,這一工序的工期就從10個模塊6天,壓縮到了10個模塊2天,并節(jié)省了大量螺栓等工程輔材。再比如對于管控子系統(tǒng)所用的物料型號,必須在系統(tǒng)測試實驗室通過兼容性測試,這樣工程調試就不需要研發(fā)人員投入,調試的人員投入和花費時間也在大幅降低。
坪山數(shù)據(jù)中心項目集高壓直流、行級制冷、能效管理等于一體,機房微模塊分別標準化為18R模塊、12R模塊。18R模塊按照總體功率120kW,12R微模塊按照總體功率80kW計算。微模塊局部PUE1.07,30%負載率整體PUE1.5左右,90%負載率整體PUE1.4左右,創(chuàng)造了PUE在深圳地區(qū)的新低。項目聯(lián)合團隊不僅重視高負載率下的PUE,也重視低負載率下的PUE,在樣機試制和系統(tǒng)測試中,優(yōu)化行間空調的群控策略,有效降低PUE,并形成了低負載率情況下如何節(jié)能等一些實用的運維建議。
坪山數(shù)據(jù)中心項目非常重視智能化,每個模塊都有一套管控軟件iDCIM,通過集成平臺,對每個模塊和各個狀態(tài)進行統(tǒng)一展示,類似計算機的CMM管理單板。iDCIM數(shù)據(jù)中心監(jiān)控系統(tǒng)具備豐富的界面組態(tài)、多樣的報警功能、開放式協(xié)議接口、大容量的數(shù)據(jù)采集、存儲功能以及智能的數(shù)據(jù)分析技術。iDCIM的能效管理模塊對整個機架服務區(qū)用電量進行管理和記錄,同時可以通過網(wǎng)絡進行外部訪問,溫度、濕度、水浸和煙霧探測監(jiān)測都與告警系統(tǒng)整合在一起,便于集中管理和遠程監(jiān)控。
只是數(shù)據(jù)中心產(chǎn)品化的啟程
據(jù)預計到2025年,數(shù)據(jù)中心將從項目集成工程變成制造業(yè),F(xiàn)acebook在最新的OCP(OpenComputingProject,開放計算項目)公布了最新的項目實踐RDDC(RapidDeployment Data Center,快速部署數(shù)據(jù)中心),其數(shù)據(jù)中心組件已經(jīng)開始全面的模塊化和產(chǎn)品化,除了微模塊外,供配電、制冷、土建都在和整柜服務器OpenRack一樣開始產(chǎn)品化。相信騰訊和中興通訊將持續(xù)投入、縱深發(fā)力,并在標準、項目、技術預研、產(chǎn)品研制上開展廣闊的合作,共同推進數(shù)據(jù)中心產(chǎn)品化革新。