不同于看不見的云計算,數(shù)據(jù)中心作為背后支撐云與AI大模型訓(xùn)練的底層基礎(chǔ)設(shè)施,是一項重資產(chǎn)投入,其生命周期往往是按十年量級來衡量的。這也意味著一旦提前布局不當,或者跟不上當下應(yīng)用市場的需求,對于建設(shè)方而言,不敢求回報,就連投資成本和后續(xù)的運營成本都可能無法收回。從運營商到獨立的第三方IDC廠商,以及互聯(lián)網(wǎng)/ICT企業(yè)在內(nèi),作為數(shù)據(jù)中心的主要參與者,都曾并正在經(jīng)歷類似問題。
盡管因近些年受政策和市場需求(包括技術(shù)門檻的進一步降低)等多方面因素影響而時有波動,但國內(nèi)數(shù)據(jù)中心的建設(shè)熱情不減。需求端,算力尤其是AI算力缺口依然很大,但Scale out芯片互聯(lián)等技術(shù)方案帶來的算力利用率不高也是事實。因而數(shù)據(jù)中心建設(shè)想要盡可能跟上企業(yè)客戶的算力需求,不僅要見效快,還能靈活可擴容。
政策端,其底色一直是朝著綠色低碳發(fā)展。早在2016年印發(fā)的《“十三五”國家信息化規(guī)劃》就提出,增加IT項目投資及逐步控制新建數(shù)據(jù)中心的PUE值(2018年不高于1.5,2020年不高于1.4)。2021年至今,北京、廣州等多地都相繼出臺了數(shù)據(jù)中心能耗保障的相關(guān)要求??傮w上,對數(shù)據(jù)中心的PUE等能耗指標的考核不斷嚴格。
同時,全國多地政策鼓勵數(shù)據(jù)中心建設(shè)采用預(yù)制模塊化等裝配式建筑。一些國家級的綠色數(shù)據(jù)中心已經(jīng)在積極采用液冷、高壓直流等高效冷卻技術(shù)產(chǎn)品、智能化運維管理技術(shù)及模塊化系統(tǒng)解決方案等。
因此,建設(shè)者們一直在推動數(shù)據(jù)中心預(yù)制化的解決方案,這也符合數(shù)據(jù)中心預(yù)制化、模塊化的趨勢。只不過,隨著時代的變遷,預(yù)制化數(shù)據(jù)中心從通用算力+風冷散熱方案為主體的上一代,開始逐漸轉(zhuǎn)變到AI算力等多元算力+液冷散熱方案為主體的AIDC模式。
鈦媒體近日跟隨浪潮信息走進了其位于濟南的元腦“算力工廠”。該智算中心是浪潮信息預(yù)制化AIDC解決方案的新樣板,支撐著在全球服務(wù)器大規(guī)模測試、客戶POC測試、大模型開發(fā)與應(yīng)用、智能化轉(zhuǎn)型等業(yè)務(wù)場景的算力需求。
預(yù)制化數(shù)據(jù)中心,即將設(shè)備模塊在工廠就預(yù)先集成到集裝箱中,并完成測試。到達現(xiàn)場后,這些集裝箱就像“樂高”一樣被快速組裝起來,形成一個完整的數(shù)據(jù)中心。其優(yōu)勢在于,與土建解耦,不受現(xiàn)場條件限制,所有機電設(shè)備在工廠預(yù)集成、預(yù)測試,接入市電、網(wǎng)絡(luò)和水源即可獨立運行,預(yù)制裝配率高,且集成工作與現(xiàn)場土建工作并行,縮短建設(shè)工期。
同時,根據(jù)功能的不同,集裝箱可被分為IT、電力、集成冷站、集成冷源、辦公、走廊、電梯、樓梯等八種功能箱體,可根據(jù)不同場景、規(guī)模靈活組合,并按照功率區(qū)段分區(qū)部署,匹配不同算力應(yīng)用場景。對于客戶而言,初期根據(jù)資金水平和算力需求按需部署,后期可根據(jù)算力設(shè)備,匹配數(shù)據(jù)中心模式在線柔性升級擴容。在支持水平擴容的同時,可實現(xiàn)豎向按需擴容,最高可擴容至5層。
此外,當前數(shù)據(jù)中心建設(shè)必須將綠色節(jié)能考慮在內(nèi)。過去十年,CPU熱設(shè)計功率(TDP)幾乎翻了一番,而GPU熱設(shè)計功耗已從2008年的不足200W到目前的1000W,單機柜功率密度已從5kW攀升至100kW以上。但Scale Up所帶來的部署密度提升是實現(xiàn)Scale Out規(guī)模持續(xù)擴張的前提和基礎(chǔ),而液冷、智能溫控等先進制冷技術(shù)則會解決Scale Up引發(fā)的散熱問題,這意味著,占地大、能耗高的數(shù)百兆瓦數(shù)據(jù)中心會進一步壓縮到更加緊湊、更加節(jié)能。
元腦算力工廠正是基于這一思路展開。
當前一期建設(shè)規(guī)模上,已實現(xiàn)119臺集裝箱,419個機柜的一層部署,總?cè)萘窟_到10MW,使用年限可達50年。
從規(guī)劃到集裝箱工廠生產(chǎn)預(yù)制、地基建設(shè)、吊裝、調(diào)試等,總共耗時9個月完成交付,刨去前期規(guī)劃時間,實際建成投運僅用時120天。
鈦媒體注意到,在選擇用集裝箱投資建設(shè)之初,浪潮信息內(nèi)部就做了深入的論證和預(yù)想。
“其實在國內(nèi),10MW以上規(guī)模的智算中心并不多。這意味著采用集裝箱結(jié)構(gòu)一旦上了規(guī)模,幾百個進行組裝實現(xiàn)互聯(lián)互通,對技術(shù)要求是非常高的。同時,和樓宇建設(shè)相比,集裝箱式不僅可以短時間內(nèi)構(gòu)建這樣一個大規(guī)模集群,同時也可以為未來基建節(jié)省更多的投資。我們認為預(yù)制化是最能滿足AI時代算力快速部署的需求。”浪潮信息服務(wù)器產(chǎn)品線副總經(jīng)理李金波指出。
除了在基建層面實現(xiàn)預(yù)制化外,元腦算力工廠全面遵循了“高密+綠色”的未來智算中心設(shè)計理念,算力節(jié)點大量使用高密智算算力倉,將風冷機柜的負載上限提升至50kW,液冷機柜的負載上限高達130kW。
為解決高密度部署帶來的散熱和能耗問題,浪潮信息還將液冷、光伏、儲能、余熱回收等多種技術(shù)結(jié)合,并采用智能管理平臺實現(xiàn)IT和機房設(shè)備的控制聯(lián)動,PUE可降至1.1以下。
如光伏發(fā)電技術(shù)將太陽能轉(zhuǎn)換為電能,為智算中心提供清潔的電力來源;儲能技術(shù)則允許智算中心在電力需求低時儲存能量,并在高峰時段使用儲存的能量,平衡電網(wǎng)負荷并提高能源利用效率;集成冷站采用變頻冷機,冬季和過渡季節(jié)實現(xiàn)自然冷卻,15℃/21℃中溫冷水制冷,整機能效比≥5.5;結(jié)合余熱利用技術(shù),冬季可覆蓋辦公區(qū)供暖。
另外,集裝箱采用了預(yù)制化鋼結(jié)構(gòu)建筑,材料回收率超80%,施工現(xiàn)場無粉塵噪音,建筑垃圾少,進一步實現(xiàn)綠色環(huán)保。
從成效上看,可總結(jié)為三點:一是“快”,將同等規(guī)模智算中心的建設(shè)周期從18個月縮減至4個月,工期縮短了近80%;二是“彈性可擴容”,可根據(jù)業(yè)務(wù)規(guī)模分期高效進行水平及豎向擴容,有效節(jié)省前期投入成本;三是“綠色節(jié)能”,全年節(jié)省電費近2億元,大幅降低運營成本。據(jù)測算,4個集裝箱、千卡規(guī)模算力,每年可節(jié)省電費400萬元。
如今,面對復(fù)雜多變的市場需求和客戶挑戰(zhàn),如何快速構(gòu)建綠色高效智算中心,成為了眾多企業(yè)客戶共同面臨的難題。預(yù)制化智算中心的優(yōu)勢在于其能夠大幅縮短交付周期。
但追求預(yù)制化的智算中心也同樣遵循“沒有最好的,只有最適合的方案”,每個客戶的業(yè)務(wù)場景、地理環(huán)境、能源政策等因素都各不相同。比如AIO(All-in-One)一體式、臨建級(十個集裝箱以內(nèi))、建筑級(永久性)三種預(yù)制化AIDC建設(shè)形式,適用于不同客戶訴求。對于算力基礎(chǔ)設(shè)施廠商而言,只有深入了解客戶需求,才能為其真正符合其實際需求的解決方案。
圖片來源@《2024算力工廠建設(shè)指南白皮書》
鈦媒體注意到,此前也有不少算力基礎(chǔ)設(shè)施廠商推出過預(yù)制化解決方案。在國內(nèi),也有不少結(jié)合了預(yù)制化模塊化思路的數(shù)據(jù)中心建設(shè)成果。例如,阿里云于2016年2016年投產(chǎn)的張北數(shù)據(jù)中心一號、二號園區(qū),由于該地區(qū)冬季氣溫低達-38°C,長達半年不能施工,同樣借鑒了預(yù)制化的解決方案。
結(jié)合浪潮信息的實踐經(jīng)驗來看,其解決方案已在互聯(lián)網(wǎng)、金融、能源、教科研、汽車等行業(yè)落地,但更多是AIO或者臨建式的預(yù)制化模式。也就是說,只需要數(shù)十個機柜,或者十個集裝箱以內(nèi)的多箱拼接就可滿足需求,甚至不用地基。
“以高校為例,有時會有一些偶發(fā)性算力需求,比如受制于科研經(jīng)費、場地空間等因素,智算中心規(guī)模較小,采用兩三個集裝箱即可拼接建成,使用十幾年達到生命周期報廢后,對高校在場地和投入上也不會有太大影響。再比如,在海外,考慮到初期建設(shè)成本問題,企業(yè)為快速上線應(yīng)用,也可以采用這種方案。”李金波表示。
那么預(yù)制化AIDC是否短期內(nèi)仍局限于一些特殊場景:比如自然條件苛刻的地區(qū),傳統(tǒng)數(shù)據(jù)中心難以快速鋪開的海外市場,或者是偶發(fā)性的客戶算力需求?
國際咨詢機構(gòu)ResearchAndMarkets近日發(fā)布的報告中指出,模塊化數(shù)據(jù)中心(modular data center)市場預(yù)計將從2024年的299.3億美元增長到2030年的794.9億美元,預(yù)測期內(nèi)的復(fù)合年增長率(CAGR)為17.7%。其中,模塊化電源和冷卻系統(tǒng)、預(yù)制IT模塊和增強的自動化等關(guān)鍵進步,都在改變數(shù)據(jù)中心的設(shè)計和部署方式。
報告還指出,小型數(shù)據(jù)中心是模塊化數(shù)據(jù)中心市場的一個重要細分市場,旨在滿足客戶對本地化計算能力日益增長的需求,同時優(yōu)化空間和能源使用。一個關(guān)鍵優(yōu)勢是其靠近最終用戶,從而減少延遲并提高邊緣計算等應(yīng)用的性能,同時配備先進的冷卻解決方案,可提高能源效率并降低運營成本。
浪潮信息人工智能與高性能產(chǎn)品線副總經(jīng)理張強認為,未來落地像云腦算力工廠一樣的大規(guī)模預(yù)制化智算中心,是與液冷部署的規(guī)模相匹配的。
他進一步告訴鈦媒體,“盡管這兩年液冷開始不斷被提及,但實際與風冷相比,其部署量還是比較低的比例。我們看到從2024年開始,AI服務(wù)器高功耗導(dǎo)致的對液冷部署的強烈需求,到2025年可能就是液冷上量的關(guān)鍵時期。這意味著原有的一批數(shù)據(jù)中心可能沒辦法適應(yīng)新的算力場景了。”
追溯預(yù)制化的發(fā)展歷程,也能夠發(fā)現(xiàn)隨著裝配式建筑技術(shù)與模塊化數(shù)據(jù)中心融合程度的加深,預(yù)制化數(shù)據(jù)中心呈現(xiàn)主體結(jié)構(gòu)建筑化、空間及內(nèi)外使用體驗樓宇化、功能區(qū)域標準化等趨勢,以適應(yīng)高層級、多樓層、大規(guī)模集群的應(yīng)用。這從此次走訪元腦算力工廠的實體空間就能感知一二。預(yù)制化智算中心正走向建筑級應(yīng)用。
不等AI需求來了才開始布局,而是在可以預(yù)見的未來,還要領(lǐng)先市場半步。(本文首發(fā)于鈦媒體APP,作者 | 楊麗,編輯 | 蓋虹達)
快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論
綠色節(jié)能是大趨勢,智算中心的液冷技術(shù)很關(guān)鍵。
浪潮信息的預(yù)制化方案很實用,適合多種場景。
這種快速交付的智算中心,未來肯定大有可為!
預(yù)制化智算中心效率真高,120天建成太厲害了!