《科創(chuàng)板日報》7月16日,提及內(nèi)蒙古,人們總會想起“風吹草低見牛羊”的草原牧歌畫卷。但從內(nèi)蒙古自治區(qū)首府呼和浩特中心城區(qū)向南行進20多公里,眼前不僅有青山綠水與遼闊草原,更矗立著一座加速新質生產(chǎn)力發(fā)展的新一代數(shù)智基礎設施。
作為云計算領域的國家隊,中國移動以大算力支撐大模型發(fā)展,統(tǒng)籌規(guī)劃了“N+X”智算中心布局。其中,中國移動呼和浩特數(shù)據(jù)中心(以下簡稱中心)的智算規(guī)模達6.7EFLOPS,是全球運營商最大的單體液冷智算中心,也是中國移動集團規(guī)模最大、技術最先進、保障最完備的中心節(jié)點。
日前,《科創(chuàng)板日報》記者在該數(shù)據(jù)中心進行了實地探訪,深入了解這座草原之上的智算基礎設施全貌。
全球運營商最大單體液冷智算中心
從內(nèi)蒙古自治區(qū)首府呼和浩特中心城區(qū)向南行進20多公里,便到達了和林格爾新區(qū),成片的數(shù)據(jù)中心在藍天白云下整齊排列。這里是國家“東數(shù)西算”工程八大樞紐、十大數(shù)據(jù)中心集群之一,也是國家大數(shù)據(jù)綜合試驗區(qū)的核心區(qū)。
其中,中國移動呼和浩特數(shù)據(jù)中心是全球運營商最大單體液冷智算中心,總占地面積1402畝。
剛踏入中心,撲面而來的未來感仿佛把人拉進了科幻電影。跟隨講解員,《科創(chuàng)板日報》記者沿走廊深入,抵達智算心臟——一排排機柜整齊地排列,上面閃爍著不同顏色的指示燈,宛若銀河傾瀉,維系著整座“數(shù)智宇宙”的澎湃算力。
據(jù)中國移動內(nèi)蒙古公司政企客戶部副總經(jīng)理王科峰向《科創(chuàng)板日報》記者介紹,呼和浩特數(shù)據(jù)中心2012年開工建設,2016年正式投入運營,數(shù)據(jù)中心肩負國家東數(shù)西算布局中“援京助東”的算力使命,既能滿足京津冀高實時性算力需求,也能為長三角等區(qū)域提供非實時算力支撐。
中國移動為此投入了巨量的資金支持——呼和浩特數(shù)據(jù)中心基礎設施總體投資約400億元,規(guī)模和業(yè)務承載能力均為中國移動數(shù)據(jù)中心之首。目前,園區(qū)總體規(guī)劃建筑面積約142萬㎡,已建成10棟數(shù)據(jù)機房、6棟配套用房,土地利用率約65%。
2023年以來,以ChatGPT為代表的大模型橫空出世,掀起了一股席卷全球的AI浪潮。而想要在AI浪潮中占據(jù)優(yōu)勢,就必須擁有強勁的AI算力支撐。因此,數(shù)據(jù)中心,作為AI算力的核心基礎設施,成為行業(yè)重點建設的對象。
為了提高數(shù)據(jù)中心功效,減少散熱耗能,液冷技術已成為新建數(shù)據(jù)中心的必選項,王科峰表示,中心之所以采用液冷技術,是因為當單機柜功率超過20至25千瓦時,傳統(tǒng)風冷散熱易在局部形成熱點;采用液冷技術對芯片實施精準冷卻,可有效消除熱點,并支持在機柜內(nèi)部署更多服務器。
此外,項目選址呼和浩特,源于此地得天獨厚的資源、氣候、地理優(yōu)勢。
比如,綠色低碳早已是數(shù)據(jù)中心發(fā)展趨勢所向。此前國家出臺的《數(shù)據(jù)中心綠色低碳發(fā)展專項行動計劃》提到,到2025年底,全國數(shù)據(jù)中心平均電能利用效率(PUE)降至1.5以下。
而內(nèi)蒙古新能源年發(fā)電量全國第一,風電裝機量全國第一,綠電使用成本全國最低。綠電比例高,是中國移動呼和浩特數(shù)據(jù)中心的顯著優(yōu)勢。據(jù)了解,2024年園區(qū)PUE(數(shù)據(jù)中心總能耗/IT設備能耗)為1.23,運營收入16.3億元,電量6.55億度,電費近2.4億,電費每度0.365元(含稅),2024全年綠電占比69%。
此外,王科峰介紹,這里年平均氣溫7.7℃左右,天然環(huán)境就能給數(shù)據(jù)中心自然散熱,使得用電成本大幅降低。
本土化率達85%
芯片和算力全球競爭的大背景下,倒逼國內(nèi)算力產(chǎn)業(yè)鏈加速自主化進程。
目前,中國移動已實現(xiàn)五類國產(chǎn)化智能算力芯片落地與實際應用,特別是在中國移動智算中心(呼和浩特),智算服務器整機、軟件主要由中國廠商提供,智算芯片也大量采用本土廠商產(chǎn)品。
那么,中心與哪些本土芯片廠商建立了深度合作?王科峰表示,在軟硬件設備方面,芯片國產(chǎn)化算力占比超85%,含五類本土芯片,包括天數(shù)智芯、華為昇騰、壁仞、昆侖芯等,現(xiàn)有訓練卡1.98萬張,推理卡也近萬張(NVIDIA顯卡30、40系列等)。
此外,園區(qū)現(xiàn)有算力11400P,90%的算力資源用于服務京津冀地區(qū)客戶,智算業(yè)務涵蓋訓練、推理全場景,可以提供包括異構算力、分布式存儲、網(wǎng)絡等IaaS基礎設施服務,以及基于九天大模型和第三方平臺賦能的AI開發(fā)框架和AI使能的PaaS服務,并構建了通用大模型和行業(yè)大模型的MaaS服務。
一個問題也隨之而來,如何突破生態(tài)壁壘,實現(xiàn)多元芯片的異構混訓(如“三芯混訓”)?
王科峰解釋,如果把多元算力比作一片星羅棋布的群島,過去每座“芯片島”都筑有高墻,彼此孤立,中國移動要做的,是讓不同島嶼之間架起高速航道,最終形成一片融合、流動的“算力?!?。為此,一支跨芯片、跨架構的“混訓艦隊”正日夜試航:
在多元異構算力整合方面,中國移動持續(xù)攻堅“多芯片混訓”技術,打破 GPU、NPU、CPU 等不同算力豎井式生態(tài)隔離,實現(xiàn)多元芯片的統(tǒng)一算力池化。當前,“雙芯”混訓最優(yōu)訓練效率已突破 90%;“三芯”混訓已完成首輪驗證,初步投入生產(chǎn)運行。
總體而言,中心智算業(yè)務體系以算為中心、網(wǎng)為根基、智為引擎,形成了以移動云、IT云、網(wǎng)絡云三大中心云,聯(lián)動12個盟市邊緣云,構建成多級立體泛在算力架構,并與200G/400G OTN全光底座的云專網(wǎng)、AI使能平臺深度融合,通過不斷提升算力規(guī)模和種類,構筑了云邊端立體泛在、多層次的智算體系。
算力賦能千行百業(yè)
算力筑基,創(chuàng)新加速。在呼和浩特數(shù)據(jù)中心,從政務到工業(yè),從物流優(yōu)化到能源研發(fā),算力正深度賦能千行百業(yè)。
據(jù)了解,平臺中心已落地了中國移動九天大模型(2000億參數(shù))、中國石油昆侖大模型(3000億參數(shù))、百度文心千帆邊緣推理,并完成 10 個通用大模型、3000 億參數(shù)規(guī)模的訓練任務。以及云游戲、云渲染等智算應用,并已形成了面向個人、家庭、政企三大市場提供的包括AR、VR、娛樂、智能家居、大模型訓練推理、AI平臺等智算服務。
在定制化服務能力方面,針對私有化部署需求,中心可提供一體機等多種交付形態(tài),確保模型能力快速落地。中心秉持“模型鍛造能力、推理變現(xiàn)價值”的理念,現(xiàn)已建成集團內(nèi)規(guī)模最大的智能訓練中心,面向渲染、游戲、電競、智能搜索等行業(yè)提供推理服務。
目前,已有內(nèi)蒙古省內(nèi)外黨政、金融、互聯(lián)網(wǎng)等113家行業(yè)客戶入駐園區(qū)。依托“九天”已孵化政務、醫(yī)療、工業(yè)、能源、教育等 40 余款行業(yè)大模型。下一步將在此基礎上,持續(xù)推進行業(yè)模型的深度應用與場景拓展,實現(xiàn)“賦能千行百業(yè)”。
典型落地案例包括:在客服領域,赤峰市 12345 政務服務熱線已部署客服語言大模型;中國移動 10086 人工客服系統(tǒng)亦完成大模型升級并投入運營。在能源與礦山領域,礦山大模型已在能源行業(yè)實現(xiàn)規(guī)模化應用;
《科創(chuàng)板日報》記者注意到,字節(jié)、智譜、滴滴、阿里云、北京城建、瞳感科技等大型科技企業(yè)也入駐了中心。
針對多租戶模型高效訓練問題,中國移動首創(chuàng)容器彈性資源管理KOSMOS架構,實現(xiàn)租戶間安全隔離,確保多租戶環(huán)境下的數(shù)據(jù)隱私與操作獨立性,使國產(chǎn)萬卡算力資源分鐘級拉起,并確保AI任務內(nèi)節(jié)點間的通信鏈路最優(yōu),從而大幅提升整體計算效率與資源利用率。
當前,作為數(shù)智時代生產(chǎn)力之源的算力,正定義著新的生產(chǎn)力形態(tài)和國家治理模式。有研究表明,計算力指數(shù)平均每提高1個百分點,數(shù)字經(jīng)濟和國內(nèi)生產(chǎn)總值(GDP)將分別增長3.3‰和1.8‰。
中心已經(jīng)做好了宏偉的未來規(guī)劃,王科峰介紹,結合技術演進趨勢,預計訓練與推理的算力配比將演進至約 1:10。中心將以“中心+邊緣”協(xié)同的方式,通過推理持續(xù)向產(chǎn)業(yè)鏈下游輸出 AI 能力,全面支撐人工智能在垂直行業(yè)的規(guī)模化應用。
下一步,中心正按國家 “十萬卡級科技創(chuàng)新集群”要求,儲備基礎資源與配套設施,唯大規(guī)模組網(wǎng)方案尚存挑戰(zhàn),年內(nèi)落地進度尚待明確。