《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 業(yè)界動(dòng)態(tài) > 中國移動(dòng)今年將開展GSE中試

中國移動(dòng)今年將開展GSE中試

給智算網(wǎng)絡(luò)更多選擇
2024-05-11
來源:C114通信網(wǎng)

大模型需要大算力,大算力需要大集群,大集群需要大網(wǎng)絡(luò)!

業(yè)界對(duì)此沒有疑問,但選擇什么樣的機(jī)間互聯(lián)技術(shù),卻有著不同的技術(shù)實(shí)現(xiàn)路徑。

是先入為主的InfiniBand,還是當(dāng)前呼聲很高的UEC;其實(shí),我們有更多的選擇。在近日舉行的“中國移動(dòng)算力網(wǎng)絡(luò)大會(huì)”上,中國移動(dòng)副總經(jīng)理高同慶宣布,對(duì)標(biāo)國際主流的IB和UEC方案,形成中國自主的技術(shù)體系--全調(diào)度以太網(wǎng)GSE),今年將開展GSE中試,加速GSE關(guān)鍵技術(shù)和產(chǎn)業(yè)成熟,為標(biāo)準(zhǔn)開放的新型智算互聯(lián)貢獻(xiàn)中國方案。

有了IB和UEC,我們?yōu)槭裁催€需要GSE?GSE將會(huì)給產(chǎn)業(yè)界帶來價(jià)值?從理念到技術(shù)再到產(chǎn)品和應(yīng)用的落地,GSE還需要邁過哪些門檻?

我們?yōu)槭裁葱枰狦SE

在回答這個(gè)問題之前,先讓看看算力形態(tài)的變化。業(yè)界現(xiàn)在將算力分為通算、超算與智算,其中智算作為AI能力的主要載體,到2025年可能會(huì)占據(jù)新增算力的85%左右。也就是說智算將逐漸成為AI市場主流,作為智算的載體,智算中心的重要性就不言而喻了。

智算中心與傳統(tǒng)數(shù)據(jù)中心存在很大不同,不僅體現(xiàn)在卡型、性能、功耗、算力密度等方面,主要由GPU服務(wù)器聯(lián)網(wǎng)構(gòu)成的智算中心需要完全不同的網(wǎng)絡(luò)架構(gòu)。當(dāng)大模型訓(xùn)練時(shí),并行計(jì)算節(jié)點(diǎn)越多,通信效率越重要,智算網(wǎng)絡(luò)性能成為集群算力提升的關(guān)鍵??偨Y(jié)下來,智算中心網(wǎng)絡(luò)要求很特殊,需要高帶寬、零丟包、超低時(shí)延、高可用性,月級(jí)零故障。

簡言之,我們需要新的網(wǎng)絡(luò)架構(gòu)??陀^來看,英偉達(dá)主導(dǎo)的InfiniBand因其自身特性,是當(dāng)前市場主流選擇,但I(xiàn)nfiniBand在產(chǎn)業(yè)開發(fā)性、部署成本方面非常不友好。還有很重要的一點(diǎn),在云譎波詭的地緣政治環(huán)境下,產(chǎn)品與解決方案的可持續(xù)獲得性也是個(gè)問題。

InfiniBand不行,我們可以選另外一條技術(shù)演進(jìn)路徑,從底層革新傳統(tǒng)以太網(wǎng)機(jī)制,同時(shí)又最大限度的利用以太網(wǎng)產(chǎn)業(yè)的開放性和成熟性。亂拳打死老師傅,這的確是個(gè)好主意!

從以太網(wǎng)這條技術(shù)路徑來看,主要有兩個(gè)流派。一種是采用大量的私有協(xié)議,自己做深度優(yōu)化,性能的確是很強(qiáng),國內(nèi)有些云服務(wù)商走的是這條路;一種是用開源社區(qū)思路,“眾人拾柴火焰高”,比如國內(nèi)主導(dǎo)的GSE,是美國主導(dǎo)的UEC,都是這個(gè)思路。

1.jpg

但需要強(qiáng)調(diào)的是,UEC和GSE的先后關(guān)系。很多人先入為主的認(rèn)為,我國在智算領(lǐng)域落后于美國,GSE是在拾UEC牙慧!但事實(shí)剛好與之相反。在2023年5月份,中國移動(dòng)聯(lián)合10余家中國企業(yè)率先發(fā)布全調(diào)度以太網(wǎng)技術(shù)架構(gòu)(GSE)白皮書,這標(biāo)志著GSE技術(shù)的確立。幾個(gè)月之后,包括英特爾、AMD、HPE、Arista、Broadcom、思科、Meta和微軟等主導(dǎo)成立的超級(jí)以太網(wǎng)聯(lián)盟(UEC)才成立。

GSE能夠給行業(yè)帶來什么?我覺得最重要的有兩點(diǎn):

第一,給了智算中心服務(wù)器互聯(lián)更多選擇。在云譎波詭的地緣政治環(huán)境下,可選擇性、可獲取性比性能、成本本身更為重要。況且,GSE也在快速的走向成熟,形成標(biāo)準(zhǔn)開放的技術(shù)體系!

第二,給了中國AI產(chǎn)業(yè)路徑更多選擇。在先進(jìn)算力芯片受限的前提下,我們只能通過別的方式來彌補(bǔ),“以網(wǎng)強(qiáng)算”是個(gè)必然路徑。但網(wǎng)絡(luò)芯片存在代際差距,網(wǎng)絡(luò)可能成為我國AI發(fā)展的“新卡點(diǎn)”。我們單純的從這個(gè)公式來看:集群有效算力={GPU單卡算力*總卡數(shù)*線性加速比*有效運(yùn)行時(shí)],前面這幾個(gè)變量我們都受限,更需要做好GSE這篇文章。

GSE應(yīng)該怎么去落地?

首先,我們要有自信。AI特別是AGI就是未來的方向,在這點(diǎn)上,是沒有任何疑問的。在AGI落地的技術(shù)路徑上,“以網(wǎng)強(qiáng)算”是個(gè)必然選擇。

我們有全球最好的網(wǎng)絡(luò)基礎(chǔ)設(shè)施,有全球最好的移動(dòng)通信網(wǎng)絡(luò)基礎(chǔ)設(shè)施,有全球技術(shù)最為領(lǐng)先的400G光傳送網(wǎng)。當(dāng)然,我們也完全可以有最優(yōu)的智算中心網(wǎng)絡(luò),或者智算中心機(jī)間互聯(lián)技術(shù)生態(tài)。在挑戰(zhàn)或者取代IB的這條道路上,UEC可以做到的,GSE為什么不能做到呢?

其次,產(chǎn)業(yè)鏈形成合力。孫凝暉院士說的好,國內(nèi)智能計(jì)算生態(tài)孱弱,更為嚴(yán)重的是國內(nèi)企業(yè)之間山頭林立,其實(shí)在機(jī)間互聯(lián)技術(shù)選擇上也一樣。比如在今年的云網(wǎng)智聯(lián)大會(huì)上,就有類似的聲音出來,認(rèn)為GSE是中國移動(dòng)主導(dǎo)的,是個(gè)個(gè)體行為,UEC才是主流。

從全球來看,特別是從用戶的CAPEX來看,UEC的確是遠(yuǎn)遠(yuǎn)超過GSE;但國內(nèi)企業(yè)在UEC中到底有沒有,有多少話語權(quán),這都是疑問。對(duì)于GSE而言,的確是中國移動(dòng)倡導(dǎo)成立的,但GSE發(fā)展離不開開放性,GSE推進(jìn)計(jì)劃現(xiàn)在已經(jīng)有40多家成員,既要最大限度兼容以太網(wǎng)生態(tài),更要最大限度包容產(chǎn)業(yè)生態(tài)。

還是要小步快跑。智算中心的發(fā)展和演進(jìn),和傳統(tǒng)的CT行業(yè)是不同的,標(biāo)準(zhǔn)是個(gè)很有意思的問題,是在發(fā)展中不斷地凝聚共識(shí)、優(yōu)化技術(shù)路徑;小步快跑才能形成可持續(xù)的社區(qū)繁榮生態(tài)。從GSE的發(fā)展歷程來看,也的確在朝著這個(gè)方向前行。特別是在上個(gè)月,《新型智算中心以太網(wǎng)物理層安全(PHYSec)架構(gòu)白皮書》的發(fā)布,說明了GSE產(chǎn)業(yè)鏈的努力。

最后,當(dāng)然也是最重要的,要用“誠意”和“信心”去培育、催熟產(chǎn)業(yè)鏈。所以,在今年的中國移動(dòng)算力網(wǎng)絡(luò)大會(huì)上,當(dāng)高總宣布要開展GSE“中試”時(shí),產(chǎn)業(yè)鏈還是很受鼓舞的??赡苡行┳x者對(duì)于“中試”不是很清楚,翻譯過來的意思就是“現(xiàn)網(wǎng)試商用”!這也凸顯了中國移動(dòng)在推動(dòng)民族智算和AI產(chǎn)業(yè)發(fā)展中的央企擔(dān)當(dāng)。當(dāng)然,我們也相信中國移動(dòng)具備這樣的能力,無論是從傳送網(wǎng)100G到400G的躍遷,還是從移動(dòng)網(wǎng)從3G到5G的嬗變,或亦是承載網(wǎng)從PTN到SPN的沿革,中國移動(dòng)都已經(jīng)證明了自己。GSE,我們相信同樣如此!


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。