DPU被視為僅次于CPU、GPU的第三顆大芯片,負(fù)責(zé)處理“CPU做不好,GPU做不了”的數(shù)據(jù)任務(wù),預(yù)計(jì)全球DPU市場將在2023-2024年迎來爆發(fā)式增長。
繼AI芯片后,DPU(數(shù)據(jù)處理器)成半導(dǎo)體的新熱點(diǎn)。
全球芯片巨頭英偉達(dá)、英特爾先后下場,國內(nèi)涌現(xiàn)了中科馭數(shù)、云豹智能、大禹智芯、云脈芯聯(lián)、星云智聯(lián)、邊緣智芯等一系列創(chuàng)業(yè)公司,下游云計(jì)算龍頭AWS、阿里云等廠商也早已布局······DPU行業(yè)迎來百家爭鳴時(shí)期。
12月21日,中科馭數(shù)宣布完成數(shù)億元規(guī)模A+輪融資,由麥星投資和昆侖資本聯(lián)合領(lǐng)投。這是繼7月底完成A輪融資之后,該公司今年獲得的第二筆數(shù)億元融資;5月成立的云脈芯聯(lián)10月獲得IDG、壁仞科技等企業(yè)的投資。
DPU也在攪動(dòng)著二級(jí)市場。21日,在左江科技回復(fù)投資者稱,公司自研可編程網(wǎng)絡(luò)安全處理芯片在功能定義和架構(gòu)設(shè)計(jì)上已具備DPU相關(guān)特性要求后,股價(jià)連漲三天。
在這一全新賽場上,國產(chǎn)DPU廠商有多大機(jī)會(huì)?誰能脫穎而出?
下一個(gè)黃金賽道?
在數(shù)據(jù)中心時(shí)代,CPU一家獨(dú)大的局面將一去不復(fù)返。
DPU被視為僅次于CPU、GPU的第三顆大芯片,負(fù)責(zé)處理“CPU做不好,GPU做不了”的數(shù)據(jù)任務(wù)。在英偉達(dá)等廠商的環(huán)伺下,英特爾在數(shù)據(jù)中心的市場將不斷被蠶食。
DPU的概念最早由硅谷創(chuàng)業(yè)公司Fungible提出,在英偉達(dá)收購網(wǎng)絡(luò)解決方案廠商Mellanox并重新包裝定義DPU后,這一概念一炮而紅。目前,該市場仍處于發(fā)展初期,各廠商定義有所不同。主流的DPU定義由NVIDIA提出,即DPU是集數(shù)據(jù)中心基礎(chǔ)架構(gòu)于芯片的通用處理器。
賽迪顧問發(fā)布的《2021中國DPU行業(yè)發(fā)展白皮書》將DPU方案分為三種:一是以通用眾核處理器為基礎(chǔ),以多核ARM為核心,以眾取勝,可編程靈活性較好,但是應(yīng)用針對(duì)性不夠,對(duì)于特殊算法和應(yīng)用的支持與通用CPU相比并無太顯著優(yōu)勢;二是以專用核為基礎(chǔ)的異構(gòu)核陣列,針對(duì)性較強(qiáng)、性能較好,但是犧牲了部分靈活性;第三種路線結(jié)合了前二者優(yōu)勢,即將通用處理器的可編程靈活性與專用的加速引擎相結(jié)合,正在成為最新的產(chǎn)品趨勢。
由于目前DPU的概念和技術(shù)標(biāo)準(zhǔn)并未統(tǒng)一,各家從自身優(yōu)勢出發(fā)輸出相應(yīng)的解決方案,形成百家爭鳴的競爭格局。
一方面,英偉達(dá)、英特爾、Marvell、博通等全球芯片龍頭積極布局,設(shè)立自己的標(biāo)準(zhǔn);另一方面,眾多創(chuàng)業(yè)公司加入這一藍(lán)海。與此同時(shí),包括AWS、阿里云等各大云服務(wù)廠商都在布局自己的數(shù)據(jù)處理器。
據(jù)第一財(cái)經(jīng)了解,全球最大云服務(wù)廠商AWS采用的是以Arm核為主的方案。2015年,AWS收購了Annapurna Labs,后者是為超大規(guī)模數(shù)據(jù)中心和邊緣計(jì)算設(shè)計(jì)基于Arm架構(gòu)芯片的廠商;2017年,AWS正式推出Nitro,將網(wǎng)絡(luò)、存儲(chǔ)和安全任務(wù)卸載到基于Arm架構(gòu)的專用設(shè)備上。
而阿里云提出的X-Dragon系統(tǒng)架構(gòu)核心MOC卡采用的則是FPGA+CPU的形式。有業(yè)內(nèi)人士表示,微軟早期采用的是純FPGA的方案,目前也在往FPGA+CPU方向轉(zhuǎn)。
除了自研,云廠商也通過投資等方式尋找合適的解決方案。例如,騰訊投資云豹智能,字節(jié)投資云脈芯聯(lián)。
大禹智芯CEO李爽告訴第一財(cái)經(jīng),目前DPU主流的市場方案包括以Arm核為主的架構(gòu)、FPGA+CPU架構(gòu),以及SoC架構(gòu),前兩者已經(jīng)在云計(jì)算廠商得到批量部署,整體SoC方案則是今后的趨勢,“我們自己的產(chǎn)品路線也按照這個(gè)來。FPGA+CPU的方案與第一代Arm核為主相比,接口的豐富度和處理性能要好很多,但是FPGA的功耗較大、價(jià)格較高。與此同時(shí),我們的SoC項(xiàng)目已經(jīng)啟動(dòng)。”
頭豹研究院預(yù)測,2025年全球DPU市場規(guī)模將達(dá)到135.7億美元,中國DPU市場規(guī)模將達(dá)到37.4億美元。
賽迪顧問的數(shù)據(jù)更樂觀。該機(jī)構(gòu)預(yù)計(jì),全球DPU市場將在2023-2024年迎來爆發(fā)式增長,中國早于全球市場,于2022-2023年就將迎來爆發(fā)式增長。預(yù)計(jì)到2025年,全球DPU產(chǎn)業(yè)市場規(guī)模將超過245.3億美元,中國DPU產(chǎn)業(yè)市場規(guī)模將超過565.9億元。
有業(yè)內(nèi)人士認(rèn)為,DPU數(shù)量會(huì)和服務(wù)器數(shù)量一個(gè)級(jí)別,每臺(tái)服務(wù)器都需要1個(gè)甚至多個(gè)DPU產(chǎn)品。
DPU的產(chǎn)生源自應(yīng)用驅(qū)動(dòng)。摩爾定律放緩使得通用CPU性能增長的邊際成本迅速上升。中科馭數(shù)CEO鄢貴海表示,2010年前,網(wǎng)絡(luò)的帶寬年化增長大約30%,近年達(dá)到45%;而CPU的性能增長從10年前的23%,到近年降低至3%。當(dāng)網(wǎng)絡(luò)帶寬增速和CPU性能增速的比例達(dá)到10倍的情形下,CPU幾乎已經(jīng)無法直接應(yīng)對(duì)網(wǎng)絡(luò)帶寬的增速。
“這個(gè)時(shí)代的核心變化是CPU性能增加趕不上數(shù)據(jù)產(chǎn)生的速度。2018年前,我如果買一個(gè)24核的CPU,有2個(gè)核處理流量,還有22個(gè)核可以處理上層應(yīng)用;2018年后流量快速增加,需要16核處理流量,處理其他任務(wù)的只有8個(gè)核,幾乎2/3就廢掉了?!边吘壷切臼紫軜?gòu)師李甫告訴第一財(cái)經(jīng)。
在大型數(shù)據(jù)中心,流量處理占了計(jì)算30%的資源,AWS將這些還未運(yùn)行業(yè)務(wù)程序,先接入網(wǎng)絡(luò)數(shù)據(jù)就要占去的計(jì)算資源稱為“數(shù)據(jù)中心稅(Datacenter Tax)”。
DPU最直接的作用是作為CPU的卸載引擎,接管網(wǎng)絡(luò)虛擬化、硬件資源池化等基礎(chǔ)設(shè)施層服務(wù),從而釋放寶貴的CPU資源來運(yùn)行上層應(yīng)用,實(shí)現(xiàn)了以數(shù)據(jù)為中心的業(yè)務(wù)和基礎(chǔ)設(shè)施操作的分離。
芯片巨頭爭霸
2020年10月,在收購Mellanox后,英偉達(dá)發(fā)布了首款DPU產(chǎn)品——BlueField2系列。英偉達(dá)創(chuàng)始人兼CEO黃仁勛表示:“現(xiàn)代超大規(guī)模云正在推動(dòng)數(shù)據(jù)中心的新架構(gòu)。需要一種旨在處理數(shù)據(jù)中心基礎(chǔ)設(shè)施軟件的新型處理器來卸載和加速虛擬化、網(wǎng)絡(luò)、存儲(chǔ)、安全和其它云原生AI服務(wù)的巨大計(jì)算負(fù)載。BlueField DPU的時(shí)代已經(jīng)到來?!?/p>
英偉達(dá)規(guī)劃了多代產(chǎn)品,計(jì)劃在2022年推出性能更強(qiáng)的BlueField3,2024年推出集成其GPU模塊的BlueField4。
從戰(zhàn)略上,英偉達(dá)收購Mellanox推出DPU,并試圖收購Arm,加上其傳統(tǒng)強(qiáng)項(xiàng)GPU,將侵蝕英特爾的市場份額,直接威脅后者在數(shù)據(jù)中心的霸主地位。
股市上的表現(xiàn)更加直接。2020年7月,英偉達(dá)市值超過英特爾,成為全球第三大半導(dǎo)體企業(yè);一年多后的今天,英偉達(dá)成為全球市值最高的半導(dǎo)體企業(yè)。截至北京時(shí)間12月28日,英偉達(dá)市值7736億美元,幾乎是英特爾(市值2112億美元)的4倍。
不過,英偉達(dá)是否能成功復(fù)制GPU的成功仍有待觀察。多位業(yè)內(nèi)人士告訴第一財(cái)經(jīng),此前Mellanox產(chǎn)品在云服務(wù)廠商的認(rèn)可度并不高,“它的劣勢是它確實(shí)不太懂(云),包括客戶對(duì)它產(chǎn)品的測試和設(shè)計(jì)都有吐槽。在Mellanox尚未被收購前,我們有測過很多功能,一些功能的改變也是我們提的?!?/p>
不少人認(rèn)為,英偉達(dá)對(duì)DPU市場的教育和推動(dòng)概念的作用要大于其產(chǎn)品的實(shí)際應(yīng)用。
在英偉達(dá)的步步緊逼下,英特爾自然也不甘落后。2021年6月,英特爾發(fā)布了IPU(Infrastructure Processing Unit,基礎(chǔ)設(shè)施處理器),對(duì)標(biāo)英偉達(dá)的DPU,并推出了基于FPGA和ASIC的兩種方案。
Guido Appenzeller介紹稱,在美國和中國,六大云服務(wù)廠商目前使用基于FPGA的IPU?!半S著帶寬變高,我們看到他們緩慢地轉(zhuǎn)向?qū)S肁SIC IPU。因?yàn)榇嬖诤芏鄬@麉f(xié)議,所以不會(huì)發(fā)生快速轉(zhuǎn)變?!?/p>
通過使用IPU,可以從服務(wù)器卸載與運(yùn)行基礎(chǔ)設(shè)施任務(wù)相關(guān)的開銷。云服務(wù)廠商的軟件在IPU本身上運(yùn)行,而租戶的應(yīng)用程序在服務(wù)器CPU上運(yùn)行。這不僅釋放了服務(wù)器上的資源,同時(shí)優(yōu)化了整體性能,而且為云廠商提供了一個(gè)單獨(dú)且安全的控制點(diǎn)。
值得一提的是,ASIC版本IPU采用的CPU核是ARM架構(gòu),而非英特爾自身的X86架構(gòu),這意味著英特爾的話語權(quán)正在減弱,為了迎合客戶需求選用了競爭對(duì)手的架構(gòu)。
第一財(cái)經(jīng)了解到,英特爾ASIC版本IPU主要與谷歌合作,谷歌提出相應(yīng)需求,英特爾為其“定制”。
李甫認(rèn)為,IPU側(cè)重多個(gè)CPU的管理,努力融合IaaS模塊,降低集群管理成本,更多像是一個(gè)協(xié)處理器?!邦愃圃贑PU中的大小核,變成了雙路服務(wù)器中的雙路大小CPU架構(gòu)。為了應(yīng)對(duì)不同客戶需求,英特爾可能會(huì)采用FPGA +小CPU +大CPU的超異構(gòu)計(jì)算模型,復(fù)雜化DPU/IPU市場。我們推出基于PCIe Switch總線交換技術(shù)的XPU芯片,正是為了這種超異構(gòu)計(jì)算架構(gòu)準(zhǔn)備的通用數(shù)據(jù)分發(fā)芯片。”
除此之外,賽靈思、Marvell、博通等老牌芯片廠商也都在推出針對(duì)數(shù)據(jù)中心的解決方案。
國內(nèi)創(chuàng)業(yè)公司遍地開花
國內(nèi)初創(chuàng)企業(yè)也陸續(xù)推出相應(yīng)的解決方案。中科馭數(shù)自主研發(fā)KPU芯片架構(gòu),落地于金融計(jì)算、數(shù)據(jù)中心、云原生、5G邊緣計(jì)算等場景。該公司正在研發(fā)的第二代DPU芯片K2已經(jīng)完成設(shè)計(jì)和驗(yàn)證工作,預(yù)計(jì)將于2022年第一季度投產(chǎn)流片。
12月4日,大禹智芯第一代DPU產(chǎn)品Paratus V1.0正式亮相。根據(jù)該公司規(guī)劃,2021年,大禹智芯完成第一代產(chǎn)品的研發(fā)、客戶測試和商業(yè)化交付;2021年年底,第二代產(chǎn)品即將成功研發(fā),并實(shí)現(xiàn)對(duì)應(yīng)商業(yè)合同的簽署;2021年年底,大禹智芯啟動(dòng)自有芯片(SoC方案)的研發(fā)。
12月15日,云豹智能發(fā)布全功能云霄DPU網(wǎng)卡,全面支持裸金屬、虛擬機(jī)和容器服務(wù)資源一體化和性能加速,主要基于FPGA方案。據(jù)悉,下一代軟件定義DPU芯片也正在按計(jì)劃研發(fā)中。
專注PCIe技術(shù)棧的邊緣智芯則提供了另一種視角,數(shù)據(jù)從網(wǎng)卡進(jìn)入其設(shè)計(jì)的XPU后,分發(fā)給CPU、GPU、SSD。按其架構(gòu),在XPU為中心的架構(gòu)中,網(wǎng)卡無需智能,只需要提供基本的網(wǎng)絡(luò)協(xié)議功能即可,適用于低成本、低延遲的應(yīng)用場景。
與CPU和GPU不同,DPU目前在技術(shù)標(biāo)準(zhǔn)和生態(tài)方面都處于早期階段,并未出現(xiàn)絕對(duì)的領(lǐng)先者。接受采訪的多位業(yè)內(nèi)人士認(rèn)為,中國具備豐富的數(shù)據(jù)資產(chǎn),有強(qiáng)大的互聯(lián)網(wǎng)產(chǎn)業(yè),在這一賽道中,中國芯片廠商或許有望脫穎而出。