前言:
最近幾年,隨著系統(tǒng)中的CPU承受越來越多的網(wǎng)絡(luò)和存儲(chǔ)工作負(fù)載,DPU已成為以數(shù)據(jù)為中心的加速計(jì)算模型的第三個(gè)成員。
那么,DPU能否真正承擔(dān)起與CPU、GPU一樣的計(jì)算重要性,實(shí)現(xiàn)數(shù)據(jù)中心的一次巨大革新?其創(chuàng)新點(diǎn)到底在哪里?這些仍然是我們要去回顧和考察的問題。
DPU將成未來計(jì)算支柱之一
DPU,是Data Processing Unit的縮寫,也就是所謂的數(shù)據(jù)處理單元。
DPU的主要作用就在于替代了數(shù)據(jù)中心原本用來處理分布式存儲(chǔ)和網(wǎng)絡(luò)通信的CPU處理器資源。
目前服務(wù)器要處理的資料日益增多,除了原有的加解密、封包壓縮外,加速器也讓服務(wù)器要處理的資料量變得更龐大,就會(huì)造成原有CPU在處理安全能力表現(xiàn)上出現(xiàn)瓶頸。
如果有了DPU的出現(xiàn),就可以先在DPU將大量的信息先做消化,接著再傳遞給CPU做其他的分配,如此一來能減少CPU約30%的消耗。
在DPU之前,智能網(wǎng)卡(SmartNIC)正在網(wǎng)絡(luò)安全和網(wǎng)絡(luò)互連協(xié)議方面逐漸取代CPU。
而現(xiàn)在DPU的出現(xiàn),相當(dāng)于是智能網(wǎng)卡的升級(jí)替代版本。
一方面增強(qiáng)了智能網(wǎng)卡對(duì)網(wǎng)絡(luò)安全和網(wǎng)絡(luò)協(xié)議的處理能力;
一方面又整合和加強(qiáng)了分布式存儲(chǔ)的處理能力。
從而在這兩個(gè)領(lǐng)域更好地替代CPU,從而釋放CPU的算力給到其他更多應(yīng)用。
所有的這些DPU功能對(duì)于實(shí)現(xiàn)隔離的裸機(jī)云原生計(jì)算至關(guān)重要,它也將定義下一代云規(guī)模計(jì)算。
DPU走進(jìn)巨頭視線的原因
①DPU更安全,因?yàn)榭刂破矫婵梢栽谙到y(tǒng)內(nèi)和系統(tǒng)集群之間與數(shù)據(jù)平面分離。DPU可以執(zhí)行原本需要CPU處理的網(wǎng)絡(luò)、存儲(chǔ)和安全等任務(wù)。CPU的不少運(yùn)算能力可以被釋放出來,去執(zhí)行廣泛的企業(yè)應(yīng)用。
②DPU釋放了服務(wù)器的容量,以便它們可以恢復(fù)到應(yīng)用程序計(jì)算。在一些具有大量I / O和沉重虛擬化的系統(tǒng)上內(nèi)核成本縮減一半,因此吞吐量提高了2倍。
③DPU豐富的、靈活和可編程的加速引擎可減輕和改善AI和機(jī)器學(xué)習(xí)應(yīng)用的性能。
④DPU能充當(dāng)數(shù)據(jù)中心的“第三插槽”,補(bǔ)充CPU和GPU,同時(shí)在單位功率和空間內(nèi)帶來前所未有的好處。該公司還表示,這些好處是安全可靠的。
⑤高幀率、高動(dòng)態(tài)范圍顯示,這些其實(shí)都需要頂級(jí)的DPU來實(shí)現(xiàn)。
⑥對(duì)于智能汽車來說,未來的超大屏當(dāng)然也需要強(qiáng)力的DPU和VPU來支撐。
⑦DPU引入機(jī)器學(xué)習(xí)算法,可對(duì)數(shù)據(jù)進(jìn)行智能管理、控制和分析,從而減少閃存擦寫次數(shù),延長(zhǎng)SSD使用壽命;還可減少盤內(nèi)計(jì)算和總線數(shù)據(jù)量,減輕主機(jī)CPU的負(fù)擔(dān)。
英偉達(dá)最為看重DPU并發(fā)力
英偉達(dá)在DPU上的技術(shù)突破,來自于去年收購(gòu)以色列芯片制造公司Mellanox之后,在這家公司的硬件基礎(chǔ)上開發(fā)出BlueFeild系列的兩款DPU——英偉達(dá)BlueField-2 DPU與BlueField-2X DPU。
BlueField-2 DPU具有英偉達(dá)Mellanox Connext-6 SmartNIC的所有特點(diǎn),與8個(gè)64位的A72ARM處理器內(nèi)核一起,實(shí)現(xiàn)可完全編程,并能提供每秒200千兆比特的數(shù)據(jù)傳輸速率,從而加速關(guān)鍵數(shù)據(jù)中心的安全、網(wǎng)絡(luò)和存儲(chǔ)任務(wù)。
最核心的一點(diǎn)是單個(gè)BlueField-2 DPU可以提供相當(dāng)于消耗125個(gè)CPU內(nèi)核所提供的數(shù)據(jù)中心服務(wù),從而有效釋放CPU內(nèi)核的算力資源。
英偉達(dá)發(fā)力DPU建設(shè)的深層目的,一個(gè)是DPU試圖再一次復(fù)制GPU替代顯示加速卡成為通用顯示芯片的路徑,再一個(gè)是DOCA試圖再一次復(fù)制CUDA在GPU通用化過程中所起到的開創(chuàng)生態(tài)之功。
國(guó)際巨頭開始紛紛提前布局
根據(jù)THENEXTPLATFORM的分析指出,在2020年,SmartNIC正在演變成DPU,每個(gè)人都想在這個(gè)領(lǐng)域分一杯羹。
在這個(gè)領(lǐng)域的玩家或者潛在玩家主要包括Broadcom,英特爾,英偉達(dá),Netronome,Pensando,Fungible和賽靈思,還包括云供應(yīng)商三大巨頭。
近水樓臺(tái)先得月,Broadcom是商品以太網(wǎng)NIC控制器市場(chǎng)上無可爭(zhēng)議的領(lǐng)導(dǎo)者。Broadcom的Stingray架構(gòu)采用了單芯片方法,與其他競(jìng)爭(zhēng)對(duì)手的許多芯片板相比,單芯片SmartNIC解決方案在板級(jí)生產(chǎn)的成本始終較低。
英特爾也對(duì)用于超大規(guī)模生產(chǎn)者和云構(gòu)建者的可編程以太網(wǎng)交換和SmartNIC更感興趣,在DPU上,英特爾主要是將CPU和FPGA結(jié)合在一起。
賽靈思是SmartNIC領(lǐng)域中另一位杰出的FPGA進(jìn)入者,其Alveo U25將雙SFP28端口直接連接到Zynq系列芯片,包括6GB DDR4內(nèi)存,Zynq的FPGA和Arm內(nèi)核可通過該芯片上運(yùn)行的程序?qū)ζ溥M(jìn)行訪問。
Fungible公司的DPU起到數(shù)據(jù)中心結(jié)構(gòu)控制和網(wǎng)絡(luò)層的作用,通過減少資源等待的次數(shù)和動(dòng)態(tài)構(gòu)成服務(wù)器的基礎(chǔ)結(jié)構(gòu),來提高數(shù)據(jù)中心的效率。
其生產(chǎn)的DPU將網(wǎng)絡(luò)資源總擁有成本降低到原來的四分之一,計(jì)算能力降低到原來的一半,存儲(chǔ)降低到原來的五分之一以下,總成本降低到原來的三分之一。
除了上述供應(yīng)商,全球的云廠商巨頭也都在部署SmartNIC,而且三家云供應(yīng)商正在設(shè)計(jì)自己的系統(tǒng)級(jí)芯片架構(gòu),他們就是阿里云的X-Dragon,亞馬遜AWS的Nitro和微軟Azure的Catapult。
結(jié)尾:
DPU可以和CPU、GPU相結(jié)合,構(gòu)成完全可編程的單一AI計(jì)算單元,實(shí)現(xiàn)前所未有的安全性和算力支持。
CPU、GPU、DPU將代表未來計(jì)算的三大支柱。這三者之間,CPU用于通用計(jì)算,GPU用于加速計(jì)算,而DPU在數(shù)據(jù)中心周圍移動(dòng)數(shù)據(jù),進(jìn)行數(shù)據(jù)處理。