近日,NVIDIA創(chuàng)始人黃仁勛在GTC2021重磅發(fā)布了三款基于Arm IP打造的處理器——NVIDIA Grace、BlueField-3 DPU、NVIDIA DRIVE Atlan。
還是熟悉的廚房、熟悉的皮衣,4月13日凌晨,NVIDIA GTC2021如約而至。NVIDIA創(chuàng)始人黃仁勛的主題演講作為GTC的重頭戲,果然沒(méi)有讓人失望,其在演講中重磅發(fā)布了多款產(chǎn)品,其中三款基于Arm IP打造的處理器尤為引人關(guān)注:
NVIDIA Grace:專為大規(guī)模人工智能和高性能計(jì)算應(yīng)用而設(shè)計(jì)
BlueField-3 DPU:首款支持第五代PCIe總線并提供數(shù)據(jù)中心時(shí)間同步加速的DPU
NVIDIA DRIVE Atlan:新一代AI自動(dòng)駕駛汽車處理器,算力將達(dá)到1000TOPS
GTC大會(huì)期間,黃仁勛在接受集微網(wǎng)電話采訪時(shí)表示,英偉達(dá)收購(gòu)Arm正在穩(wěn)妥有序進(jìn)行。盡管收購(gòu)尚未塵埃落定,但英偉達(dá)已經(jīng)開(kāi)始了基于Arm IP的研發(fā),打造了一款專為大規(guī)模人工智能和高性能計(jì)算應(yīng)用而設(shè)計(jì)的CPU——NVIDIA Grace。
目前,絕大多數(shù)的數(shù)據(jù)中心仍將繼續(xù)使用現(xiàn)有的CPU,而Grace主要將用于計(jì)算領(lǐng)域的細(xì)分市場(chǎng)。黃仁勛介紹道,“結(jié)合 GPU 和 DPU,Grace 為我們提供了第三種基礎(chǔ)計(jì)算能力,并具備重新定義數(shù)據(jù)中心架構(gòu),推進(jìn) AI 前進(jìn)的能力?!?/p>
Grace 的名字來(lái)自于計(jì)算機(jī)科學(xué)家、世界最早一批的程序員,也是最早的女性程序員之一的格蕾絲 · 赫柏(Grace Hopper)。她創(chuàng)造了現(xiàn)代第一個(gè)編譯器 A-0 系統(tǒng),以及第一個(gè)高級(jí)商用計(jì)算機(jī)程序語(yǔ)言「COBOL」。計(jì)算機(jī)術(shù)語(yǔ)「Debug」(調(diào)試)便是她在受到從電腦中驅(qū)除蛾子的啟發(fā)而開(kāi)始使用的,于是她也被冠以「Debug 之母」的稱號(hào)。
Grace CPU是NVIDIA首次使用下一代 Arm Neoverse 內(nèi)核的設(shè)計(jì),采用了更為先進(jìn)的 5nm 制程,在內(nèi)部通信能力上,它使用了英偉達(dá)第四代 NVIDIA NVLink,在 CPU 和 GPU 之間提供高達(dá) 900 GB/s 的雙向帶寬,相比之前的產(chǎn)品提升了八倍。整個(gè)SoC是由多個(gè)芯片組合構(gòu)成,它主要有三個(gè)部分,分別是CPU、GPU和內(nèi)存/IO子系統(tǒng)。
Grace是一款高度專業(yè)化的處理器,主要解決工作負(fù)載問(wèn)題,例如訓(xùn)練擁有超過(guò)1萬(wàn)億個(gè)參數(shù)的下一代NLP模型。當(dāng)與英偉達(dá)GPU緊密結(jié)合時(shí),基于Grace CPU的系統(tǒng)將比當(dāng)今最先進(jìn)的基于英偉達(dá)DGX的系統(tǒng)(運(yùn)行在x86 CPU上)的性能還要快10倍。
此外,Grace 還是第一個(gè)通過(guò)錯(cuò)誤校正代碼(ECC)等機(jī)制利用 LPDDR5x 內(nèi)存系統(tǒng)提供服務(wù)器級(jí)可靠性的 CPU,同時(shí)提供 2 倍的內(nèi)存帶寬和高達(dá) 10 倍的能源效率。
對(duì)Grace的性能,黃仁勛如此總結(jié)道:“Grace能充分彰顯出Arm的強(qiáng)大?!?/p>
雖然是首次出現(xiàn)在大眾視野中,但目前Grace已經(jīng)找到了至少兩個(gè)客戶——瑞士國(guó)家超級(jí)計(jì)算中心(CSCS)將采用Grace,構(gòu)建一臺(tái)名為Alps的超級(jí)計(jì)算機(jī),其算力可達(dá)20Exaflops;美國(guó)洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室(Los Alamos National Laboratory)即將推出的超級(jí)計(jì)算機(jī)也將采用Grace。
三類芯片,逐年飛躍
在黃仁勛看來(lái),CPU和GPU以及負(fù)責(zé)在數(shù)據(jù)中心傳輸和處理數(shù)據(jù)的數(shù)據(jù)處理單元(DPU),將共同組成“未來(lái)計(jì)算的三大支柱”。
GTC2021上,除了推出首款CPU“炸圈”外,英偉達(dá)的DPU同樣值得關(guān)注?!拔覀兠磕甓紩?huì)發(fā)布激動(dòng)人心的新品。三類芯片,逐年飛躍,一個(gè)架構(gòu)。”黃仁勛說(shuō),數(shù)據(jù)中心路線圖包括CPU、GPU和DPU這三類芯片,而Grace和BlueField是其中必不可少的關(guān)鍵組成部分。
圖源:智東西
英偉達(dá)全新推出的BlueField-3 DPU包含220億個(gè)晶體管,采用16個(gè)Arm A78 CPU核心、18M IOPs彈性塊存儲(chǔ),加密速度是上一代的4倍,并完全向下兼容BlueField-2。
據(jù)悉,BlueField-2能夠卸載相當(dāng)于30個(gè)CPU核的工作負(fù)載,而B(niǎo)lueField-3實(shí)現(xiàn)了10倍的加速計(jì)算性能提升,能夠替代300個(gè)CPU核,以400Gbps的速率對(duì)網(wǎng)絡(luò)流量進(jìn)行保護(hù)、卸載和加速。該處理器也是首款支持第五代PCIe總線并提供數(shù)據(jù)中心時(shí)間同步加速的DPU。
此外,黃仁勛還發(fā)布了英偉達(dá)新一代AI自動(dòng)駕駛汽車處理器——NVIDIA DRIVE Atlan,其算力將達(dá)到1000TOPS,約是上一代Orin處理器的4倍,超過(guò)了絕大多數(shù)L5無(wú)人駕駛出租車的總計(jì)算能力。
黃仁勛提出,“對(duì)于汽車而言,更高的算力意味著更加智能化,開(kāi)發(fā)者們也能讓產(chǎn)品更快迭代。TOPS就是新的馬力?!?/p>
圖源:智東西
該SoC采用下一代GPU的體系結(jié)構(gòu)、新型Arm CPU內(nèi)核、新深度學(xué)習(xí)和計(jì)算機(jī)視覺(jué)加速器,并內(nèi)置為先進(jìn)的網(wǎng)絡(luò)、存儲(chǔ)和安全服務(wù)的BlueField DPU,網(wǎng)絡(luò)速度可達(dá)400Gbps。同時(shí),這也是DRIVE平臺(tái)首次集成DPU,通過(guò)Arm核為自動(dòng)駕駛汽車帶來(lái)數(shù)據(jù)中心級(jí)的網(wǎng)絡(luò)。
除了NVIDIA Grace、BlueField-3 DPU、NVIDIA DRIVE Atlan這三款基于Arm IP打造的處理器外,黃仁勛還提到了AI-on-5G計(jì)算平臺(tái),這是一款專為邊緣設(shè)計(jì)、將5G和AI相結(jié)合的新型計(jì)算平臺(tái),將采用NVIDIA Aerial軟件開(kāi)發(fā)套件與NVIDIA BlueField-2 A100,將GPU和CPU組合成“有史以來(lái)最先進(jìn)的PCIE卡?!蹦壳?,富士通、谷歌云、Mavenir、Radisys和Wind River等合作伙伴都在開(kāi)發(fā)適用于NVIDIA AI-on-5G平臺(tái)的解決方案。
布局Arm生態(tài)
在完成Arm收購(gòu)后,英偉達(dá)將打造完整的數(shù)據(jù)中心芯片產(chǎn)品線,雖然收購(gòu)案懸而未決,但在本次GTC大會(huì)上,NVIDIA仍宣布了一系列與Arm處理器設(shè)計(jì)商的合作進(jìn)展,包括將為亞馬遜AWS Graviton2 CPU提供GPU加速、為科學(xué)和AI應(yīng)用開(kāi)發(fā)提供支持的全新HPC開(kāi)發(fā)者套件、提升邊緣視頻分析和安全功能、打造新一類基于Arm并搭載NVIDIA RTX GPU的新款PC等。
從自研三類芯片到GPU合作伙伴,從云、高性能計(jì)算、邊緣計(jì)算到PC,不難看出英偉達(dá)對(duì)于Arm生態(tài)的重視程度。
為亞馬遜AWS Graviton2 CPU提供GPU加速
2021年下半年,基于AWS Graviton2的Amazon EC2實(shí)例將與NVIDIA GPU相結(jié)合,在云端部署,可實(shí)現(xiàn)降低成本、支持更豐富的游戲串流體驗(yàn)、優(yōu)化云上安卓游戲和人工智能推理、以更低成本提供更高的AI推理性能等優(yōu)勢(shì)。
為科學(xué)和AI應(yīng)用開(kāi)發(fā)提供支持的全新HPC開(kāi)發(fā)者套件
NVIDIA全新HPC開(kāi)發(fā)者套件為超級(jí)計(jì)算機(jī)提供了一個(gè)高性能、高能效的平臺(tái),該平臺(tái)結(jié)合了1個(gè)Ampere Altra CPU(包含80個(gè)Arm Neoverse核,運(yùn)行頻率高達(dá)3.3GHz)、雙NVIDIA A100 GPU(每個(gè)GPU可提供312TFLOPS的FP16深度學(xué)習(xí)性能)、兩個(gè)用于加速網(wǎng)絡(luò)、存儲(chǔ)和安全的NVIDIA BlueField-2 DPU。
提升邊緣視頻分析和安全功能
NVIDIA正擴(kuò)大與Marvell的合作,將基于Arm的OCTEON DPU與GPU相結(jié)合,加速AI工作負(fù)載,實(shí)現(xiàn)網(wǎng)絡(luò)優(yōu)化和安全。
打造新一類基于Arm并搭載NVIDIA RTX GPU的新款PC
NVIDIA將與聯(lián)發(fā)科合作,共同打造一個(gè)采用Arm核與NVIDIA顯卡、支持Chromium、Linux和NVIDIA SDK的參考平臺(tái),將GPU的性能及先進(jìn)的AI、光線追蹤圖形等技術(shù)帶入Arm PC平臺(tái)。
寫在最后
黃仁勛在NVIDIA GTC2021上公布了多項(xiàng)最新成果與研發(fā)進(jìn)展,首款數(shù)據(jù)中心CPU的發(fā)布,也宣告著英偉達(dá)數(shù)據(jù)中心產(chǎn)品線正式集齊了“未來(lái)計(jì)算的三大支柱”——CPU、GPU、DPU,從英偉達(dá)在Arm身上“下的功夫”便不難看出其在CPU領(lǐng)域的野心。
英偉達(dá)每年在GTC大會(huì)上發(fā)布的新品已經(jīng)成為了行業(yè)發(fā)展的重要指向,而正如黃仁勛所說(shuō),“新時(shí)代的計(jì)算機(jī)需要新的芯片、新的系統(tǒng)架構(gòu)、新的網(wǎng)絡(luò)、新的軟件和工具?!辈恢裉爝^(guò)后,芯片圈的風(fēng)向要怎么變呢?
參考資料:
1、《英偉達(dá)CPU問(wèn)世:ARM架構(gòu),對(duì)比x86實(shí)現(xiàn)十倍性能提升》,機(jī)器之心
2、《英偉達(dá)CPU面世!基于Arm,性能超過(guò)英特爾為核心的自家系統(tǒng)10倍,連客戶都找好了》,大數(shù)據(jù)文摘
3、《芯片圈變天了!英偉達(dá)推出首個(gè)CPU,狂捧Arm生態(tài)》,智東西
4、《英偉達(dá)發(fā)布“空氣CPU”,Arm架構(gòu)專為AI而生,性能超x86十倍,與自家GPU更搭》,量子位
5、《NVIDIA發(fā)布首款代號(hào)為“Grace”的CPU 基于ARM架構(gòu)與Neoverse核心》,cnBeta.COM