芯東西9月23日報道,今天,Arm公布下一代Neoverse服務(wù)器CPU設(shè)計,不僅公布N系列的第二代產(chǎn)品N2,還首次推出了全新產(chǎn)品類別Neoverse V系列平臺,劍指最高單線程性能。
▲最新Neoverse服務(wù)器CPU路線圖
Neoverse V1內(nèi)核(代號Zeus)支持可伸縮擴(kuò)展(SVE),具備更高的單線程性能和機(jī)器學(xué)習(xí)性能,適用于對CPU性能和帶寬要求更高的應(yīng)用。相較N1內(nèi)核,V1單線程性能提高了50%以上。
N2內(nèi)核(代號Perseus)提供更多的內(nèi)核數(shù)和優(yōu)化的性能/功率比,具有更好的橫向擴(kuò)展性能。相較N1內(nèi)核,N2單線程性能提高了40%以上。
Neoverse N系列的PPA特征定義是性能、功率、面積得到了同等考量,擅長可擴(kuò)展;E系列主要關(guān)注效率,對于網(wǎng)絡(luò)流量和數(shù)據(jù)應(yīng)用程序非常有效,在功耗和面積的縮減上進(jìn)行優(yōu)化;V系列旨在提供最佳性能,需要添加更大的緩存、窗口和隊列,相對來說會消耗更多面積和功耗。
Arm基礎(chǔ)設(shè)施事業(yè)部高級副總裁兼總經(jīng)理Chris Bergey說,Arm承諾每年30%的性能提升,將持續(xù)到2022年及以后。
01
Neoverse V1:主打高單線程性能,支持可伸縮矢量擴(kuò)展
Neoverse V1面向7nm和5nm工藝技術(shù)而設(shè)計,是Arm的第一個支持可伸縮矢量擴(kuò)展(Scalable Vector Extensions,SVE)的設(shè)計核心,將支持256位寬度的向量,適合高性能計算、高性能云和機(jī)器學(xué)習(xí)處理任務(wù)。
SVE可基于未知寬度向量單元的軟件編程模型,執(zhí)行單指令流多數(shù)據(jù)流(SIMD)整數(shù)、bfloat16、浮點(diǎn)指令。SVE可確保軟件編碼的可移植性與使用壽命,同時兼顧高效的執(zhí)行。
“我們的芯片伙伴可以完全控制SVE電壓和頻率轉(zhuǎn)換,富士通A64FX CPU就是一個很好的例子,在執(zhí)行SVE代碼時,它可以全天全頻率運(yùn)行?!?/p>
Chris Bergey介紹說,對于開發(fā)者而言,主要好處是SVE的架構(gòu)使其可以在寄存器寬度之間無縫轉(zhuǎn)換,因此,他們可以合并新的寬向量SVE指令,同時可以重新使用為較小的寄存器編寫的輔助函數(shù)。
V1還支持PCIe 5.0連接、DDR5、HBM2e和CCIX 1.0,以實(shí)現(xiàn)插槽之間的芯片與封裝內(nèi)小芯片之間的雙向一致性通信。
與Neoverse N1相比,Neoverse V1的單線程性能可提升超過50%。
02
Neoverse N2:主打高度可擴(kuò)展性,單線程性能較N1提升40%
Neoverse N2被設(shè)計為一個超級可擴(kuò)展平臺,用來滿足橫向擴(kuò)展的性能需求。
N2面向5nm工藝技術(shù)而設(shè)計,支持PCIe 5.0和DDR5,通過支持用于高帶寬存儲器的HBM3以及用于結(jié)構(gòu)的CCIX 2.0和CXL 2.0來進(jìn)一步擴(kuò)展。
此外,相較Neoverse N1,Neoverse N2在保持相同水平的功率和面積效率之余,單線程性能提升了40%。
它不會像V1在每線程性能具有突出表現(xiàn),但它將在恒定的TDP中支持更多內(nèi)核。它可以支持從20W、8個內(nèi)核到350W、192個內(nèi)核,用例可橫跨云、智能網(wǎng)卡(SmartNICs)、企業(yè)網(wǎng)絡(luò)到功耗受限的邊緣設(shè)備。
N2在邊緣計算要求的性能下,甚至非常有限的TDP條件下,同樣能展現(xiàn)出良好的性能表現(xiàn)?!皩τ谄髽I(yè)網(wǎng)絡(luò)和SmartNIC應(yīng)用,沒有比N2更好的解決方案。”Chris Bergey說。
Arm的一位性能工程負(fù)責(zé)人做了一張有趣的圖表,X軸是芯片級性能,Y軸是每線程性能,Arm認(rèn)為客戶和運(yùn)營商將需要更多的單線程性能。
Chris Bergey認(rèn)為,N1 CPU在芯片級吞吐量和單線程性能方面,都將超過市場上的任何產(chǎn)品。V1和N2在圖的右上方,Arm也展示了這兩款新品預(yù)期的性能提升。
“我們知道其他競爭架構(gòu)不會停滯不前,但我們非常有信心N2將繼續(xù)代表最高的單芯片性能,而V1將在未來提供最高的單線程性能。”Chris Bergey談到。
▲Arm的移動設(shè)備和服務(wù)器CPU IP之間的世代同級產(chǎn)品(圖源:AnandTech)
值得注意的是,同一時期串聯(lián)開發(fā)的Arm移動IP系列Cortex和Neoverse產(chǎn)品之間存在相似之處,例如Neoverse N1是與Cortex-A76一起開發(fā)的,因此這兩個微體系結(jié)構(gòu)可以看作是兄弟設(shè)計,具有很多相似之處。
Neoverse V1可以看作是Cortex-X1的同級設(shè)計,可能共享許多為這兩個旗艦CPU開發(fā)的超大型內(nèi)核結(jié)構(gòu)。Neoverse N2較為特殊,代表了下一代Cortex-A內(nèi)核的兄弟設(shè)計,是A78的后續(xù)產(chǎn)品。
03
“裝機(jī)即用”的軟件與創(chuàng)新的組件
除了提供更高性能的處理器核外,Arm還為合作伙伴提供可擴(kuò)展性的交換網(wǎng),用以支持大量的處理器核。
Arm在CCIX與CXL進(jìn)行投資,確保其生態(tài)系統(tǒng)得以快速且高效地推出相關(guān)的技術(shù)。
迄今為止,日本富士通超算的A64FX芯片和定制核心微架構(gòu)是唯一一款宣布和提供SVE的CPU, Neoverse V1和N2將是Arm第一批實(shí)現(xiàn)SVE的自主設(shè)計處理器核。
在軟件生態(tài)系統(tǒng)方面,Arm Project Cassini旨在為軟件開發(fā)者提供流暢的體驗(yàn),通過標(biāo)準(zhǔn)、平臺安全性與參考實(shí)施,使得行業(yè)伙伴可基于Arm平臺上部署“裝機(jī)即用”的軟件。
同時,Arm也持續(xù)推動基礎(chǔ)軟件支持。例如,Xen、KVM、Docker容器以及越來越多的Kubernetes等操作系統(tǒng)、虛擬機(jī)管理程序,都已經(jīng)陸續(xù)宣布支持Arm架構(gòu)。許多初期由Arm推動的開源項目正在變得自主運(yùn)轉(zhuǎn),同時,商用ISV應(yīng)用程序也齊步演進(jìn)。
Chris Bergey談到,Arm希望每一代有30%以上的性能提升,除了與技術(shù)團(tuán)隊的努力分不開外,與整個軟件生態(tài)的逐漸成熟也有很大關(guān)系,許多原生軟件現(xiàn)已能夠無縫運(yùn)行在軟件架構(gòu)上。
04
7大互聯(lián)網(wǎng)公司已有4家公開宣布采用Arm技術(shù)
Arm自十年前就開始部署數(shù)據(jù)中心領(lǐng)域的高效計算技術(shù)。
2018年,Arm首次公布在基礎(chǔ)設(shè)施市場的初步產(chǎn)品——Neoverse服務(wù)器CPU路線圖,這個“量尺”用來衡量Arm在接下來的18個月的進(jìn)程,并承諾以每年增長30%的平臺性能為指標(biāo),持續(xù)優(yōu)化到2021年。
過去兩年間,Arm在服務(wù)器市場取得一系列落地進(jìn)展。
在互聯(lián)網(wǎng)領(lǐng)域,前7大互聯(lián)網(wǎng)公司中有4家公開宣布采用Arm技術(shù)進(jìn)行部署。
在高性能計算(HPC)領(lǐng)域,搭載Arm服務(wù)器CPU的日本富士通超算是今年全球排名第一的超級計算機(jī)。
在整個5G生態(tài)系統(tǒng)廠商中,從L1到傳輸?shù)恼麄€堆棧,以及新興的OpenRAN和VRAN計劃,Arm都獲得一系列重大設(shè)計項目。
在基礎(chǔ)架構(gòu)和邊緣,Arm已推出uCPE轉(zhuǎn)Arm以及Project Cassini計劃,并將在兩周后的Arm DevSummit大會上更新Project Cassini第一年的進(jìn)展。
05
結(jié)語:Arm在服務(wù)器市場的競爭力顯著增長
如今第一代Neoverse N1基礎(chǔ)架構(gòu)CPU IP產(chǎn)品已經(jīng)以商業(yè)和公開可用的形式進(jìn)入市場,下一代Neoverse平臺也即將面世。
無論是近年推出的基于Arm平臺的服務(wù)器處理器產(chǎn)品,還是今天所公布的新一代處理器核的性能,都足見Arm已成為數(shù)據(jù)中心服務(wù)器市場的競爭力正顯著提升。
今天的發(fā)布只是預(yù)告片,據(jù)Chris Bergey透露,Arm將在明年深入分享關(guān)于V1和N2產(chǎn)品的更多細(xì)節(jié)。