7月15日消息,AMD近日在美國洛杉磯舉行的技術(shù)日活動中,介紹了其全新的Zen 5 CPU架構(gòu),將會帶來平均16%的每時(shí)鐘指令數(shù)(IPC)性能提升,相關(guān)處理器產(chǎn)品將于7月底上市。
在今年6月初的Computex 2024展會上,AMD正式發(fā)布了基于全新的Zen5架構(gòu)的Ryzen 9000系列桌面處理器(Granite Ridge)和面向筆記本電腦的Ryzen AI 300系列AI PC處理器(Strix Point)。
其中,Ryzen 9000系列當(dāng)中的旗艦產(chǎn)品——Ryzen 9 9950X配備16核心32線程,170W TDP,最高主頻5.7 GHz。而Ryzen AI 300系列的旗艦產(chǎn)品——Ryzen AI 9 HX 370的CPU為12核心24線程,包括4個Zen 5 內(nèi)核和8個Zen 5C 內(nèi)核,每個核心1MB二級緩存,三級緩存為24MB,最高主頻5.1GHz。GPU不但升級架構(gòu),CU單元數(shù)量也從12個增至16個,命名為“Radeon 890M”。NPU算力則提升到了50TOPS,增加了2倍有余。
根據(jù)此前AMD公布的數(shù)據(jù)顯示,與英特爾Core i9-14900K相比,AMD旗艦16核心Ryzen 9 9950X在游戲性能測試中的速度快4%到23%。在生產(chǎn)力性能測試中,9950X顯示出更大的優(yōu)勢,比英特爾Core i9-14900K快7%至56%。同樣Ryzen AI 300系列相比上代產(chǎn)品也帶來的很大的性能提升。
當(dāng)然,制程工藝、CPU核心數(shù)量、緩存容量和主頻上的提升,都對于其CPU的性能提升帶來了不小的助力,但是其中關(guān)鍵的性能提升則是來源于Zen 5 內(nèi)核架構(gòu)的提升。
Zen 5 內(nèi)核帶來了平均16%的IPC性能提升
據(jù)介紹,其 Zen 5 內(nèi)核擁有 6 個 ALU,數(shù)量是上一代的 3 倍,采用了 48KB 的 12 路一級緩存,在浮點(diǎn)運(yùn)算以及最大帶寬上均是上代的 2 倍,并且Zen 5內(nèi)核也同樣支持完整版的 AVX-512 指令,從而在一些專業(yè)應(yīng)用上有事半功倍的作用。得益于這些方面的提升,Zen 5的IPC性能比上一代的Zen 4 內(nèi)核高出了10%-35%,平均提升了16%。
據(jù)AMD首席技術(shù)官M(fèi)ark Papermaster介紹,Zen 5內(nèi)核的最大改進(jìn)之一是其前端,在其IPC整體性能提升當(dāng)中的占比為39%。
具體來說,AMD已經(jīng)擴(kuò)大了前端,允許每個周期進(jìn)行更多的分支預(yù)測——這是現(xiàn)代CPU內(nèi)核性能的主要貢獻(xiàn)者——并實(shí)施了雙解碼管道以及i-cache和op-cache改進(jìn),以遏制延遲并提高帶寬。
Zen 5 這個更寬的前端與一個更大的整數(shù)執(zhí)行引擎配對,該引擎現(xiàn)在每個周期中最多支持8條指令——調(diào)度和報(bào)廢,而上代的Zen 4 只有6條指令。AMD 還將算術(shù)邏輯單元 (ALU) 的數(shù)量從 4 個增加到 6 個,還有3個乘法器,并實(shí)施了更統(tǒng)一的調(diào)度程序,以提高執(zhí)行效率。
為了減少錯誤預(yù)測增加的可能性,AMD還將Zen 5的執(zhí)行窗口延長了約40%?!八淖饔檬菐硇碌男阅芩剑?yàn)樗c這些前端進(jìn)步相結(jié)合......它允許我們使用這些指令,并利用通過管道向我們提供的改進(jìn)預(yù)測,“Papermaster 解釋道。
Zen 5 的 IPC 性能增長當(dāng)中,約 27% 可歸因于后端數(shù)據(jù)帶寬的增加。與上一代相比,AMD 將 L1 數(shù)據(jù)緩存從 32KB 提升到 48KB,并將 L1 和浮點(diǎn)單元的最大帶寬增加了一倍。
關(guān)鍵的一點(diǎn)是,AMD不僅對分支預(yù)測器或執(zhí)行引擎進(jìn)行了優(yōu)化,還試圖平衡內(nèi)核的每個元素,以避免瓶頸或增加延遲。其結(jié)果是,器核心可以比前幾代更快地消化更多指令。
Zen 5 內(nèi)核所帶來的最大的IPC提升,在于其改進(jìn)了AVX-512指令的實(shí)施,對于AVX-512矢量擴(kuò)展進(jìn)行了重新設(shè)計(jì),以提供完整的512位數(shù)據(jù)路徑,使得其在AVX-512 矢量擴(kuò)展的工作負(fù)載中表現(xiàn)更為出色。
雖然 Papermaster 聲稱 Zen 5 現(xiàn)在可以運(yùn)行完整的 AVX-512 工作負(fù)載而不會受到頻率損失,但這些指令在歷史上一直運(yùn)行得非常熱。這在臺式機(jī)或工作站上沒什么大不了的,但對于散熱空間有限的筆記本電腦來說并不理想。所以對于“Strix Point”系列移動芯片,AMD則是堅(jiān)持使用“double-pumped” AVX-512來實(shí)現(xiàn)——可能會針對每瓦性能和散熱限制進(jìn)行優(yōu)化。相比之下,上代的Zen 4 則是“double-pumped” AVX-256。
此外,Papermaster 還強(qiáng)調(diào)了了AVX-512 工矢量擴(kuò)展在 CPU 上運(yùn)行AI工作負(fù)載的潛力。在機(jī)器學(xué)習(xí)方面,AMD聲稱單核Zen 5 性能比Zen 4 提高了32%,在AES-XTS 加密算法性能上也提升了35%。特別是在其移動芯片方面,AMD強(qiáng)調(diào)了在每個領(lǐng)域運(yùn)行機(jī)器學(xué)習(xí)的概念,而不僅僅是在集成GPU或NPU上。
AMD表示 Zen 5 架構(gòu)將會應(yīng)用于各個領(lǐng)域,除了桌面與移動處理器之外,包括 EPYC 霄龍?zhí)幚砥饕约扒度胧教幚砥鞯榷紝⒉捎?Zen 5 架構(gòu),從而讓企業(yè)部署更加得心應(yīng)手。
在AMD的技術(shù)日披露中,其Zen 5和緊湊型Zen 5C 內(nèi)核在功能方面在架構(gòu)上基本保持相同,只不過較小的 Zen 5C 內(nèi)核可以以較低的頻率換取更高的性能密度。
據(jù)介紹,首批基于 Zen 5 內(nèi)核的處理器系列(Ryzen 9000系列和Ryzen AI 300系列處理器)將于 7 月 31 日上市。但是基于Zen 5 內(nèi)核的數(shù)據(jù)中心處理器可能必須等待更長的時(shí)間才能到達(dá)。
根據(jù)之前曝光的信息顯示,在第5代 Epyc服務(wù)器處理器,預(yù)計(jì)將會采用臺積電3nm制程,并將具有192個CPU內(nèi)核和384個線程。與此同時(shí),頻率優(yōu)化的“Turin”可能會有128 個內(nèi)核和256 個線程。
競爭白熱化
在Zen 5 內(nèi)核推出之際,AMD 正面臨多年來最激烈的競爭。因?yàn)楦咄ü就瞥隽艘豢顝?qiáng)大的基于 Arm 架構(gòu)的Windows筆記本電腦芯片,而英特爾也準(zhǔn)備在其至強(qiáng)和酷睿產(chǎn)品系列中推出一系列改進(jìn)的CPU。
在客戶端領(lǐng)域,高通具有45TOPS NPU算力的驍龍?zhí)幚砥魇蛊湓谖④浀腃opilot + AI PC推動中處于領(lǐng)先地位。AMD的具備50TOPS NPU算力的Ryzen AI 300系列則希望帶來更多競爭優(yōu)勢。但是,英特爾即將上市的Lunar Lake則具有48TOPS NPU算力,AI綜合算力更是高達(dá)120TOPS。顯然,AMD的Ryzen AI 300在與英特爾Lunar Lake的競爭當(dāng)中,可能并沒有多少優(yōu)勢。
在數(shù)據(jù)中心領(lǐng)域也有類似的情況,隨著英特爾 144 核 Sierra Forest 和即將推出的 128 核 Granite Rapids Xeon 6 平臺的推出,AMD在該市場也面臨更加激烈的競爭。英特爾Xeon 6系列除了架構(gòu)轉(zhuǎn)向了全大核和全小核,也轉(zhuǎn)向新的小芯片架構(gòu),并且這些芯片也升級到了Intel 3 制程工藝。
與此同時(shí),越來越多的云服務(wù)提供商也在自研基于Arm 架構(gòu)的定制芯片,來處理其超大規(guī)模工作負(fù)載。比如亞馬遜的Graviton 現(xiàn)在已經(jīng)是發(fā)展到了第四代,并普遍可用。此外,谷歌、阿里云、百度、微軟、Meta也都已開始部署或研發(fā)自己的Arm架構(gòu)服務(wù)器芯片。