《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 電子元件 > 業(yè)界動(dòng)態(tài) > 1530億晶體管芯片發(fā)布,AMD正式叫板英偉達(dá)

1530億晶體管芯片發(fā)布,AMD正式叫板英偉達(dá)

2023-06-14
作者: 李壽鵬
來(lái)源:半導(dǎo)體行業(yè)觀察
關(guān)鍵詞: AMD 晶體管芯片 英偉達(dá)

 本文作者: 李壽鵬

本文來(lái)源: 半導(dǎo)體行業(yè)觀察

原文鏈接:https://mp.weixin.qq.com/s/RmVrg5LynNKFxwoCCDUvcA

    在生成式AI浪潮的推動(dòng)下,AMD也成為半導(dǎo)體市場(chǎng)的一個(gè)贏家。

  根據(jù)最新的數(shù)據(jù)顯示,自今年年初以來(lái),AMD的市值大漲超過(guò)90%。如果將時(shí)間線拉長(zhǎng)到五年,AMD的市值大漲超過(guò)660%。在這背后,除了文章開(kāi)頭談到的生成式AI推動(dòng)外,AMD所推動(dòng)的基于ZEN架構(gòu)CPU和專為數(shù)據(jù)中心專用GPU設(shè)計(jì)的CDNA架構(gòu)產(chǎn)品,收購(gòu)Xilinx和Pensando所獲得的的FPGA和DPU,以及公司在Chiplet和3D V-Cache等技術(shù)的投入功不可沒(méi)。

  在今天于舊金山舉辦的產(chǎn)品發(fā)布會(huì)上,AMD CEO Lisa Su更是直言,我們?nèi)蕴幱?AI 生命周期的非常、非常早的階段。而根據(jù)他們的預(yù)估,數(shù)據(jù)中心AI加速器的TAM到2027年將會(huì)達(dá)到1500億美元,這意味著未來(lái)四年的CAGR將會(huì)超過(guò)50%。

微信截圖_20230614105947.png

  正是在這樣龐大市場(chǎng)需求的推動(dòng)下,AMD帶來(lái)了公司最新的,極具競(jìng)爭(zhēng)力的AMD Instinct MI300系列的產(chǎn)品更多細(xì)節(jié)和更新。與此同時(shí),AMD還帶來(lái)了第四代的Epyc產(chǎn)品的更新,全面擁抱數(shù)據(jù)中心新時(shí)代。

  1530億晶體管的怪獸芯片,震撼登場(chǎng)

  在AMD今天的發(fā)布會(huì)上,最受人關(guān)注的毫無(wú)疑問(wèn)是公司的Instinct MI 300系列。因?yàn)樵?a class="innerlink" href="http://theprogrammingfactory.com/tags/英偉達(dá)" target="_blank">英偉達(dá)GPU把持的AI時(shí)代,大家希望AMD的這系列芯片能成為萬(wàn)億芯片巨頭的最強(qiáng)競(jìng)爭(zhēng)者。而從Lisa提供的參數(shù)看來(lái),MI 300系列的新芯片擁有極強(qiáng)的競(jìng)爭(zhēng)力。

  “人工智能是塑造下一代計(jì)算的決定性技術(shù),也是 AMD 最大的戰(zhàn)略增長(zhǎng)機(jī)會(huì)?!盠isa Su強(qiáng)調(diào)。

  對(duì)AMD有了解的讀者應(yīng)該知道,MI 300是他們?cè)谌ツ炅掳l(fā)布的,面向AI和HPC推出的一個(gè)重要產(chǎn)品。通過(guò)將CPU和GPU以chiplet的方式集成到一個(gè)芯片,并采用統(tǒng)一的內(nèi)存架構(gòu),AMD希望這個(gè)市場(chǎng)能夠給AI市場(chǎng)帶來(lái)不一樣的產(chǎn)品。

微信截圖_20230614110005.png

  而在今日,AMD帶來(lái)了公司的AMD Instinct MI 300X,一款專門(mén)面向生成式AI推出的加速器。和AMD Instinct MI 300A不一樣,AMD Instinct MI 300X并沒(méi)有集成CPU內(nèi)核,而是采用了8 個(gè) GPU chiplet(基于CDNA 3架構(gòu))和另外 4 個(gè) IO 內(nèi)存chiplet的設(shè)計(jì),這讓其集成的晶體管數(shù)量達(dá)到了驚人的1530億。而為了緩解AI 大型語(yǔ)言模型 (LLM) 所面臨的內(nèi)存制約,AMD為這款芯片集成了192GB的HBM 3,其存儲(chǔ)帶寬也高達(dá)5.2 TB/s,可以處理的參數(shù)高達(dá)400億。

微信截圖_20230614110033.png

  作為一款對(duì)標(biāo)英偉達(dá)H100的產(chǎn)品,如圖所示,AMD Instinct MI 300X的HMB密度是前者的2.4倍,帶寬則為前者的1.6倍。這讓AMD的這顆產(chǎn)品在當(dāng)前的AI時(shí)代競(jìng)爭(zhēng)力大增。同時(shí),據(jù)AMD方面透露,基于帶寬高達(dá)896GB/s的AMD Infinity架構(gòu),我們可以將八個(gè) M1300X 加速器組合在一個(gè)系統(tǒng)中,這樣就能為開(kāi)發(fā)帶來(lái)更強(qiáng)大的計(jì)算能力,為 AI 推理和訓(xùn)練提供不一樣的解決方案。據(jù)AMD介紹,該芯片會(huì)在今年三季度送樣,值得一提的是,這種設(shè)計(jì)方法也是英偉達(dá)的 8 路 HGX 和英特爾Ponte Vecchio 的X8 UBB的選擇。

微信截圖_20230614110049.png

  如前面所說(shuō),AMD同期還推出了AMD Instinct MI300A,這是全球首款面向AI和HPC的APU,采用了集成24 個(gè) Zen 4 內(nèi)核、CDNA3 GPU 內(nèi)核和 128GB HBM3的設(shè)計(jì)。換而言之,和MI 300X只是集成GPU內(nèi)核不一樣,AMD Instinct MI300A在設(shè)計(jì)上同時(shí)集成了CPU和GPU。與 MI250 相比,該產(chǎn)品提供了 8 倍的性能和 5 倍的效率。在半導(dǎo)體行業(yè)觀察之前的文章《AMD最大的芯片:13個(gè)chiplet,1460億晶體管》中,我們有介紹了這款初代的產(chǎn)品。

  據(jù)外媒seminalysis所說(shuō),MI300A 憑借異構(gòu) CPU+GPU 計(jì)算成為頭條新聞,而El Capitan Exascale 超級(jí)計(jì)算機(jī)正在使用該版本。他們指出,MI300A 在 72 x 75.4mm 基板上采用集成散熱器封裝的設(shè)計(jì),適合插槽 SH5 LGA 主板,每塊板有 4 個(gè)處理器,能有效地支付開(kāi)發(fā)成本。seminalysis透露,該芯片已經(jīng)出貨,但真正在第三季度出現(xiàn)增長(zhǎng),這和AMD的說(shuō)法也是一致的。他們進(jìn)一步指出,標(biāo)準(zhǔn)服務(wù)器/節(jié)點(diǎn)將是 4 個(gè) MI300A。不需要主機(jī) CPU,因?yàn)樗莾?nèi)置的。

  “這是迄今為止市場(chǎng)上最好的 HPC 芯片,并將保持一段時(shí)間?!眘eminalysis強(qiáng)調(diào)。

微信截圖_20230614110137.png

  在發(fā)布這些面向AI應(yīng)用芯片的同時(shí),我們自然就繞不開(kāi)AMD在軟件方面的投入,這在很多分析人士看來(lái),會(huì)是AMD在這個(gè)市場(chǎng)發(fā)力的一個(gè)短板。但從AMD總裁Victor Peng的介紹我們可以看到,他們也在這個(gè)市場(chǎng)訂下了一個(gè)目標(biāo),那就是Open(software approach)、Proven(AI capability)和Ready(support for AI models)。

微信截圖_20230614110223.png

  據(jù)Victor Peng介紹,AMD 擁有一套完整的庫(kù)和工具ROCm,可以用于其優(yōu)化的 AI 軟件堆棧。與專有的 CUDA 不同,這是一個(gè)開(kāi)放平臺(tái)。而在過(guò)去的發(fā)展中,公司也一直在不斷優(yōu)化 ROCm 套件。AMD同時(shí)還在與很多合作伙伴合作,希望進(jìn)一步完善其軟件,方便開(kāi)發(fā)者的AI開(kāi)發(fā)和應(yīng)用。

微信截圖_20230614110242.png

  “我們?cè)跇?gòu)建可與模型、庫(kù)、框架和工具的開(kāi)放生態(tài)系統(tǒng)協(xié)同工作的強(qiáng)大軟件堆棧方面取得了真正的巨大進(jìn)步。”Victor Peng說(shuō)。

  備受關(guān)注的Bergamo,如約而至

  在介紹了MI300的同時(shí),AMD在今天還介紹公司了另一款重頭戲產(chǎn)品——新一代的EPYC。這是一系列為數(shù)據(jù)中心設(shè)計(jì)的芯片,到了第四代,AMD則準(zhǔn)備了四條針對(duì)不同市場(chǎng)的產(chǎn)品線,當(dāng)中更是包括了備受關(guān)注的、以云原生計(jì)算需求為目的的Bergamo系列以及代號(hào)為Genoa-X的第二代 EPYC 3D V-Cache CPU。

微信截圖_20230614110342.png

  據(jù)Lisa Su 介紹,新一代的AMD EPYC Genoa 在云工作負(fù)載中的性能是英特爾競(jìng)爭(zhēng)處理器的 1.8 倍,在企業(yè)工作負(fù)載中的速度是英特爾競(jìng)爭(zhēng)處理器的 1.9 倍。Lisa同時(shí)談到,絕大多數(shù)人工智能都在 CPU 上運(yùn)行,而AMD 的產(chǎn)品在這方面性能方面比競(jìng)爭(zhēng)對(duì)手的至強(qiáng) 8490H 具有絕對(duì)領(lǐng)先優(yōu)勢(shì),性能高出 1.9 倍,效率也同樣是競(jìng)爭(zhēng)對(duì)手的1.8 倍。

微信截圖_20230614110403.png

  在介紹了EPYC Genoa之后,Lisa著重介紹了公司的云原生產(chǎn)品Bergamo,一款讓開(kāi)發(fā)者期待已久的高密度服務(wù)器 CPU。據(jù)介紹,該芯片基于 AMD 的密度優(yōu)化 Zen 4c 架構(gòu),提供多達(dá) 128 個(gè) CPU 內(nèi)核,比 AMD 當(dāng)前一代旗艦 EPYC 9004 “Geona”芯片多 32 個(gè)內(nèi)核。在AMD CTO Mark Papermaster看來(lái),Zen 4c是AMD緊湊密度的補(bǔ)充,是公司核心路線圖的新泳道,它在大約一半的核心區(qū)域提供與 Zen 4 相同的功能。

微信截圖_20230614110418.png

  在分析人士看來(lái),Zen 4c 和 Bergamo 設(shè)計(jì)的目的是提供盡可能多的計(jì)算資源,這也是AMD在摩爾定律失效的情況下,為滿足盡客戶需要繼續(xù)增加核心數(shù)量需求而做出的一個(gè)決定。根據(jù)AMD提供的數(shù)據(jù),全新的Zen 4C核心可以減少35%的面積,在每個(gè)CCD中可以提供的核心數(shù)量是Zen 4的兩倍,在每個(gè)Socket中則能增加33%的核心。換而言之,Zen 4 每個(gè) CCD 有 8 個(gè)內(nèi)核,而 Zen 4c 每個(gè) CCD 有 16 個(gè)內(nèi)核。這也意味著 Zen 4c EPYC 芯片的 CCD 總體上少于其原始 Zen 4 芯片。

微信截圖_20230614110428.png

  據(jù)AMD介紹, 這次發(fā)布的Bergamo僅使用八個(gè) Zen 4C Chiplet和中央 IO Chiplet,這和標(biāo)準(zhǔn)EPYC 芯片最多使用十二個(gè) Zen 4 Chiplet設(shè)計(jì)略有不同。得益于這個(gè)設(shè)計(jì),Bergamo成為了一個(gè)擁有820億晶體管的設(shè)計(jì),低于完整 Genoa 芯片中的約900億個(gè)晶體管。這個(gè)更高的內(nèi)核數(shù)量和更小的時(shí)鐘速度設(shè)計(jì)使得該芯片比 Genoa 設(shè)計(jì)更節(jié)能——這是AMD定義該產(chǎn)品所專注市場(chǎng)時(shí)考慮的重要因素。AMD也透露,Bergamo在性能和效率方面的表現(xiàn)也非常出色。

微信截圖_20230614110434.png

  依賴于其高核心密度和高能效,AMD 希望Bergamo在該領(lǐng)域能與基于 Arm 的Ampere、Amazon 和其他使用Arm 架構(gòu)內(nèi)核的公司競(jìng)爭(zhēng),AMD 也希望這款芯片會(huì)成為Intel于2024 年推出的,具備144核心的Sierra Forest的有力競(jìng)爭(zhēng)者。

  除了上述產(chǎn)品之外,AMD還帶來(lái)了具有1.1GB L3緩存的“Genoa-X”EPYC 處理器。據(jù)了解,Genoa-X是 AMD 第一代 V-cache Milan-X的繼任者。與上一代產(chǎn)品一樣,AMD 正在使用緩存芯片堆疊為其他常規(guī)的 Genoa Zen 4 CCD 添加更多的 L3 緩存。在這種設(shè)計(jì)下,Genoa/Genoa-X 芯片上有 12 個(gè) CCD,這允許 AMD 向芯片添加 768MB 的額外 L3 緩存。

  更多芯片在路上

  在這次的盛會(huì)上,AMD還披露了全新的DPU規(guī)劃,這是他們通過(guò)收購(gòu) Pensando所獲得的技術(shù)。在他們看來(lái),AMD 的 Pensando SmartNIC 是新數(shù)據(jù)中心架構(gòu)不可或缺的一部分。按照AMD的規(guī)劃,他們接下來(lái)會(huì)將P4 DPU 卸載集成到網(wǎng)絡(luò)交換機(jī),從而在機(jī)架級(jí)別提供服務(wù)。為此,他們正在與HPE Aruba Networks 一起開(kāi)發(fā)智能交換機(jī)。

微信截圖_20230614110515.png

  AMD 同時(shí)強(qiáng)調(diào)了其代號(hào)為“Giglio”的下一代 DPU 路線圖,與當(dāng)前一代產(chǎn)品相比,該路線圖旨在為客戶帶來(lái)更高的性能和能效,預(yù)計(jì)將于 2023 年底上市。AMD 還發(fā)布了 AMD Pensando Software-in-Silicon Developer Kit (SSDK),使客戶能夠快速開(kāi)發(fā)或遷移服務(wù)以部署在 AMD Pensando P4 可編程 DPU 上,與 AMD 上已經(jīng)實(shí)現(xiàn)的現(xiàn)有豐富功能集相協(xié)調(diào)Pensando 平臺(tái)。AMD Pensando SSDK 使客戶能夠發(fā)揮領(lǐng)先的 AMD Pensando DPU 的強(qiáng)大功能,并在其基礎(chǔ)架構(gòu)中定制網(wǎng)絡(luò)虛擬化和安全功能,與 Pensando 平臺(tái)上已實(shí)施的現(xiàn)有豐富功能集相協(xié)調(diào)。

  依賴于這些豐富的產(chǎn)品,AMD正在沖擊數(shù)據(jù)中心的下一個(gè)高峰。

  微信截圖_20230614110534.png

 更多精彩內(nèi)容歡迎點(diǎn)擊==>>電子技術(shù)應(yīng)用-AET<<

微信圖片_20210517164139.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。