《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 電子元件 > 業(yè)界動態(tài) > 英特爾數(shù)據(jù)中心處理器將走向何方?

英特爾數(shù)據(jù)中心處理器將走向何方?

2022-01-24
來源:半導(dǎo)體行業(yè)觀察

  系統(tǒng)業(yè)務(wù)中有句老話是這么說的,客戶購買的不是處理器,而是路線圖。

  作為一家服務(wù)器供應(yīng)商,無論是CPU、GPU還是任何其他類型的設(shè)備,其訣竅都是披露足夠的產(chǎn)品線路線圖,這樣既不會涉及泄密,又可以讓人們信任你的產(chǎn)品。以英特爾為例,隨著其計算引擎產(chǎn)品組合的擴大,競爭對手的數(shù)量也在不斷增加,越來越多的企業(yè)開始加入其競爭對手的行列。

  考慮到英特爾在數(shù)據(jù)中心領(lǐng)域所處的地位,最近其XEON SP業(yè)務(wù)受到AMD的EPYC x86服務(wù)器芯片和亞馬遜云科技(Amazon Web Services)以及Ampere Computing旗下的ARM(ARM Collective)的沖擊,尤其在大型超大規(guī)模企業(yè)和云計算企業(yè)中,你可能會認(rèn)為英特爾需要公布一份路線圖,對其未來的創(chuàng)新和時間表進(jìn)行描述。

  在計算機引擎可靠性方面,英特爾是失敗者,這可能很難讓人相信,但卻是事實。英特爾的芯片制造技術(shù)不僅無法與代工巨頭臺積電競爭,而且工藝技術(shù)的持續(xù)延遲也給CPU的推出造成了嚴(yán)重的破壞。此外,當(dāng)AMD在2017年首次推出Epyc處理器,并不斷完善隨后兩代的x86兼容服務(wù)器芯片時,英特爾卻在芯片架構(gòu)方面拖后腿。當(dāng)前,AMD已在設(shè)定技術(shù)規(guī)劃,并且有一個代工合作伙伴幫助它在CPU、GPU和FPGA方面實現(xiàn)這一目標(biāo),一旦Xilinx的收購?fù)瓿?,這個目標(biāo)也會很快實現(xiàn)。

  鑒于英特爾首席執(zhí)行官Pat Gelsinger掌舵已經(jīng)一年多了,你可能會認(rèn)為英特爾會像甲骨文(Oracle)聯(lián)合創(chuàng)始人Larry Ellison在2010年1月收購太陽微系統(tǒng)公司(Sun Microsystems)后所做的那樣:制定一份五年路線圖,然后堅持執(zhí)行。AMD在2017年憑借EPYCS重返服務(wù)器領(lǐng)域時也做了同樣的事情,并且現(xiàn)在仍在這樣做,只是程度較輕。

  我們認(rèn)為,問題在于即使Pat Gelsinger回到公司并掌舵一年后,但英特爾依舊對自己的未來充滿不確定,如果在2009年9月的大衰退中Pat Gelsinger沒有被排除在外,英特爾在數(shù)據(jù)中心的霸權(quán)可能已經(jīng)完成,因為Pat Gelsinger會阻止之前發(fā)生的那些混亂?;貋砹鶄€月后,Pat Gelsinger重組了公司,創(chuàng)建了新的業(yè)務(wù)團(tuán)隊,并授權(quán)了新的高管,但別搞錯了:Pat Gelsinger負(fù)責(zé)整個Intelchilada,并與Queso一起訂購芯片。

  有傳言稱,下一代“Sapphire Rapids”處理器將在第三季度推出,我們詢問英特爾時,他們否認(rèn)了這一傳言。于是我們開始調(diào)查有關(guān)XEON處理器路線圖的傳言,發(fā)現(xiàn)大部分內(nèi)容都由一位名為Tom(姓氏未知)的博主在“Moore s Law Is Dead”博客和“Broken Silicon”播客上發(fā)布的視頻中提出。如果你在網(wǎng)上瀏覽,你會發(fā)現(xiàn)各種各樣的網(wǎng)站都指向MLID上的這篇文章,從去年夏天開始,關(guān)于英特爾2023年及以后的芯片路線圖將如何發(fā)展已有各式各樣的言論。雖然這些都很有趣,但我們想知道的是Xeon服務(wù)器的未來到底會是什么樣,以及會如何影響未來的應(yīng)用程序和市場。世界上的大多數(shù)應(yīng)用程序仍然是在CPU上進(jìn)行計算,所以服務(wù)器CPU的未來對大多數(shù)應(yīng)用程序來說十分重要。

  因此,為了解英特爾推出Xeon系列的潛在原因及其可能產(chǎn)生的影響,我們制作了一系列表格,顯示了從“Sandy Bridge” Xeon E5到用于雙插槽機器的“Cascade Lake” Xeon SP的發(fā)展情況,并且分別預(yù)測了從去年的“Ice Lake” Xeon SP到“Diamond Rapids” Xeon SP(如果英特爾仍打算這樣命名)的發(fā)展情況,預(yù)計將在2025年或2026年實現(xiàn),具體取決于進(jìn)展情況。

  這與組織我們的思想一樣重要。

  表中以紅色粗斜體顯示的項目是在缺乏數(shù)據(jù)的情況下對這些功能的估計,并且它是基于各種功能信號和時鐘速率的預(yù)期改進(jìn),以及基于晶體管密度、能耗和chiplet架構(gòu)的合理預(yù)期容量增加。公平地說,在許多情況下,英特爾還不知道這些未來的Xeon SP會是什么樣子,因為要將PCI-Express 6.0外圍設(shè)備控制器或DDR6內(nèi)存控制器推向市場,還有許多工程工作要做,而且CPU必須與外圍設(shè)備和內(nèi)存的可用性交叉才能插入這些控制器。

  我們的表格忽略了單插槽、4插座和8插座平臺,以及創(chuàng)建這些平臺所需的對Xeon CPU的調(diào)整。這些系統(tǒng)可能占據(jù)了20%到25%的市場份額,所賺的錢也差不多,并且為它們創(chuàng)建芯片和芯片組的調(diào)整也是相當(dāng)溫和的。在芯片和芯片組中需要激活不同數(shù)量的內(nèi)核和不同數(shù)量的QPI或UPI鏈路,但是相對于服務(wù)器節(jié)點的每個規(guī)模,底層架構(gòu)或多或少地保持同步變化。

  讓我們先來看看傳統(tǒng)的Xeon E5和Xeon SP平臺,全面了解英特爾在2012年至2020年期間擁有先進(jìn)的CPU計算、內(nèi)存和互連功能時所使用的手段:

20220122020033772.jpg

  在每種情況下,我們都在觀察每代Xeon E5和Xeon SP中的頂級部分,這在芯片行業(yè)中通常被稱為頂級BIN部分。每代變體擁有最多的內(nèi)核,并將該代系統(tǒng)的熱限制推到最高。

  正如你所看到的,從2016年到2021年,英特爾已經(jīng)采取了多種手段,但制造工藝一直停留在14納米,這顯然讓Xeon 芯片更大的同時制造成本也提高了,還導(dǎo)致英特爾阻礙核心數(shù),實際上減少了高速緩存。時鐘速度也在一段時間內(nèi)大幅下降,以幫助支付熱室的費用,來增加核心計數(shù),而不是轉(zhuǎn)移到英特爾拖延已久的10納米制造工藝。時鐘指令(IPC)的改進(jìn)(針對恒定時鐘速率和單內(nèi)核進(jìn)行標(biāo)準(zhǔn)化)通常也不會給人留下深刻印象?!癈ascade Lake”Xeon實際上是“Skylake”Xeon,只有幾個不同的指令,隨著2020年初Cascade Lake-R的更新,AMD憑借“Rome”EPYC 7002處理器大獲關(guān)注,英特爾重新調(diào)整了雙插座Xeon SP-6200系列黃金版本,并在AMD的EPYC爬坡之前從Skylake生產(chǎn)線中獲得巨額利潤,然后大幅削減價格。(早在2017年9月的《the Huge Premium Intel Is Charging For Skylake xeon》,我們就討論過Skylake xeon的相對價格與之前Xeon相比有多高,這表明它顯然是盈利的。)

  在英特爾服務(wù)器芯片的歷史上,這已經(jīng)不是第一次了。2014年的“Haswell”Xeon芯片在原始吞吐量性能方面比“Ivy Bridge”Xeon E5稍差(至少對于頂級芯片而言),Ice Lake Xeon SPS的成本也略高于Cascade Lake-R Xeon SPS,但比2019年的Cascade Lake Xeon SPS低得多。但Skylake芯片創(chuàng)下了英特爾再也回不去的高水平。從標(biāo)價上看,英特爾對Skylake CPU的報價只有之前的“Broadwell”CPU的一半,這就是當(dāng)你沒有競爭對手時會發(fā)生的事情。公平地說,機器之間的吞吐量增加了58.5%,這是值得的。(相對性能與IPC變化、核心數(shù)量和時鐘速度有關(guān),并與2009年3月推出的四核“Nehalem”E5500處理器進(jìn)行比較,這是自七年前推出the Next Platform以來一直采用的計算方法。)

  為了使Skylake和Cascade Lake處理器對數(shù)據(jù)中心更有價值,AVX-512矢量引擎和第二代Fusion Multiply Add(FMA)單元被添加到Xeon核心中,PCI-Express控制器獲得了更多通道(即使它們沒有變得更快),內(nèi)存速度也在幾代之間緩慢提升,QuickPath Interconnect(QPI)鏈路也是如此;更多的鏈接被添加到與兩個、四個或八個處理器連接得更緊密的NUMA節(jié)點上。設(shè)備的瓦數(shù)也在攀升,因為當(dāng)運行速度需要加快時,它會加速升溫。

  在CPU設(shè)計中平衡所有的這些壓力是一項嚴(yán)峻的挑戰(zhàn),英特爾的芯片設(shè)計師們的一只手被綁在背后,另一只手戴著厚厚的太空手套,因為英特爾的代工廠無法及時生產(chǎn)出10納米、7納米和5納米芯片,并用于他們的架構(gòu)。

  坦率地說,對于始終需要最大限度地提高每美元每瓦性能的數(shù)據(jù)中心客戶來說,這是一件令人痛苦的事情,也是非常令人沮喪的事情。

  隨著去年“Ice Lake” Xeon  SPS的推出,我們看到了本可以在2017年或2018年用10納米工藝實現(xiàn)的產(chǎn)品。Ice Lake芯片為一年一度(或多或少)的路線圖奠定了基礎(chǔ),服務(wù)器平臺跨越兩代Xeon  SPS,并有望實現(xiàn)令人印象深刻的計算、內(nèi)存、和互連,以及新一代IPC改進(jìn)的健康劑量,以擴展chiplet架構(gòu)在服務(wù)器CPU插槽中實現(xiàn)的核心數(shù)量。

  在去年夏天的架構(gòu)日上,英特爾提供了今年即將推出的“Sapphire Rapids” Xeon  SPS的一些突出功能,這些功能將插入“Eagle Stream”服務(wù)器平臺。據(jù)我們所知,Xeon SP平臺的“高級平臺”不會像2019年的“Cascade Lake-AP”那樣,將兩個完整的處理器塞進(jìn)一個插槽中。但有傳言稱,一個名為“Birch Stream”的AP平臺將于2024年和2025年分別推出“Granite Rapids”和“Diamond Rapids”處理器。

  據(jù)報道,Granite Rapids雙核處理器被稱為“Sierra Forrest”,類似于AMD的Genoa Epyc 7004處理器的“Bergamo” ,針對那些希望在一個插槽中擁有最大數(shù)量內(nèi)核的超scaler和云客戶。關(guān)鍵是,即使我們預(yù)計有大量的核心數(shù)量,英特爾似乎也會在一個封裝中將其增倍。IBM今年在Power10上也做了同樣的事情。這并不是一個新的想法,很早之前就有了,甚至可以追溯到互聯(lián)網(wǎng)熱潮時期,當(dāng)時IBM、惠普和英特爾都將其服務(wù)器芯片的DCM投入該領(lǐng)域,以增加計算密度。

  為了比較未來發(fā)布的Xeon SP處理器,我們忽略了這些AP以及那些將使用HBM內(nèi)存來提高處理器內(nèi)存帶寬的處理器,雖然這些都很重要,但主題的其他因素也很重要,例如包含各種加速器的封裝,而其他封裝則不包含。計算領(lǐng)域?qū)霈F(xiàn)大規(guī)模定制,正如我們之前所指出的,這將意味著,相對于過去更加精簡的產(chǎn)品,任何特定的變化都會導(dǎo)致產(chǎn)量下降。Nehalem Xeon只有一個CPU,某些功能可能已經(jīng)激活或未激活。在chiplet架構(gòu)中,任何變化都是可能的。我們還認(rèn)為英特爾最終將在服務(wù)器中混合使用大核和小核,即所謂的P核和E核(Performance and Efficient的縮寫),我們忽略了這一點,并考慮在未來的Xeon中只使用P核的芯片。

  因此,與當(dāng)前的Ice Lake Xeon SPS相比,我們對未來四代Xeon SPS的最佳猜測如下:

20220122020033649.jpg

  正如我們所說,任何加粗的紅色斜體都是我們的猜測。這是一個模板,我們將判斷英特爾實際做什么,預(yù)測可能做什么。

  我們認(rèn)為“Emerald Rapids” Xeon SP將在一年后推出,并對Eagle Stream平臺進(jìn)行升級,它將是Sapphire Rapids的一個完整版本,所有的核心都被激活(或核心復(fù)雜的新芯片),并擁有更快的DDR5內(nèi)存。鑒于核心數(shù)、時鐘速度和IPC的改進(jìn),我們預(yù)計Top Bin 56核Sapphire Rapids芯片的吞吐量將比Top Bin 40核Ice Lake芯片高出約67%,并進(jìn)一步認(rèn)為英特爾將把芯片的價格提高到10,000美元左右,并提供約26%的性價比。

  這也引出了一個很好的觀點。在所有可以拉動的杠桿中,價格是最大的杠桿,也是最容易用力拉動的杠桿。如果AMD或ARM在性能或價格方面又或者兩方面都變得咄咄逼人,那么英特爾也不得不效仿。我們希望每個企業(yè)都能在芯片上賺更多的錢,并為芯片注入更多的性能,以證明更高的價格是合理的。這些芯片的制造成本會更高,所以為什么不呢?

  我們預(yù)計高端的Xeon處理器會變得更貴,因為與過去10年的Xeon產(chǎn)品線相比,每一代提供的增量計算都將非常驚人。

  Granite Rapids 和Diamond Rapids就是一個很好的例子。在去年的英特爾加速活動上,芯片制造商推出了Granite Rapids的模具模型,我們在本文的頂部展示了這張?zhí)貙憟D片,在此重復(fù)一下:

20220122020033761.jpg

  這個模型顯示了兩個核心塊,每個有60個核,被HBM和高速緩存或PCI Express和內(nèi)存控制器包圍。(我們認(rèn)為是后者,而不是前者。)為了與AMD的Epyc芯片競爭,Granite Rapids必須擁有120個左右的內(nèi)核,所以也許英特爾只是為了好玩才在演示中放了個復(fù)活節(jié)彩蛋。

  有傳言稱,Diamond Rapids Xeon SP芯片中使用的“Lion Cove”核心的IPC將是Sapphire Rapids CPU中使用的“Golden Cove”核心的兩倍。

  下面的圖表展示了IPC與Dothan核心架構(gòu)的改進(jìn),Dothan核心架構(gòu)在Opteron一代中保存了英特爾的cookie:

20220122020033544.jpg

  Golden Cove和Lion Cove內(nèi)核之間的2X IPC似乎很難實現(xiàn),但上表顯示了這兩個處理器的性能和價格/性能。預(yù)計Emerald Rapids Xeon SPS中的“Raptor Cove”內(nèi)核中的IPC將比Sapphire Rapids Xeon SPS使用的Golden Cove內(nèi)核中的IPC提高5%到10%,而我們只顯示了大約8%的中間值。為了實現(xiàn)2倍的飛躍,Granite Rapids和Diamond Rapids Xeon SPS中分別使用的Redwood Cove和Lion Cove內(nèi)核,需要實現(xiàn)英特爾歷史上最大的IPC改進(jìn)。

  如果英特爾能做到這一點,并以合適的工藝刻蝕(自己或臺積電的)核心,盡可能將多的核心裝入一個封裝中,那么2024年和2025年的主流Xeon SP芯片將會令人印象深刻。如果一切如我們所料,一個頂級的Diamond Rapids處理器的價格將是頂級Sandy Bridge Xeon E5的6.3倍,但它擁有更多的18X核,提供65.6倍的吞吐量性能,并將單位性能成本降低了90.4%。

  這些變化將徹底改變數(shù)據(jù)中心中CPU計算的性質(zhì)。即使英特爾不這樣做,AMD和ARM也很有可能會這樣做。我們強烈懷疑,英特爾可能還需要一到兩代人的時間才能實現(xiàn)其看似崇高的目標(biāo),讓我們拭目以待。




mmexport1621241704608.jpg


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。