很長一段時間以來,摩爾定律和它的最終結(jié)局一直就像房間里的大象,不容忽視。英特爾聯(lián)合創(chuàng)始人戈登·摩爾在1965年的一篇論文中預(yù)測,芯片中的晶體管數(shù)量每年將翻一番。更多的晶體管意味著更快的速度,而這種穩(wěn)定的增長推動了幾十年的計(jì)算機(jī)進(jìn)步。這是CPU制造商提高CPU速度的傳統(tǒng)方式。但晶體管的這些進(jìn)步正顯示出放緩的跡象。多倫多大學(xué)電氣和計(jì)算機(jī)工程教授Natalie Jerger說:“這已經(jīng)沒了動力?!?/p>
圖片: Alex Cranz, Gizmodo
不只Jerger一個人這么說。2016年,《麻省理工學(xué)院技術(shù)評論》宣稱,“摩爾定律已死”,今年1月,Register發(fā)布了一份摩爾定律的“死亡通知”。如果你在過去幾年里買了一臺筆記本電腦,你可能也注意到了。CPU看起來比前一年快不了多少。英特爾生產(chǎn)了我們的大多數(shù)筆記本電腦、臺式機(jī)和服務(wù)器中CPU,自2014年以來,英特爾很少能夠讓CPU性能提高15%以上,而AMD,即使采用了一些相當(dāng)激進(jìn)的新設(shè)計(jì)方法,通常也只是與英特爾并駕齊驅(qū)。
在英特爾和AMD(直到最近)所采用的典型的“單片(monolithic)”設(shè)計(jì)風(fēng)格中,CPU由半導(dǎo)體材料組成——通常都是硅。這就是所謂的芯片(die)。在芯片的頂部是一系列晶體管,因?yàn)樗鼈兌荚谕粋€芯片上,所以它們可以快速地相互通信。更多的晶體管意味著更快的處理速度,理想情況下,當(dāng)你縮小芯片的尺寸時,晶體管就會更緊密地組裝在一起,并且可以更快地相互通信,從而帶來更快的處理速度和更高的能源效率。在1974年,第一個微處理器,英特爾的8080,是建立在一個6微米的芯片上。明年的AMD處理器預(yù)計(jì)將建立在一個7納米的芯片上。這幾乎縮小了1000倍,而且速度快得多。
AMD的Threadripper比英特爾CPU大很多,因?yàn)樗鼘?shí)際上將許多AMD CPU組合在一起。(圖片:Alex Cranz, Gizmodo)
但AMD最近憑借其聽起來荒唐的Threadripper CPU實(shí)現(xiàn)了最大的速度提升。這些CPU核心數(shù)量從8個到32個不等。核心類似于CPU的引擎。在現(xiàn)代計(jì)算中,多核可以并行工作,允許某些利用多核的進(jìn)程運(yùn)行得更快。擁有32個內(nèi)核可以將Blender中3D文件的渲染時間從10分鐘縮短到僅一分半鐘,PCWorld運(yùn)行的這個基準(zhǔn)測試可以看到這一點(diǎn)。
另外,32核處理器聽起來很酷!AMD通過采用chiplet設(shè)計(jì)實(shí)現(xiàn)了這一點(diǎn)。它所有的現(xiàn)代CPU都使用一種叫做Infinity Fabric的東西。今年早些時候在接受Gizmodo采訪時,AMD計(jì)算和圖形業(yè)務(wù)部門前總經(jīng)理Jim Anderson稱,這是AMD最新的微架構(gòu)Zen的“秘方”。與此同時,CTO Mark Papermaster稱其為“隱藏的寶石”。
Infinity Fabric是一種基于開源的Hyper Transport的新系統(tǒng)總線架構(gòu)。系統(tǒng)總線完成了你認(rèn)為它會做的事情——從一個點(diǎn)到另一個點(diǎn)的數(shù)據(jù)總線。Infinity Fabric的巧妙之處在于它能夠非常快地傳輸數(shù)據(jù),并允許用它構(gòu)建的處理器克服chiplet CPU設(shè)計(jì)的一個主要障礙:延遲。
圖片: Alex Cranz, Gizmodo
chiplet的設(shè)計(jì)并不新鮮,但它通常很難實(shí)現(xiàn),因?yàn)楹茈y在單獨(dú)的芯片上制造出一堆晶體管,使這些芯片盡可能快地相互通信。但有了AMD的Threadrippers,你就可以在無限的結(jié)構(gòu)上配置許多典型的Ryzen CPU,它們的通信速度就像在一塊芯片上一樣快。
它運(yùn)行得非常好,其結(jié)果是超高速處理器的制造成本非常低廉,以至于AMD能夠以相當(dāng)于英特爾幾分之一的價格出售處理器,而英特爾繼續(xù)在其高核心數(shù)量中使用單片設(shè)計(jì)。在某種程度上,Infinity Fabric是一種欺騙摩爾定律的方法,因?yàn)樗皇菃蝹€快速CPU,而是通過Infinity Fabric連接的一系列CPU。所以AMD并沒有克服摩爾定律的限制,而是繞過了摩爾定律。
Jerger說:“如果你回過頭來說,‘好吧,摩爾定律實(shí)際上就是關(guān)于功能的更大集成。’我確實(shí)認(rèn)為chiplet不會以任何方式幫助整合更多小型晶體管,但它確實(shí)幫助我們建立了比上一代人更強(qiáng)大的功能和能力的系統(tǒng)?!?/p>
英特爾最新的i9 CPU可能速度很快,但它仍運(yùn)行在4年前的14納米的基礎(chǔ)上。(圖片: Alex Cranz, Gizmodo)
她指出,在某些情況下,這種圍繞chiplet設(shè)計(jì)的對話是對一家公司更顯著的失敗的一種偏移。她指的是英特爾,在過去幾年里,英特爾一直在努力克服晶體管不能永遠(yuǎn)微縮的局限性。它一直停留在14納米處理器,而且一年以來一直承諾10納米處理器,但未能兌現(xiàn)。對于英特爾來說,這是一個可怕的尷尬,當(dāng)其他芯片制造商繞著這家芯片巨頭跑了幾圈之后,情況變得更加糟糕。今年,蘋果售出了數(shù)百萬部內(nèi)置7納米處理器的手機(jī)和iPad,而AMD則在2019年發(fā)貨了12納米處理器,并承諾在2019年推出7納米處理器。AMD今年在臺北舉行的Computex大會上也公開讓英特爾感到難堪:英特爾承諾在今年年底前推出一款28核的CPU(目前還沒有出貨),幾天后,AMD推出了一款32核CPU,自8月份以來一直在出貨,價格是英特爾CPU預(yù)計(jì)價格的一半。相比之下,英特爾最近承諾的2019年向10納米工藝遷移的拖延已久的計(jì)劃顯得有些可悲。
這就是為什么你不應(yīng)該把它對chiplet CPU設(shè)計(jì)的擁抱看作是一個巧合。在某種程度上,這似乎是英特爾在鼓吹很酷的創(chuàng)新,以轉(zhuǎn)移人們對重大創(chuàng)新失敗的關(guān)注,甚至跟上競爭對手的步伐。
英特爾的帶有AMD GPU的G系列CPU就是英特爾采用chiplet設(shè)計(jì)的一個例子。(圖片:Alex Cranz, Gizmodo)
不過,盡管這款chiplet CPU是為了分散英特爾10納米問題的注意力,但它實(shí)際上也相當(dāng)酷。英特爾在chiplet設(shè)計(jì)方面的首次嘗試是在去年春天相對低調(diào)地推出了G系列CPU。G系列CPU實(shí)際上是與AMD合作開發(fā)的,AMD提供了GPU,英特爾的CPU可以與之通信。英特爾沒有依賴AMD的Infinity Fabric之類的東西,而是開發(fā)了一種名為嵌入式多?;ミB橋(EMIB)的東西,它可以讓CPU、GPU和4 GB的高帶寬內(nèi)存以接近同一芯片上一系列組件的速度進(jìn)行通信。它的速度很快,當(dāng)我們在3月份進(jìn)行測試時,它給我們留下了深刻的印象。它預(yù)示著一個很酷的未來,我們的集成GPU最終會變得像英偉達(dá)GTX和RTX系列這樣的分立GPU一樣快。
但EMIB也像是對英特爾本月早些時候宣布的一款產(chǎn)品進(jìn)行的一次試水,該產(chǎn)品預(yù)計(jì)明年上市:它是一款10納米CPU,帶有集成3D堆疊的chiplet設(shè)計(jì)。與EMIB和Infinity Fabric一樣,3D堆疊也是一種chiplet設(shè)計(jì)工具。但是,Infinity Fabric和EMIB只是讓傳統(tǒng)CPU部件更快地相互通信的方法,而3D堆疊增加了另一個維度。
使用3D堆疊的CPU布局示例。(圖片:英特爾)
通常芯片被放置在一個水平面上,這樣芯片的每個部分都可以與散熱器接觸,保持涼爽。3D堆疊,如果可以正確處理散熱,則可以把CPU構(gòu)建得更高而非更大。有點(diǎn)像高層建筑vs牧場式住宅。
英特爾對3D堆疊技術(shù)非常感興趣,它認(rèn)為3D堆疊技術(shù)比Infinity Fabric或EMIB更能避開摩爾定律。據(jù)英特爾工藝與產(chǎn)品集成總監(jiān)Ramune Nagisetty稱,這是摩爾定律的“進(jìn)化”。她在幾周前的談話中澄清了一些事情:
“如果你花時間去挖掘戈登·摩爾寫的那篇論文,你就會明白這一點(diǎn)。這真的很有趣,因?yàn)樵谀瞧撐闹械囊欢?,他?shí)際上預(yù)示了封裝集成的使用。他沒有使用我們今天使用的語言,但他確實(shí)說過,建立一個由小功能組成的大系統(tǒng)是更加經(jīng)濟(jì)的,這些小功能是分開封裝并相互連接的?!?/p>
我不確定我是否完全同意Nagisetty認(rèn)為這是一種演變的觀點(diǎn),但她和Jerger都承認(rèn),摩爾最初的論文中的語言有一些靈活性,而且這些封裝集成(或稱為chiplet設(shè)計(jì))的確讓新的CPU設(shè)計(jì)模式超出了摩爾在1965年設(shè)想的模式。
今年,我們還沒有確切地看到摩爾定律的死亡,但英特爾和AMD都知道死期在快速逼近,二者選擇了稍微不同的想法。這些公司現(xiàn)在正在接受一種允許他們制造許多更小、更定制化的芯片的設(shè)計(jì),而不是制造一種速度快得令人難以置信、適用于大多數(shù)人的單一芯片。
對于Jerger而言,這種靈活性是令人興奮的。她說:“在這之前,一切都是關(guān)于大批量生產(chǎn)——我必須生產(chǎn)大多數(shù)人想要的東西,因?yàn)檫@是我賺錢的唯一途徑?,F(xiàn)在,你可能會變得更加多樣化,我認(rèn)為這讓學(xué)術(shù)界和初創(chuàng)企業(yè)有機(jī)會做一些很酷的硬件設(shè)計(jì)。”