《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 電子元件 > 業(yè)界動(dòng)態(tài) > CPU與GPU、VCU的關(guān)系愈加“微妙”

CPU與GPU、VCU的關(guān)系愈加“微妙”

2021-06-09
來源:雷鋒網(wǎng)
關(guān)鍵詞: CPU GPU VCU

  一個(gè)GPU總需要一個(gè)CPU,但CPU的選擇已經(jīng)不再單一,GPU的功能也不再”簡(jiǎn)單“,曾經(jīng)穩(wěn)固的關(guān)系,不再是單純的合作。

  四月份,英偉達(dá)發(fā)布了采用Arm架構(gòu)的首款數(shù)據(jù)中心CPU Grace引發(fā)廣泛關(guān)注。本月,外媒Tomshardware報(bào)道,像CPU一樣總需要一個(gè)CPU的谷歌自研視頻編解碼處理單元Argos VCU,預(yù)計(jì)可以替換3000-4000萬個(gè)英特爾CPU。

  依賴CPU的GPU和VCU為什么會(huì)有替代CPU的勢(shì)頭?芯片巨頭與互聯(lián)網(wǎng)巨頭間的競(jìng)合關(guān)系,是如何加深的?

  1

  CPU市場(chǎng)的雙重變化

  回答CPU與其它依賴CPU處理器關(guān)系變化之前,不妨先了解CPU市場(chǎng)本身的變化。在很長(zhǎng)一段時(shí)間,由于CPU的性能已經(jīng)足夠滿足包括PC在內(nèi)的各種應(yīng)用需求,再加上內(nèi)存和帶寬成為CPU性能提升的瓶頸。CPU王者英特爾在提升CPU性能動(dòng)力不足,以及先進(jìn)制程工藝進(jìn)展不如預(yù)期的情況下,連續(xù)多代CPU性能提升幅度不大,被稱作”擠牙膏“。

  英特爾在領(lǐng)先位置緩慢前進(jìn)的幾年間,AMD憑借Zen架構(gòu)的迅速迭代以及臺(tái)積電先進(jìn)制造工藝的加持,性能迅速接近甚至超越英特爾酷睿和至強(qiáng)CPU的性能?!盇MD Yes“表達(dá)了消費(fèi)者對(duì)于AMD產(chǎn)品迅速提升的認(rèn)可。

  英特爾和AMD的x86 CPU是PC時(shí)代的標(biāo)志,然而在性能提升陷入瓶頸,以及先進(jìn)半導(dǎo)體制程提升難度越來越大的背景下,兩家最具代表性的CPU公司表現(xiàn)相差甚遠(yuǎn),并且開始在市場(chǎng)份額上有所體現(xiàn)。

  依舊有領(lǐng)先優(yōu)勢(shì)的英特爾感受到了老對(duì)手帶來的競(jìng)爭(zhēng)壓力,因此無論是產(chǎn)品性能提升還是市場(chǎng)策略都更加積極。然而,英特爾在服務(wù)器CPU市場(chǎng)除了要面臨同為x86陣營(yíng)AMD的競(jìng)爭(zhēng),Arm陣營(yíng)的公司也來勢(shì)洶洶。

  Ampere董事長(zhǎng)兼首席執(zhí)行官Renee James說:”我們知道未來將與過去不同,因?yàn)檐浖h(huán)境變了,不再是關(guān)于PC和PC服務(wù)器的業(yè)務(wù),而是圍繞云和云邊緣?,F(xiàn)在,需要另一種不同的微處理器?!?/p>

  3.png

  Ampere基于Arm Neoverse N1內(nèi)核,推出了80核的Altra CPU和128核Altra Max CPU,持續(xù)刷新服務(wù)器CPU核心數(shù)的紀(jì)錄,突出與x86 CPU相比更高的核數(shù)以及在云原生市場(chǎng)的優(yōu)勢(shì)。

  同樣是強(qiáng)調(diào)差異化優(yōu)勢(shì),英偉達(dá)的Grace主要是面向數(shù)據(jù)密集型HPC和AI應(yīng)用。英偉達(dá)首席執(zhí)行官黃仁勛稱基于Grace的系統(tǒng)與英偉達(dá)GPU緊密結(jié)合,性能將比目前最先進(jìn)的NVIDIA DGX系統(tǒng)(在x86 CPU上運(yùn)行)高出10倍。

  無論是Ampere還是英偉達(dá),其差異化高性能CPU的基礎(chǔ)都是Arm。而Arm也在今年三月推出了面向未來十年的新一代架構(gòu)Armv9,Arm希望將其架構(gòu)在智能終端的成功擴(kuò)展到高性能計(jì)算市場(chǎng),包括邊緣、云端及5G等?;贏rmv9架構(gòu)的Neoverse N2正是Arm向高性能市場(chǎng)拓展的關(guān)鍵產(chǎn)品。

 4.png

  整體看來,已經(jīng)在PC和服務(wù)器CPU市場(chǎng)大獲成功的x86陣營(yíng)正開始一場(chǎng)激烈的競(jìng)爭(zhēng)。此時(shí),面向云計(jì)算、AI的Arm架構(gòu)CPU迅速發(fā)展,要在新興市場(chǎng)分一杯羹。未來,RISC-V CPU會(huì)以怎樣的方式參與到CPU市場(chǎng)的競(jìng)爭(zhēng),也讓人充滿期待。

  2

  異構(gòu)時(shí)代,定制CPU優(yōu)勢(shì)突顯

  CPU市場(chǎng)發(fā)生雙重變化的一個(gè)關(guān)鍵因素是市場(chǎng)需求,在市場(chǎng)的驅(qū)動(dòng)下,CPU的價(jià)值也更多體現(xiàn)在異構(gòu)系統(tǒng)中。英偉達(dá)在今年四月發(fā)布Grace CPU的時(shí)候,也同時(shí)將其數(shù)據(jù)中心產(chǎn)品路線圖升級(jí)為GPU+CPU+DPU的三類芯片,逐年飛躍,一個(gè)架構(gòu)的策略。在這個(gè)新的策略中,GPU和DPU性能的充分發(fā)揮依舊需要有CPU強(qiáng)大的性能,也就是說,CPU計(jì)算和控制的基礎(chǔ)和核心作用沒有改變。

 5.png

  變的是新興應(yīng)用對(duì)于算力的大幅快速增長(zhǎng),異構(gòu)系統(tǒng)的性能是更重要的關(guān)注點(diǎn)?!蹦壳笆袌?chǎng)上每年交付的3000萬臺(tái)數(shù)據(jù)中心服務(wù)器中,有1/3用于運(yùn)行軟件定義的數(shù)據(jù)中心堆棧,其負(fù)載的增長(zhǎng)速度遠(yuǎn)遠(yuǎn)快于摩爾定律。除非我們找到加速的辦法,否則用于運(yùn)行應(yīng)用的算力將會(huì)越來越少。“黃仁勛說,”新時(shí)代的計(jì)算機(jī)需要新的芯片、新的系統(tǒng)架構(gòu)、新的網(wǎng)絡(luò)、新的軟件和工具。“

  這也是英偉達(dá)推出DPU,并且將DPU歸入其數(shù)據(jù)中心產(chǎn)品路線圖的原因。”現(xiàn)代超大規(guī)模云技術(shù)推動(dòng)數(shù)據(jù)中心從基礎(chǔ)上走向了新的架構(gòu), 利用一種專門針對(duì)數(shù)據(jù)中心基礎(chǔ)架構(gòu)軟件而設(shè)計(jì)的新型處理器, 來卸載和加速由虛擬化、網(wǎng)絡(luò)、存儲(chǔ)、安全和其它云原生AI服務(wù)產(chǎn)生的巨大計(jì)算負(fù)荷。BlueField DPU正是為此而生?!包S仁勛此前表示。

  6.png

  異構(gòu)組合才能更好滿足未來市場(chǎng)的需求,這也已經(jīng)是業(yè)界共識(shí),從英特爾擁有CPU+GPU+FPGA+AI加速器的完整芯片組合,到英偉達(dá)宣布收購Arm,再到AMD宣布收購賽靈思,芯片巨頭們都希望通過不同類型的芯片組合滿足云計(jì)算、AI等計(jì)算更加密集應(yīng)用的需求。

 7.png

  在這種變化中,CPU的選擇也會(huì)更加多樣。Computex 21上,黃仁勛在回答雷鋒網(wǎng)等提問時(shí)表示:”未來的世界非常多樣,當(dāng)然也會(huì)有不同的CPU,包括x86架構(gòu)和Arm架構(gòu),大型CPU和小型CPU,面向邊緣、數(shù)據(jù)中心、超算等CPU,我們的策略是在我們服務(wù)的市場(chǎng),選擇最合適的CPU,我們會(huì)繼續(xù)支持x86 CPU?!?/p>

  面向特定的市場(chǎng),并非所有CPU都合適。因此在不同的市場(chǎng)需要不同的CPU,比如在筆記本電腦市場(chǎng),英特爾的x86 CPU是不錯(cuò)的選擇,在DGX系統(tǒng)中,AMD的CPU表現(xiàn)非常好。在5G基站中,基于Arm的Marvell CPU是一個(gè)理想選擇。在云計(jì)算市場(chǎng),Ampere的CPU性能出色。英偉達(dá)的CPU為的是解決AI推薦系統(tǒng)和自然語言理解這樣大型AI模型的計(jì)算挑戰(zhàn)。

  ”我相信未來既需要通用CPU,也需要定制CPU。支持Arm和x86對(duì)我們來說都是很好的戰(zhàn)略?!包S仁勛表示。

  3

  CPU與GPU、VCU更加微妙的競(jìng)合關(guān)系

  既有自研的Arm CPU,也支持x86 CPU,讓英偉達(dá)與CPU巨頭間的競(jìng)合關(guān)系中競(jìng)爭(zhēng)的成分更高。在PC時(shí)代,芯片巨頭間的競(jìng)爭(zhēng),是CPU公司或者GPU公司之間的競(jìng)爭(zhēng),CPU與GPU公司以合作為主旋律。

  邁入AI時(shí)代,英偉達(dá)憑借其GPU硬件加上通用的軟件,成為了AI芯片公司的代表,在AI市場(chǎng)成為了英特爾強(qiáng)大的競(jìng)爭(zhēng)對(duì)手。面向市場(chǎng)空間巨大的云計(jì)算和5G市場(chǎng),英偉達(dá)的GPU依舊離不開英特爾和AMD的CPU,但同時(shí)英偉達(dá)會(huì)更加注重Arm架構(gòu)CPU的開發(fā),芯片巨頭間的競(jìng)合關(guān)系進(jìn)一步加深。

  這種關(guān)系變化更明顯的轉(zhuǎn)變?cè)谛酒揞^與互聯(lián)網(wǎng)巨頭之間。比如文章開頭提到的谷歌Argos VCU,多年來谷歌都使用英特爾CPU中的視頻編解碼引擎,但隨著視頻內(nèi)容越來越多,以及分辨率越來越高,谷歌需要性能更強(qiáng)但是功耗和成本更低的芯片。

  定制的專用芯片性能往往會(huì)比通用芯片更強(qiáng),通過自研核心功能加上集成第三方IP,能在規(guī)模應(yīng)用中實(shí)現(xiàn)優(yōu)勢(shì)。谷歌表示,與英特爾Skylake驅(qū)動(dòng)的服務(wù)器系統(tǒng)相比,其基于VCU的設(shè)備在性能、TCO(總體擁有成本)、計(jì)算效率方面實(shí)現(xiàn)了7倍(H.264)和高達(dá)33倍(VP9)的提升。

  8.png

  CPU、GPU 和配備 VCU 的系統(tǒng)離線雙通道單輸出 (SOT) 吞吐量

  除了VPU,谷歌也已經(jīng)通過自研的TPU減少了購買CPU和GPU。谷歌與芯片巨頭們的關(guān)系,不再單純是緊密的合作伙伴,在特定市場(chǎng)也成為了競(jìng)爭(zhēng)對(duì)手。

  對(duì)于這種轉(zhuǎn)變,英特爾公司副總裁兼中國(guó)區(qū)總經(jīng)理王銳此前對(duì)雷鋒網(wǎng)表示,”競(jìng)爭(zhēng)對(duì)手可以在某一參數(shù)或者是在制程上縮短與我們的差距。但要打造整個(gè)架構(gòu),在計(jì)算和AI的各個(gè)方面都要能夠趕超英特爾,不是那么容易的事情。“

  這是芯片巨頭應(yīng)對(duì)技術(shù)、市場(chǎng)變化的自信和底氣,當(dāng)然,芯片巨頭們也需要更多地考慮與自研芯片的互聯(lián)網(wǎng)巨頭們的關(guān)系。

  不要忽略,無論是芯片巨頭們之間的競(jìng)爭(zhēng),還是芯片巨頭與互聯(lián)網(wǎng)巨頭們之間關(guān)系的變化,本質(zhì)上除了市場(chǎng)和應(yīng)用變化的驅(qū)動(dòng),還有成熟的芯片產(chǎn)業(yè)鏈,包括成熟的設(shè)計(jì)工具、IP、代工廠和封裝,很大程度降低了GPU公司設(shè)計(jì)CPU,以及互聯(lián)網(wǎng)巨頭設(shè)計(jì)定制芯片的門檻。

  芯片行業(yè)的門檻還在進(jìn)一步降低,這還會(huì)帶來怎樣的變化?

  


微信圖片_20210517164139.jpg


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。