《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > ASIC會不會取代GPU?

ASIC會不會取代GPU?

2024-12-20
來源:36Kr
關鍵詞: 高通 ASIC GPU 英偉達

最近這段時間,美國股票市場的動靜比較大。有兩個科技股概念,突然變得很火,引起了市場的高度關注,漲幅驚人。這兩個概念,分別是ASIC和量子計算。

今天這篇文章,我們主要說說ASIC。

按資本市場的說法,ASIC正在加速崛起,威脅GPU在AI計算中的統(tǒng)治地位。而博通,作為ASIC最重要的概念股,股價一路猛漲,一度從180飆到了250,市值也突破了萬億美元。相比之下,英偉達反而成了昨日黃花,股價一路下跌,甚至不到130美元。

博通股價(昨天跌了)

那么,ASIC時代真的到來了嗎?博通真的會取代英偉達,成為新的AI之王?

ASIC和GPU是什么

ASIC和GPU,都是用于計算功能的半導體芯片。因為都可以用于AI計算,所以也被稱為“AI芯片”。

準確來說,除了它倆,計算芯片還包括大家更熟悉的CPU,以及FPGA。

行業(yè)里,通常會把半導體芯片分為數(shù)字芯片和模擬芯片。其中,數(shù)字芯片的市場規(guī)模占比較大,達到70%左右。

數(shù)字芯片,還可以進一步細分,分為:邏輯芯片、存儲芯片以及微控制單元(MCU)。CPU、GPU、FPGA、ASIC,全部都屬于邏輯芯片。

1.jpg

芯片的分類

邏輯芯片,就是計算芯片。它包含了各種邏輯門電路,可以實現(xiàn)運算與邏輯判斷功能。

四個芯片里,CPU和GPU是通用芯片,可以完成多種任務。尤其是CPU,是全能型選手,單核主頻高,啥都能干,所以經常被拿來做主處理器。

而GPU,本來是用來做圖形處理(顯卡)的。它的內核數(shù)量特別多(大幾千個),適合做并行計算,也就是擅長同時做大量的簡單計算任務。(圖形處理,就是同時處理大量的像素計算。)

2.jpg

AI計算和圖形計算一樣,也是典型的并行計算型任務。

AI計算中包括大量并行的矩陣相乘、卷積、循環(huán)層、梯度運算等任務,所以,特別適合GPU去完成。CPU不適合AI計算,這也是英特爾股價跌到20美元以下的原因之一。

2023年以來,AI浪潮爆發(fā),大部分企業(yè)的AI訓練,采用的是 英偉達的GPU集群。如果進行合理優(yōu)化,一塊GPU卡,可以提供相當于數(shù)十其至上百臺CPU服務器的算力。這直接導致了英偉達的股價猛漲了幾十倍,而且還買不到。

3.jpg

NVIDIA HGX A100 8 GPU 組件

再來看看ASIC和FPGA。

ASIC(Application Specific Integrated Circuit,專用集成電路),是一種專用于特定任務的芯片。ASIC的官方定義,是指:應特定用戶的要求,或特定電子系統(tǒng)的需要,專門設計、制造的集成電路。

4.jpg

Google公司大名鼎鼎的TPU(Tensor Processing Unit,張量處理單元),還有前幾年很火的比特幣礦機,英特爾的Gaudi 2 ASIC芯片,IBM的AIU,AWS的Trainium,都屬于ASIC芯片。

這幾年非常火的DPU(Data Processing Unit,數(shù)據處理單元)和NPU(Neural Processing Unit,神經網絡處理單元),也是ASIC芯片。

FPGA(Field Programmable Gate Array,現(xiàn)場可編程門陣列),是半定制芯片,也被人稱為“萬能芯片”。FPGA可以根據用戶的需要,在制造后,進行無限次數(shù)的重復編程,以實現(xiàn)想要的數(shù)字邏輯功能。

ASIC和FPGA的區(qū)別在于,AISC是全定制芯片,功能寫死,沒辦法改。 而FPGA是半定制芯片,功能靈活,可玩性強。 FPGA不需要流片(很燒錢的一個工序),但因為可編輯,冗余功能比較多,一旦用于單一目的,就會存在浪費。大規(guī)模生產的情況下,F(xiàn)PGA的成本比ASIC高,且極致能效不如ASIC。

所以,F(xiàn)PGA現(xiàn)在多用于產品原型的開發(fā)、設計迭代,以及一些低產量的特定應用,或者用于培訓和教學。它適合那些開發(fā)周期必須短的產品,也經常用于ASIC的驗證。

反正,大家記住,大規(guī)模出貨用于AI計算,一般不考慮FPGA。

所以,AI芯片,也就是GPU和ASIC之爭。

GPU和ASIC,到底誰厲害?

ASIC作為專用定制芯片,基于芯片所面向的專項任務。它的計算能力和計算效率都是嚴格匹配于任務算法的。芯片的核心數(shù)量,邏輯計算單元和控制單元比例,以及緩存等,整個芯片架構,也是精確定制的。

所以,ASIC可以實現(xiàn)極致的體積、功耗。這類芯片的可靠性、保密性、算力、能效,都會比通用芯片(GPU)更強。

例如,在同等預算下,AWS的Trainium 2(ASIC芯片)可以比英偉達的H100 GPU更快速完成推理任務,且性價比提高了30-40%。明年計劃推出的Trainium3,計算性能更是提高了2倍,能效提高40%。

5.jpg

但是,為什么這兩年一直火的都是GPU呢?

主要是因為英偉達太猛。

英偉達在AI上也是歪打正著。當年AI大佬辛頓(就是那個新晉諾貝爾獎得主)帶著徒弟使用GPU做AI訓練,獲得巨大突破,才讓英偉達發(fā)現(xiàn)自己竟然還有這樣的潑天富貴。

然后,英偉達就開始在AI發(fā)力,拼命做更厲害的GPU(當然,也有游戲的帶動)。

在英偉達的持續(xù)努力下,GPU的核心數(shù)和工作頻率一直在提升,芯片面積也越來越大。算力越強,有利于縮短訓練時間,加快產品發(fā)布,這也是重要優(yōu)勢。

當然,算力變強,功耗也水漲船高。但是,靠工藝制程、水冷等被動散熱,勉強也能兜得住,反正不會燒掉。

除了硬件之外,英偉達在軟件和生態(tài)方面也很會布局。

他們搗鼓出來的CUDA(AI開發(fā)的軟件套件),是GPU的一個核心競爭力?;贑UDA,初學者都可以很快上手。所以,英偉達的GPU方案,被全球用戶廣泛接受,形成了牢固的生態(tài)。

相比之下,F(xiàn)PGA和ASIC的開發(fā)還是太過復雜,不適合普及。

ASIC之所以在AI上干不過GPU,和它的高昂成本、超長開發(fā)周期、巨大開發(fā)風險有很大關系。 現(xiàn)在AI算法變化很快,ASIC這種開發(fā)周期,很要命。

綜合上述原因,GPU才有了現(xiàn)在的大好局面。

值得一提的是,前面說了,AI計算分為訓練和推理兩種。訓練任務,需要更強大的算力,所以在AI訓練上,廠商們主要以GPU為主。

推理任務的話,算力要求要低一點,也不需要什么并行,所以GPU的算力優(yōu)勢沒那么明顯。很多企業(yè),就會開始采用更便宜、更省電的FPGA或ASIC,進行計算。

這個情況,一直持續(xù)到了現(xiàn)在。AI芯片,GPU的占比能達到70%以上。

如今,因為大家實在是“苦英偉達久矣”,不想總被英偉達“卡脖子”,所以非常希望算力多元化。再有,大模型現(xiàn)在從“訓練熱”走向了“推理熱”。推理類的AI計算需求增加,給了ASIC機會。

所以,扶持ASIC產業(yè)鏈,提升ASIC芯片在AI領域的占有率,成為了大家的共識。這才有了博通和Marvell股價的猛漲。(據說,博通正與三個大型客戶開發(fā)AI芯片,預計2025年AI芯片業(yè)務收入達到150億-200億美元。)

那么,取代就真的那么容易嗎?ASIC會很快淘汰掉GPU嗎?

顯然不是的。

憑借前面提到的性能、生態(tài)、集成能力等方面的優(yōu)勢,英偉達的GPU仍然會是中短期內的AI芯片首選。英偉達的軟硬件網絡整套方案都很成熟,技術和資金實力太強,GPU的存量和出貨量依然很大,市場地位難以撼動。

ASIC的崛起速度雖然很快,但仍需要一定的時間走向成熟。AI ASIC芯片的研發(fā),也具有很高的風險。即使研發(fā)成功,也需要時間被用戶所接受。

這就意味著,在很長的一段時間內,GPU和ASIC都將處于共存狀態(tài)?;诓煌膱鼍?,用戶會選擇最適合自己的芯片。發(fā)展自研ASIC,更多是有利于廠商們和英偉達進行談判砍價。

未來的情況還是比較難預測的。 量子計算是不是會對計算領域造成顛覆式影響,現(xiàn)在也是討論的熱點。


Magazine.Subscription.jpg

本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。