隨著英偉達在最新的財報會議中明示,不同的國家都在嘗試建立屬于自己的 AI 算力,這一暗流下的激烈角逐已經(jīng)完全走向臺前。
在這一場國家級、企業(yè)巨頭之間的競爭中,站在最前排的就是大模型和大模型的算力發(fā)動機 GPU。
從今年的 Sora、Claude3、GPT5 的態(tài)勢來看,大模型的智力涌現(xiàn)并未有絲毫放緩的跡象;這也使得國產(chǎn)大模型的追趕,眼看要縮小的差距又被無情的拉大,但算法的半透明和原理的公開,總歸讓這場競賽不至于被套圈太多。
雖然 GPU 龍頭英偉達股價一飛沖天,但攪局者的動力也有增無減,AMD 作為二供被寄予了厚望,谷歌自研 TPU 也被不少人看好;而國產(chǎn) GPU 選手華為昇騰、寒武紀、海光、沐熙、壁韌等也在嘗試形成自己的閉環(huán)。
但在更為隱秘的戰(zhàn)場,HBM(高帶寬內(nèi)存)顯然是基本被忽視的關鍵一環(huán)。
01
大模型和 GPU 是明戰(zhàn),HBM 則是暗戰(zhàn)
如果因循最基本的原則,從 AI 算力出發(fā),我們知道制約單芯片能力的最大瓶頸有三個,分別是:GPU、先進制程(含 CoWoS 先進封裝),以及 HBM。
其中 GPU 和先進制程是一體兩面的關系,優(yōu)秀 GPU 企業(yè)如英偉達設計出來 GPU 之后,還需要利用臺積電的先進制程進行制造,再利用臺積電、日月光的先進封裝技術 CoWoS 進行最后的合封,這一點在 2023 年 CoWoS 產(chǎn)能奇缺的時候,已被市場刨根問底。
而在同一顆 AI 芯片上的顯存顆粒模組 HBM,作為與先進制程同等重要的存在,但到的關注顯然不夠。這一產(chǎn)品基本完全被韓國的海力士和三星壟斷,合計占市場份額的 90% 以上,絲毫不比 GPU 和 CoWoS 競爭格局差,而高度壟斷,在這逆全球化的背景下,隱含的就是高供應鏈風險。
HBM 也是 AI 芯片中占比最高的部分,根據(jù)外媒的拆解,H100 的成本接近 3000 美元,而其中占比最高的是來自海力士的 HBM,總計達到 2000 美元左右,超過制造和封裝,成為成本中最大的單一占比項。
雖然 HBM 非常昂貴,但隨著 AI 基礎算力需求的大爆發(fā),草根調(diào)研顯示當前 HBM 仍是一芯難求,海力士和三星 2024 年所有的產(chǎn)能都已經(jīng)完全被預定,行業(yè)的供需失衡可能在 2025 年也仍無法得到有效的緩解??赡軓娙缬ミ_,也需要思考自己的 HBM 供應鏈是否足夠安全。
這一重大的產(chǎn)業(yè)趨勢,自然也被存儲芯片大國韓國了如指掌。
經(jīng)過一段時間的醞釀,2024 年初,韓國企劃財政部正式公布了《2023 年稅法修正案后續(xù)執(zhí)行規(guī)則修正案草案》,將 HBM 等技術指定為國家戰(zhàn)略技術,進一步擴大稅收支持,在這一法案的支持下,三星電子、SK 海力士等中大型企業(yè)可享受高達 30% 至 40% 的減免。
考慮到韓國的大企業(yè)所得稅一般在 25%,這么大力度的減免,相當于給了韓國的 HBM 產(chǎn)品直接額外賦予了接近 10% 的價格優(yōu)勢。當前韓國的存儲芯片企業(yè)海力士和三星,在 HBM 產(chǎn)品的產(chǎn)能和技術上,本來就處于斷檔式領先,即使其他追趕者能夠做出來產(chǎn)品,考慮到海力士和三星天然的價格屠夫的歷史形象,這將使得追趕者大概率始終陷入技術落后、價格高企的惡性循環(huán)中。
當然,韓國目前仍然是小大小鬧,還暫時沒有將 HBM 出口進行管制,或者進行相關的技術限制。但是翻看最近的歷史,我們不得不對此事提起十二分的關注。
2022 年 10 月,美國限制中國先進制程的發(fā)展,從設備、技術到人才實現(xiàn)全方面圍堵,使得原本進步飛速的國產(chǎn)先進制程舉步維艱。
2023 年 10 月,美國限制英偉達等美國企業(yè)向中國出口超過一定算力和帶寬的 GPU 芯片,直接對國產(chǎn)大模型實施了釜底抽薪式的打擊。
如果未來對 HBM 的限制變嚴格,那么就意味著我國在 AI 算力的三要素—先進制程、GPU 和 HBM —中,將陷入全方位的被動局面。
所以我們才說,上一輪最值得關注 HBM 的時間是十年前它被發(fā)明的時候,其次就是現(xiàn)在。
02
HBM 的昨天、今天和明天
1. 一種特殊類型的存儲芯片,可以理解為 DRAM 的 3D 版本
存儲芯片是最大的芯片品種。為了滿足不同場景的存儲要求,又被進一步的分為 SRAM、DRAM、NAND、NOR 等等,其中市場空間最大最為重要的是 DRAM 和 NAND,也就是業(yè)內(nèi)人士常說的大宗品存儲,全球的市場空間都是接近 1000 億美元。
DRAM 對智能設備的運行速度起到與主控芯片一樣的決定性作用,對于普通消費者都能接觸到的手機為例,主控芯片和內(nèi)存(即移動端 LPDDR DRAM)就是最重要的兩顆芯片。HBM,正是 DRAM 中的一個分支品種,主打高性能。
根據(jù)行業(yè)協(xié)會的定義,DRAM 可以分為三種:1)主要用在電腦、服務器中的標準 DDR,也就是常說的內(nèi)存條;2)手機和汽車等移動終端領域的 LPDDR 系列;3)用在數(shù)據(jù)密集型場景的圖形類 DDR,HBM 正是在這一分類下。
所以,HBM 是脫胎于普通的 DRAM 的升級產(chǎn)品,基于 3D 堆棧工藝(使用 TSV 技術將多個 DRAM 芯片堆疊起來,在增加帶寬的同時,實現(xiàn)芯片間的高速通信和低功耗),可以實現(xiàn)更高的內(nèi)存帶寬和更低的能耗,。
2023 年之前,雖然上述三種 DRAM 產(chǎn)品中,HBM 在傳輸速度、容量和功耗方面都具備明顯的優(yōu)勢,但高于普通 DRAM 數(shù)倍的價格,使得對 HBM 需求一直都是名氣沒輸過、銷售沒贏過的尷尬存在。
圖:存儲芯片 DRAM 進一步分類,方正證券
但 AI 大模型的出現(xiàn),使得 HBM 找到完美的應用場景。
眾所周知,大模型的智力涌現(xiàn),依托于 Scaling laws 指導下的大力出奇跡,大模型對數(shù)據(jù)量和算力有著近乎無上限的需求,而算力的發(fā)動機 GPU 和存儲池 HBM,意外成為最大的受益者。
傳統(tǒng)帶寬的標準類 DDRDRAM 和移動類 LPDDR DRAM 顯然已經(jīng)完全無法滿足 AI 芯片的需求,而立體堆疊的 HBM,它相對普通的內(nèi)存帶寬可以提升數(shù)倍,而功耗反而更低,卻完美契合大模型的要求。
所以我們可以看到,在 AI 場景中,英偉達的 GPU 芯片不再是單獨售賣:從流程上,英偉達首先設計完 GPU,然后采購海力士的 HBM,最后交由臺積電利用 CoWoS 封裝技術將 GPU 和 HBM 封裝到一張片子上,最終交付給 AI 服務器廠商。最終產(chǎn)品結構正如海力士的宣傳材料展示的一樣。
可以說,英偉達、臺積電、海力士,這三家公司共同構成了全球 AI 算力基座的鐵三角。
2.AI 爆發(fā)帶來巨大的增長空間
從配角到主角的 HBM,也隨著 AI 的爆發(fā)也迎來屬于自己的廣闊舞臺。
在 AI 沒有爆發(fā)之前,市場預測全球 HBM 將平穩(wěn)增長至一個 100 億美元的市場。但是隨著 2023 年大模型的橫空出世,HBM 的市場中樞預測被快速拔高。
根據(jù)市場機構測算,2023 年 HBM 市場規(guī)模為 40 億美元,預計 2024 年增長至 150 億美元,到 2026 年增長至接近 250 億美元,年復合增速高達 80% 以上。這一測算也與海力士的估算匹配上,2023 年 11 月,海力士 CEO 表示,預計到 2030 年,海力士每年 HBM 出貨量將達到 1 億顆,隱含產(chǎn)值規(guī)模將接近 300 億美元,假設屆時海力士市場份額為 50%,則整個市場空間將在 500 億美元左右。
屆時,HBM 將從配角,正式成為存儲芯片中最搶眼的主角。
圖:全球 HBM 市場規(guī)模預測(AI 浪潮之前),方正證券
3. 科技巨頭的縮圈游戲
與 AI 算力中的其他要素一樣,HBM 是一個科技難度極高的產(chǎn)品,典型特征是重資本投入和高技術含量。
做 HBM,首先就要求芯片企業(yè)能做出一流的 DRAM,然后在這個 DRAM 芯粒的基數(shù)上做 3D 的堆疊。經(jīng)過幾十年的發(fā)展競爭,DRAM 已經(jīng)有極高的技術門檻,其制程已經(jīng)微縮到極限,雖然叫法上略有不同,但整體與邏輯芯片差別不大,最先進的 DRAM 都離不開 EUV 光刻機的加持;同時還非常燒錢,投資金額極高,海力士每年資本開支超百億美元。所以,當前 DRAM 已經(jīng)基本被韓國三星、海力士以及美國美光所壟斷。
而從 DRAM 到 HBM,拋開更高的資本開支不談,還新增三大工藝難點:分別是 TSV、MR-MUF、混合鍵合 Hybrid Bonding。比如 TSV 技術,在維持較低的單 I/O 數(shù)據(jù)速率的情況下大幅提升了位寬進而獲得了遠優(yōu)于 GDDR 的總帶寬表現(xiàn)。本文不就技術細節(jié)進行展開,這一難度就相當從 2D 電影進階到 3D 電影,完全是另一個維度的競爭。
直接衡量大家技術水平的,簡單可以看堆疊層數(shù)。根據(jù)了解到的最新行業(yè)動態(tài):為配套英偉達最新的 H200,2024 年下半年三大存儲廠將推出 36GB 版本的 HBM3e 或為 12 層堆疊。
對于追趕者而言,靶子已經(jīng)固定在那兒,只是難度著實不小。
03
HBM 背后的國力之爭
我們判斷,從 2024 年起,HBM 將繼 GPU 之后成為各個國家在算力競爭的關鍵。
毫無疑問,目前韓國海力士和三星遙遙領先。哪怕美國在這個領域也是落后的,他們本土的代表性公司美光科技已奮起直追。而中國國內(nèi)的大宗存儲尚處在追趕狀態(tài),所以 HBM 的落后自然也就更多,也更為急迫。
1. 韓國雙子星閃耀:海力士的不放棄功不可沒
前文提到,HBM 是基于 DRAM 的 3D 形態(tài),而 DRAM 的全球霸主三星卻在 HBM 這一細分品類上處于落后狀態(tài),而海力士卻是壟斷者的存在,這得益于公司對 HBM 技術的不離不棄。
早在 10 年前的 2013 年,海力士就首次制造出 HBM,并被行業(yè)協(xié)會采納為標準。2015 年,AMD 成為第一個使用 HBM 的客戶。但在此之后,HBM 由于價格高昂,下游根本不買單,甚至一度被認為是點錯了科技樹。
但海力士死磕這個方向,并沒有放棄。在 2015-2022 年,雖然并沒有什么突出客戶,海力士仍然對 HBM 產(chǎn)品進行了多達 3 次技術升級,絲毫不像對待一個邊緣產(chǎn)品的待遇。
最終,憑借著 2023 年至今的 AI 浪潮,海力士的 HBM 一芯難求,從無人問津到一飛沖天,10 年的堅守終于換了回報。在低迷的韓國股市中,海力士股價也一騎絕塵,實現(xiàn)翻倍,成為跟上全球 AI 浪潮的唯一一家韓國公司。
另一方面,內(nèi)存領域的霸主三星,得益于在 DRAM 上的深厚積累,以及并不落后的技術儲備,迅速崛起成為 HBM 排名第二的玩家。
2016 年三星開始大規(guī)模量產(chǎn) HBM。落后于海力士 3 年;而根據(jù)公司最新進展,三星已經(jīng)于 2023 年實現(xiàn)了 HBM3 的量產(chǎn)出貨,而將在今年上半年推出 HBM3E,而且規(guī)劃 2025 年實現(xiàn) HBM4 的量產(chǎn)。根據(jù)這一規(guī)劃,三星與海力士的差距已經(jīng)縮小到半年左右,而差距有望于 2025 年被完全消弭。
三星除了有 DRAM 的底氣之外,由于 HBM 當中包含部分邏輯芯片的電路,因此三星電子依托于自有的邏輯晶圓廠,確實具備彎道超車的比較優(yōu)勢。而且同為韓國公司,直接挖相關人才也更為容易。
毫無疑問,在 HBM 領域起了個大早的韓國,也絲毫沒有放松,還在朝前一路狂奔。
2. 美國獨苗苦苦支撐,但猶可追
美國公司在 HBM 的競賽中落后似乎是命中注定的。由于存儲芯片行業(yè)周期性極強,資本開支又是無底洞,已經(jīng)逐漸被美國企業(yè)放棄,比如當年的存儲芯片龍頭英特爾早已完全退出存儲芯片市場,轉而增加了對韓國的依賴。
好在美國還剩最后的獨苗美光科技。在存儲這個刺刀見紅的嗜血賽道上,它的生存之道是 " 茍住 "。為了避免出現(xiàn)重大損失,美光一直在研發(fā)策略上堅持不做首發(fā)者,而更傾向于采取跟隨戰(zhàn)術,這樣能夠避免高昂的研發(fā)投入和可能打水漂的資本開支。
美光開始研發(fā) HBM 的時間相對較晚,現(xiàn)在主流的 HBM3 上,美光的進度較海力士和三星落后半年以上。半年差距看似不大,但在 AI 硬件軍備競賽中,時間就是生命,大家為了保證大模型的領先,都爭相上最先進的算力產(chǎn)品,用最新的卡、最大帶寬的光模塊和最優(yōu)質的 HBM,因此晚半年推出,就代表著整個市場的錯失,所以美光在 HBM 的份額低到只有個位數(shù)。
為了實現(xiàn)彎道超車,美光已經(jīng)開始挖海力士和三星的核心人才,同時開啟多代產(chǎn)品的并行研發(fā)。公司放衛(wèi)星的表示,將在 2024 年年底實現(xiàn) HBM3E 的量產(chǎn),如果屆時完成,將使得其與韓國巨頭的技術差距明顯縮小。此外,公司規(guī)劃在 2028 年量產(chǎn) HBM4E ,將每個堆棧的容量提升到 48GB 至 64GB。
3. 中國突圍路在何方?
美國尚存獨苗,中國的 HBM 行業(yè)尚處 0 到 1 的階段,要補的課更多。
目前,中國企業(yè)在 HBM 產(chǎn)業(yè)鏈上的存在感甚至還要落后于先進制程與 GPU。如果說 GPU 只是人優(yōu)我差的問題,HBM 則是人有我無的問題。
雖然 A 股已經(jīng)對 HBM 進行了一輪又一輪的炒作,但不得不承認的客觀現(xiàn)實是,國內(nèi)到現(xiàn)在無法量產(chǎn) HBM,這成為國內(nèi)自研 AI 芯片的重大隱憂,因為 GPU 需要和 HBM 利用 CoWoS 工藝封裝在一起,國產(chǎn)的 GPU 和 CoWoS 工藝都已經(jīng)解決了有沒有的問題,已經(jīng)進入量產(chǎn)爆發(fā)階段,而 HBM 還遙遙無期。
不同于境外市場要么押注龍頭海力士,要么押注能追趕上的美光,這種簡單的選擇題。A 股對 HBM 的投資邏輯演化成兩條:
參與全球產(chǎn)業(yè)鏈。選擇能夠參與到全球 HBM 供應鏈中的企業(yè),比如做材料、代銷和封測的企業(yè),如雅克科技、神工股份、太極實業(yè)、香農(nóng)芯創(chuàng)等等。
選擇相信國產(chǎn)化能夠成功。國內(nèi)具備大宗 DRAM 能力的企業(yè)長鑫、晉華均未上市,因此選擇能夠可能在 HBM 封裝上面能夠發(fā)揮作用上市公司,如通富微電、興森科技、甬夕電子、長電科技等。
國產(chǎn) HBM 正處于 0 到 1 的突破期;考慮到海外的貿(mào)易保護主義抬頭,可能靠自己是一條不得不走的路只能靠我們自己。
時間就是生命,但由于在 DRAM 領域的落后,一家企業(yè)去主導 HBM 的突破顯得更加困難。從產(chǎn)業(yè)鏈合力的角度,更有望突破,HBM 顯然需要存儲廠、晶圓代工廠、封測廠的通力合作。根據(jù)最新的產(chǎn)業(yè)信息,到 2026 年我國將具備量產(chǎn) HBM 的能力,但這一速度顯然還是有點跟不上日新月異的大模型需求。
也就是說,現(xiàn)在,留給 HBM 中國隊的時間唯 " 緊迫 " 二字。