集邦咨詢 TrendForce 昨日(7 月 30 日)發(fā)布博文,表示英偉達 Blackwell 高耗能推動散熱需求,預估到 2024 年年底水冷散熱方案滲透率將達 10%。功耗不斷攀升
英偉達 Blackwell 平臺將于 2025 年正式放量,取代既有的 Hopper 平臺、成為英偉達高端 GPU(圖形處理器)主力方案,占整體高端產(chǎn)品近 83%。
在 B200 和 GB200 等追求高效能的 AI Server 機種,單顆 GPU 功耗可達 1,000W 以上。HGX 機種每臺裝載 8 顆 GPU,NVL 機種每柜達 36 顆或 72 顆 GPU,能耗上漲將促進 AI Server 水冷散熱供應鏈的發(fā)展。
TrendForce 集邦咨詢表示,服務器芯片的熱設計功耗(Thermal Design Power, TDP)持續(xù)提高,如 B200 芯片的 TDP 將達 1000W,傳統(tǒng)風冷散熱方案不足以滿足需求;GB200 NVL36 及 NVL72 整機柜的 TDP 甚至將高達 70kW 及近 140kW,需要搭配水冷方案以有效解決散熱問題。
水冷供應鏈
GB200 NVL36 架構(gòu)初期將以風冷、水冷并行方案為主;NVL72 因有更高散熱能力需求,原則上優(yōu)先使用水冷方案。
援引報道 GB200 機柜系統(tǒng)水冷散熱供應鏈,主要包括 5大零部件:
水冷板(Cold Plate)
冷卻分配系統(tǒng)(Coolant Distribution Unit, CDU)
分歧管(Manifold)
快接頭(Quick Disconnect, QD)
風扇背門(Rear Door Heat Exchanger, RDHx)
CDU 為其中的關鍵系統(tǒng),負責調(diào)節(jié)冷卻劑的流量至整個系統(tǒng),確保機柜溫度控制在預設的 TDP 范圍內(nèi)。
TrendForce 集邦咨詢觀察,目前針對 NVIDIA AI 方案,以 Vertiv(維諦技術)為主力 CDU 供應商,奇鋐、雙鴻、臺達電和 CoolIT 等持續(xù)測試驗證中。
在 NVIDIA 大力擴展 CSPs 客群的情況下,預估 2025 年 GB200 折算 NVL36 合計出貨數(shù)量可望達 6 萬柜,而 GB200 的 Blackwell GPU 用量可望達 210-220 萬顆。