2020年8月4日,國務院公布《新時期促進集成電路產業(yè)和軟件產業(yè)高質量發(fā)展的若干政策》,開篇指出,集成電路產業(yè)和軟件產業(yè)是信息產業(yè)的核心,是引領新一輪科技革命和產業(yè)變革的關鍵力量。2020年的國際環(huán)境,讓全社會越來越認識到中國集成電路和軟件產業(yè)的薄弱,越來越堅定要把集成電路和軟件產業(yè)搞上去的決心。
今天,我們來談一談GPGPU市場。
縱觀整個IT系統(tǒng),從CPU、操作系統(tǒng)、辦公套件、整機到服務器,我們都已經初步具有一些商用化的可替代產品。唯獨在GPGPU領域,目前還是一片空白。如下圖所示:
GPGPU是什么
GPGPU全稱是通用圖形處理器(General-Purpose computing on Graphics Processing Units)。它是用專門處理圖形任務的處理器,執(zhí)行原本由中央處理器處理(CPU)完成的通用計算任務。這些通用計算常常與圖形處理沒有任何關系。圖形處理器的特點是,并行處理能力特別強,計算能效比高,并且有很大的存儲帶寬。有些應用,例如人工智能(機器學習)模型訓練與推理、高性能計算,它們往往是大數據流應用,這時,用GPGPU解決這類問題就比CPU效率更高。雖然目前機器學習會有遷移到專用硬件的可能,但在編程模型上GPU是圖靈完備的,且對于用傳統(tǒng)語言編寫的、軟件形式的計算有較好的支持,具有高度的靈活性。
因此,GPGPU目前廣泛應用于高性能計算、行業(yè)AI應用、安防與政府項目、互聯網及云數據中心等。其主要應用場景:一是人工智能模型訓練與推理;二是高性能計算。
根據有關數據預測,到2025年,中國GPGPU芯片板卡的市場規(guī)模將達到458億元,是2019年86億元的5倍多,2019年到2025年的年復合增長率高達32%。按行業(yè)來分,互聯網及云數據中心為228億元,安防與政府數據中心為142億元,行業(yè)AI應用為37億元,高性能計算為28億元。按應用場景來分,到2025年的預測數據是,人工智能推理286億元,人工智能訓練144億元,高性能計算28億元。
可以看出,GPGPU在中國的未來需求量很大,對國民經濟的發(fā)展至關重要。
GPGPU國產化的市場呼喚
一般人對GPGPU沒有什么概念。某頭部供應商的一塊高端GPGPU板卡,其售價接近一輛普通轎車的價格。
當前,人工智能應用的閘門打開了,很多企業(yè)、研究機構、研究者希望利用人工智能。首先是要做的是人工智能訓練,根據現有數據,反復訓練,得出一個模型。將這個模型部署到業(yè)務應用中,當對這個模型輸入一個新的數據時,根據模型計算出一個結果,這一過程稱為人工智能推理。例如,一個游戲網站接收到一個新用戶注冊,它想判斷這個用戶是正常用戶,還是競爭對手注冊進來拉人的惡意用戶。它就可以利用過去大量的用戶行為數據,訓練出一個人工智能模型。這個模型能夠計算出,什么樣的用戶行為就有可能是惡意用戶,從而自動地對這些用戶限制權限,或者交給人工客服來處理。類似的應用特別多,可以訓練機器做很多以前由人工來完成的事情,例如,安防領域的視頻分析,媒體領域的內容生產、字幕生成、內容審核、分類與標簽,醫(yī)療健康領域的藥物發(fā)現與探索、醫(yī)學影像自動識別、輔助醫(yī)療、自動診療,電商領域的個性化推薦、信用評級,金融交易領域的交易算法、服務管理與推薦、潛在用戶挖掘,客服領域的語音服務、聊天機器人、呼叫中心優(yōu)化,等等。
高性能計算則是國之重器,計算機學科中的明珠,廣泛應用于勘探、天氣、海洋、氣候變化、核能、發(fā)動機、航空航天等領域。
面對日益增長的需求來說,GPGPU的供應是沒有很好地滿足的。當前,全球GPGPU市場供應處于一家獨大的局面,價格昂貴,產品種類單一。以中國的云端AI訓練芯片市場為例,最大的供應商市場份額達到90%,其中,某一款產品就占整個市場的50%,另一款產品占25%。
這樣的局面雖然源自該供應商的技術和實力,但是客戶還是需要更多的選擇。例如在2017年,因為人工智能訓練和數字貨幣挖礦的需求猛增,GPGPU供不應求,價格高漲,一部分用戶嘗試將原本用作獨立顯卡的消費級GPGPU,替代用于數據中心,但是被供應商在軟件驅動上禁用,當時引起一陣熱議。
從國家的供應鏈安全角度,這兩年,一些重要的企業(yè)和機構陸續(xù)被美國列入禁售實體名單。這些用戶除了國產化,別無選擇。
GPGPU國產化如何突圍
看到這里,很多人一定會問。第一位的供應商占據90%的市場,這個市場一定很難攻下,不然全球有那么多芯片公司,早就有別的公司來制衡了。
一方面,前面分析了目前的國際環(huán)境下,我們實現國產化的必要性和緊迫性。國家也出臺了《若干政策》這樣的鼓勵措施,從財稅、投融資、研究開發(fā)、進出口、人才培養(yǎng)、知識產權、市場應用、國際合作等多個方面,支持相關的企業(yè)發(fā)展壯大。另一方面,從技術難度看,GPGPU也不是可望不可及的。改革開放四十多年來,中國有一大批芯片人才,在國際公司積累了深厚的經驗?,F在恰逢中國經濟實力增長、下決心發(fā)展半導體產業(yè)的良好時機,他們希望抓住這一機遇,一顯身手,為中國半導體產業(yè)發(fā)展做出一份貢獻。
天數智芯就是這樣一家公司。天數智芯的芯片研發(fā)團隊于2018年初組建,數十名創(chuàng)始團隊主要來自世界知名芯片公司AMD的GPU部門和企業(yè)軟件翹楚Oracle、IBM、英偉達等公司。完整的芯片設計團隊在芯片設計領域平均積累了近十年經驗,可以說,這是一支在世界范圍內都不可多得的、完善的高端芯片設計隊伍。
公司正在積極研發(fā)針對云端算力提升的訓練及推理芯片。其中,面向人工智能訓練的GPGPU芯片計劃在今年實現批量生產,2021年初商業(yè)化投向市場,這將是國內首款自研的GPGPU芯片;面向人工智能推理的GPGPU芯片也在研發(fā)之中。
天數智芯在芯片設計初始,就與服務器廠商合作共同對產品設計進行定義,以實現未來在數據中心中的國產替代。目前,天數智芯已經與浪潮、新華三等服務器廠商簽署戰(zhàn)略合作,共同推動服務器領域人工智能和HPC的計算芯片及硬件解決方案發(fā)展。天數智芯還與國產CPU龍頭中科龍芯等密切對接技術及業(yè)務合作,打造天數GPGPU+國產CPU的自主安全超算解決方案。
展望未來,我們深知任務艱巨,但我們也有信心、決心和耐力,為國產GPGPU闖出一片天地。也希望有更多的人才、合作伙伴、行業(yè)應用單位加入我們的征程。
作者簡介:
鄭金山,上海天數智芯半導體有限公司首席科學家,擁有21年芯片設計工作經驗,曾先后供職于Trident、XGI、ATI Technologies、AMD超微半導體上海有限公司和酷芯微電子(Artosyn),任高級經理、PMTS和架構師等職位。專注于GPU IP設計多年,對GPU架構與設計有深厚的造詣。他建立與帶領上海芯片設計團隊參與過多個顯卡(從Radeon HD2000到R400)芯片的研發(fā)與產品化。在酷芯微電子參與了機器視覺芯片9201的研發(fā)并成功量產。鄭金山1999年畢業(yè)于復旦大學ASIC與系統(tǒng)國家重點實驗室,獲微電子與固體電子學專業(yè)碩士學位。