以AI為賣點(diǎn)的國(guó)產(chǎn)GPU新貴是泡沫嗎?
昨天,“壁仞科技完成B輪融資,成立一年多累計(jì)融資超過(guò)47億”的新聞刷爆了半導(dǎo)體圈。
2019年9月成立的壁仞科技在其官網(wǎng)上聲稱,從發(fā)展路徑上,壁仞科技將首先聚焦云端通用智能計(jì)算,逐步在人工智能訓(xùn)練和推理、圖形渲染、高性能通用計(jì)算等多個(gè)領(lǐng)域趕超現(xiàn)有解決方案,實(shí)現(xiàn)國(guó)產(chǎn)高端通用智能計(jì)算芯片的突破。據(jù)稱該公司創(chuàng)始團(tuán)隊(duì)由國(guó)內(nèi)外芯片和云計(jì)算領(lǐng)域核心專業(yè)人員、研發(fā)人員組成,在GPU、DSA(專用加速器)和計(jì)算機(jī)體系結(jié)構(gòu)等領(lǐng)域具有深厚的技術(shù)積累和獨(dú)到的行業(yè)洞見(jiàn)。
2020年6月成立的摩爾線程獲得數(shù)十億元融資,該公司致力于構(gòu)建中國(guó)視覺(jué)計(jì)算及人工智能領(lǐng)域計(jì)算平臺(tái),研發(fā)全球領(lǐng)先的自主創(chuàng)新GPU知識(shí)產(chǎn)權(quán),以及助力建立中國(guó)本土的高性能計(jì)算生態(tài)系統(tǒng),其GPU產(chǎn)品線覆蓋通用圖形計(jì)算和高性能計(jì)算。據(jù)稱其創(chuàng)始團(tuán)隊(duì)核心成員主要來(lái)自英偉達(dá)(NVIDIA)、微軟(Microsoft)、英特爾(Intel)、AMD和Arm等,主要成員都在GPU驅(qū)動(dòng)、編譯、AI芯片、軟件算法以及系統(tǒng)設(shè)計(jì)等領(lǐng)域超過(guò)10年以上經(jīng)驗(yàn)。
2020年9月成立的沐曦集成電路完成數(shù)億元PreA+輪融資,據(jù)稱這家高性能通用GPU芯片設(shè)計(jì)公司的創(chuàng)始團(tuán)隊(duì)主要來(lái)自AMD等國(guó)際公司,擁有從40nm到7nm制程GPU芯片的設(shè)計(jì)和量產(chǎn)經(jīng)驗(yàn)。
2019年11月成立的芯瞳半導(dǎo)體創(chuàng)始團(tuán)隊(duì)來(lái)自西郵GPU研發(fā)團(tuán)隊(duì),這家專注于計(jì)算機(jī)圖形和高性能計(jì)算的芯片設(shè)計(jì)初創(chuàng)公司將在南京投資1.5億元,開(kāi)發(fā)高性能、高可靠和高穩(wěn)定性的國(guó)產(chǎn)自主GPU和人工智能芯片。
于2018年12月在上海成立的瀚博半導(dǎo)體已經(jīng)完成總計(jì)5000萬(wàn)美元的A輪融資,其核心員工平均擁有15年以上的相關(guān)芯片和軟件設(shè)計(jì)經(jīng)驗(yàn),目前有員工150多人。其產(chǎn)品注重計(jì)算機(jī)視覺(jué)及視頻處理的優(yōu)化,可提供豐富的特性和高效的性能/功耗,適用多個(gè)人工智能領(lǐng)域。
2017年11月成立的登臨科技最近完成A+輪融資,其首款GPU+(軟件定義的片內(nèi)異構(gòu)通用AI處理器)產(chǎn)品已成功回片通過(guò)測(cè)試。成立三年以來(lái),登臨致力于完全自主研發(fā)的多場(chǎng)景AI 計(jì)算平臺(tái),其Goldwasser GPU+產(chǎn)品在現(xiàn)有市場(chǎng)主流GPU 架構(gòu)上,創(chuàng)新性地采用軟硬件協(xié)同的異構(gòu)設(shè)計(jì),相比傳統(tǒng)GPU在AI計(jì)算性能和能效上均有明顯提升。
成立于2015年12月的上海天數(shù)智芯最近完成12億元的C輪融資,其7納米通用(GPGPU)云端計(jì)算芯片BI于 2020 年 5 月流片、11 月回片并于12月成功 “點(diǎn)亮”。天數(shù)智芯將進(jìn)一步加速面向5G需求的云端訓(xùn)練及推理芯片的研發(fā),提供針對(duì)當(dāng)前主流 GPGPU 生態(tài)產(chǎn)品選項(xiàng),幫助人工智能在更多領(lǐng)域落地應(yīng)用。
這些由來(lái)自英偉達(dá)或AMD等國(guó)際巨頭的資深華人專家創(chuàng)辦的國(guó)產(chǎn)GPU新貴們大都只有雄心壯志和發(fā)展宏圖,還沒(méi)有具體的產(chǎn)品和應(yīng)用方案。在短時(shí)間內(nèi)拿到這么大金額的VC投資,這是不是又一輪國(guó)產(chǎn)芯片的“泡沫”?
要準(zhǔn)確回答和預(yù)測(cè)這一輪國(guó)產(chǎn)GPU融資和創(chuàng)業(yè)的前景,還要先從GPU的發(fā)展歷程、全球和中國(guó)市場(chǎng)現(xiàn)狀,以及未來(lái)應(yīng)用發(fā)展?jié)摿?lái)看。
圖形處理器(GPU)發(fā)展進(jìn)程
對(duì)GPU比較熟悉的朋友可跳過(guò)這部分內(nèi)容,直接到“全球GPU市場(chǎng)進(jìn)入寡頭壟斷格局”部分。
圖形處理器(Graphics Processing Unit,GPU)又稱顯示核心、顯卡、視覺(jué)處理器、顯示芯片或繪圖芯片,是一種專門(mén)在PC、工作站、游戲機(jī)和一些移動(dòng)設(shè)備(如平板電腦、智能手機(jī)等)上運(yùn)行繪圖運(yùn)算工作的微處理器。
圖形處理器(GPU)的構(gòu)成。(來(lái)源:維基百科)
圖形處理器是英偉達(dá)公司(NVIDIA)在1999年8月發(fā)布NVIDIA GeForce 256圖形處理芯片時(shí)首先提出的概念。在此之前,電腦中處理圖形輸出的顯示芯片很少被視為是一個(gè)獨(dú)立的運(yùn)算單元。而競(jìng)爭(zhēng)對(duì)手ATI(后來(lái)被AMD收購(gòu))也提出了視覺(jué)處理器(Visual Processing Unit,VPU)的概念。圖形處理器可讓顯卡減少對(duì)CPU的依賴,并分擔(dān)部分原本由CPU所執(zhí)行的任務(wù),尤其是在進(jìn)行三維繪圖運(yùn)算時(shí),功效更加明顯。GPU所采用的核心技術(shù)有硬件坐標(biāo)轉(zhuǎn)換與光源、立體環(huán)境材質(zhì)貼圖和頂點(diǎn)混合、紋理壓縮和凹凸映射貼圖、雙重紋理四像素256位渲染引擎等。
GPU可單獨(dú)與專用電路板組成顯卡,或作為單獨(dú)的芯片直接內(nèi)嵌到主板上,或者內(nèi)置于主板的北橋芯片中,現(xiàn)在也有內(nèi)置于CPU組成SoC的。在2007年,90%以上的新型臺(tái)式機(jī)和筆記本電腦都帶有嵌入式圖形芯片,但是在性能上往往低于獨(dú)立顯卡。但2009年以后,AMD和英特爾都各自大力發(fā)展內(nèi)置于CPU的高性能集成式圖形處理內(nèi)核,其性能在2012年已經(jīng)超過(guò)那些低端獨(dú)立顯卡,這使得不少低端的獨(dú)立顯卡逐漸失去市場(chǎng)需求。而在手持和移動(dòng)設(shè)備領(lǐng)域,隨著設(shè)備對(duì)圖形處理能力的需求越來(lái)越高,像高通(Qualcomm)、Imagination、ARM等開(kāi)始在GPU領(lǐng)域“大顯身手”,但大都是以GPU內(nèi)核的形式植入應(yīng)用處理器MPU中。
傳統(tǒng)的CPU(如Intel i5或i7處理器)內(nèi)核數(shù)量較少,是為通用計(jì)算而設(shè)計(jì)的。相反,GPU是一種特殊類型的處理器,具有數(shù)百或數(shù)千個(gè)內(nèi)核,經(jīng)過(guò)優(yōu)化可并行執(zhí)行大量計(jì)算。雖然GPU在游戲中以3D渲染而聞名,但它對(duì)數(shù)據(jù)分析、深度學(xué)習(xí)和機(jī)器學(xué)習(xí)算法尤其有用。GPU可讓某些計(jì)算比傳統(tǒng)CPU的處理速度快10倍至100倍。
AI加速讓GPU和英偉達(dá)騰飛
人工智能加速器(AI accelerator)是一種專門(mén)的硬件加速器或計(jì)算機(jī)系統(tǒng),旨在加速人工智能應(yīng)用,尤其是人工神經(jīng)網(wǎng)絡(luò)、機(jī)器視覺(jué)和機(jī)器學(xué)習(xí)。AI加速器的典型應(yīng)用包括機(jī)器人、物聯(lián)網(wǎng)和其他數(shù)據(jù)密集型或傳感器驅(qū)動(dòng)任務(wù)的算法。它們通常由許多處理器內(nèi)核設(shè)計(jì)而成,并且通常專注于低精度算術(shù)運(yùn)算,采用新的數(shù)據(jù)流體系結(jié)構(gòu)或存內(nèi)計(jì)算架構(gòu)。
GPU是用于處理圖像和計(jì)算局部圖像屬性的專用硬件,而神經(jīng)網(wǎng)絡(luò)和圖像處理的數(shù)學(xué)基礎(chǔ)是相似的,都需要處理龐大的矩陣并行任務(wù)。自從2012年AI開(kāi)始流行以來(lái),GPU越來(lái)越多地用于機(jī)器學(xué)習(xí)任務(wù)。特別是2016年以來(lái),GPU在處理AI任務(wù)中越來(lái)越流行,并朝著深度學(xué)習(xí)的方向發(fā)展。無(wú)論是數(shù)據(jù)中心的AI訓(xùn)練還是自動(dòng)駕駛的邊緣AI推理,GPU都可以從容應(yīng)對(duì)。隨著GPU在AI方面的普及,專注于GPU的英偉達(dá)自然也成為AI時(shí)代的寵兒,一改多年活在英特爾和AMD夾縫中的“underdog”形象,一躍成為市值超過(guò)英特爾的華爾街新貴。
深度學(xué)習(xí)框架和AI算法仍在不斷發(fā)展中,這使得設(shè)計(jì)定制硬件變得異常困難。像現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)這類可重配置的器件可以比GPU更為靈活地跟隨AI框架和軟件而演進(jìn)。微軟率先使用FPGA芯片進(jìn)行AI推理加速,F(xiàn)PGA在AI加速中的應(yīng)用前景也促使Intel收購(gòu)Altera,目的是將FPGA集成到服務(wù)器CPU中,使得CPU在執(zhí)行通用計(jì)算任務(wù)的同時(shí)還能夠?qū)崿F(xiàn)AI加速。
盡管GPU和FPGA在執(zhí)行AI相關(guān)任務(wù)上性能表現(xiàn)要比CPU更好,但基于特定域架構(gòu)(DSA)理念而定制設(shè)計(jì)的ASIC可將效率再提高多達(dá)10倍。這種AI加速器采用優(yōu)化內(nèi)存使用和低精度算術(shù)之類的辦法來(lái)加速計(jì)算,并提高計(jì)算吞吐量。Facebook、Amazon和Google等互聯(lián)網(wǎng)巨頭都在設(shè)計(jì)自己的AI ASIC,像Google的TPU等。
全球GPU市場(chǎng)進(jìn)入寡頭壟斷格局
據(jù)權(quán)威調(diào)研機(jī)構(gòu)預(yù)測(cè),2020年全球GPU市場(chǎng)規(guī)模達(dá)254.1億美元,預(yù)計(jì)2027年將達(dá)到1853.1億美元,年復(fù)合增長(zhǎng)率高達(dá)32.82%。按GPU的行業(yè)應(yīng)用劃分,市場(chǎng)可細(xì)分為電子、IT與電信、國(guó)防與情報(bào)、媒體與娛樂(lè)、汽車及其它。由于GPU在設(shè)計(jì)和工程應(yīng)用中的廣泛使用,預(yù)計(jì)汽車細(xì)分行業(yè)的年復(fù)合增長(zhǎng)率最高。
在全球AI芯片市場(chǎng),GPU約占1/3左右。高性能計(jì)算(HPC)領(lǐng)域歷來(lái)都是GPU的重要市場(chǎng),有數(shù)據(jù)預(yù)測(cè)到2023年將有10%的服務(wù)器配備GPU以加速AI工作負(fù)載,而這一數(shù)字在2018年還不到2%。隨著HPC與AI的加速融合,GPU正在重新定義數(shù)據(jù)中心和高性能計(jì)算市場(chǎng)。
全球GPU已經(jīng)進(jìn)入了寡頭壟斷的格局。在傳統(tǒng)GPU市場(chǎng)中,排名前三的Nvidia、AMD、Intel的營(yíng)收幾乎可以代表整個(gè)GPU行業(yè)的收入。在手機(jī)和平板GPU方面,聯(lián)發(fā)科、海思麒麟和三星Exynos的GPU設(shè)計(jì)主要基于公版ARM Mali GPU或Imagination PowerVR微架構(gòu),而高通驍龍Adreno和蘋(píng)果A系列則采用自研GPU微架構(gòu)。
英偉達(dá)是GPU計(jì)算領(lǐng)域公認(rèn)的全球領(lǐng)導(dǎo)者,其主要GPU產(chǎn)線“GeForce”和AMD的“Radeon”形成直接競(jìng)爭(zhēng)。英偉達(dá)的四大業(yè)務(wù)增長(zhǎng)驅(qū)動(dòng)力分別是游戲、數(shù)據(jù)中心、專業(yè)視覺(jué)和自動(dòng)駕駛,代表性GPU方案包括GeForce、DGX、EGX、HGX、Quadro、AGX。該公司2021財(cái)年?duì)I收為167億美元,其中游戲、數(shù)據(jù)中心、專業(yè)視覺(jué)和自動(dòng)駕駛業(yè)務(wù)在2020財(cái)年分別貢獻(xiàn)47%、40%、6%和3%。繼2014年毛利率達(dá)到50%之后,英偉達(dá)于2021財(cái)年毛利率突破60%。
2020年9月,NVIDIA宣布以400億美元收購(gòu)ARM。如果這宗并購(gòu)成功,英偉達(dá)領(lǐng)先的AI計(jì)算平臺(tái)和ARM龐大的處理器生態(tài)相結(jié)合,將締造出AI時(shí)代的世界級(jí)計(jì)算公司。合并后的英偉達(dá)將把計(jì)算從云端、智能手機(jī)、PC、自動(dòng)駕駛和機(jī)器人領(lǐng)域推進(jìn)到邊緣物聯(lián)網(wǎng),將AI計(jì)算拓展到全球市場(chǎng)。同時(shí),英偉達(dá)計(jì)算平臺(tái)的開(kāi)發(fā)者將由200萬(wàn)擴(kuò)大至超過(guò)1500萬(wàn),從而形成全球最大的計(jì)算平臺(tái)和生態(tài)社區(qū)。
國(guó)產(chǎn)GPU發(fā)展現(xiàn)狀及市場(chǎng)潛力
經(jīng)過(guò)多年的探索和發(fā)展,國(guó)產(chǎn)CPU已經(jīng)形成一定的氣候,產(chǎn)業(yè)和生態(tài)也逐漸健全起來(lái)。以龍芯、兆芯和飛騰為代表的國(guó)產(chǎn)CPU開(kāi)始圍繞各自的核心產(chǎn)品發(fā)展和擴(kuò)展生態(tài),借助國(guó)家信創(chuàng)和獨(dú)立自主發(fā)展半導(dǎo)體產(chǎn)業(yè)的東風(fēng)而逐漸發(fā)展壯大。然而,國(guó)產(chǎn)GPU的發(fā)展卻遠(yuǎn)遠(yuǎn)落后于國(guó)產(chǎn)CPU。直到2014年,景嘉微才成功研發(fā)出國(guó)內(nèi)首款高性能、低功耗GPU芯片—JM5400。
究其原因,GPU自身依賴于CPU的屬性是主要因素。GPU結(jié)構(gòu)沒(méi)有控制器,必須由CPU進(jìn)行控制調(diào)用才能工作,否則GPU無(wú)法單獨(dú)工作。所以,國(guó)產(chǎn)CPU較GPU先行一步是符合芯片產(chǎn)業(yè)發(fā)展邏輯的。再者,GPU技術(shù)開(kāi)發(fā)難度很高。國(guó)內(nèi)人才缺口也是國(guó)產(chǎn)GPU發(fā)展緩慢的原因之一。
然而,中國(guó)GPU市場(chǎng)規(guī)模和潛力非常大,龐大的整機(jī)制造能力意味著巨量的GPU采購(gòu)。雖然近些年,計(jì)算機(jī)整機(jī)和智能手機(jī)產(chǎn)量增長(zhǎng)都出現(xiàn)瓶頸,但由于這兩類產(chǎn)品體量龐大,GPU的需求量大且單品價(jià)值非常高,市場(chǎng)規(guī)模依然非??捎^。同時(shí),服務(wù)器GPU伴隨著整機(jī)出貨的快速成長(zhǎng),需求量增長(zhǎng)也較為迅速。據(jù)統(tǒng)計(jì),2018年國(guó)內(nèi)服務(wù)器出貨量達(dá)到330.4萬(wàn)臺(tái),同比增長(zhǎng)26%,其中互聯(lián)網(wǎng)、電信、金融和服務(wù)業(yè)等行業(yè)的出貨量增速均超過(guò)20%。另外,國(guó)內(nèi)在物聯(lián)網(wǎng)、車聯(lián)網(wǎng)、人工智能等新興計(jì)算領(lǐng)域,對(duì)GPU也存在海量的需求。
國(guó)產(chǎn)主要GPU廠商匯編
除本文開(kāi)頭提到的幾家以AI為賣點(diǎn)的國(guó)產(chǎn)GPU初創(chuàng)公司外,還有一些國(guó)產(chǎn)GPU廠商已經(jīng)在特定領(lǐng)域深耕多年,現(xiàn)正把握信創(chuàng)市場(chǎng)和“國(guó)產(chǎn)替代”的機(jī)遇擴(kuò)展應(yīng)用市場(chǎng),加速國(guó)產(chǎn)GPU行業(yè)的發(fā)展。
景嘉微
長(zhǎng)沙景嘉微成立于2006年4月,是目前唯一專注于國(guó)產(chǎn)GPU芯片設(shè)計(jì)的上市企業(yè),其主要產(chǎn)品包括JM5400、JM7200和JM7201圖形處理器,所面向的應(yīng)用市場(chǎng)包括筆記本電腦、一體機(jī)、移動(dòng)工作站、刀片式主板等桌面辦公和工業(yè)控制領(lǐng)域。
2014年4月,景嘉微成功研發(fā)出國(guó)內(nèi)首款高可靠、低功耗GPU芯片-JM5400,具有完全自主知識(shí)產(chǎn)權(quán),打破了國(guó)外產(chǎn)品長(zhǎng)期壟斷中國(guó)GPU市場(chǎng)的局面。第一代GPU JM5400主要用于軍用市場(chǎng),替代原ATI M9、M54、M72等美系GPU芯片。
景嘉微的第二代GPU JM7200系列于2018年8月流片成功,并在2019年3月獲得首個(gè)訂單。相較于前代產(chǎn)品,JM7200在理論性能上有翻倍的提升,同時(shí)制程也提升至28納米。但是JM7200在顯存帶寬、像素填充率、浮點(diǎn)性能等方面較2012年發(fā)布的采用完整版GK107核心的英偉達(dá)GT640還有相當(dāng)差距。
2019年,該公司在JM7200基礎(chǔ)上,推出了商用版本JM7201,以滿足桌面系統(tǒng)高性能顯示需求,并全面支持國(guó)產(chǎn)CPU和國(guó)產(chǎn)操作系統(tǒng),從而推動(dòng)國(guó)產(chǎn)計(jì)算機(jī)產(chǎn)業(yè)的生態(tài)構(gòu)建進(jìn)一步完善。JM7201對(duì)民用市場(chǎng)的桌面應(yīng)用進(jìn)行了優(yōu)化,推出了標(biāo)準(zhǔn)MXM和標(biāo)準(zhǔn)PCIE顯卡,在保證性能的同時(shí),降低了功耗,并縮小了體積。
景嘉微GPU已完成與龍芯、飛騰、麒麟軟件、統(tǒng)信軟件、道、天脈等國(guó)內(nèi)主要CPU和操作系統(tǒng)廠商的適配工作;與中國(guó)長(zhǎng)城、超越電子等十余家國(guó)內(nèi)主要計(jì)算機(jī)整機(jī)廠商建立合作關(guān)系并進(jìn)行產(chǎn)品測(cè)試;與麒麟、長(zhǎng)城、蒼穹、寶德、超圖、昆侖、中科方德、中科可控、寧美等多家軟硬件廠商進(jìn)行互相認(rèn)證,共同構(gòu)建國(guó)產(chǎn)化計(jì)算機(jī)應(yīng)用生態(tài)。
景嘉微GPU產(chǎn)線。(來(lái)源:景嘉微和方正證券)
2018年12月,景嘉微定增募集10.88億元,用于高性能通用圖形處理器和面向消費(fèi)電子領(lǐng)域的通用類芯片研發(fā)和產(chǎn)業(yè)化項(xiàng)目。其中,高性能通用圖形處理器項(xiàng)目包括JM9231和JM9271兩款GPU芯片,分別面向不同應(yīng)用領(lǐng)域的中、高檔系列產(chǎn)品。據(jù)公司2020年中報(bào)顯示,下一代圖形處理器研發(fā)處于后端設(shè)計(jì)階段。景嘉微JM9系列是繼JM5400和JM7200局部渲染計(jì)算內(nèi)核之后,首次采用統(tǒng)一渲染結(jié)構(gòu)的GPU,并且增加了可編程計(jì)算模塊數(shù)量。JM9231和JM9271在性能表現(xiàn)上分別對(duì)標(biāo)英偉達(dá)于2016年推出的GTX1050和GTX1080。
JM9系列的推出將使公司GPU水平與國(guó)際龍頭縮短至5年,大幅提升公司在GPU領(lǐng)域的競(jìng)爭(zhēng)力。
芯動(dòng)科技
2020年10月,位于武漢的芯動(dòng)科技宣布與Imagination達(dá)成合作,將采用多晶粒(chiplet)和GDDR6高速顯存等SoC創(chuàng)新技術(shù),基于Imagination全新頂配BXT多核架構(gòu),開(kāi)發(fā)“風(fēng)華”系列GPU。
芯動(dòng)科技“風(fēng)華”系列顯卡GPU。(來(lái)源:芯動(dòng)科技)
在信創(chuàng)和算力安全方面,“風(fēng)華”系列GPU內(nèi)置物理不可克隆iUnique Security PUF信息安全加密技術(shù),提升數(shù)據(jù)安全和算力抗攻擊性,支持桌面電腦和數(shù)據(jù)中心GPU計(jì)算自主可控生態(tài)。這款GPU芯片自帶浮點(diǎn)和智能3D圖形處理功能,全定制多級(jí)流水計(jì)算內(nèi)核,兼具高性能渲染和智能AI算力,還可級(jí)聯(lián)組合多顆芯片合并處理能力,靈活性大大增加,適配國(guó)產(chǎn)桌面市場(chǎng)1080P/4K/8K高品質(zhì)顯示,支持VR/AR/AI,多路服務(wù)器云桌面、云游戲、云辦公等應(yīng)用場(chǎng)景。
IP和芯片定制開(kāi)發(fā)服務(wù)商芯原
在科創(chuàng)板上市的芯原股份的GPU IP源于在2016年收購(gòu)嵌入式GPU開(kāi)發(fā)商圖芯技術(shù)(Vivante)。芯原在GPU IP領(lǐng)域已經(jīng)掌握了支持主流圖形加速標(biāo)準(zhǔn)、自主可控指令集和可拓展性強(qiáng)等核心技術(shù),廣泛應(yīng)用于IOT、汽車電子、PC等市場(chǎng)。芯原可拓展的Vivante GPU IP應(yīng)用涵蓋從低功耗的小型物聯(lián)網(wǎng)MCU(GPU Nano IP系列)到面向汽車和計(jì)算機(jī)應(yīng)用的強(qiáng)大SoC(GPU Arcturus圖形IP),可滿足各種芯片尺寸和功耗預(yù)算,是具有成本效益的優(yōu)質(zhì)圖形處理器解決方案。
芯原Vivante GPU IP產(chǎn)品線及其應(yīng)用。(來(lái)源:芯原)
芯原的圖形處理器技術(shù)支持業(yè)界主流的嵌入式圖形加速標(biāo)準(zhǔn)Vulkan 1.0、OpenGL 3.2、OpenCL 1.2 EP/FP和OpenVX 1.2等,具有自主可控的指令集及專用編譯器,支持每秒2500億次的浮點(diǎn)運(yùn)算能力及128個(gè)并行著色器處理單元。
芯原在圖形處理器技術(shù)方面的研發(fā)包括高性能的通用圖形處理器GC8400 IP,該IP適用于汽車電子,目前仍處IP設(shè)計(jì)驗(yàn)證階段,擬達(dá)到每秒1萬(wàn)億次的浮點(diǎn)運(yùn)算能力雙倍精密度,512個(gè)并行著色器處理單元。
兆芯
總部位于上海張江的兆芯是世界上第三家擁有X86授權(quán)的微處理器公司,掌握CPU、GPU、芯片組三大核心技術(shù),且具備三大核心芯片及相關(guān)IP設(shè)計(jì)與研發(fā)能力。兆芯提供桌面整機(jī)、服務(wù)器、工業(yè)主板和系統(tǒng)級(jí)解決方案,在黨政辦公、交通、金融、能源、教育和網(wǎng)絡(luò)安全方面有著廣泛的應(yīng)用。
兆芯KX-6000是國(guó)內(nèi)第一款完整集成CPU、GPU、芯片組的SoC單芯片國(guó)產(chǎn)通用處理器,采用16納米制程,集成高性能顯卡,支持DP/HDMI/VGA輸出,兼容DirectX、OpenGL、OpenCL等主流API,最高可同時(shí)輸出3臺(tái)顯示器,分辨率可達(dá)4K。
未來(lái),兆芯還會(huì)對(duì)KX系列處理器進(jìn)行進(jìn)一步升級(jí),使用全新的CPU架構(gòu),將內(nèi)存從DDR4升級(jí)為DDR5,將總線從PCIe3.0升級(jí)至PCIe4.0。內(nèi)存和總線的升級(jí)分別可以提高顯卡的帶寬和CPU與GPU間的通訊速度。除了集成GPU外,兆芯還計(jì)劃發(fā)布一款采用臺(tái)積電28納米工藝,TDP 70瓦的獨(dú)立GPU芯片。
芯瞳半導(dǎo)體
西安芯瞳半導(dǎo)體致力于研發(fā)高性能的GPU芯片,公司創(chuàng)始團(tuán)隊(duì)在GPU領(lǐng)域有著超過(guò)10年的學(xué)術(shù)和工程經(jīng)驗(yàn),是一支軟硬件全棧式支持的研發(fā)團(tuán)隊(duì)。其核心技術(shù)人員來(lái)自西郵GPU核心團(tuán)隊(duì)、Intel、Mstar、華為海思、中興、RedHat、騰訊、ThoughtWorks等知名軟硬件公司。
公司第一代GPU芯片(GenBu01)系列產(chǎn)品已完成與國(guó)產(chǎn)CPU和主流操作系統(tǒng)的適配工作,可應(yīng)用于嵌入式計(jì)算及設(shè)備、辦公電腦和工控顯示設(shè)備等應(yīng)用場(chǎng)景。與深圳中微信息聯(lián)合發(fā)布基于芯瞳GenBu01的MXMGB01顯卡,是支持國(guó)產(chǎn)固件BIOS、國(guó)產(chǎn)操作系統(tǒng)、國(guó)產(chǎn)CPU的純國(guó)產(chǎn)化顯示解決方案。
在研的高性能產(chǎn)品可應(yīng)用于服務(wù)器、數(shù)據(jù)中心等大型設(shè)備。公司目前所發(fā)明的專利囊括了GPU芯片設(shè)計(jì)的多個(gè)技術(shù)核心方向,包括顯存管理、芯片架構(gòu)建模、圖形管線架構(gòu)、著色器設(shè)計(jì)等方面。
登臨科技
登臨科技花費(fèi)三年時(shí)間研發(fā)的第一代產(chǎn)品 Goldwasser已在2020年三季度量產(chǎn),該產(chǎn)品目前正在與互聯(lián)網(wǎng)和安防等領(lǐng)域的龍頭企業(yè)合作集成及業(yè)務(wù)測(cè)試。該公司采用自主創(chuàng)新的 Minsky體系結(jié)構(gòu)(軟件定義的異構(gòu)人工智能計(jì)算平臺(tái)),在提供兼容 CUDA/OpenCL 硬件加速能力的前提下,全面支持各類流行的人工智能網(wǎng)絡(luò)框架及底層算子。相比英偉達(dá)公司目前主流云端推理產(chǎn)品 (T4),登臨科技的產(chǎn)品在同樣的工藝上,具有更小的芯片面積,在同樣功耗的情況下,視不同 AI 網(wǎng)絡(luò)可將計(jì)算效率提升 3-10 倍,同時(shí)也減低了芯片性能對(duì)外存吞吐的依賴。
英偉達(dá)和AMD感受到威脅了嗎?
在AI加速計(jì)算、國(guó)產(chǎn)半導(dǎo)體自主創(chuàng)新和風(fēng)投資本的多重驅(qū)動(dòng)下,原本風(fēng)平浪靜的國(guó)產(chǎn)GPU突然風(fēng)生水起,在本就躁動(dòng)不安的中國(guó)半導(dǎo)體業(yè)界掀起一股風(fēng)浪。這對(duì)半導(dǎo)體行業(yè)和國(guó)產(chǎn)GPU的產(chǎn)業(yè)發(fā)展肯定是好事,但筆者認(rèn)為這股被資本追逐和掀起的風(fēng)浪有點(diǎn)熱過(guò)了頭。即便有資深的GPU研發(fā)專家、雄厚的資本加持,從頭開(kāi)創(chuàng)一個(gè)產(chǎn)業(yè)去跟全球GPU巨頭競(jìng)爭(zhēng)是不太現(xiàn)實(shí)的。英偉達(dá)和AMD是否感受到威脅了呢?我認(rèn)為除了一些技術(shù)管理人才流失和研發(fā)人員被挖之外,國(guó)產(chǎn)GPU短期內(nèi)還無(wú)法撼動(dòng)他們的地位。
國(guó)家信創(chuàng)市場(chǎng)需求和工業(yè)控制等特定領(lǐng)域?qū)PU的需求增長(zhǎng)將給景嘉微等國(guó)產(chǎn)GPU廠商帶來(lái)增長(zhǎng)和擴(kuò)大市場(chǎng)的機(jī)遇。至于以AI為主要應(yīng)用市場(chǎng)的這些GPU新貴們,除了拿出真正可以對(duì)比的GPU芯片外,還需要在生態(tài)建設(shè)和AI場(chǎng)景落地方面下功夫,才能證明自己拿到這么多錢(qián)確實(shí)是“物有所值”,才能消除“泡沫”的嫌疑。
對(duì)方正證券研究報(bào)告《GPU研究框架—行業(yè)深度報(bào)告》感興趣的朋友可以點(diǎn)擊文末左下角“閱讀原文”,進(jìn)入電子工程專輯網(wǎng)站下載完整PDF版本。