最近,英特爾推出了第二代神經(jīng)擬態(tài)芯片Loihi2和用于神經(jīng)啟發(fā)應(yīng)用程序的開源軟件框架Lava。并且,Loihi2采用Intel4工藝的預(yù)生產(chǎn)版本制造。使用極紫外光刻技術(shù)簡化布局設(shè)計(jì)規(guī)則,使得快速開發(fā)Loohi2成為可能。
在AI芯片方面,除了英特爾推出的神經(jīng)擬態(tài)芯片,百度也在8月18日的百度世界大會(huì)上宣布第二代自研AI芯片——昆侖2正式量產(chǎn)。公布即量產(chǎn),可以看出百度對(duì)于昆侖芯片的自信。
自1956年的Dartmouth學(xué)會(huì)上,人工智能的概念誕生。經(jīng)過了半個(gè)多世紀(jì)的發(fā)展,麥卡錫提出的人工智能在機(jī)器人、語音識(shí)別、圖像識(shí)別等領(lǐng)域都不斷發(fā)展。而在人工智能發(fā)展的過程中,必然不會(huì)缺少的就是AI芯片。
目前對(duì)于AI芯片并沒有明確的定義,廣義上所有面向AI應(yīng)用的芯片,包括訓(xùn)練和推理應(yīng)用的芯片都可以稱為AI芯片。
幾乎所有的科技巨頭都已開始布局,除了百度、英特爾兩家企業(yè),特斯拉也推出了號(hào)稱全球算力最高的自研AI芯片。AI芯片行業(yè)巨頭英偉達(dá)市值一度被推至5000億以上。
AI芯片的市場注定是一場激烈的斗爭。
資本的涌入
2017年左右掀起了一輪新的AI熱潮。AlphaGo戰(zhàn)勝人類頂級(jí)棋手柯潔,橫掃圍棋界,一時(shí)間學(xué)界開始了又一輪的AI研究。
在最近三年級(jí),AI芯片領(lǐng)域出現(xiàn)了兩筆超級(jí)融資,壁仞科技在新創(chuàng)18個(gè)月就融資超過47億元,創(chuàng)下國內(nèi)芯片創(chuàng)業(yè)公司的最大融資記錄。摩爾線程成立不到一年,估值超百億,融資數(shù)十億。
就單從2021年開年后看,AI芯片行業(yè)至少有20多起公開融資,而已公布的投融資金額及加起來,合計(jì)已達(dá)到約200億人民幣,其中有至少8起單筆融資的金額逾10億人民幣,單筆最高融資達(dá)53.5億人民幣。
國內(nèi)的云端AI芯片創(chuàng)業(yè)公司擁有超強(qiáng)的吸金能力。
致力于打造高性能GPU的沐曦集成電路有限公司8月27日宣布完成10億元人民幣A輪融資。
2021 年 1 月,燧原科技完成 18 億人民幣 C 輪融資。其實(shí)在去年 5 月,燧原科技就完成 7 億人民幣 B 輪融資,領(lǐng)投方為半導(dǎo)體產(chǎn)業(yè)基金武岳峰資本,老股東騰訊繼續(xù)跟投。
2021年3月1日,云端服務(wù)器級(jí)的通用高性能計(jì)算芯片的天數(shù)智芯宣布完成C輪12億元融資。
摩爾線程在成立后的短短100天,即獲深創(chuàng)投、紅杉資本中國基金、GGV紀(jì)源資本等眾多機(jī)構(gòu)的青睞,融資金額已達(dá)數(shù)10億。
可重構(gòu)存算AI芯片的提出者千芯半導(dǎo)體(TensorChip)在3月22日公布完成了數(shù)千萬人民幣融資。
9月22日,黑芝麻智能宣布今年已經(jīng)完成數(shù)億美元的戰(zhàn)略輪及C輪兩輪融資。戰(zhàn)略輪由小米長江產(chǎn)業(yè)基金、富賽汽車等國內(nèi)產(chǎn)業(yè)龍頭企業(yè)參與投資。
在深圳的墨芯人工智能,其自稱是唯一擁有動(dòng)態(tài)稀疏和靜態(tài)稀疏技術(shù)的企業(yè),在今年的1、3月份分別宣布獲得新融資。
如此強(qiáng)大的吸金能力,能夠看出資本方對(duì)于AI芯片企業(yè)的看好。
無論資本市場如何火熱,檢驗(yàn)AI芯片創(chuàng)企們長期發(fā)展實(shí)力的關(guān)鍵準(zhǔn)則,最終會(huì)回歸到產(chǎn)品實(shí)際性能和落地能力上來。
AI芯片落地難點(diǎn)
AI芯片已經(jīng)進(jìn)入肉搏期。相比起一度火熱的概念潮,目前比拼的是誰能夠率先落地產(chǎn)品、構(gòu)建生態(tài)。
現(xiàn)在的問題成為了:進(jìn)入了哪些場景?合作了哪些客戶?有沒有軟硬一體化方案?是否已經(jīng)有標(biāo)桿案例?
AI芯片落地難的原因可能有很多個(gè)。例如,神經(jīng)網(wǎng)絡(luò)中的卷積運(yùn)算加速對(duì)于功耗的增加,當(dāng)算力翻倍,除了硬件成本增加,電力供應(yīng)和電費(fèi)成本更是一個(gè)瓶頸。從芯片技術(shù)到算法理論的創(chuàng)新,是一個(gè)原因。
還有芯片研發(fā)速度小于AI語言的研發(fā)速度,當(dāng)出現(xiàn)合適的芯片時(shí),其采用的AI語言可能已經(jīng)過時(shí)。這對(duì)于能否量產(chǎn)打出了一個(gè)問號(hào)。
Rokid北京AI實(shí)驗(yàn)室負(fù)責(zé)人高鵬在鈦媒體的采訪中說,“衡量一塊芯片成功與否的標(biāo)準(zhǔn),就是看它能否大規(guī)模的應(yīng)用于產(chǎn)品?!?云知聲創(chuàng)始人黃偉也曾表示:“我們的芯片是有客戶的,不是PPT造芯,更不是自嗨?!?/p>
落地難更重要的原因還是在應(yīng)用場景的設(shè)計(jì)。缺乏殺手級(jí)應(yīng)用使得現(xiàn)有的AI芯片沒有清晰的定位,無法高度優(yōu)化PPA。支撐AI芯片的不僅僅是AI計(jì)算,更要面向場景,實(shí)現(xiàn)完整的功能。
“每個(gè)規(guī)格的芯片都有自己的特性,有些芯片非常便宜,性能就會(huì)差,無法支持諸如打斷喚醒這種前端能力,這類芯片就適合高性價(jià)比產(chǎn)品;像 Rokid KAMINO18這樣的AI 芯片,支持4麥陣列,就很適合智能音箱場景?!眻D靈機(jī)器人兒童事業(yè)部總監(jiān)劉峰表示。
除去殺手級(jí)應(yīng)用場景的缺乏,很多半導(dǎo)體投資人都表示,誰能在自己的產(chǎn)品賽道上率先突破生態(tài),誰就能存活下來。
所謂的AI芯片生態(tài)指的是,芯片上整個(gè)軟件棧來支持AI框架,而AI應(yīng)用程序則是基于這些框架開發(fā)的。軟件棧包括驅(qū)動(dòng)程序、編譯器、函數(shù)庫、算字庫、工具包等等,是實(shí)現(xiàn)高性能、高通用性、高易用性,以及針對(duì)不同應(yīng)用場景深度優(yōu)化的關(guān)鍵。
生態(tài)搭建的難度和時(shí)間,遠(yuǎn)比芯片開發(fā)要更難、更長。
安謀中國AI技術(shù)高級(jí)市場經(jīng)理吳彤曾表示,ASIC定制類的AI芯片會(huì)在未來的五到十年內(nèi)成為市場上的主流,與此同時(shí),AI芯片領(lǐng)域?qū)S眉軜?gòu)(DSA)也將開始流行。
針對(duì)不同的應(yīng)用場景,客戶的需求并不統(tǒng)一。一個(gè)可以商用的AI芯片除去自身芯片的研發(fā),更多的時(shí)間還是花在了創(chuàng)造生態(tài)上。
在AI訓(xùn)練芯片領(lǐng)域,國際巨頭英偉達(dá)一家獨(dú)大,云端訓(xùn)練芯片上,很少有公司能夠突破英偉達(dá)生態(tài)。在英偉達(dá)快速擴(kuò)大中,生態(tài)成為了他的“護(hù)城河”。在2019年,云廠商亞馬遜、谷歌、阿里巴巴中97.4%的人工智能加速器都部署了英偉達(dá)的圖形處理器。
生態(tài)的改變絕非一朝一夕的事。
國內(nèi)廠商的芯片落地
2018年,騰訊戰(zhàn)略領(lǐng)投了燧原科技。燧原科技的通用AI訓(xùn)練芯片專為人工智能計(jì)算領(lǐng)域而設(shè)計(jì),基于這種芯片的AI加速卡、燧原智能互聯(lián)技術(shù),以及“馭算”計(jì)算及編程平臺(tái)可實(shí)現(xiàn)深度全棧集成,為編程人員提供針對(duì)性的加速AI計(jì)算。
面向AI云端訓(xùn)練,邃思2.0在7月份正式發(fā)布。
尺寸為57.5毫米×57.5毫米(面積為3306mm2),達(dá)到了芯片采用的日月光2.5D封裝的極限,與上代產(chǎn)品一樣采用格羅方德12nm工藝,單精度FP32算力為40TFLOPS,單精度張量TF32算力為160TFLOPS,整數(shù)精度INT8算力為320TOPS。
燧原產(chǎn)品的商業(yè)落地場景包括,液冷超大規(guī)模集群,加速視頻內(nèi)容生產(chǎn);強(qiáng)大的視覺能力,保駕護(hù)航金融安全;邊緣部署融合多數(shù)據(jù),構(gòu)建新型智能化交通;高效推理算力集群,建設(shè)園區(qū)AI視頻云。
中科寒武紀(jì),寒武紀(jì)科技的終端智能處理器IP主要產(chǎn)品有2016年推出的寒武紀(jì)1A處理器、2017年推出的寒武紀(jì)1H處理器、2018年推出的寒武紀(jì)1M處理器;云端智能芯片及加速卡產(chǎn)品有2018年推出的思元100、2019年推出的思元270、2021年初正式亮相的思元290;邊緣智能芯片及加速卡為思元220,推出時(shí)間為2019年。
寒武紀(jì)科技面向云、邊、端三大場景研發(fā)了三種類型的芯片產(chǎn)品。
分別為終端智能處理器IP、云端智能芯片及加速卡、邊緣智能芯片及加速卡,并為上述三個(gè)產(chǎn)品線所有產(chǎn)品研發(fā)了統(tǒng)一的基礎(chǔ)系統(tǒng)軟件平臺(tái)(包含應(yīng)用開發(fā)平臺(tái))——Cambricon Neuware軟件開發(fā)平臺(tái)(適用于其所有芯片與處理器產(chǎn)品)。
中星微,于 2016 年 6 月率先推出全球頭先款具有深度學(xué)習(xí)能力的嵌入式神經(jīng)網(wǎng)絡(luò)處理器(NPU)人工智能芯片——“星光智能一號(hào)”,其后又于 2018 年推出運(yùn)算速度提高 16 倍、功耗降低50%、適用場景更廣的“星光智能二號(hào)”(NPU-II)人工智能芯片。
在今年9月的中關(guān)村論壇上,中星微發(fā)布了后摩爾時(shí)代下的新一代人工智能機(jī)器視覺芯片——“星光摩爾一號(hào)”。
“星光摩爾一號(hào)”是面向邊緣計(jì)算的人工智能機(jī)器視覺芯片,可廣泛應(yīng)用于各類機(jī)器視覺邊緣計(jì)算。支持800萬像素的圖像處理、視頻編解碼、安全加解密和異構(gòu)智能計(jì)算,其視頻編解碼提供國標(biāo)SVAC2.0與H.265兩種格式的自由切換和轉(zhuǎn)碼,支持國標(biāo)35114的A、B、C三種安全級(jí)別,提供4TOPS的深度學(xué)習(xí)峰值算力并支持多模融合智能計(jì)算框架。
地平線機(jī)器人(Horizon Robotics)。成立于 2015 年,總部在北京,創(chuàng)始人是前百度深度學(xué)習(xí)研究院負(fù)責(zé)人余凱。
地平線機(jī)器人在2021年先后發(fā)布了芯片征程5、Matrix 5平臺(tái)和Matrix SuperDrive整車智能解決方案,并將推出國內(nèi)首個(gè)開源安全實(shí)時(shí)操作系統(tǒng)TogetherOS。9月15日,搭載了地平線旭日3芯片,科沃斯發(fā)布了最新一代掃地機(jī)器人地寶X1也成為了業(yè)內(nèi)首款搭載AI專用芯片的掃地機(jī)器人。
除去掃地機(jī)器人芯片的使用,征程2則是商用落地的車規(guī)級(jí)AI芯片。該芯片現(xiàn)已應(yīng)用于智能輔助駕駛、高級(jí)別自動(dòng)駕駛、高精建圖與定位,以及智能座艙等智能駕駛場景?;谲浻步Y(jié)合的創(chuàng)新設(shè)計(jì)理念,可提供4 TOPS等效算力,典型功耗僅2瓦;而且具有極高的算力有效性,每TOPS算力可達(dá)同等算力GPU的10倍以上。
靈汐科技,類腦芯片KA200入選2021年世界互聯(lián)網(wǎng)領(lǐng)先科技成果“提名項(xiàng)目”。該系列產(chǎn)品可廣泛應(yīng)用于云端和邊緣計(jì)算,滿足眾多傳統(tǒng)人工智能企業(yè)的智能化升級(jí)需求,促進(jìn)智慧城市、智能網(wǎng)聯(lián)車等眾多相關(guān)行業(yè)的發(fā)展和變革。
不僅能高效支持類腦計(jì)算模型和大規(guī)模腦仿真,為腦科學(xué)領(lǐng)域提供有利工具。同時(shí),還可助力構(gòu)建更大、更快、更精準(zhǔn)的功能級(jí)腦仿真平臺(tái),推動(dòng)腦科學(xué)與類腦算法的研究和類腦生態(tài)構(gòu)建。
計(jì)算機(jī)科學(xué)與腦科學(xué)融合的類腦芯片KA200,采用異構(gòu)融合眾核、存算一體的架構(gòu),單芯片集成25萬神經(jīng)元和2500萬突觸,每秒超過16萬億次突觸計(jì)算,功耗近12瓦。KA200已經(jīng)于2021年實(shí)現(xiàn)量產(chǎn)。
并且基于KA200構(gòu)成了完整的產(chǎn)品體系,如類腦計(jì)算板卡、類腦計(jì)算模組、類腦服務(wù)器、軟件工具鏈和系統(tǒng)軟件以及類腦整體解決方案。
國內(nèi)本土的AI芯片在不同場景應(yīng)用中發(fā)力。
燧原科技面向云端訓(xùn)練,瞄準(zhǔn)具體商業(yè)落地場景;寒武紀(jì)科技面向云、邊、端三大場景研發(fā)了三種類型的芯片產(chǎn)品;中星微則布局嵌入式人工智能大規(guī)模商用,與AlphaGo這樣高算力、高功耗的服務(wù)器端AI不同,嵌入式人工智能應(yīng)用需要小型化、低功耗、低成本的芯片,星光智能二號(hào)完美地符合了這些需求,攝像頭本身就具備AI邊緣計(jì)算功能。
落地應(yīng)用前景
云端和邊緣端
作為AI算力的主要應(yīng)用場景,AI芯片在云端發(fā)展需要解決算力性價(jià)比與通用性問題。算力性價(jià)比決定了人工智能應(yīng)用的部署成本,而算力通用性及軟件生態(tài)決定著不同算法的遷移及開發(fā)成本。
在邊緣和終端這一側(cè),AI芯片所面臨的挑戰(zhàn)是它們會(huì)被部署在各種各樣的應(yīng)用環(huán)境中。即便在同一個(gè)垂直場景里,也需要考慮不同模塊之間的任務(wù)負(fù)載均衡問題。
賽靈思的單羿認(rèn)為,FPGA因?yàn)橛徐`活可編程的優(yōu)勢(shì),可以根據(jù)場景的持續(xù)需求調(diào)整這些模塊之間的資源占用比例,從而達(dá)到全系統(tǒng)最優(yōu)的效果。
ADAS/自動(dòng)駕駛應(yīng)用場景落地
地平線瞄準(zhǔn)自動(dòng)駕駛應(yīng)用場景,在ADAS/自動(dòng)駕駛應(yīng)用場景下,AI芯片的核心價(jià)值就是實(shí)時(shí)處理行駛道路上的人、車、物等復(fù)雜環(huán)境的感知和決策。
目前,自動(dòng)駕駛芯片在架構(gòu)設(shè)計(jì)、研發(fā)投入與車規(guī)級(jí)應(yīng)用等方面仍處于較為前期的探索過程中,特別是國產(chǎn)汽車芯片的市場份額還有待提升,因此,突破本土自動(dòng)駕駛芯片技術(shù)的發(fā)展壁壘,將成為促進(jìn)未來中國智能汽車產(chǎn)業(yè)發(fā)展的關(guān)鍵環(huán)節(jié)。
安防
安防是目前最為明確的AI芯片應(yīng)用場景,主要任務(wù)是視頻結(jié)構(gòu)化。攝像頭終端加入AI芯片,可以實(shí)現(xiàn)實(shí)時(shí)響應(yīng)、降低帶寬壓力。也可以將推理功能集成在邊緣的服務(wù)器級(jí)產(chǎn)品中。
AI芯片要有視頻處理和解碼能力,主要考慮的是可處理的視頻路數(shù)以及單路視頻結(jié)構(gòu)化的成本。
寫在最后
在AI芯片狂熱的背后,越來越多的關(guān)注點(diǎn)轉(zhuǎn)移到落地,中國的AI狂歡并不會(huì)持續(xù)太久。在“老大吃肉,老二喝湯”的半導(dǎo)體行業(yè),AI芯片也具有這樣的屬性,每個(gè)產(chǎn)品線最后會(huì)跑出兩三家公司。不過這是未來的格局,現(xiàn)在的AI芯片市場,很符合一句話:讓子彈先飛一會(huì)。