新型基礎(chǔ)設(shè)施的完善,推動(dòng)了人工智能技術(shù)在消費(fèi)領(lǐng)域以及工業(yè)生產(chǎn)領(lǐng)域的應(yīng)用,落地場景趨向細(xì)分化、垂直化。當(dāng)人工智能進(jìn)一步發(fā)展,深度學(xué)習(xí)模型的復(fù)雜度不斷增加,硬件和內(nèi)存逼近臨界點(diǎn),CPU 這樣的通用芯片無法滿足人工智能任務(wù)要求時(shí),AI 芯片應(yīng)運(yùn)而生。與此同時(shí),隨著智能物聯(lián)時(shí)代掀開序幕,越來越多的數(shù)據(jù)開始在云、邊、端流動(dòng)。急劇增長的數(shù)據(jù)量對(duì) AI 芯片的算力和功耗提出了更高要求。
AI 芯片是專門用于處理人工智能應(yīng)用中大量計(jì)算任務(wù)的模塊,主要分為 GPU、FPGA、ASIC。其中 GPU 主要處理圖像領(lǐng)域的運(yùn)算加速,是最先被引入深度學(xué)習(xí)的類型,技術(shù)相對(duì)成熟;FPGA 是一種可以重構(gòu)電路的芯片,用戶可以根據(jù)需求進(jìn)行重復(fù)編程,適用于多指令和數(shù)據(jù)流的分析,性能出眾但技術(shù)壁壘較高;ASIC 即專用集成電路,除了不能擴(kuò)展外,在功耗、可靠性方面均有優(yōu)勢,可定制、低成本是其顯著特點(diǎn)。
2021 年,全球“缺芯”潮依然未曾平復(fù)。中美兩國的貿(mào)易戰(zhàn)中,芯片是角力中的重頭戲。當(dāng)中國致力于在 2030 年成為人工智能產(chǎn)業(yè)的全球領(lǐng)導(dǎo)者時(shí),美國自然也不會(huì)甘心于自己在技術(shù)上的頭把交椅被撼動(dòng)。而在 AI 芯片戰(zhàn)場,國內(nèi)外呈現(xiàn)出了完全不同的光景。
在“缺芯少魂”的危機(jī)意識(shí)倒逼下,中國加大自主研發(fā)力度尋求破局。BAT 互聯(lián)網(wǎng)大廠自研 AI 芯片均已揭曉。
百度發(fā)布了自主研發(fā)的第二代昆侖 AI 芯片“昆侖芯 2”,并宣布實(shí)現(xiàn)量產(chǎn)。2 代采用 7nm 制程,通用性顯著增強(qiáng),可應(yīng)用于互聯(lián)網(wǎng)、智慧城市、智慧工業(yè)等領(lǐng)域;
阿里平頭哥自研 AI 芯片含光 800 在雙十一期間成為了搜索推薦等場景算力的主力,支持了淘寶搜索、推薦等業(yè)務(wù),其中淘寶主搜 100% 的 AI 算力由該芯片提供;
騰訊在其數(shù)字生態(tài)大會(huì)上也公布了自研芯片的進(jìn)展,AI 推理芯片紫霄性能目前已經(jīng)流片成功并順利點(diǎn)亮。
在投融資領(lǐng)域,國內(nèi) AI 芯片賽道也頗為熱鬧。超 40 家 AI 芯片企業(yè)在 2021 年拿下新融資。地平線、黑芝麻智能、燧原科技、壁仞科技、昆侖芯、摩爾線程等企業(yè)的估值均超 100 億人民幣。
相較于國內(nèi)的百花齊放,國外 AI 芯片的格局要清晰得多。英偉達(dá)和英特爾依然占據(jù)了人工智能算力領(lǐng)域的主導(dǎo)位置,而率先闖進(jìn)獨(dú)角獸陣營的歐美 AI 芯片企業(yè)僅有 6 家,分別是獲得谷歌首個(gè) AI 芯片投資的 SambaNova Systems,將“史上最大”晶圓級(jí)芯片賣給阿聯(lián)酋云計(jì)算公司的 Cerebras Systems,來自英國的 Graphcore,創(chuàng)始團(tuán)隊(duì)曾是谷歌 TPU 核心研發(fā)成員的 Groq,業(yè)界大神吉姆·凱勒的新東家 Tenstorrent 和主攻邊緣 AI 芯片的以色列初創(chuàng)公司 Hailo。
總體來說,受益于存量需求替代以及增量需求釋放,芯片行業(yè)將迎來新一輪增長契機(jī)。但目前產(chǎn)能不足仍是困擾全球芯片行業(yè)的主要問題。在芯片應(yīng)用領(lǐng)域,中國是目前全球最大的芯片應(yīng)用市場,但芯片自給率依然是一大挑戰(zhàn)。放眼整個(gè)芯片市場,中國仍處于追趕階段,還未掌握話語權(quán)。盡管現(xiàn)在國內(nèi)的芯片廠商不少,但在制程工藝上與國際領(lǐng)先水準(zhǔn)差距依然很大,此外芯片制造短板也不容忽視。
但“危機(jī)”二字本就蘊(yùn)藏著“轉(zhuǎn)危為機(jī)”的可能。國務(wù)院印發(fā)的《新時(shí)期促進(jìn)集成電路產(chǎn)業(yè)和軟件產(chǎn)業(yè)高質(zhì)量發(fā)展的若干政策》表明,發(fā)展集成電路產(chǎn)業(yè)已經(jīng)上升到國家戰(zhàn)略高度。未來相信會(huì)有更多的資本和企業(yè)加入到芯片設(shè)計(jì)制造行列。
回顧 2021 年,值得關(guān)注的是,在 AI 芯片步入發(fā)展快車道的同時(shí),基于下游應(yīng)用的強(qiáng)驅(qū)動(dòng),AI 芯片的技術(shù)創(chuàng)新進(jìn)程得到推進(jìn)。其中最引人矚目的是,曾經(jīng)長期止步于理論階段的“存算一體架構(gòu)”芯片取得了較好的進(jìn)展,少數(shù)企業(yè)已經(jīng)有成品問世。目前來看,存算一體 AI 芯片將成為未來主流的發(fā)展方向。
為什么要發(fā)展存算一體芯片
在傳統(tǒng)馮·諾伊曼架構(gòu)下,計(jì)算和存儲(chǔ)分離,兩者間通過數(shù)據(jù)總線進(jìn)行數(shù)據(jù)傳輸。計(jì)算單元從內(nèi)存中讀取數(shù)據(jù),計(jì)算完成后存回內(nèi)存。但隨著 AI 芯片的發(fā)展,這種架構(gòu)也成為制約計(jì)算系統(tǒng)性能提升的主要瓶頸之一。一方面,存儲(chǔ)和計(jì)算之間性能不匹配的問題長期存在,存儲(chǔ)器的數(shù)據(jù)訪問速度跟不上計(jì)算單元的數(shù)據(jù)處理速度,存儲(chǔ)器帶寬在很大程度上限制了處理器的性能發(fā)揮,“存儲(chǔ)墻”日益嚴(yán)重,算力提升受限;另一方面,AI 計(jì)算往往要面臨海量數(shù)據(jù),數(shù)據(jù)總線的有限帶寬嚴(yán)重制約處理器的性能與效率,而且大量數(shù)據(jù)傳輸導(dǎo)致功耗居高不下,“功耗墻”挑戰(zhàn)日盛。
由于兩只攔路虎——“存儲(chǔ)墻”和“功耗墻”的存在,馮·諾依曼計(jì)算架構(gòu)的局限性日益凸顯,因此亟需新型的計(jì)算架構(gòu)應(yīng)對(duì)未來應(yīng)用場景的挑戰(zhàn)。在這一背景下,存算一體的概念重新進(jìn)入業(yè)界視野。
“存算一體”并非新事物,其概念的提出最早可追溯到 20 世紀(jì) 60 年代,但受限于制作成本、制作工藝及需求驅(qū)動(dòng)等問題,并未掀起多大波瀾。直到近年來人工智能的發(fā)展逐漸邁向正軌,存算一體才有機(jī)會(huì)嶄露頭角。
由于在存儲(chǔ)單元內(nèi)完成運(yùn)算,這就直接解決 困擾業(yè)界許久的“存儲(chǔ)墻”問題,減少了數(shù)據(jù)搬運(yùn)過程中高達(dá) 90% 的功耗消費(fèi)。同時(shí),這種架構(gòu)也減少了等待數(shù)據(jù)讀取時(shí)算力的浪費(fèi),實(shí)際性能更好。這種優(yōu)勢被認(rèn)為是解決 AI 特定場景需求的關(guān)鍵。
國內(nèi)外在存算一體方面都還處于起步階段,因此無論是行業(yè)龍頭還是初創(chuàng)公司都在積極蓄力,希望在這一賽道保持領(lǐng)先或?qū)崿F(xiàn)彎道超車。
國外巨頭中,三星的動(dòng)向值得持續(xù)關(guān)注。2021 年 2 月,三星發(fā)布了 HBM-PIM 存內(nèi)計(jì)算技術(shù),在高帶寬內(nèi)存 (HBM) 配置中集成內(nèi)存處理 (PIM) 。這也是業(yè)界第一個(gè) HBM 集成 AI 處理能力的芯片。據(jù)官方資料顯示,與現(xiàn)有的內(nèi)存解決方案相比,三星的 PIM 理論上可以通過可編程計(jì)算單元 (PCU) 提高 4 倍的性能。
另外,美國 AI 芯片初創(chuàng)公司 Myhtic 也是該領(lǐng)域的重要參與者。在 2021 年 C 輪融資中,Mythic 籌集 7000 萬美元,自成立以來 Mythic 的總?cè)谫Y額已達(dá)到 1.652 億美元。2020 年年底,Mythic 推出了其第一代 AI 芯片 M1108 AMP。與很多 AI 芯片不同,M1108 基于更加成熟的模擬計(jì)算技術(shù),將足夠的存儲(chǔ)與大量并行計(jì)算單元打包在芯片上,以最大化內(nèi)存帶寬并減少數(shù)據(jù)移動(dòng)的能力。
而在國內(nèi)企業(yè)中,看準(zhǔn)這一趨勢的阿里巴巴落子可謂相當(dāng)果斷。2021 年 12 月,達(dá)摩院宣布成功研發(fā)新型存算一體架構(gòu)芯片,該芯片是全球首款基于 DRAM 的 3D 鍵合堆疊存算一體 AI 芯片。
除了阿里外,眾多初創(chuàng)公司也開始在這個(gè)賽道發(fā)力,知存科技、后摩智能、九天睿芯等皆是個(gè)中翹楚。
成立于 2017 年的知存科技推出了國際首個(gè)存算一體加速器 WTM1001 和首個(gè)存算一體 SoC 芯片 WTM2101。截止 2021 年,知存科技已完成累計(jì)近 3 億元的 A 輪系列融資。
后摩智能作為國內(nèi)首家采用存算一體技術(shù)打造大算力芯片的公司,其愿景也十分清晰:打造出具有“十倍效應(yīng)”的 AI 芯片, 致力于滿足真正人工智能時(shí)代的超大算力需求。
九天睿芯成立于 2018 年,專注于神經(jīng)擬態(tài)感存算一體芯片研發(fā)。2021 年,九天睿芯已設(shè)計(jì)出基于 SRAM 的感存算一體架構(gòu)芯片 ADA20X,可廣泛應(yīng)用于多種視覺場景。
當(dāng)前,存算一體芯片聚焦于低延遲、低功耗、高算力需求的邊緣計(jì)算,主要應(yīng)用于音頻類、健康類及低功耗視覺端側(cè)應(yīng)用場景中。隨著 AI 應(yīng)用日益豐富,在推進(jìn)規(guī)模化應(yīng)用階段,終端廠商必然會(huì)關(guān)注成本問題,而成本和功耗有著直接的關(guān)系,低功耗的 AI 芯片往往意味著它能夠?qū)崿F(xiàn)整機(jī)低成本。這對(duì)于存算一體芯片來說無疑是一片藍(lán)海。
任何一項(xiàng)技術(shù)都不是“萬金油”,存算一體亦然,它只針對(duì)某一類計(jì)算特別是以數(shù)據(jù)為主的 AI 計(jì)算,并不適合 CPU 等以控制為主的計(jì)算。而且這種架構(gòu)正處于學(xué)術(shù)界向工業(yè)界遷移的關(guān)鍵時(shí)期,要真正實(shí)現(xiàn)轉(zhuǎn)化成功,一方面要求對(duì)存算一體技術(shù)有深刻的洞察,另一方面也要對(duì) AI 應(yīng)用落地有透徹的理解,兩者相結(jié)合才可能發(fā)生質(zhì)變,取得實(shí)質(zhì)性突破。
此外,存算一體作為新的芯片方向,還面臨電路設(shè)計(jì)、架構(gòu)、軟件等諸多層面的挑戰(zhàn)。由于存算一體芯片和常規(guī)的芯片設(shè)計(jì)方案不同,目前市面上也沒有成熟的專用 EDA 工具輔助設(shè)計(jì)和仿真驗(yàn)證;芯片流片之后,沒有成熟的工具協(xié)助測試;在芯片落地應(yīng)用階段,也缺乏專用的軟件與之適配。如何完善重要技術(shù)的生態(tài)鏈,是行業(yè)上下游廠商應(yīng)該共同考慮的問題。
“時(shí)勢造英雄?!泵恳淮斡?jì)算構(gòu)架的大變革都會(huì)創(chuàng)造一個(gè)新的王者。從主機(jī)時(shí)代的 IBM、PC 時(shí)代的英特爾、移動(dòng)時(shí)代的高通,現(xiàn)在進(jìn)入智能物聯(lián)網(wǎng)的時(shí)代,問芯片天下,誰主沉?。课覀兪媚恳源?。