最近,一則新聞?wù)饎?dòng)業(yè)界,賽靈思亞太地區(qū)實(shí)驗(yàn)室首席工程師、實(shí)驗(yàn)室主任胡成臣確認(rèn)加入蔚來(lái)汽車(chē),在技術(shù)規(guī)劃領(lǐng)域擔(dān)任首席專(zhuān)家、助理副總裁一職。
這則新聞的背后,是蔚來(lái)汽車(chē)自研AI芯片的加速。蔚來(lái)汽車(chē)的目的很清楚,就是像特斯拉一樣,建立起自動(dòng)駕駛能力閉環(huán)。而要建立這種閉環(huán),芯片是繞不過(guò)去的一關(guān)。
實(shí)際上,從去年開(kāi)始,我們發(fā)現(xiàn),智能芯片(AI芯片)這個(gè)領(lǐng)域再次迅速進(jìn)入高光時(shí)刻,除了云端居壟斷地位的英偉達(dá),國(guó)內(nèi)無(wú)論是地平線,還是黑芝麻,都引起了業(yè)界極大關(guān)注。而算力的不斷提升,也讓各大車(chē)企對(duì)進(jìn)入算力的“軍備競(jìng)賽”產(chǎn)生焦慮。
比如,今年英偉達(dá)發(fā)布業(yè)內(nèi)首款1000TOPS的SoC,相比特斯拉FSD單芯片算力72TOPS提升超過(guò)一個(gè)數(shù)量級(jí)。而在國(guó)內(nèi),也有地平線的征程5,算力最高達(dá)到128TOPS,以及黑芝麻A1000Pro,算力達(dá)到106TOPS等等。
但是,我們的一個(gè)問(wèn)題就是,追求TOPS算力真的有那么重要嗎?是不是堆疊芯片的算力,就能達(dá)到目的了?業(yè)內(nèi)似乎進(jìn)入了“唯算力論”的誤區(qū)。所以,這里簡(jiǎn)單探討一下。
01
算力VS軟件
地平線創(chuàng)始人兼CEO余凱打過(guò)一個(gè)比方,“如果說(shuō)動(dòng)力電池是未來(lái)汽車(chē)的心臟,那么智能芯片就是未來(lái)汽車(chē)的大腦?!盇I芯片作為未來(lái)車(chē)載計(jì)算中心的核心,其作用當(dāng)然非常重要。
目前,這些汽車(chē)主控芯片的結(jié)構(gòu)形式是由MCU向SoC異構(gòu)芯片(ASIC結(jié)構(gòu))方向發(fā)展。根據(jù)觀研天下的預(yù)測(cè),全球自動(dòng)駕駛汽車(chē)上的AI芯片(推理),其市場(chǎng)規(guī)模將從2017年的1.42億美元,年均增長(zhǎng)135%至2022年的102億美元,遠(yuǎn)超AI芯片(手機(jī)側(cè))的市場(chǎng)規(guī)模34億美元。
而部署于邊緣端的(像地平線這樣的)AI芯片/內(nèi)置單元的市場(chǎng)規(guī)模占比,也將從2017年的21%上升到2022年的47%。其年均增速123%,超過(guò)部署于云端的AI芯片75%的年均增速。GPU(圖形處理器,Graphics Processing Unit)市場(chǎng)份額則會(huì)從2017年的70%下降到2022年的39%。
但是,在“軟件定義汽車(chē)”的情況下,車(chē)企的核心能力到底應(yīng)該是什么?這是業(yè)界思考的一個(gè)問(wèn)題。是不是唯芯片算力馬首是瞻呢?
實(shí)際上不見(jiàn)得。還是需要辯證地看。我們說(shuō)“數(shù)據(jù)是生產(chǎn)資料”,而提供處理數(shù)據(jù)的芯片是工具,不可能工具反客為主成為核心。工具是必備的,但是更重要的核心是跑在上面的軟件。而隨著各個(gè)芯片企業(yè)算力的快速提升,這個(gè)問(wèn)題很快會(huì)變得不是問(wèn)題。
此外,車(chē)企面對(duì)的消費(fèi)端是不是立刻就需要那么高端的算力呢?也不見(jiàn)得。目前,車(chē)企號(hào)稱(chēng)8核芯片算力多強(qiáng)的多了,但是真的車(chē)機(jī)系統(tǒng)就流暢、好用了?
我們知道,近年“軟硬件解耦”的趨勢(shì)以及“軟硬件融合”的提法都有。實(shí)際上,軟件與硬件從來(lái)沒(méi)有真正分離過(guò),一直都是相互融合發(fā)揮作用的。
以PC時(shí)代的WinTel聯(lián)盟為例,在WinTel架構(gòu)下,Intel芯片和Windows操作系統(tǒng)高度協(xié)同,最終才能產(chǎn)生壟斷市場(chǎng)份額的效果,缺一不可。
所以,地平線創(chuàng)始人和CEO余凱有句話講得非常到位,芯片就是軟件的舞臺(tái),衡量芯片優(yōu)劣的標(biāo)準(zhǔn),要看芯片之上的軟件能否最大化地發(fā)揮作用。當(dāng)然不是說(shuō)算力不重要,算力和軟件之間需要有效匹配。兩款相同算力的芯片比較,能讓軟件運(yùn)行得更高效的芯片才是“好芯片”。
而且,作為車(chē)企來(lái)說(shuō),還有一個(gè)芯片的成本問(wèn)題?,F(xiàn)在的一種傾向是“L4硬件+L2軟件”,先硬件“預(yù)埋”以達(dá)標(biāo)或者超標(biāo),軟件上慢慢積累。但是反過(guò)來(lái)說(shuō),這是不是一種浪費(fèi)?恐怕,還是要“對(duì)每一個(gè)TOPS都要精打細(xì)算地使用?!?/p>
比如,超星未來(lái)聯(lián)合創(chuàng)始人兼首席技術(shù)官梁爽在最近一次論壇上說(shuō)過(guò),現(xiàn)在算力的軍備競(jìng)賽是已經(jīng)掀起來(lái)了,但是芯片的算力本質(zhì)上對(duì)于智能駕駛系統(tǒng)還是必要不充分的條件,“現(xiàn)在大家更多提的算力是峰值算力。我們經(jīng)常會(huì)看到一個(gè)優(yōu)化程度不好的芯片宣稱(chēng)有10TOPS算力,實(shí)際跑出來(lái)的應(yīng)用等效只有3~4TOPS的算力。”
說(shuō)到底,是要AI算法流暢地跑在芯片上,最終,這成為一個(gè)非常復(fù)雜的需要進(jìn)行系統(tǒng)優(yōu)化設(shè)計(jì)的問(wèn)題。
02
算力的“罩門(mén)”
作為現(xiàn)代科技工業(yè)中的集大成者和數(shù)字經(jīng)濟(jì)“基礎(chǔ)設(shè)施”的芯片,匯集了最復(fù)雜、最尖端、最精密的基礎(chǔ)性技術(shù),以及高端人才和資金,無(wú)疑是未來(lái)爭(zhēng)奪的焦點(diǎn)。
不過(guò),由于芯片制造越來(lái)越復(fù)雜,芯片制程每提升一代往往就需要投入數(shù)百億美元,我們可以看到,芯片制造逐漸集中到臺(tái)積電、三星等少數(shù)幾家公司。相應(yīng)的,很多老牌芯片企業(yè)都放棄了制造,專(zhuān)注于設(shè)計(jì)。
所以,芯片設(shè)計(jì)公司的創(chuàng)新能力也變得更加重要。隨之而來(lái)的,還有AI芯片公司和AI算法公司之間的紛爭(zhēng)。不過(guò),像英偉達(dá)這種TOP級(jí)的芯片公司,軟件工程師其實(shí)比硬件工程師還要多。換句話說(shuō),芯片公司的底層技術(shù)都是包含著硬件和軟件的。
而且,我們說(shuō)芯片最終是為車(chē)企的車(chē)載計(jì)算平臺(tái)服務(wù)的。所以,行業(yè)需要思考一個(gè)問(wèn)題是,解決智能駕駛系統(tǒng)計(jì)算平臺(tái)的支撐問(wèn)題,是否只能通過(guò)芯片算力堆疊來(lái)實(shí)現(xiàn)?
答案顯然是否定的。盡管汽車(chē)智能化需要更強(qiáng)的運(yùn)算能力,但業(yè)內(nèi)專(zhuān)家也表示:“算力也不能說(shuō)無(wú)限增長(zhǎng),芯片PPA(功耗、成本和面積)都是很要命的?!?/p>
這是因?yàn)?,?duì)于車(chē)載AI芯片來(lái)說(shuō),算力指標(biāo)重要,能效比更重要。在傳統(tǒng)芯片行業(yè),PPA是最經(jīng)典的性能衡量指標(biāo)。而現(xiàn)在出于自動(dòng)駕駛對(duì)算力的追求,業(yè)界還是把“峰值算力”當(dāng)作衡量AI芯片的主要指標(biāo)的話,就導(dǎo)致了一種“唯算力論”的偏頗。
這方面,地平線提出了一個(gè)新的方法MAPS(Mean Accuracy-guaranteed Processing Speed,在精度有保障范圍內(nèi)的平均處理速度),用以評(píng)估芯片的AI真實(shí)性能。而在業(yè)內(nèi)沒(méi)有統(tǒng)一的測(cè)評(píng)標(biāo)準(zhǔn)情況下,目前還只能算是一家之言。
不過(guò)功耗方面地平線還是有巨大優(yōu)勢(shì)的。我們以地平線2020年最先商用量產(chǎn)的征程2芯片為例,它搭載自主研發(fā)的計(jì)算架構(gòu)BPU2.0(Brain Processing Unit),可提供超過(guò)4TOPS的等效算力,典型功耗僅2瓦,而且,每TOPS的AI能力輸出可達(dá)同等算力GPU的10倍以上。
對(duì)于車(chē)企來(lái)說(shuō),在最高性能模式下,如果自動(dòng)駕駛控制器的芯片功耗級(jí)別較高,即便其自身性能強(qiáng)勁,但也會(huì)引發(fā)某些不可預(yù)知的隱患,如發(fā)熱量成倍增加,耗電率成倍增加,這些結(jié)果對(duì)于智能電動(dòng)車(chē)來(lái)說(shuō)毫無(wú)疑問(wèn)是顆“雷”。因此,車(chē)企在自動(dòng)駕駛芯片的選用中都會(huì)充分考慮其功耗指標(biāo)。
我們說(shuō),AIoT時(shí)代大量的邊緣AI應(yīng)用(智能電動(dòng)車(chē)就屬于邊緣端應(yīng)用),對(duì)邊緣智能計(jì)算提出更高要求。而邊緣端一般條件會(huì)比較差,要求低功耗,AI邊緣計(jì)算要解決的就是在功耗限制下提供最好的算力支持,以及配套的內(nèi)存支持、連接能力。
也就是說(shuō),車(chē)企不大會(huì)擔(dān)心車(chē)用電的問(wèn)題,但芯片散熱功耗等問(wèn)題還是必須考慮的。以行業(yè)人士的分析來(lái)說(shuō),芯片算力的無(wú)限膨脹和硬件預(yù)埋不會(huì)是未來(lái)的趨勢(shì),硬件也需要匹配實(shí)際,有業(yè)內(nèi)人士就說(shuō)過(guò),“特別是在SoC上,我們需要精準(zhǔn)高效的算力來(lái)適配電子電氣架構(gòu)的變革?!?/p>
還有一個(gè)可能的情況是,未來(lái)在智能座艙域、自動(dòng)駕駛域等的主芯片選擇上,越來(lái)越多車(chē)企可能會(huì)選擇同一家SoC芯片,原因就在于軟件適配性更好,可以大幅節(jié)約開(kāi)發(fā)周期與成本。像現(xiàn)在多家車(chē)企選擇地平線的征程芯片,就是最好的例子。
最后說(shuō)說(shuō),從曾任百度總裁的陸奇博士最近提出的“母生態(tài)”這個(gè)概念來(lái)說(shuō),智能汽車(chē)將是繼PC、智能手機(jī)之后更大的母生態(tài),也是中國(guó)汽車(chē)行業(yè)和科技產(chǎn)業(yè)最大的機(jī)遇所在。而且,芯片所在的科技產(chǎn)業(yè)逐步走向成熟的標(biāo)志之一就是形成完整的生態(tài)。出于對(duì)未來(lái)生態(tài)的爭(zhēng)奪,也需要芯片公司更加注重算力和軟件匹配的問(wèn)題。