3月15日,據(jù)路透社報(bào)道,百度昆侖芯片業(yè)務(wù)完成獨(dú)立融資,投后估值約130億元人民幣,領(lǐng)投方為CPE,跟投方IDG、君聯(lián)資本、元禾璞華。據(jù)了解,百度正在考慮將其人工智能芯片設(shè)計(jì)能力進(jìn)行商業(yè)化,目的是將昆侖部門打造成一家獨(dú)立的公司。
如今互聯(lián)網(wǎng)科技企業(yè)造芯已不是什么新鮮事,尤其是AI領(lǐng)域已經(jīng)成為世界科技巨頭爭(zhēng)奪的制高點(diǎn), IBM,微軟,谷歌和亞馬遜正在微調(diào)其AI平臺(tái),以使客戶更輕松,更快捷地整合各種AI技術(shù)。
可以說(shuō),造芯熱幾乎與人工智能的爆發(fā)處于同一個(gè)階段,人工智能的這一輪爆發(fā)是深度學(xué)習(xí)算法的興起,而深度學(xué)習(xí)的基礎(chǔ)就是需要更多的數(shù)據(jù)訓(xùn)練、更高的算力支撐。當(dāng)傳統(tǒng)芯片逐漸無(wú)法滿足互聯(lián)網(wǎng)爆發(fā)的算力需求時(shí),擁有先進(jìn)算法和強(qiáng)大計(jì)算能力的互聯(lián)網(wǎng)公司成為了芯片自研的推動(dòng)者,國(guó)內(nèi)外企業(yè)幾乎步調(diào)一致地各自開啟了這一篇章。
中國(guó)在進(jìn)入其市場(chǎng)方面的行動(dòng)將在該行業(yè)的創(chuàng)新中發(fā)揮關(guān)鍵作用。根據(jù)一項(xiàng)研究,中國(guó)現(xiàn)在占全球半導(dǎo)體消費(fèi)的60%。根據(jù)《國(guó)際商業(yè)戰(zhàn)略》,2019年,中國(guó)半導(dǎo)體行業(yè)銷售額為2122億美元,北美為595億美元,世界其他地區(qū)為488億美元,歐洲為418億美元,日本為387億美元。
圖:2019年按地區(qū)劃分的全球半導(dǎo)體消費(fèi)(十億)
目前,國(guó)產(chǎn)AI芯片處于一個(gè)窗口,這個(gè)窗口有如下特征:1、市場(chǎng)廣闊,容納下許多巨頭玩家;2、處于爆發(fā)期初期,大規(guī)模應(yīng)用尚未到來(lái);3、應(yīng)用場(chǎng)景分散、復(fù)雜度高,需要定制化;4、單獨(dú)芯片不夠,需要配套的解決方案支撐。
在這樣的大背景下,對(duì)“AI第一股”百度而言,造芯能抓住其中的哪些機(jī)會(huì),競(jìng)爭(zhēng)力又有多少?
問(wèn)世2年多,昆侖幾何?
衡量一款芯片好不好,成不成功,最直觀的就是看出貨量。百度昆侖于2018年宣布,2019年12月,百度和三星宣布,百度首款基于云的產(chǎn)品昆侖第一代用于計(jì)算和邊緣計(jì)算的AI芯片已經(jīng)完成。
截至目前,實(shí)現(xiàn)量產(chǎn)的百度昆侖1已在百度搜索引擎及云計(jì)算用戶部署2萬(wàn)片。與國(guó)內(nèi)其他互聯(lián)網(wǎng)造芯玩家的產(chǎn)品相比,百度昆侖1的出貨量可以說(shuō)是不錯(cuò)的。
從技術(shù)結(jié)合場(chǎng)景的經(jīng)驗(yàn)來(lái)看,新一批崛起的AI 芯片要針對(duì)不同的人工智能應(yīng)用類型和場(chǎng)景,對(duì)于芯片的要求就不單單是要適合深度學(xué)習(xí),需要兼顧計(jì)算能力、能耗和靈活性。
云計(jì)算巨頭紛紛布局云計(jì)算+FPGA芯片,首先因?yàn)镕PGA作為一種可編程芯片,非常適合部署于提供虛擬化服務(wù)的云計(jì)算平臺(tái)之中。FPGA的靈活性,可賦予云服務(wù)商根據(jù)市場(chǎng)需求調(diào)整FPGA加速服務(wù)供給的能力。
運(yùn)算速度、功耗等性能是衡量一款芯片的核心指標(biāo)。昆侖芯片定位為通用AI芯片,目標(biāo)是提供高性能,低成本,高度靈活的AI芯片。特別要指出的是,昆侖芯片既能做訓(xùn)練也能做推理,它可以滿足AI的高處理需求,用于云實(shí)例和邊緣實(shí)例,包括數(shù)據(jù)中心,公共云和自動(dòng)駕駛汽車。據(jù)了解,昆侖2將采用7nm工藝打造,將于2021年實(shí)現(xiàn)量產(chǎn),其性能對(duì)1代,將再提升3倍。
一份經(jīng)紀(jì)報(bào)告顯示:“這種大型的,基于云的,具有高計(jì)算能力的AI芯片具有很高的技術(shù)門檻。只有百度,華為和寒武紀(jì)才能生產(chǎn)這些產(chǎn)品。”
在昆侖芯片誕生前,2017年百度內(nèi)部數(shù)據(jù)中心、自動(dòng)駕駛系統(tǒng)等就已大規(guī)模使用部署了超過(guò)10000片F(xiàn)PGA加速器,這對(duì)跨行業(yè)跨場(chǎng)景測(cè)試?yán)鲂酒蛳铝顺醪交A(chǔ)。隨后,在部署上線的微億智造工業(yè)智能質(zhì)檢設(shè)備上,百度智能云以整機(jī)一體化方式,向微億智造交付搭載百度昆侖芯片的百度云質(zhì)檢一體機(jī)。
僅僅硬件遠(yuǎn)遠(yuǎn)不夠,一個(gè)整體的解決方案對(duì)商業(yè)化落地也至關(guān)重要。百度提出了AI-Native的云計(jì)算架構(gòu),從基礎(chǔ)設(shè)施的AI計(jì)算集群、AI芯片,到工程平臺(tái)的飛槳、云原生,以及應(yīng)用開發(fā)平臺(tái)的視頻云、區(qū)塊鏈等,通過(guò)云智一體、端到端的方式,支持產(chǎn)業(yè)的智能應(yīng)用。
當(dāng)然,無(wú)形財(cái)產(chǎn)的積累對(duì)以科技為導(dǎo)向的企業(yè)來(lái)說(shuō)也是至關(guān)重要的一環(huán),手機(jī)芯片玩家高通光靠專利費(fèi)就吃透了全世界。在AI專利申請(qǐng)和許可方面,百度已連續(xù)三年位居中國(guó)第一,百度AI開放平臺(tái)也已經(jīng)匯集了265萬(wàn)開發(fā)者。
百度在其他地區(qū)的市場(chǎng)份額不大,與成熟的競(jìng)爭(zhēng)對(duì)手競(jìng)爭(zhēng)也將非常艱難。但盡管如此,在當(dāng)前大環(huán)境下,昆侖芯片如今的量產(chǎn)和交付進(jìn)展卻凸顯了AI在中國(guó)的整體發(fā)展勢(shì)頭,也代表了中國(guó)企業(yè)在這一新興領(lǐng)域確立全球領(lǐng)導(dǎo)者的決心。
其實(shí)在AI領(lǐng)域,中國(guó)一直沒有落后。據(jù)斯坦福大學(xué)發(fā)布的一份222頁(yè)的《2021年度AI指數(shù)報(bào)告》指出,2020年,中國(guó)在世界人工智能期刊上的引用頻次首次超過(guò)美國(guó)。在刊登數(shù)量上,早在2004年,中國(guó)在人工智能期刊的總發(fā)表數(shù)量上短暫超過(guò)美國(guó),然后在2017年重新占據(jù)領(lǐng)先地位。
中國(guó)在世界人工智能期刊上的引用頻次首次超過(guò)美國(guó)
定制、魔改、二次開發(fā)
早在2011年百度啟動(dòng)了FPGA AI加速器項(xiàng)目,2015年的FPGA部署已經(jīng)超過(guò)5000片,2017年成為業(yè)界部署最多的,超過(guò)了12000片;2018年百度發(fā)布自主研發(fā)的AI芯片——百度昆侖;2019年流片成功,2020年昆侖一代開始量產(chǎn)并且大規(guī)模部署。
關(guān)于昆侖芯片的細(xì)節(jié)我們不做過(guò)多的贅述,但是值得一提的是,往往GPU是打造AI芯片的重要手段之一,但是我們也可以看出,百度從一開始卻是基于FPGA打造的,F(xiàn)PGA的特點(diǎn)就是可編程,這樣使用昆侖芯片的用戶,就完全可以根據(jù)自己的應(yīng)用場(chǎng)景來(lái)進(jìn)行定制、魔改、二次開發(fā)。
由于AI應(yīng)用場(chǎng)景的分散和復(fù)雜度高,定制化就顯得格外重要。FPGA作為一種可編程芯片,非常適合部署于提供虛擬化服務(wù)的云計(jì)算平臺(tái)之中。昆侖芯片配以FPGA的靈活性,可讓用戶可以按照自己的需求和應(yīng)用場(chǎng)景進(jìn)行專項(xiàng)定制,魔改,二次開發(fā),實(shí)現(xiàn)更快速的市場(chǎng)普及,并能完成自身產(chǎn)品的后續(xù)迭代。
在性能方面,百度昆侖性能最高比英偉達(dá)T4強(qiáng)三倍。放大到全球的AI芯片,據(jù)麻省理工學(xué)院林肯實(shí)驗(yàn)室超級(jí)計(jì)算中心的一項(xiàng)統(tǒng)計(jì)研究《機(jī)器學(xué)習(xí)加速器的調(diào)查和基準(zhǔn)測(cè)試》,在全球公開宣布的人工智能加速器和處理器的性能與功率分散圖中,我們也可以看出,昆侖芯片性能也處于高位(如下圖)。下圖顯示了最近公開發(fā)布的一些AI處理器能力(截至2019年5月),列出了芯片的峰值性能與功耗。
公開宣布的人工智能加速器和處理器的性能與功率分散圖(圖源:MIT《機(jī)器學(xué)習(xí)加速器的調(diào)查和基準(zhǔn)測(cè)試》研究)
注:其中x軸表示峰值功率,y軸表示每秒千兆次操作的峰值。處理能力的計(jì)算精度由所采用的幾何形狀來(lái)描述;計(jì)算精度范圍從單個(gè)位int1到單個(gè)字節(jié)int8,從4字節(jié)float 32到8字節(jié)float 64。形狀因子由顏色來(lái)描述,這對(duì)于顯示消耗了多少能量很重要,而且對(duì)于顯示在單個(gè)芯片、單個(gè)PCI卡和整個(gè)系統(tǒng)中可以裝載多少計(jì)算量也很重要。藍(lán)色僅是單個(gè)芯片的性能和功耗。橙色表示芯片的性能和功率(注意,它們都在200-300W區(qū)域)。綠色表示整個(gè)系統(tǒng)的性能和能力——在這里是單節(jié)點(diǎn)桌面和服務(wù)器系統(tǒng)。
眾所周知,“AI應(yīng)用場(chǎng)景碎片化、落地難”已成行業(yè)共識(shí),在AI芯片前仆后繼的大軍中,泡沫過(guò)后,許多企業(yè)已銷聲匿跡,僅留下了為數(shù)不多的十幾家。百度又能靠什么?
造芯者不但需要懂硬件,還需要懂AI算法軟件。據(jù)了解,百度昆侖作為百度人工智能平臺(tái)的核心組件,可以原生支持開源深度學(xué)習(xí)框架飛槳(PaddlePaddle),百度機(jī)器學(xué)習(xí)平臺(tái)(BML)及各垂類的AI 能力引擎。另外,昆侖不僅支持全球主流CPU、操作系統(tǒng),Pytorch和 TensorFlow 等深度學(xué)習(xí)框架,也和國(guó)產(chǎn)化廠商密切合作支持飛騰、申威和海光等國(guó)產(chǎn)CPU,麒麟、深度和統(tǒng)信等國(guó)產(chǎn)操作系統(tǒng)。
此外,生態(tài)能力在芯片行業(yè)中尤為關(guān)鍵,而且放在自家產(chǎn)品上可盡顯其性價(jià)比優(yōu)勢(shì)。
其實(shí)這點(diǎn)我們可以從華為麒麟芯片得到啟發(fā),因?yàn)橛惺謾C(jī)終端的不斷試錯(cuò)和支持,麒麟芯片才能在迭代中不斷創(chuàng)新,二者相輔相成,最終成就一段手機(jī)史上的佳話。百度亦是如此,相比其他單打獨(dú)斗的AI芯片企業(yè),它有大公司的生態(tài)優(yōu)勢(shì)。百度完全不用有一般AI芯片廠商的擔(dān)憂:“我該做什么樣的芯片?芯片做出來(lái)能否迎合市場(chǎng)的需求?又將用在什么場(chǎng)景?”因?yàn)榘俣扔刑嗟膽?yīng)用場(chǎng)景了,智能音箱、智能駕駛Apollo、智能云等等,這些對(duì)百度整體業(yè)務(wù)都形成一個(gè)大循環(huán)。
特斯拉也是一樣。在特斯拉自研FSD芯片前,需要采用英偉達(dá)的芯片,不僅在性能上滿足不了特斯拉的需求,而且成本還高昂,完全不具有話語(yǔ)權(quán)。此后,特斯拉自己研發(fā)芯片竟達(dá)到了與英偉達(dá)相同乃至更好的效果,成本也把控在自己手里。
在造芯策略上,百度與當(dāng)下國(guó)際互聯(lián)網(wǎng)巨頭如亞馬遜、谷歌、微軟等如出一轍,自產(chǎn)自用為主,但同時(shí)也注意為芯片建生態(tài),芯片又反哺生態(tài)。未來(lái)隨著智能汽車逐漸爆發(fā),云計(jì)算、物聯(lián)網(wǎng)市場(chǎng)的大幅度需求,百度或?qū)⒈煌粕蠚v史的潮頭。