芯東西4月14日消息,美國明星AI芯片獨(dú)角獸SambaNova Systems最新宣布D輪融資6.76億美元(折合44億人民幣),由軟銀愿景基金2領(lǐng)投,英特爾資本、谷歌風(fēng)投、華登國際等參投。
至此,該公司估值超過50億美元(折合327億人民幣),成為全球估值最高的人工智能(AI)創(chuàng)企之一。
這家脫胎于斯坦福大學(xué)的AI芯片創(chuàng)企,長期受到知名投資者的青睞,英特爾資本、谷歌風(fēng)投、華登國際、貝萊德、紅鏈資本等均曾參與其多輪融資。截至當(dāng)前,SambaNova Systems累計(jì)融資已達(dá)11.32億美元。
就在去年12月,這家創(chuàng)企一舉推出其最重磅的軟硬件集成平臺(tái)SambaNova DataScale,擁有TB級(jí)內(nèi)存容量和數(shù)百萬PetaFLOPS低延遲互連計(jì)算能力,能處理大量復(fù)雜的數(shù)據(jù)模型。
美國阿貢國家實(shí)驗(yàn)室、美國能源部旗下國家核安全管理局(NNSA)、勞倫斯利弗莫爾國家實(shí)驗(yàn)室(LLNL)、洛斯阿拉莫斯國家實(shí)驗(yàn)室(LANL)均已應(yīng)用DataScale來加速AI計(jì)算研究。
01.
甲骨文元老、斯坦福教授聯(lián)合創(chuàng)立
華登國際董事長兼任董事會(huì)主席
這家初創(chuàng)公司專注于開發(fā)處理AI工作負(fù)載的基礎(chǔ)設(shè)施,總部位于加州帕洛阿爾托,由甲骨文和Sun Microsystems公司的元老Rodrigo Liang、斯坦福大學(xué)教授Kunle Olukotun、Chris Ré于2017年成立,提供從數(shù)據(jù)中心到邊緣運(yùn)行AI和數(shù)據(jù)密集型應(yīng)用的系統(tǒng)。
Liang擔(dān)任SambaNova的首席執(zhí)行官,Olukotun任首席技術(shù)專家,華登國際創(chuàng)始人兼董事長、EDA軟件巨頭Cadence CEO陳立武同時(shí)也是SambaNova董事長。
▲SambaNova創(chuàng)始人合影,左-Kunle Olukotun,中-Rodrigo Liang,右-Chris Ré
Olukotun被稱為“多核處理器之父”,最近獲得了IEEE計(jì)算機(jī)協(xié)會(huì)的哈里·H·古德紀(jì)念獎(jiǎng)(Harry H. Goode Memorial Award)。
他是斯坦福Hydra芯片多處理器(CMP)研究項(xiàng)目的負(fù)責(zé)人,這個(gè)項(xiàng)目研發(fā)了一種芯片設(shè)計(jì),將四個(gè)專用處理器和它們的緩存與共享的二級(jí)緩存相匹配。
Ré是斯坦福大學(xué)信息實(shí)驗(yàn)室計(jì)算機(jī)科學(xué)系的副教授,也是美國跨領(lǐng)域最高獎(jiǎng)項(xiàng)之一——麥克阿瑟天才獎(jiǎng)(MacArthur genius award)的獲得者,他還隸屬于斯坦福統(tǒng)計(jì)機(jī)器學(xué)習(xí)小組(Statistical Machine Learning Group)、普適并行實(shí)驗(yàn)室(Pervasive Parallelism Lab)和斯坦福AI實(shí)驗(yàn)室。
▲SambaNova董事會(huì)成員
02.
自研可重構(gòu)數(shù)據(jù)流單元
400億晶體管、臺(tái)積電7nm制程
SambaNova的AI芯片與其客戶很大程度上仍在保密狀態(tài),但該公司此前透露,受DARPA資助的高效AI處理研究啟發(fā),他們正在開發(fā)“軟件定義”設(shè)備。
通過算法優(yōu)化和自定義硬件結(jié)合,SambaNova聲稱能顯著提高大多數(shù)AI應(yīng)用的性能和能力。該公司聯(lián)合創(chuàng)始人兼CEO Rodrigo Liang分享道,SambaNova并沒有采用市面上主流的Arm和x86架構(gòu),而是自主研發(fā)了芯片架構(gòu)。
SambaNova研發(fā)的可重構(gòu)數(shù)據(jù)流單元Cardinal SN10 RDU包含400億晶體管,采用臺(tái)積電7nm制程,由一系列可重構(gòu)節(jié)點(diǎn)組成,用于數(shù)據(jù)、存儲(chǔ)和交換。
Rodrigo Liang提到,為規(guī)避芯片短缺可能帶來的不利影響,SambaNova于去年早些時(shí)候進(jìn)行投資,以確保獲得臺(tái)積電的產(chǎn)能。
每個(gè)Cardinal芯片有6個(gè)內(nèi)存控制器,支持153GB/s帶寬, 8個(gè)芯片以全對(duì)全配置連接,最后一點(diǎn)是通過允許芯片擴(kuò)展的交換網(wǎng)絡(luò)實(shí)現(xiàn)的。
SambaNova并不是單獨(dú)出售Cardinal,而是將其作為一種安裝在數(shù)據(jù)中心的解決方案。
2020年12月,SambaNova Systems宣布SambaNova Systems DataScale正式可用,DataScale基于可重構(gòu)數(shù)據(jù)流架構(gòu)(RDA),是一個(gè)完全集成的軟件和硬件平臺(tái),可針對(duì)從算法到芯片的數(shù)據(jù)流進(jìn)行優(yōu)化,包含SambaFlow軟件棧和8個(gè)可重構(gòu)數(shù)據(jù)流單元Cardinal SN10 RDU。每個(gè)RDU都能支持無縫并行處理大型模型,使企業(yè)能夠比當(dāng)今最先進(jìn)的解決方案更快地將新的服務(wù)和產(chǎn)品推向市場(chǎng)。
SambaNova提供的基本單元被稱為DataScale SN10-8R ,配備了一個(gè)AMD處理器,搭配8個(gè)Cardinal芯片和12 TB的DDR 4內(nèi)存,或每個(gè)Cardinal芯片1.5TB。
▲SambaNova DataScale SN10-8R運(yùn)行工作負(fù)載的效果
03.
對(duì)標(biāo)NVIDIA
4個(gè)關(guān)鍵領(lǐng)域性能破紀(jì)錄
SambaNova Systems DataScale專為高效的深度學(xué)習(xí)推理和訓(xùn)練而設(shè)計(jì),相比最新NVIDIA旗艦A100 GPU,DataScale在四個(gè)關(guān)鍵領(lǐng)域?qū)崿F(xiàn)破紀(jì)錄的多機(jī)架規(guī)模性能指標(biāo):
?。?)性能:DLRM推理的吞吐量比A100高7倍,延遲只有A100的1/7;BERT-Large訓(xùn)練速度比DGX A100系統(tǒng)快1.4倍。
?。?)精度:與DGX A100系統(tǒng)相比,其高分辨率計(jì)算機(jī)視覺的精度達(dá)90.23%;與NVIDIA A100 GPU相比,其DLRM推薦引擎的精度達(dá)80.46%。
?。?)規(guī)模:以多機(jī)架規(guī)模打破BERT-Large訓(xùn)練和精度的記錄。
?。?)易用性:從加載dock到數(shù)據(jù)中心,DataScale可以在45分鐘內(nèi)快速輕松地集成到任何運(yùn)行客戶工作負(fù)載的現(xiàn)有基礎(chǔ)設(shè)施中,數(shù)秒內(nèi)即可在DataScale上以先進(jìn)精度下載數(shù)千個(gè)預(yù)訓(xùn)練的Hugging Face Transformer模型,無需更改代碼。
在軟件方面,SambaNova有自己的圖形優(yōu)化器和編譯器,使用TensorFlow、PyTorch等其他機(jī)器學(xué)習(xí)框架的客戶可以用這些工具為Cardinal重新編譯工作負(fù)載。
SambaNova的目標(biāo)是支持包含超過1000億參數(shù)的自然語言處理、高分辨率計(jì)算機(jī)視覺和推薦模型,并提供更大的內(nèi)存占用和更高的準(zhǔn)確性。
與新的SN10-8R產(chǎn)品一起,SambaNova將提供兩種類似云的服務(wù)選項(xiàng):
第一種是SambaNova AI云平臺(tái),允許研究機(jī)構(gòu)能免費(fèi)訪問和使用SambaNova的硬件資源;
第二種是業(yè)界首個(gè)數(shù)據(jù)流即服務(wù)(DataFlow as a Service),面向想要靈活的云服務(wù)而無需為硬件付費(fèi)的商業(yè)客戶所準(zhǔn)備。
04.
產(chǎn)品已銷售1年多
落地多個(gè)美國實(shí)驗(yàn)室
據(jù)悉,第一代Cardinal芯片在2019年春季taped out,首批芯片樣品已用于客戶服務(wù)器上。
在此之前,SambaNova的產(chǎn)品已經(jīng)向客戶銷售了一年多。
美國阿貢國家實(shí)驗(yàn)室、美國能源部旗下國家核安全管理局(NNSA)、勞倫斯利弗莫爾國家實(shí)驗(yàn)室(LLNL)、洛斯阿拉莫斯國家實(shí)驗(yàn)室(LANL)等多個(gè)研究機(jī)構(gòu),均已部署DataScale平臺(tái)來加速研究中的AI計(jì)算。
例如,LLNL正將DataScale用在其Corona超級(jí)計(jì)算機(jī)中,用于研發(fā)新冠肺炎藥物。
LLNL首席技術(shù)官Bronis de Supinski稱,SambaNova的平臺(tái)正被用于探索一種被稱為認(rèn)知模擬的技術(shù),在這種技術(shù)中,AI被用來加速部分模擬處理。他聲稱,與運(yùn)行相同型號(hào)的GPU相比,這一性能提高了大約5倍。
05.
SambaNova融資背后
AI芯片成各國必爭(zhēng)之地
AI芯片是一種專用于加速AI應(yīng)用的硬件,通過低精度計(jì)算、存內(nèi)計(jì)算等技術(shù),提高運(yùn)行大規(guī)模AI算法的性能。根據(jù)全球綜合數(shù)據(jù)資料庫Statista的一項(xiàng)研究,專用集成電路(ASIC)預(yù)計(jì)將在推理階段AI邊緣計(jì)算處理能力中占有越來越大的份額,到2025年占比將達(dá)70%。
以SambaNova獲得的新融資為例,多國AI芯片創(chuàng)企正斬獲融資,AI芯片市場(chǎng)正競(jìng)爭(zhēng)激烈。根據(jù)美通社數(shù)據(jù),該市場(chǎng)預(yù)計(jì)2025年將達(dá)到911.8億美元。
▲到2025年,ASIC在推理階段AI邊緣計(jì)算處理能力的占比達(dá)70%(來源:Statista)
近期,中國云端AI芯片創(chuàng)企正經(jīng)歷著新一輪融資熱潮。天數(shù)智芯、壁仞科技、燧原科技、沐曦集成等多家云端芯片創(chuàng)企宣布獲得高額新融資,百度AI芯片部門最近在融資后估值為20億美元,中科寒武紀(jì)去年成為科創(chuàng)板上市的第一家純AI芯片公司。
在云端及邊緣AI芯片的研發(fā)及落地競(jìng)賽中,其他國家也有一些備受關(guān)注的明星創(chuàng)企。
例如,以色列AI芯片創(chuàng)企Hailo正在開發(fā)加快邊緣AI推理速度的硬件,該公司在2020年3月獲得了6000萬美元的風(fēng)險(xiǎn)投資。
美國加州創(chuàng)企Mythic已融資8520萬美元用于開發(fā)定制的存內(nèi)計(jì)算架構(gòu)。
英國AI芯片獨(dú)角獸Graphcore致力于研發(fā)加速AI工作負(fù)載的大規(guī)模IPU處理器芯片及系統(tǒng),該公司擁有數(shù)億美元的資金儲(chǔ)備。
隨著AI芯片出現(xiàn)前所未有且持續(xù)的客戶需求,SambaNova也是受益者之一。
因新冠肺炎疫情蔓延,汽車和電子產(chǎn)品采購需求的激增加劇了日益嚴(yán)重的芯片緊缺。美國總統(tǒng)喬·拜登近期承諾投入1800億美元,用于先進(jìn)計(jì)算的研發(fā)和專門用于AI和量子計(jì)算的半導(dǎo)體制造,這些都已成為美國國家科技戰(zhàn)略的核心。
06.
結(jié)語:AI芯片市場(chǎng)
開啟落地與生態(tài)之戰(zhàn)
2020年以來,多國AI芯片領(lǐng)域均傳出多起融資事件??傮w來看,以國內(nèi)市場(chǎng)為例,據(jù)工銀投行數(shù)據(jù),2019年國內(nèi)AI芯片領(lǐng)域投資金額達(dá)58.57億元,而2020年僅1-10月的AI芯片總?cè)谫Y額已經(jīng)超過了2019年全年。企業(yè)層面之外,多個(gè)國家與地區(qū)亦從政策層面出發(fā),扶持AI芯片企業(yè)成長。
在這背后,AI芯片創(chuàng)企走過了早期的技術(shù)拓荒期,市場(chǎng)或?qū)㈤_啟落地與生態(tài)構(gòu)建新戰(zhàn)事。