Wave Computing在2018取得了不少進(jìn)展,推出其第一個(gè)DataFlow處理單元,收購MIPS,創(chuàng)建MIPS Open,并將首批系統(tǒng)交付給少數(shù)客戶。雖然Wave架構(gòu)有一些非常有趣的功能,但我們更期待用戶的大規(guī)模真實(shí)體驗(yàn)反饋。
Wave不是插入到服務(wù)器的加速器,它是用于圖形計(jì)算的獨(dú)立處理器。這種方法有利有弊。從積極的方面看,Wave不會(huì)受到GPU等加速器面臨的內(nèi)存瓶頸影響。從消極方面來說,安裝Wave設(shè)備將是新的升級(jí),需要完全替換傳統(tǒng)的X86服務(wù)器,也讓其成為所有服務(wù)器制造商的競(jìng)爭(zhēng)對(duì)手。
我不認(rèn)為Wave能從某個(gè)點(diǎn)擊敗NVIDIA,但該架構(gòu)的設(shè)計(jì)的非常好,該公司已經(jīng)表示它很快就會(huì)有客戶的反饋。
圖1:Wave是從上面顯示的4節(jié)點(diǎn)“DPU”構(gòu)建的系統(tǒng)。Wave Computing
Graphcore
Graphcore是一家資金雄厚(融資3.1億美元,目前估值為17億美元)的英國(guó)獨(dú)角獸創(chuàng)業(yè)公司,擁有全球化的團(tuán)隊(duì)。它正在構(gòu)建一種新型的圖形處理器架構(gòu),其內(nèi)存與其邏輯單元位于同一芯片上,這應(yīng)該能夠?qū)崿F(xiàn)更高的性能。該團(tuán)隊(duì)產(chǎn)品的發(fā)布時(shí)間暫不明確,不過他們?nèi)ツ晁脑卤硎尽皫缀鯗?zhǔn)備好發(fā)布”了,12月的最新信息表明它將很快開始生產(chǎn)。
Graphcore的投資者名單令人印象深刻,包括紅杉資本、寶馬、微軟、博世和戴爾科技。
我了解了該公司的架構(gòu),它非常令人印象深刻。從邊緣設(shè)備擴(kuò)展到用于數(shù)據(jù)中心的訓(xùn)練和推理的“Colossus”雙芯片封裝。在最近的NeurIPS活動(dòng)中,Graphcore展示了其RackScale IPU Pod,它在一個(gè)32臺(tái)服務(wù)器的機(jī)架中提供超過16 petaflops的算力。雖然該公司經(jīng)常聲稱它將提供比同類最好GPU強(qiáng)100倍的性能。
Graphcore表示,4“Colossus”GC2(8芯片)服務(wù)器可提供500 TFlops(每秒數(shù)萬億次操作)的混合精度性能。單個(gè)NVIDIA V100可提供125 TFlops,因此理論上4 個(gè)V100就可提供與其相同的性能。
與往常一樣,細(xì)節(jié)更能發(fā)現(xiàn)差別,V100峰值性能僅在重構(gòu)代碼執(zhí)行TensorCore的4x4矩陣乘法時(shí)才可用,這是Graphcore架構(gòu)巧妙避免的限制。更不用說V100消耗了300瓦的電能和大量現(xiàn)金這一事實(shí)。
此外,Graphcore支持片上互連和“處理器內(nèi)存”(片上存儲(chǔ)器)方法,可以得到超出TFlops基準(zhǔn)所認(rèn)可的優(yōu)秀性能。在一些神經(jīng)網(wǎng)絡(luò)中,如Generative Adversarial Networks,內(nèi)存是瓶頸。
再次強(qiáng)調(diào),我們將不得不等待真實(shí)的用戶用實(shí)際應(yīng)用程序來評(píng)估此體系結(jié)構(gòu)。盡管如此,Graphcore的投資者名單、專家名單和臺(tái)天價(jià)估值告訴我,這可能是一件好事。
圖2:GraphCore展示了ImageNet數(shù)據(jù)集處理的照片。 可視化可幫助開發(fā)人員了解其訓(xùn)練處理占用處理周期的位置。
Habana Labs
Habana Labs是一家以色列創(chuàng)業(yè)公司,去年9月在第一次AI硬件峰會(huì)上宣布它已經(jīng)準(zhǔn)備好推出其首款用于推理的芯片,其創(chuàng)紀(jì)錄的性能用于卷積神經(jīng)網(wǎng)絡(luò)圖像處理。結(jié)果顯示在Resnet50圖像分類數(shù)據(jù)庫中該處理器每秒分類15,000張圖像,比NVIDIA的T4高出約50%,功耗僅為100瓦。
在2018年12月,Habana Labs的最新一輪融資由英特爾風(fēng)險(xiǎn)投資(Intel Venture Capital)領(lǐng)投,WRV Capital,Bessemer Venture Partners和Battery Ventures跟投,該公司的融資也由此前的4500萬美元增加了7500萬美元。
據(jù)悉,Habana Labs新的融資將部分用于流片其名為“Gaudi“的第二款芯片,該芯片將專注于訓(xùn)練市場(chǎng),據(jù)稱可擴(kuò)展到1000多個(gè)處理器。
其它創(chuàng)業(yè)公司
我知道世界上有超過40家公司在為人工智能設(shè)計(jì)訓(xùn)練和推理芯片。我發(fā)現(xiàn)大多數(shù)公司都在進(jìn)行簡(jiǎn)單的FMA(浮點(diǎn)乘法累加)和混合精度數(shù)學(xué)(整型8位和浮點(diǎn)16位和32位)。對(duì)此我不會(huì)感到驚訝,因?yàn)檫@種方法相對(duì)容易實(shí)現(xiàn)并且會(huì)獲得一些成果,但它不會(huì)為像NVIDIA,英特爾以及少數(shù)初創(chuàng)公司做出不一樣的架構(gòu)提供持久的架構(gòu)優(yōu)勢(shì)。
以下是一些引起我注意的公司:
Groq:前Google員工創(chuàng)立,從事TPU工作,他們有雄心統(tǒng)治世界其他地區(qū)。
Tenstorrent:加拿大前AMD員工創(chuàng)立,目前仍處于保密階段。我只能說其首席執(zhí)行官的愿景和架構(gòu)給我留下了深刻的印象。
ThinCi:印度公司專注于邊緣設(shè)備和自動(dòng)駕駛汽車,與三星和Denso建立了合作伙伴關(guān)系。
Cerebras:由前SeaMicro(雷鋒網(wǎng)注,AMD子公司,專注于超密集計(jì)算機(jī)服務(wù)器行,在2015年4月16日停止運(yùn)營(yíng))員工領(lǐng)導(dǎo),包括Andrew Feldman,目前仍處于深度“隱身”模式。
Mythic:一家采用獨(dú)特方法進(jìn)行邊緣推理處理的創(chuàng)業(yè)公司,類似于非易失性存儲(chǔ)器上的模擬處理; 應(yīng)該在2019年有芯片。
中國(guó)AI芯片初創(chuàng)公司
中國(guó)一直試圖找到一條擺脫美國(guó)半導(dǎo)體的方式,人工智能加速器可能會(huì)提供它一直在尋求的機(jī)會(huì)。中國(guó)設(shè)定了2030年要建立一個(gè)價(jià)值數(shù)萬億美元的人工智能產(chǎn)業(yè)的目標(biāo),自2012年以來,投資者已經(jīng)向創(chuàng)業(yè)公司投入了超過40億美元的資金。
美國(guó)國(guó)會(huì)稱這是一場(chǎng)人工智能軍備競(jìng)賽,美國(guó)科技產(chǎn)業(yè)可能落后于中國(guó)公司和研究機(jī)構(gòu),因?yàn)槠洳惶P(guān)注阻礙西方進(jìn)步的隱私問題。
Cambricon(寒武紀(jì)科技)和SenseTime(商湯科技)可能是最值得關(guān)注的中國(guó)人工智能玩家,但像邊緣AI這樣的玩家更關(guān)注Horizon Robotics(地平線)。此外,大型科技公司如百度、華為、騰訊和阿里巴巴也值得關(guān)注,所有這些公司都對(duì)人工智能軟件和硬件進(jìn)行了大量投資。
寒武紀(jì)科技估值為25億美元,是已經(jīng)發(fā)布了第三代AI芯片的中國(guó)獨(dú)角獸公司。寒武紀(jì)稱它可以用更低的功耗提供比NVIDIA V100更好的AI性能,他們還銷售其AI IP,搭載在華為麒麟970和麒麟980的處理器當(dāng)中,作為AI加速硬件。
商湯科技也許是估值最高的AI創(chuàng)業(yè)公司,以在中國(guó)推廣智能監(jiān)控?cái)z像頭而聞名。這些安防攝像頭數(shù)量超過1.75億,包括其他公司生產(chǎn)的攝像頭。商湯科技在香港成立,最近一輪融資數(shù)額達(dá)6億美元,由阿里巴巴領(lǐng)投。據(jù)報(bào)道,這家初創(chuàng)公司的價(jià)值目前為45億美元。
商湯科技與阿里巴巴、高通、本田甚至NVIDIA等主要公司建立了戰(zhàn)略合作伙伴關(guān)系。該公司今天擁有一臺(tái)超級(jí)計(jì)算機(jī),運(yùn)行大約8000塊(可能是NVIDIA提供?)GPU,并計(jì)劃再建造5臺(tái)超級(jí)計(jì)算機(jī)來處理數(shù)百萬個(gè)攝像頭采集的面部識(shí)別數(shù)據(jù)。