據(jù)enterpriseai報(bào)道,目前市場(chǎng)上有80多家AI芯片供應(yīng)商和初創(chuàng)公司,每家公司都表示,在為廣泛的行業(yè)和用途構(gòu)建AI芯片時(shí),他們都有一個(gè)更好的主意。
這樣的情況同樣出現(xiàn)在擁有3年歷史的無(wú)晶圓廠AI芯片公司SimpleMachines身上。據(jù)報(bào)道,他們正在憑借自己獨(dú)特的設(shè)計(jì)去挑戰(zhàn)Nvidia和Marvell這樣的芯片巨頭。當(dāng)然,像他們這樣的初創(chuàng)公司也是其挑戰(zhàn)對(duì)象。其說(shuō)憑借的就是他們所說(shuō)的不同方法去解決AI計(jì)算的難題。
SimpleMachines的創(chuàng)始人兼首席執(zhí)行官Karu Sankaralingam說(shuō),這始于公司所謂的算法自適應(yīng)AI芯片,程序員可以對(duì)其進(jìn)行定制,以快速,無(wú)縫地滿足其工作流程的需求。
這個(gè)想法催生了Mozart:該公司的首個(gè)AI芯片,該芯片針對(duì)推理進(jìn)行了優(yōu)化,在設(shè)計(jì)中使用了16納米工藝,HBM2高帶寬內(nèi)存和PCIe Gen3x16尺寸。Sankaralingam告訴EnterpriseAI,公司的Mozart芯片現(xiàn)在正在送樣,正在接受客戶評(píng)估。他說(shuō),Mozart芯片是由芯片制造商臺(tái)積電生產(chǎn)的,具有完整的軟件和硬件堆棧,可讓數(shù)據(jù)科學(xué)家運(yùn)行程序而無(wú)需擔(dān)心背后的問(wèn)題。
Sankaralingam說(shuō),Mozart之所以能夠在AI芯片領(lǐng)域脫穎而出,是因?yàn)樗梢栽谝粋€(gè)芯片上同時(shí)運(yùn)行多個(gè)AI模型。
他說(shuō):“之所以發(fā)生這種情況,是因?yàn)槲覀兊男酒趦?nèi)部分為64個(gè)不同的模塊,如果有必要,程序員可以對(duì)其進(jìn)行尋址并同時(shí)運(yùn)行64個(gè)不同的應(yīng)用程序或模型?!?“然后,開(kāi)發(fā)人員可以編寫(xiě)64個(gè)不同的模型,并且可以在一芯片硅片上同時(shí)運(yùn)行64個(gè)模塊(如果需要)。
Mozart的軟件堆棧包括直接的TensorFlow支持以及C / C ++和Python的API,使程序員和數(shù)據(jù)科學(xué)家可以使用它。
Mozart可以以稱為Accelerando的PCIe卡形式購(gòu)買(mǎi),也可以通過(guò)SimpleMachines的Symphony Cloud Service進(jìn)行使用,該服務(wù)可以訪問(wèn)Azure,Google Cloud Platform和AWS等公有云,本質(zhì)上是一種AI-as-a -服務(wù)交付模式。初始測(cè)試顯示了可以同時(shí)運(yùn)行的推薦引擎,語(yǔ)音和語(yǔ)言處理以及圖像檢測(cè)的用例。將來(lái),帶有Mozart芯片的Accelerando卡將在標(biāo)準(zhǔn)OEM廠商的系統(tǒng)中出售,例如Dell和Supermicro。
不同的方法
Moor Insights&Strategy的HPC和機(jī)器學(xué)習(xí)高級(jí)研究分析師Karl Freund表示,近年來(lái)他在AI芯片和軟件的”寒武紀(jì)大爆發(fā)“中看到了十幾種獨(dú)特的AI芯片設(shè)計(jì),但是SimpleMachines的Mozart設(shè)計(jì)不同于大多數(shù)設(shè)計(jì)。
”像所有的AI初創(chuàng)公司一樣,他們聲稱性能出色,但是現(xiàn)在還不能斷言他們的說(shuō)法“ Freund說(shuō)?!彼麄兊膬?nèi)存架構(gòu)給人留下了深刻的印象,這種架構(gòu)看上去優(yōu)雅而簡(jiǎn)單,這將使繁重的軟件工作變得更容易解決。在軟件方面,他們還有很多工作要做,例如對(duì)PyTorch的支持。但是隨著平臺(tái)的成熟,他們似乎正在朝著正確的方向前進(jìn),這值得進(jìn)一步跟蹤?!?/p>
AI芯片要求不斷變化
他說(shuō),新型Mozart AI芯片的靈感之一是Sankaralingam正在進(jìn)行的研究,該研究指出需要一種新型的架構(gòu),以適應(yīng)當(dāng)今的大數(shù)據(jù)時(shí)代。Sankaralingam還是威斯康星大學(xué)麥迪遜分校的計(jì)算機(jī)科學(xué)教授,他在那里任教14年。
Sankaralingam說(shuō),當(dāng)前的芯片平臺(tái),甚至包括為特定要求而構(gòu)建的定制芯片,都無(wú)法滿足這些需求。”應(yīng)用呈爆炸式增長(zhǎng),因此,它不再只是處理圖像了。它是文本到語(yǔ)音乘以重要數(shù)據(jù)的時(shí)間,并且變化迅速且不斷增長(zhǎng),然后每六個(gè)月突破一次。公司的機(jī)會(huì)是市場(chǎng)需要大量的計(jì)算效率,而GPU卻無(wú)法滿足他們的需求。這些趨勢(shì)使我們意識(shí)到,針對(duì)一個(gè)AI問(wèn)題的專用定制芯片已經(jīng)面世?!?/p>
他說(shuō),借助Mozart,這些挑戰(zhàn)得以解決,因?yàn)榭梢酝ㄟ^(guò)使用芯片的深度軟件堆棧即時(shí)重新編程來(lái)更改芯片上的項(xiàng)目需求。
他說(shuō):”我們正在與客戶的討論中,他們都說(shuō)過(guò)不同的公司如何使用不同的模型,許多公司正在使用許多模型。“ ”這使我們?cè)俅螌徱暳岁P(guān)于AI計(jì)算必要條件的假設(shè)。能力和效率并不是唯一的指標(biāo),另一個(gè)重要的指標(biāo)是算法適應(yīng)性。GPU之所以會(huì)出現(xiàn),是因?yàn)樗鼈兙哂泻芨叩倪m應(yīng)性。“
Sankaralingam說(shuō),使用另一種方法,SimpleMachines的策略是忽略應(yīng)用正在嘗試執(zhí)行的操作,而轉(zhuǎn)向算法?!蔽覀冇^察到,許多或所有這些算法從根本上分解為四種行為:數(shù)據(jù)收集,計(jì)算,控制和同步。我們可以使用這些行為對(duì)算法進(jìn)行分類(lèi)。然后,我們構(gòu)建一個(gè)個(gè)可以將應(yīng)用分解為這些行為的編譯器,并將該信息提供給我們的硬件?!?/p>
他說(shuō),然后硬件不再執(zhí)行指令,獲取,分支中斷器和緩存,而是實(shí)現(xiàn)了這四種行為。
Sankaralingam說(shuō):”這就是我們需要對(duì)它們進(jìn)行編程的全部,作為一名程序員,您可以在TensorFlow中編寫(xiě)這些代碼,然后提取出這些行為并將其映射到我們的芯片上?!?”這是一個(gè)很大的平行轉(zhuǎn)變?!?/p>
Mozart的體系結(jié)構(gòu)將任何軟件應(yīng)用程序抽象為少量已定義的行為,然后使用SimpleMachines自己的編譯器集成到TensorFlow等標(biāo)準(zhǔn)AI框架的后端。據(jù)該公司稱,這使得架構(gòu)可以實(shí)時(shí)轉(zhuǎn)換這些程序并重新配置硬件,從而產(chǎn)生一種芯片,其性能就像最初為該應(yīng)用程序設(shè)計(jì)的一樣。
SimpleMachines認(rèn)為其Mozart AI芯片將在公共數(shù)據(jù)中心,網(wǎng)絡(luò)安全,金融和保險(xiǎn)市場(chǎng)中看到機(jī)遇,并在未來(lái)的邊緣和移動(dòng)設(shè)備市場(chǎng)中為其路線圖上即將推出的產(chǎn)品提供更多機(jī)遇。