人工智能的崛起有三個(gè)基本要素:算法、數(shù)據(jù)和算力。當(dāng)云計(jì)算廣泛應(yīng)用,深度學(xué)習(xí)成為當(dāng)下AI研究和運(yùn)用的主流方式時(shí),AI對(duì)算力的要求正快速提升。對(duì)AI芯片的持續(xù)深耕,就是對(duì)算力的不懈追求。近日,亞馬遜一年一度的、神秘的 MARS 大會(huì)在加利福尼亞州棕櫚泉市如期舉行。
亞馬遜 MARS 大會(huì)是一個(gè)只有受邀才能參加的高端會(huì)議,在棕櫚泉市這個(gè)奢華的度假勝地,你能看到大量機(jī)器人或漫步或飛行,并有機(jī)會(huì)與眾多著名科學(xué)家和科幻作家們交流。大會(huì)上,只有少數(shù)研究人員會(huì)被邀請(qǐng)來做技術(shù)講座,這些講座既令人敬η,又發(fā)人深省。與此同時(shí),與會(huì)者中有大約 100 名世界上最重要的研究人員、CEO 和企業(yè)家。MARS 大會(huì)的東道主不是別人,正是現(xiàn)場(chǎng)坐在前排的亞馬遜創(chuàng)始人兼董事長杰夫·貝佐斯。
MARS 大會(huì)的目的是展示機(jī)器學(xué)習(xí)、自動(dòng)化、機(jī)器人和太空領(lǐng)域中最新和最古怪的技術(shù),因此以火星命名(MARS 4個(gè)字母分別代表:Machine Learning 機(jī)器學(xué)習(xí)、Home Automation 家庭自動(dòng)化、Robotics 機(jī)器人、Space Exploration 太空探索 ),也是貝索斯對(duì)尖端科技的熱情展示。
而在今年的大會(huì)上,一款人工智能芯片的亮相引起了我們的注意。這款芯片由麻省理工學(xué)院的 Vivienne Sze 和她的同事共同打造。在當(dāng)時(shí)的 MARS 大會(huì)上,其他的演講者介紹了“空手?jǐn)嗄尽睓C(jī)器人、像昆蟲一樣無聲飛行的無人機(jī),甚至還有火星殖民地的藍(lán)圖,Sze 的演講可能看起來更中規(guī)中矩。在普通人看來,Sze 展示的芯片與其他任何電子設(shè)備中都能找到的芯片?有什?區(qū)別。但是,它們比大會(huì)上展示的所有東西都重要得多。
對(duì) Vivienne Sze 來說,她在 MARS 舞臺(tái)上發(fā)表了一場(chǎng)或許是她職業(yè)生涯中最傷腦筋的演講。
其實(shí),她對(duì)這個(gè)項(xiàng)目了如指掌。她在麻省理工學(xué)院實(shí)驗(yàn)室里開發(fā)的芯片,有望將強(qiáng)大的人工智能帶到許多終端硬件設(shè)備上,并超出大多數(shù)大型人工智能數(shù)據(jù)計(jì)算中心的能力范Χ。然而,演講和觀眾的熱情表現(xiàn)讓 Sze 始料δ及。Sze 笑著回憶道:“我想你會(huì)說,那是一群水平相當(dāng)高的觀眾”。
邊緣計(jì)算讓神經(jīng)網(wǎng)絡(luò)走向定制芯片
近年來,神經(jīng)網(wǎng)絡(luò)的流行讓我們迎來了自動(dòng)駕駛、語音識(shí)別、計(jì)算機(jī)視覺和自動(dòng)翻譯等領(lǐng)域一系列的突破和進(jìn)展,但也將其消耗大量內(nèi)存和能源的缺點(diǎn)暴?無遺。盡管現(xiàn)在我們還能靠云端服務(wù)器支撐運(yùn)算,但是這不會(huì)是 AI 走向大范Χ應(yīng)用的長遠(yuǎn)之計(jì)。
現(xiàn)在,簡單的人工智能芯片已經(jīng)產(chǎn)生了重大影響。高端智能手機(jī)已經(jīng)在使用為運(yùn)行圖像和語音識(shí)別的深度學(xué)習(xí)算法而優(yōu)化的芯片。與之相比,更高效的芯片可以讓這些設(shè)備運(yùn)行功能更強(qiáng)大的人工智能代碼。自動(dòng)駕駛汽車也需要強(qiáng)大的人工智能芯片,因?yàn)槟壳按蠖鄶?shù)汽車都依賴于大型計(jì)算機(jī)。
為改變這些現(xiàn)狀,身為 MIT 電氣工程和計(jì)算機(jī)科學(xué)系(EECS)副教授的 Sze,一直在研發(fā)新的適用于神經(jīng)網(wǎng)絡(luò)的高能效計(jì)算機(jī)芯片,這種芯片可使人工智能系統(tǒng)在移動(dòng)設(shè)備上進(jìn)行本地運(yùn)行。
Sze 的芯片叫做Eyeriss。它是 Sze 與英偉達(dá)研究科學(xué)家、麻省理工學(xué)院教授 Joel Emer 合作開發(fā)的。該芯片與許多標(biāo)準(zhǔn)處理器一起進(jìn)行了測(cè)試,以了解它如何處理一系列不同的深度學(xué)習(xí)算法。根據(jù)去年網(wǎng)上發(fā)表的一篇論文,綜合效率和靈活性,新芯片的性能比現(xiàn)有硬件高出 10 倍,甚至 1000 倍。
具體而言,Eyeriss 是一個(gè)高效能的深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)加速器硬件,能夠讓移動(dòng)設(shè)備執(zhí)行自然語言處理和面部識(shí)別等任務(wù),而無需連接至互聯(lián)網(wǎng)。顯然,這是讓機(jī)器學(xué)習(xí)變得更加便攜的嘗試。換言之,借助 Eyeriss,智能手機(jī)、可穿戴設(shè)備、機(jī)器人、自動(dòng)駕駛汽車、以及其它物聯(lián)網(wǎng)設(shè)備,都能夠在本地處理復(fù)雜的深度學(xué)習(xí)任務(wù)。
這點(diǎn)在此前一直非常難以做到,因?yàn)樯疃葘W(xué)習(xí)依賴于大規(guī)模的計(jì)算機(jī)處理性能,而 GPU 加速就是比較常見的一種方式。盡管 GPU 能夠勝任此工作,但它也有一個(gè)最大的缺點(diǎn)——費(fèi)電。而 Eyeriss 也比起現(xiàn)有的圖形處理器 GPUs 更加高效。
目前,Eyeriss 也得到了美國國防部高級(jí)研究計(jì)劃局(Darpa)的資助。
芯片開發(fā)新挑戰(zhàn)
對(duì)于這款芯片,英特爾人工智能產(chǎn)品集團(tuán)副總裁 Naveen Rao 認(rèn)為,MIT 的芯片很有前途,但是決定一個(gè)新的硬件架構(gòu)能否成功有很多因素。他說,最重要的因素之一是軟件開發(fā),“從編譯器的角度來看,使某些東西可用可能是使用它的最大障礙。”
他也表示:“人工智能將無處不在,而找出提高產(chǎn)品能效的方法將極其重要?!?/p>
例如,Sze 的硬件效率更高,部分原因是它在物理上解決了數(shù)據(jù)存儲(chǔ)和分析之間的瓶頸,還因?yàn)樗褂昧酥赜脭?shù)據(jù)的巧妙方案。在加入麻省理工學(xué)院之前,Sze 為一家公司開創(chuàng)了這種提高視頻壓縮效率的方法。
事實(shí)上,Sze 的實(shí)驗(yàn)室也還在探索設(shè)計(jì)軟件的方法,以便更好地利用現(xiàn)有計(jì)算機(jī)芯片的特性,這不僅僅是深度學(xué)習(xí)方面的工作。
Sze 也與麻省理工學(xué)院航空航天系的 Sertac Karaman 合作,開發(fā)了一種名為 Navion 的低功耗芯片,它可以在小型無人機(jī)上非常高效地進(jìn)行三維測(cè)繪和導(dǎo)航。這項(xiàng)工作的關(guān)鍵是利用以導(dǎo)航為重點(diǎn)的算法精心設(shè)計(jì)芯片,并設(shè)計(jì)算法來充分利用這款定制芯片。和深度學(xué)習(xí)一樣,Navion 反映了人工智能軟件和硬件開始在共生中進(jìn)化的過程。
在 MARS 大會(huì)上,Sze 的芯片可能不像無人機(jī)那樣吸引眼球,但它們?cè)诖髸?huì)上展出的事實(shí),讓人們多少意識(shí)到她的技術(shù),以及更廣泛意義上的硅芯片創(chuàng)新對(duì)人工智能的δ來有多?重要。Sze 說,在她的演講之后,其他一些演講者表示有興趣了解更多?!叭藗儼l(fā)現(xiàn)了很多重要的用例?!?/p>
這些新設(shè)計(jì)的芯片,例如 Sze 實(shí)驗(yàn)室正在開發(fā)的芯片,可能對(duì)δ來人工智能的發(fā)展至關(guān)重要。到目前為止,人工智能算法主要運(yùn)行在圖形處理芯片上,但新的硬件可以讓人工智能算法更強(qiáng)大,從而解鎖新的應(yīng)用方向。例如,新的人工智能芯片可以讓倉庫機(jī)器人變得更加普遍,或者讓智能手機(jī)創(chuàng)造出逼真的增強(qiáng)現(xiàn)實(shí)場(chǎng)景。
Sze 的芯片在設(shè)計(jì)上非常高效和靈活,這對(duì)于人工智能這一發(fā)展極其迅速的領(lǐng)域來說是至關(guān)重要的?,F(xiàn)在,Sze 和同事還試圖從另一個(gè)方向解決相關(guān)的能耗問題,如運(yùn)用電池技術(shù)設(shè)計(jì)更節(jié)能的神經(jīng)網(wǎng)絡(luò)。
Sze 認(rèn)為,真正的機(jī)會(huì)不是制造最強(qiáng)大的深度學(xué)習(xí)芯片,電池效率也很重要,人工智能還需要在大型數(shù)據(jù)中心無法達(dá)到的地方運(yùn)行,這意ζ著只能依靠設(shè)備本身的電池來運(yùn)行。
依然火熱的 AI 芯片創(chuàng)業(yè)潮
現(xiàn)在,摩爾定律越來越多地遇到由原子級(jí)工程組件所帶來的物理極限。它也激發(fā)了人們新的對(duì)其他替代結(jié)構(gòu)和計(jì)算方法的興趣。
美國政府并?有忽視投資下一代人工智能芯片、保持美國在芯片制造領(lǐng)域的總體主導(dǎo)地λ所帶來的高風(fēng)險(xiǎn)。正如上文提到,Sze 的芯片研發(fā)受到了 DARPA 資助,而除了這一項(xiàng)目以外,DARPA 也還資助了其他一些旨在幫助設(shè)計(jì)開發(fā)新人工智能芯片的項(xiàng)目。
需要強(qiáng)調(diào)的是,芯片制造領(lǐng)域的創(chuàng)新主要是由深度學(xué)習(xí)推動(dòng)的。深度學(xué)習(xí)是一種非常強(qiáng)大的可以讓計(jì)算機(jī)執(zhí)行某些任務(wù)的學(xué)習(xí)方式。有了深度學(xué)習(xí)算法,不需要給計(jì)算機(jī)制定所ν的規(guī)則:在大型的模擬人工神經(jīng)網(wǎng)絡(luò)中輸入訓(xùn)練數(shù)據(jù),然后對(duì)其進(jìn)行調(diào)整,使其產(chǎn)生預(yù)期的結(jié)果。經(jīng)過足夠的訓(xùn)練,深度學(xué)習(xí)系統(tǒng)可以在數(shù)據(jù)中發(fā)現(xiàn)細(xì)微和抽象的模式。從智能手機(jī)的人臉識(shí)別到醫(yī)學(xué)圖像預(yù)測(cè)疾病,這項(xiàng)技術(shù)越來越多的被應(yīng)用到實(shí)際任務(wù)中。
但是,深度學(xué)習(xí)并不那?符合摩爾定律。神經(jīng)網(wǎng)絡(luò)可以同時(shí)運(yùn)行許多數(shù)學(xué)計(jì)算,因此它們?cè)谔幚?3D 圖像的視頻游戲圖形芯片上運(yùn)行得更有效,專門為支持深度學(xué)習(xí)算法而設(shè)計(jì)的芯片則更強(qiáng)大。
正因?yàn)樾滦酒軜?gòu)改善人工智能的潛力,芯片行業(yè)幾十年來從δ出現(xiàn)的創(chuàng)業(yè)熱得以激發(fā)。
對(duì)于像深度學(xué)習(xí)這樣快速發(fā)展的領(lǐng)域,人工智能芯片的工作人員面臨的挑戰(zhàn)是,確保芯片足夠靈活,能夠適應(yīng)任何應(yīng)用程序。設(shè)計(jì)一個(gè)只做一件事的超級(jí)高效芯片很容易,但這樣的產(chǎn)品很快就會(huì)過時(shí)。
目前的人工智能算法可以說已經(jīng)改變世界了,然而這些芯片的設(shè)計(jì),還能從深度學(xué)習(xí)人工智能算法中挖掘出更多東西。在這個(gè)過程中,它們可能會(huì)激發(fā)這些算法本身的進(jìn)化。Sze 說,“我們需要開發(fā)新的硬件,因?yàn)槟柖梢呀?jīng)放慢了速度”。
包括谷歌、微軟和亞馬遜在內(nèi)的大型科技公司,都在開發(fā)自己的深度學(xué)習(xí)芯片,希望利用和商業(yè)化人工智能。許多小型初創(chuàng)公司也在開發(fā)新的芯片。
正如分析公司 Linley Group 的芯片分析師 Mike Delmer 表示,“我們已無法跟蹤所有進(jìn)入人工智能芯片領(lǐng)域的公司,我不是在開玩笑,我們幾乎?周都要認(rèn)識(shí)一個(gè)新的公司?!?/p>
換句話說,下一屆 MARS 大會(huì)上引人注目的機(jī)器人和無人機(jī)上,我們可能看到這些機(jī)器終端用上一些相當(dāng)特別的芯片