以存儲(chǔ)為中心的片上系統(tǒng)與人工智能
2016-12-18
作者:Sylvain Dubois,Crossbar半導(dǎo)體戰(zhàn)略市場(chǎng)營(yíng)銷與業(yè)務(wù)開(kāi)發(fā)副總裁
當(dāng)高性能、低功耗以存儲(chǔ)器為中心的片上系統(tǒng)與物聯(lián)網(wǎng)設(shè)備和云服務(wù)器相結(jié)合時(shí),能夠?qū)崿F(xiàn)怎樣的情形呢?
斯坦福大學(xué)近期的一份報(bào)告表示,人工智能 (AI) 在近期不會(huì)取代人類的需求,但它將對(duì)日常生活產(chǎn)生深遠(yuǎn)的影響,改變運(yùn)輸、教育、醫(yī)療和娛樂(lè)等行業(yè)。深度神經(jīng)網(wǎng)絡(luò)算法與機(jī)器學(xué)習(xí)所產(chǎn)生的激動(dòng)人心的發(fā)展成果將帶來(lái)新的智能接口、新的虛擬助手以及多個(gè)行業(yè)一系列應(yīng)用的進(jìn)化 —— 這些曾經(jīng)只存在于研究實(shí)驗(yàn)室中的夢(mèng)想如今卻成為了消費(fèi)者觸手可及的現(xiàn)實(shí)。
圖1:來(lái)源 https://de.wikipedia.org/wiki/Go_(Spiel)#/media/File:Go_board.jpg
Donarreiskoffer - Selbstfotografiert
機(jī)器學(xué)習(xí)算法開(kāi)始走向大眾的第一個(gè)例子是計(jì)算機(jī)開(kāi)始在與棋手的對(duì)戰(zhàn)中取勝,比如最近與頂級(jí)圍棋選手之間的比賽(圖1)。而像這樣的可能性還會(huì)更多。我們現(xiàn)在正在進(jìn)入一個(gè)監(jiān)視攝像頭和自動(dòng)駕駛通過(guò)機(jī)器學(xué)習(xí)技術(shù)成為現(xiàn)實(shí)生活中高級(jí)計(jì)算機(jī)視覺(jué)應(yīng)用的時(shí)代。使用深度學(xué)習(xí)算法的語(yǔ)音識(shí)別和智能傳感器能夠提高機(jī)器人應(yīng)用的環(huán)境感知。用于電子商務(wù)與廣告建議的云分析以及商業(yè)分析或醫(yī)療建議也只不過(guò)是冰山一角,并且這些應(yīng)用的種類正變得越來(lái)越豐富。
為了讓人工智能不僅限于實(shí)驗(yàn),需要改進(jìn)用戶體驗(yàn),從而加快采納并且使公司能夠盈利。人工智能以及更具體的機(jī)器學(xué)習(xí)是幾乎每家未來(lái)企業(yè)盈利和與競(jìng)爭(zhēng)對(duì)手實(shí)現(xiàn)更大差異的核心。在過(guò)去,數(shù)據(jù)存儲(chǔ)是成本中心,而如今它有機(jī)會(huì)成為利潤(rùn)中心 —— 這是因?yàn)閿?shù)據(jù)能夠訓(xùn)練算法并且創(chuàng)造新的應(yīng)用。
算法需要訓(xùn)練大型數(shù)據(jù)集。處理這些數(shù)據(jù)的算法正變得越來(lái)越復(fù)雜,并且所有數(shù)據(jù)都需要實(shí)時(shí)處理。多年來(lái),許多公司都清楚地知道數(shù)據(jù)采集是其商業(yè)模式中最寶貴的資產(chǎn)?,F(xiàn)在,人們已了解社交媒體公司為何提供如此便捷、免費(fèi)的平臺(tái)用于圖片分享與發(fā)表評(píng)論。這一海量的合格數(shù)據(jù)現(xiàn)在已成為一項(xiàng)非常寶貴的資產(chǎn),并且為這些企業(yè)帶來(lái)了極高的價(jià)值:其應(yīng)用或設(shè)備所采集的大部分?jǐn)?shù)據(jù)被直接輸入到深層神經(jīng)網(wǎng)絡(luò)以訓(xùn)練它們??梢钥焖僭L問(wèn)、用于訓(xùn)練機(jī)器學(xué)習(xí)算法的數(shù)Zb存儲(chǔ)數(shù)據(jù)將帶來(lái)更具創(chuàng)新性的產(chǎn)品與應(yīng)用。
圖2:人工智能可以將數(shù)據(jù)轉(zhuǎn)換為體驗(yàn)。
物聯(lián)網(wǎng)是人工智能的基礎(chǔ)
物聯(lián)網(wǎng)是人工智能的自然基礎(chǔ),并且最終當(dāng)所有互連設(shè)備成為更智能、更具預(yù)測(cè)性的設(shè)備時(shí),這兩者將會(huì)合二為一。物聯(lián)網(wǎng)主要用于采集數(shù)據(jù),而人工智能的主要工作則是使用數(shù)據(jù)。數(shù)據(jù)越多,人工智能算法的智能程度就越高。
內(nèi)置于智能設(shè)備的聲控虛擬助手,比如蘋(píng)果公司的 Siri、亞馬遜的Alexa或谷歌的Home等的性能正變得越來(lái)越強(qiáng)大。類似于斯派克·瓊斯的浪漫主義科幻電影《云端情人》中的體驗(yàn)可能在幾個(gè)月后就能實(shí)現(xiàn)。近期,需要對(duì)數(shù)據(jù)進(jìn)行本地分析的人工智能型監(jiān)控?cái)z像頭的發(fā)展速度正在加快。而將4K視頻上傳到云端進(jìn)行處理和下載所產(chǎn)生的性能與成本挑戰(zhàn)將阻礙必須采取的措施。想象一下:當(dāng)無(wú)線網(wǎng)絡(luò)信號(hào)不佳時(shí),駕駛輔助系統(tǒng)出現(xiàn)故障。大部分智能設(shè)備都需要通過(guò)更好地理解其環(huán)境和消費(fèi)者的習(xí)慣來(lái)根據(jù)用戶體驗(yàn)改善性能。進(jìn)化的基礎(chǔ)是從我們過(guò)去的經(jīng)驗(yàn)中學(xué)習(xí)并且改進(jìn)我們的未來(lái)行為。
這些生成大量可分析與可執(zhí)行數(shù)據(jù)集的技術(shù)需要有創(chuàng)新的存儲(chǔ)技術(shù)提供高性能與低能耗。
Crossbar RRAM等非易失性存儲(chǔ)技術(shù)正在通過(guò)提供低功耗、低電壓的運(yùn)行、與計(jì)算機(jī)內(nèi)核的單片集成以及可按字節(jié)尋址的寫(xiě)入幫助解決嵌入式物聯(lián)網(wǎng)的性能與能源挑戰(zhàn)。RRAM是能耗最低的物聯(lián)網(wǎng)應(yīng)用存儲(chǔ)技術(shù),并且可以與單片解決方案上的處理內(nèi)核集成。
RRAM通過(guò)與專用邏輯的片上集成加快深度神經(jīng)網(wǎng)絡(luò)算法。來(lái)自傳感器的數(shù)據(jù)可以保存在片上并且直接通過(guò)深度神經(jīng)網(wǎng)絡(luò)傳輸,從而采取直接行動(dòng)。對(duì)象并非通過(guò)軟件的獲取行,而是通過(guò)與來(lái)自各傳感器的外部數(shù)據(jù)產(chǎn)生反應(yīng)來(lái)實(shí)現(xiàn)智能。數(shù)據(jù)采集與處理可以通過(guò)嵌入式RRAM集成到一個(gè)單片解決方案上。通過(guò)集成高密度片上存儲(chǔ)器與同一節(jié)點(diǎn)上的處理器,數(shù)據(jù)從處理器向片外存儲(chǔ)器子系統(tǒng)的傳輸及回傳所固有的延遲被消除。因此, RRAM 技術(shù)是一項(xiàng)加快挖掘新型大數(shù)據(jù)、人工智能領(lǐng)域潛力的創(chuàng)新,使多種應(yīng)用加快性能,并且大幅提高了能效、實(shí)現(xiàn)了出色的安全性并且減少了芯片的數(shù)量與尺寸。
圖3:同一硅晶片上的非易失性存儲(chǔ)器和計(jì)算邏輯加快數(shù)據(jù)訪問(wèn)并且提高能效
人工智能所需的新架構(gòu)
摩爾定律戛然而止,CPU的刷新頻率更低。目前英特爾處理器所遇到的馮·諾依曼存儲(chǔ)瓶頸問(wèn)題可以通過(guò)更加以存儲(chǔ)器為中心的新系統(tǒng)架構(gòu)解決。必須減少存儲(chǔ)技術(shù)與計(jì)算之間的性能差異。傳統(tǒng)的閃存型存儲(chǔ)解決方案的讀取反應(yīng)時(shí)間在100微秒范圍內(nèi),而Crossbar 3D RRAM則為1微秒。除了 Crossbar的 RRAM之外,Intel Micron XPoint PCM、Everspin 和 Avalanche MRAM等新興存儲(chǔ)技術(shù)還支持其他多項(xiàng)倡議,它們都致力于解決這一挑戰(zhàn)。
數(shù)據(jù)中心中的傳統(tǒng)架構(gòu)通常包含三個(gè)獨(dú)立的部分:
帶頂尖處理內(nèi)核與配套DRAM存儲(chǔ)器的計(jì)算部分
SSD或HDD單位字節(jié)成本最低的數(shù)據(jù)存儲(chǔ)部分
連接計(jì)算部分與數(shù)據(jù)存儲(chǔ)部分的網(wǎng)絡(luò)
分析師發(fā)現(xiàn)數(shù)據(jù)中心的集成度正呈現(xiàn)越來(lái)越高的趨勢(shì),其中這三個(gè)組成部分 —— 計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)被壓縮到一個(gè)緊湊的尺寸,這被稱之為“超融合服務(wù)器”。
根據(jù)近期的一些報(bào)告,已有40%的企業(yè)數(shù)據(jù)中心使用超融合服務(wù)器,而這一市場(chǎng)有望在未來(lái)五年增長(zhǎng)近80%。
數(shù)據(jù)中心基礎(chǔ)架構(gòu)市場(chǎng)正在縮短服務(wù)器各元素延遲時(shí)間的方向快速發(fā)展。在一個(gè)單元中集成所有組件能夠減少延遲、總擁有成本和功耗。在超融合服務(wù)器中,計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)部分可以實(shí)現(xiàn)更高效的互連。新的行業(yè)論壇正在實(shí)現(xiàn)處理器、存儲(chǔ)和IO之間的高帶寬低延遲數(shù)據(jù)訪問(wèn)。在高性能計(jì)算應(yīng)用中,Intel Micron 3D XPoint PCM和 Crossbar 3D RRAM將通過(guò)減少存儲(chǔ)與計(jì)算之間的性能差距實(shí)現(xiàn)顯著的改進(jìn)。
可以直接在片上與處理邏輯集成的存儲(chǔ)技術(shù)將實(shí)現(xiàn)全新的以存儲(chǔ)器為中心的片上架構(gòu)。當(dāng)非易失性存儲(chǔ)器與計(jì)算邏輯共享同一塊硅晶片時(shí),就能解決外部總線的性能瓶頸。嵌入式永久存儲(chǔ)技術(shù)的一個(gè)特殊應(yīng)用領(lǐng)域是建立在以存儲(chǔ)器為中心的片上系統(tǒng)基礎(chǔ)之上的深度學(xué)習(xí)硬件加速。人工智能和深度學(xué)習(xí)是這十年最有可能取得進(jìn)展的計(jì)算技術(shù)。深層神經(jīng)網(wǎng)絡(luò)的核心是數(shù)據(jù)以及經(jīng)過(guò)訓(xùn)練的算法如何應(yīng)對(duì)新的數(shù)據(jù)集。行業(yè)對(duì)于新計(jì)算平臺(tái)的開(kāi)發(fā)具有濃厚的興趣,這些計(jì)算平臺(tái)通過(guò)專門(mén)嵌入RRAM內(nèi)核的多個(gè)處理引擎具備了大規(guī)模并行計(jì)算能力。目前已有多家企業(yè)已經(jīng)在研究如何將RRAM單元作為神經(jīng)形態(tài)處理架構(gòu)的突觸。
圖4:提供新人工智能體驗(yàn)的RRAM并行計(jì)算平臺(tái)。
在物聯(lián)網(wǎng)設(shè)備和云服務(wù)器中引入這些高性能、低功耗且以存儲(chǔ)器為中心的片上系統(tǒng)使數(shù)據(jù)和計(jì)算變得無(wú)處不在 —— 用戶可隨時(shí)隨地在需要時(shí)使用它們。這些解決方案不僅為云端提供了容量與規(guī)模都十分“龐大”的數(shù)據(jù),而且也帶來(lái)了嵌入式應(yīng)用實(shí)現(xiàn)新人工智能應(yīng)用所需的能效、安全性以及出色的低延遲性能。