飛行汽車(chē)、機(jī)器人管家……在一些未來(lái)暢想中,今天的人們已經(jīng)擁有了各式“智慧”產(chǎn)品。如果運(yùn)氣不好的話,高智能機(jī)器人大行其道,開(kāi)始起來(lái)反抗人類(lèi),再現(xiàn)《機(jī)械公敵》劇情。雖然這些想象并未成真,但在當(dāng)下,人工智能(AI)技術(shù)已經(jīng)走進(jìn)了人們的世界。比如,每當(dāng)給Alexa智能音箱指令時(shí),機(jī)器學(xué)習(xí)技術(shù)都會(huì)努力弄清話語(yǔ)內(nèi)容,并試圖做出最佳判斷。每次Netflix或亞馬遜推薦了“下一部電影”或“下一次購(gòu)貨商品”時(shí),均是基于復(fù)雜機(jī)器學(xué)習(xí)算法而定向推薦,讓這些推薦遠(yuǎn)比之前的促銷(xiāo)看上去誘人。盡管自動(dòng)駕駛汽車(chē)尚未普及,但人們紛紛意識(shí)到自主導(dǎo)航的潛力和趨勢(shì)。
人工智能技術(shù)大有前途——它讓機(jī)器可以根據(jù)周?chē)氖澜缱龀鰶Q策,像人一樣處理信息,甚至處理方式還會(huì)優(yōu)于人類(lèi)。但是,如果細(xì)想上述事例,便會(huì)發(fā)現(xiàn)目前的很多人工智能,只能通過(guò)“大型機(jī)器”來(lái)實(shí)現(xiàn)——這些機(jī)器發(fā)熱量高、擁有線路功耗、體積巨大,而且昂貴。像Alexa和Netflix依靠云端的大型、高耗電服務(wù)器來(lái)分析用戶(hù)的意圖。而自動(dòng)駕駛汽車(chē)則要依賴(lài)電池供電,考慮到電池必須能夠驅(qū)動(dòng)車(chē)輪和轉(zhuǎn)向,因此需要提供很高的容量,與非常昂貴的人工智能決策相比,同樣也要消耗大量能源。
目前,人工智能技術(shù)穩(wěn)步發(fā)展,但是人工智能的“小型化,邊緣化”卻明顯滯后。那些由小型電池供電或存在成本和尺寸限制的設(shè)備無(wú)法實(shí)現(xiàn)機(jī)器的視覺(jué)和聽(tīng)覺(jué)分析功能。目前,這些小型機(jī)器只能利用簡(jiǎn)單的人工智能技術(shù):也許只是聽(tīng)一個(gè)關(guān)鍵詞,或者分析低維信號(hào),比如用光容積描記術(shù)(PPG)來(lái)測(cè)量心率。
如果小型機(jī)器有視覺(jué)和聽(tīng)覺(jué)功能會(huì)怎么樣?
事實(shí)上,小型設(shè)備一旦能夠看到和聽(tīng)到,是否有實(shí)用價(jià)值呢?思考一下,像門(mén)鈴攝像頭這樣的小產(chǎn)品需要使用自動(dòng)駕駛或自然語(yǔ)言處理等高階人工智能技術(shù)嗎?似乎也沒(méi)有必要。因此可以考慮采用不太復(fù)雜、處理強(qiáng)度不大的小型化的、邊緣的人工智能計(jì)算,比如詞匯識(shí)別、語(yǔ)音識(shí)別和圖像分析。
-普通的門(mén)鈴攝像頭和消費(fèi)類(lèi)安保攝像頭經(jīng)常會(huì)被一些無(wú)關(guān)緊要的事件觸發(fā),比如刮風(fēng)引起的植物擺動(dòng)、云彩引起的劇烈光線變化、甚至是狗或貓?jiān)跀z像頭前跑動(dòng)。這些事件可能會(huì)導(dǎo)致誤觸發(fā),從而需要房主去操作忽視并清除此類(lèi)觸發(fā)事件。尤其糟糕的是,如果房主正好在世界其它地方旅行,而家里的攝像頭卻對(duì)日出、云彩、日落造成的光線變化發(fā)出了誤警報(bào)會(huì)影響他們睡眠和旅行。但一個(gè)智能攝像頭卻能夠基于更具體的事件進(jìn)行觸發(fā),例如在所監(jiān)控的畫(huà)面中出現(xiàn)了一個(gè)人。
-門(mén)鎖或其它出入口可使用面部識(shí)別,甚至是語(yǔ)音識(shí)別來(lái)授予人員訪問(wèn)權(quán)限,在某些情況下不需要鑰匙或胸卡。
-很多攝像頭都希望在發(fā)生某些特定事件時(shí)才觸發(fā):例如,跟蹤攝像頭可能希望在畫(huà)面中出現(xiàn)鹿時(shí)被觸發(fā),安保攝像頭可能希望在畫(huà)面中有人或出現(xiàn)開(kāi)門(mén)或腳步聲等噪音時(shí)被觸發(fā),而個(gè)人攝像頭可能希望通過(guò)語(yǔ)音命令來(lái)觸發(fā)。
-雖然有很多“Hey Alexa”這樣的簡(jiǎn)單解決方案,但多詞匯量命令在很多應(yīng)用中都非常有用。如果具備識(shí)別20個(gè)或更多單詞的詞匯表,就可以在工業(yè)設(shè)備、家居自動(dòng)化、烹飪?cè)O(shè)備和大量其它設(shè)備中應(yīng)用,以簡(jiǎn)化人機(jī)交互。
盡管這些例子只觸及表層:讓小型機(jī)器看到、聽(tīng)到和解決過(guò)去需要人為干預(yù)的問(wèn)題,但實(shí)際上這是一種顛覆性思路,因?yàn)槿藗兠刻於疾粩喟l(fā)現(xiàn)可智能化創(chuàng)造的新場(chǎng)景。
讓小機(jī)器具備視覺(jué)和聽(tīng)覺(jué)功能,面臨哪些挑戰(zhàn)?
既然人工智能對(duì)小型機(jī)器具有如此實(shí)用價(jià)值,為何沒(méi)有被大量開(kāi)發(fā)呢?答案是受限于算力。人工智能推理是神經(jīng)網(wǎng)絡(luò)模型計(jì)算的結(jié)果??梢园焉窠?jīng)網(wǎng)絡(luò)模型看作是大腦處理圖像或聲音的粗略近似形態(tài),將其分解為非常小的片段,然后在這些小碎片組合在一起時(shí)識(shí)別出模型?,F(xiàn)代化視覺(jué)問(wèn)題的主要模型是卷積神經(jīng)網(wǎng)絡(luò)(CNN)。這類(lèi)模型在圖像分析方面非常出色,在音頻分析方面也非常有用。問(wèn)題在于,這些模型需要數(shù)百萬(wàn)或數(shù)十億次的數(shù)學(xué)計(jì)算。對(duì)于傳統(tǒng)硬件設(shè)計(jì),這些應(yīng)用在實(shí)施時(shí)卻會(huì)面臨一些困難抉擇:
-使用低成本、低功耗的微控制器解決方案。雖然平均功耗可能很低,但卷積神經(jīng)網(wǎng)絡(luò)可能需要幾秒鐘時(shí)間來(lái)計(jì)算,這意味著人工智能推理不是實(shí)時(shí)的,并會(huì)消耗大量的電池電量。
-購(gòu)置一個(gè)昂貴的高性能處理器,能在規(guī)定延遲內(nèi)完成這些數(shù)學(xué)運(yùn)算。不過(guò),這些處理器通常很大,需要很多外部組件,包括散熱器或類(lèi)似的冷卻組件。好處是,它們執(zhí)行人工智能推理的速度非??臁?/p>
-低功耗微控制器解決方案的速度太慢,無(wú)法發(fā)揮作用,而高性能處理器方法會(huì)超出成本、尺寸和電源預(yù)算,可以說(shuō)上述兩種方案都不夠理想,難以實(shí)施。
由此可見(jiàn),人們需要的是一種全新的嵌入式人工智能解決方案,盡可能減少卷積神經(jīng)網(wǎng)絡(luò)計(jì)算所需的能耗。人工智能推理需要以比傳統(tǒng)微控制器或處理器解決方案更少的能量來(lái)執(zhí)行,并且無(wú)需借助能耗高、尺寸大、成本大的外部組件(如存儲(chǔ)器)。如果人工智能推理解決方案實(shí)際上能夠消除機(jī)器視覺(jué)的能量損失,那么即便是最小的設(shè)備也能看到并識(shí)別周?chē)澜绨l(fā)生的事情。
幸運(yùn)的是,人們現(xiàn)在已經(jīng)處于這場(chǎng)“小型機(jī)器”革命的開(kāi)端。目前,ADI已經(jīng)在市場(chǎng)上推出了相關(guān)產(chǎn)品,能夠消除人工智能推理的能源成本,并實(shí)現(xiàn)電池供電的機(jī)器視覺(jué)功能。