2016年,人工智能技術(shù)被推上了研究和商業(yè)的風(fēng)口浪尖, 從“深藍(lán)” 到Master,從駕駛輔助到自動(dòng)駕駛,從Alexa到Google Home,從大學(xué)教授到企業(yè)領(lǐng)袖,人工智能技術(shù)在互聯(lián)網(wǎng)行業(yè)遍地開花,同時(shí)也對(duì)人們心目中的傳統(tǒng)行業(yè)--制造業(yè)帶來(lái)了巨大的沖擊與商機(jī)。
從“深藍(lán)”到Master
繼IBM“深藍(lán)”在國(guó)際象棋對(duì)決中戰(zhàn)勝世界冠軍卡斯帕羅夫,Waston在危機(jī)邊緣戰(zhàn)勝人類冠軍Ken和Brad,Eugene挑戰(zhàn)圖靈的“TheImitation Game”后,人工智能在一個(gè)更加復(fù)雜的領(lǐng)域—圍棋中再次超過(guò)了人類的最高水平,AlphaGo以4:1的比分戰(zhàn)勝了韓國(guó)圍棋大師李世乭,其升級(jí)版Master更是在弈城網(wǎng)上取得60:0:1的不敗戰(zhàn)績(jī)。同樣是在對(duì)弈比賽中戰(zhàn)勝頂尖人類選手,“深藍(lán)”到Master的發(fā)展充分體現(xiàn)出了人類科技進(jìn)步在計(jì)算方法和計(jì)算資源上的長(zhǎng)足進(jìn)步。如果說(shuō)“深藍(lán)”是憑借其運(yùn)算速度通過(guò)遍歷戰(zhàn)勝了人類,那么Master是在此基礎(chǔ)上通過(guò)優(yōu)化的搜尋算法,決策支持和計(jì)算架構(gòu)遍歷了當(dāng)時(shí)覺得不可能實(shí)現(xiàn)的所有可能。Master所用到的Deep Reinforcement Learning結(jié)合了當(dāng)今AI領(lǐng)域研究的兩大前沿技術(shù)Deep Learning(DL)和Reinforcement Learning(RL),創(chuàng)造性的使用DL的方式,通過(guò)棋局的圖片評(píng)估落子的優(yōu)先級(jí),再結(jié)合RL,通過(guò)自我“對(duì)弈”的方式更新深度神經(jīng)元網(wǎng)絡(luò)的參數(shù),最終帶領(lǐng)人類真正意義上站在了“智能”的門口。AlphaGo最重要的成就并不是采用了性能多么優(yōu)秀的電腦,而是第一次讓程序可以近似人類的方式去感知、學(xué)習(xí)、思考和決策。
無(wú)論是Master這樣已經(jīng)存在的,還是在《西部世界》中的BICAMERAL MIND,人工智能已經(jīng)大跨步的走進(jìn)了我們的生活。目前來(lái)看,人類所有的外部感知能力例如溫度,加速度等都早已可使用現(xiàn)有的傳感器技術(shù)實(shí)現(xiàn),基于機(jī)器學(xué)習(xí),統(tǒng)計(jì)學(xué)習(xí)的方法更是幫助機(jī)器在聽(語(yǔ)音助手),看(computer vision),讀(NLP),寫(handwriting recognition),思考(Optimization)等多方面超越人類平均水平。有人預(yù)測(cè)奇點(diǎn)理論正在以很快的速度成為現(xiàn)實(shí)。我們不去探討人工智能的技術(shù)本質(zhì)或是它的倫理問(wèn)題,如果人工智能真的被規(guī)模化地應(yīng)用,那么能夠?qū)θ祟惿鐣?huì)帶來(lái)什么樣的改變和價(jià)值?
走出“楚門的世界”
在與Master交手前,棋手柯潔在自己的微博上如是說(shuō),可謂一語(yǔ)道出了智能化的真諦。如果智能化僅僅停留在遍歷搜索,相似度分析的層面,那對(duì)人類的進(jìn)步又有何意義。作者看來(lái),人工智能和大數(shù)據(jù)分析最重要的核心就是要能夠?yàn)槿祟愄峁┤碌恼J(rèn)識(shí)問(wèn)題和解決問(wèn)題的方式,用機(jī)器純理性的“思維”方式去輔助人類的思維與決策。
決定人類社會(huì)進(jìn)步速度的最本質(zhì)的制約要素是“認(rèn)知的邊界”,所謂知識(shí)的邊界則是基于前人的經(jīng)驗(yàn)與規(guī)則所構(gòu)建的無(wú)形的域。 就像《楚門的世界》當(dāng)中,劇組為楚門所構(gòu)建的整個(gè)生態(tài),無(wú)形的禁錮了他認(rèn)識(shí)問(wèn)題,解決問(wèn)題的能力。而當(dāng)人的認(rèn)知和判斷無(wú)法滿足不斷增長(zhǎng)的數(shù)據(jù)維度和問(wèn)題復(fù)雜度時(shí),依靠人的知識(shí)和經(jīng)驗(yàn)去驅(qū)動(dòng)和創(chuàng)造的過(guò)程就會(huì)有邊界。以圖像識(shí)別為例,基于人類經(jīng)驗(yàn)的數(shù)據(jù)分析方法,首先使用濾波器對(duì)原始圖像經(jīng)行降噪,在使用濾波器經(jīng)行圖像邊界識(shí)別,最終使用模式識(shí)別的方法分辨圖像中不同的物體。這樣的方式,其核心在于濾波器的選擇,濾波器的參數(shù)配置以及分類器的選擇都需要經(jīng)驗(yàn)支持,不同的組合形式其最終模型輸出的結(jié)果差距明顯。如今使用的基于深度學(xué)習(xí)的CNN方法,將濾波器的類型及參數(shù)選擇基于依賴于最終分類器輸出結(jié)果的表現(xiàn),使用反向傳播算法,不斷優(yōu)化模型結(jié)構(gòu)與參數(shù)。這樣的方法,基于大量原始數(shù)據(jù),從數(shù)據(jù)中發(fā)現(xiàn)規(guī)律,提取有效特征,最終實(shí)現(xiàn)更加準(zhǔn)確地決策支持。
除了深度神經(jīng)元網(wǎng)絡(luò)研究,機(jī)器學(xué)習(xí)和人工智能領(lǐng)域的研究包括遷移學(xué)習(xí),無(wú)監(jiān)督或半監(jiān)督學(xué)習(xí),特征工程,增強(qiáng)學(xué)習(xí),對(duì)抗網(wǎng)絡(luò)等的不斷創(chuàng)新,為人工智能在更多領(lǐng)域的應(yīng)用和價(jià)值創(chuàng)造提供了有力的理論支撐。遷移學(xué)習(xí),無(wú)監(jiān)督或半監(jiān)督學(xué)習(xí)的研究實(shí)現(xiàn)了將統(tǒng)一的模型或模塊的推廣和啟發(fā)式應(yīng)用,類似于人類知識(shí)積累到一定程度之后觸類旁通。特征工程的研究,提供了在海量數(shù)據(jù)當(dāng)中依照業(yè)務(wù)需求或者既定規(guī)則抽取或者重構(gòu)有效信息的方法,為認(rèn)識(shí)和研究高維度下的數(shù)據(jù)科學(xué)問(wèn)題提供了有效地工具。增強(qiáng)學(xué)習(xí),對(duì)抗網(wǎng)絡(luò)等研究領(lǐng)域的不斷創(chuàng)新為在數(shù)據(jù)樣本不足,數(shù)據(jù)不完善前提下的智能化問(wèn)題提供了全新的思路。
從“人工智能”到“工業(yè)智能”
從計(jì)算機(jī),互聯(lián)網(wǎng)行業(yè)出身的智能化技術(shù),正在以勢(shì)不可當(dāng)?shù)膭?shì)頭橫掃全球各個(gè)領(lǐng)域。智能化與工業(yè)的結(jié)合更是引得全球矚目。從德國(guó)的工業(yè)4.0到美國(guó)的工業(yè)互聯(lián)網(wǎng),從GE的Predix到IBM的PMQ,可以看出,工業(yè)與智能化技術(shù)的結(jié)合也必將是下一個(gè)風(fēng)口。
智能的核心在于決策和執(zhí)行,而決策的核心在于感知和判斷。在工業(yè)系統(tǒng)中,IoT技術(shù), 包括傳感器技術(shù),數(shù)據(jù)傳輸,數(shù)據(jù)管理等不斷發(fā)展,為智能化技術(shù)實(shí)施提供了可靠的感知基礎(chǔ)。但是目前的工業(yè)界大都以人的決策和反饋為核心,這就導(dǎo)致系統(tǒng)中有很大一部分的價(jià)值并沒(méi)有被釋放出來(lái)。系統(tǒng)越是復(fù)雜,人的學(xué)習(xí)曲線就會(huì)越緩慢,而當(dāng)人的學(xué)習(xí)曲線比技術(shù)的進(jìn)步速度慢時(shí),人就會(huì)成為制約技術(shù)進(jìn)步和應(yīng)用的瓶頸。而人工智能為工業(yè)帶來(lái)的第一個(gè)革命性的改變,就是擺脫人類認(rèn)知和知識(shí)邊界的限制,為決策支持和協(xié)同優(yōu)化提供可量化依據(jù)。
現(xiàn)階段,工業(yè)智能的應(yīng)用尚處于探索階段,結(jié)合工業(yè)領(lǐng)域的特性,在實(shí)施階段需要著重考慮以下幾點(diǎn):
一.問(wèn)題的定義
在應(yīng)用人工智能方法解決工業(yè)問(wèn)題時(shí),首先要確定需要解決的問(wèn)題,一定要避免“拿著錘子找釘子”的情況,不能為了使用算法而徒增問(wèn)題的復(fù)雜度。首先需要將實(shí)際問(wèn)題抽象成可用建模方法解決的問(wèn)題,需要人員的經(jīng)驗(yàn)輔助。微軟亞洲研究院鄭宇博士也強(qiáng)調(diào)“培養(yǎng)一個(gè)真正的數(shù)據(jù)科學(xué)家需要七到十年時(shí)間”。這里的時(shí)間其實(shí)是對(duì)個(gè)人基本功以及實(shí)戰(zhàn)經(jīng)驗(yàn)的非強(qiáng)制指標(biāo)。
二. 問(wèn)題的邊界
工業(yè)問(wèn)題與圍棋問(wèn)題不同,其解決問(wèn)題的邊界定義不明確,沒(méi)有明確的規(guī)則。這樣就為解決方案的設(shè)計(jì)帶來(lái)了很大的不確定性。一切模型可以解決的問(wèn)題都是在前提條件所包含的問(wèn)題域內(nèi),沒(méi)有一個(gè)方案是可以涵蓋所有的情況,所以在制定工業(yè)智能方案時(shí)一定要緊密結(jié)合業(yè)務(wù)來(lái)定義問(wèn)題邊界,最終確定解決方案。
工業(yè)智能,在智能化算法和技術(shù)層面也擁有自身的特點(diǎn)和挑戰(zhàn):
一. 機(jī)理模型是關(guān)鍵基礎(chǔ)
工業(yè)智能所要解決的問(wèn)題大都是針對(duì)特定設(shè)備的特定問(wèn)題,其數(shù)據(jù)表征應(yīng)該符合設(shè)備運(yùn)行的機(jī)理。在大量雜亂的數(shù)據(jù)當(dāng)中,依照設(shè)備運(yùn)行機(jī)理可以幫助選擇、構(gòu)建出更加有用的變量,為決策支持提供有效依據(jù)。特征工程,非監(jiān)督式學(xué)習(xí)很大一部分研究工作就是針對(duì)如何從海量數(shù)據(jù)提取有效特征?;跈C(jī)理的特征提取方法在傳統(tǒng)的故障診斷上應(yīng)用廣泛,例如軸承故障診斷中所用到的失效頻率。在大數(shù)據(jù)分析,人工智能沖擊傳統(tǒng)行業(yè)的同時(shí),傳統(tǒng)行業(yè)的分析方法也在人工智能領(lǐng)域得到應(yīng)用,在2017年的AAAI榮獲outstandingpaper award的文章“Label-Free Supervision of NeuralNetworks with Physics and Domain Knowledge”就是將機(jī)理模型加入神經(jīng)元網(wǎng)絡(luò)的訓(xùn)練當(dāng)中得到優(yōu)化的網(wǎng)絡(luò)模型。
二. 數(shù)據(jù)的標(biāo)準(zhǔn)和技術(shù)仍有待發(fā)展
在工業(yè)領(lǐng)域,數(shù)據(jù)資源是發(fā)展智能化的一大障礙。眾所周知,在圖像識(shí)別領(lǐng)域有ImageNet,手寫識(shí)別有MNIST,UCI的機(jī)器學(xué)習(xí)數(shù)據(jù)庫(kù)也提供了大量標(biāo)準(zhǔn),有標(biāo)注的訓(xùn)練數(shù)據(jù)組。在工業(yè)領(lǐng)域,數(shù)據(jù)獲取需要投入較大資金和時(shí)間,同時(shí)數(shù)據(jù)的標(biāo)注需要專家知識(shí)協(xié)助,更增加了獲取大量標(biāo)準(zhǔn)數(shù)據(jù)組的難度。除此之外,受限于傳感器技術(shù),設(shè)備使用狀態(tài)等,經(jīng)常會(huì)出現(xiàn)關(guān)鍵數(shù)據(jù)無(wú)法獲取的情況。上述條件就導(dǎo)致在模型開發(fā)時(shí),經(jīng)常會(huì)遇到樣本量小,不平衡數(shù)據(jù)組,數(shù)據(jù)質(zhì)量差,數(shù)據(jù)不完整,缺少失效狀態(tài)數(shù)據(jù)等問(wèn)題。所以,IoT、遷移學(xué)習(xí)、增強(qiáng)學(xué)習(xí)、半監(jiān)督式學(xué)習(xí)的研究對(duì)于工業(yè)智能技術(shù)的發(fā)展至關(guān)重要。
三. 一體化解決方案 - 從“產(chǎn)品”到“能力”的全方位交付
在解決方案的設(shè)計(jì)上,工業(yè)智能是多層次,高準(zhǔn)確度的解決方案,有時(shí)還需要實(shí)時(shí)計(jì)算與回饋。這樣的特點(diǎn)就要求所訓(xùn)練和部署的模型計(jì)算速度快,結(jié)果準(zhǔn)確,不確定性小。因此,需要有能夠靈活重構(gòu)的工業(yè)數(shù)據(jù)應(yīng)用模塊,以快速開發(fā)解決工業(yè)系統(tǒng)中碎片化問(wèn)題的應(yīng)用。同時(shí)可以看出,工業(yè)智能的解決方案不是僅僅依賴于智能算法,整個(gè)鏈條上的每一環(huán)節(jié)的共同進(jìn)步才可以保證技術(shù)的進(jìn)步。那么,可以通過(guò)可視化的編程環(huán)境降低數(shù)據(jù)分析和應(yīng)用開發(fā)的門檻,以及通過(guò)培訓(xùn),是企業(yè)的工程師可以根據(jù)自己的經(jīng)驗(yàn)和需求開發(fā)個(gè)性化的預(yù)測(cè)和分析應(yīng)用,來(lái)保證持續(xù)地解決企業(yè)在發(fā)展過(guò)程中遇到的問(wèn)題。
中國(guó)特色工業(yè)智能之路
我國(guó)工業(yè)智能化起步較晚,工業(yè)基礎(chǔ)相對(duì)落后,但是我們是設(shè)備使用大國(guó),設(shè)備保有量和設(shè)備使用數(shù)據(jù)保有量都是當(dāng)之無(wú)愧的世界第一。結(jié)合設(shè)備、業(yè)務(wù)場(chǎng)景和智能算法,依靠成熟的CPS理論框架,相信我國(guó)一定會(huì)在工業(yè)智能引領(lǐng)世界發(fā)展。