《紐約客》8月26日發(fā)表文章《人工智能的炒作和希望》,將AI分為三個(gè)階段。第一個(gè)階段是識(shí)別智能,在更加強(qiáng)大的計(jì)算機(jī)里運(yùn)行的算法能從大量文本中識(shí)別模式和獲取主題,甚至能從幾個(gè)句子獲取整個(gè)文章的意義。第二個(gè)階段是認(rèn)知智能,機(jī)器已經(jīng)超越模式識(shí)別,而且開始從數(shù)據(jù)中做出推論。第三個(gè)階段的實(shí)現(xiàn)要等到我們能創(chuàng)建像人類一樣思考、行動(dòng)的虛擬人類才行。作者認(rèn)為,我們現(xiàn)在只處于第一階段,“識(shí)別智能”。
Om Malik是一名科技作家,還是科技新聞網(wǎng)站Giga Om的創(chuàng)始人和創(chuàng)業(yè)基金True Ventures的合伙人。
本月早些時(shí)候,約翰·奧利弗在HBO的脫口秀節(jié)目“Last Week Tonight”上,諷刺媒體公司瘋狂追求點(diǎn)擊率。這條視頻在網(wǎng)上瘋狂傳播,在You Tube上已經(jīng)有近六百萬次觀看。在節(jié)目進(jìn)行到十分鐘左右,奧利弗炮轟Tronc(更名后的Tribune Publishing Company)和其宣傳視頻。視頻中,一個(gè)女性機(jī)器人發(fā)言人在介紹人工智能給新聞界帶來的好處。
Tronc董事長(zhǎng)Michael Ferro說,每天要用人工智能制作2000個(gè)視頻Tronc董事長(zhǎng)Michael Ferro說,每天要用人工智能制作2000個(gè)視頻
Tronc不是唯一熱情擁抱人工智能的公司。AI十分火熱,每一家公司都在談?wù)撍鼘⑷绾胃淖円磺小<幢闶敲肺靼儇浌咀罱残?,它已?jīng)在旗下十家百貨商店測(cè)試一個(gè)IBM的AI工具,目的是換回那些放棄傳統(tǒng)零售店轉(zhuǎn)而支持網(wǎng)上購(gòu)物的客戶。
就像之前的“云計(jì)算”、“大數(shù)據(jù)”和“機(jī)器學(xué)習(xí)”,“人工智能”這個(gè)詞已經(jīng)被市場(chǎng)營(yíng)銷人員和廣告文案人員大肆使用。人們說的“人工智能”里面有很大一部分其實(shí)是數(shù)據(jù)分析,還是原來的套路。如果這些過度炒作讓你忍不住問“人工智能到底是什么?”別擔(dān)心,你并不是一個(gè)人。我曾向許多專家詢問這個(gè)詞的定義,得到了不同的答案。他們一致同意的只有一件事,那就是人工智能是一組試圖模擬或增強(qiáng)人類智能的技術(shù)。對(duì)我來說,“增強(qiáng)”才是重點(diǎn),智能軟件可以幫助我們與這個(gè)日益數(shù)字化的世界進(jìn)行交互。
三十年前,我讀報(bào)紙,用電動(dòng)打字機(jī)打字,可以看的電視頻道屈指可數(shù)。而在今天,我有來自Netflix、亞馬遜、HBO等的流媒體視頻,有時(shí)候我都不知道怎么選擇。我們?cè)絹碓诫y以承受電子郵件、消息、約會(huì)和提醒的轟炸。增強(qiáng)智能使人類面對(duì)著越來越多的信息輸入和選擇,數(shù)量多到一個(gè)人無法應(yīng)付。
與其他技術(shù)相比,計(jì)算機(jī)和軟件對(duì)于大多數(shù)人來說更難理解,充斥著神秘感。曾經(jīng)有一段時(shí)間,你要用錄音機(jī)把一封信或者一篇文檔記錄下來,然后再由別人轉(zhuǎn)寫成文字給你。一個(gè)人在機(jī)器的幫助下將語音轉(zhuǎn)換成文本。而在今天,你可以對(duì)著你的iPhone說話,它會(huì)自己轉(zhuǎn)錄你的消息。如果五十年前的人們看到我們目前的語音轉(zhuǎn)換成文本的功能,他們會(huì)覺得技術(shù)已經(jīng)具有知覺。現(xiàn)在也是同樣的情況,我們夸大了與世界交互的方式。著名的作家和未來學(xué)家凱文·凱利說,“我們現(xiàn)在能做到的,在50年前是AI,在50年后就不會(huì)被稱作AI?!?/p>
在以前沒有互聯(lián)網(wǎng)的時(shí)候,我們要么打電話要么寫信給朋友,一次聯(lián)系一個(gè)人,來了解他們最近的生活。這是一個(gè)緩慢的過程,要花很多的精力和時(shí)間來了解每一個(gè)人。其結(jié)果是,我們的互動(dòng)很少,因?yàn)榇蜷L(zhǎng)途電話費(fèi)錢,寫信也要時(shí)間成本。隨著因特網(wǎng)的出現(xiàn),電子郵件成為一種促進(jìn)和加快這些互動(dòng)的方式。而Facebook在這方面做的更好,它把你的電話簿變成了一個(gè)中樞,讓你能同時(shí)與數(shù)百、甚至數(shù)千名朋友同時(shí)聯(lián)系。該算法使我們能輕松維持更多的關(guān)系而幾乎無需成本。
Michelle Zhou花了15年的時(shí)間在IBM研究院和IBM Watson團(tuán)隊(duì)工作,之后離開IBM成為情緒分析初創(chuàng)企業(yè)Juji的聯(lián)合創(chuàng)始人。情緒分析是人工智能和人機(jī)交互的一個(gè)交叉領(lǐng)域,Zhou作為該領(lǐng)域的專家,將AI分為三個(gè)階段。第一個(gè)階段是識(shí)別智能,在更加強(qiáng)大的計(jì)算機(jī)里運(yùn)行的算法能從大量文本中識(shí)別模式和獲取主題,甚至能從幾個(gè)句子獲取整個(gè)文章的意義。第二個(gè)階段是認(rèn)知智能,機(jī)器已經(jīng)超越模式識(shí)別,而且開始從數(shù)據(jù)中做出推論。第三個(gè)階段的實(shí)現(xiàn)要等到我們能創(chuàng)建像人類一樣思考、行動(dòng)的虛擬人類才行。
我們離創(chuàng)建虛擬人類還有很長(zhǎng)的路要走。盡管媒體吹得天花亂墜,但是沒有任何一個(gè)技術(shù)是完美的,AI最有價(jià)值的功能在于增強(qiáng)人類智能。要達(dá)到這一點(diǎn),我們需要訓(xùn)練計(jì)算機(jī)來模仿人類。2016年4月,彭博商業(yè)周刊的一篇報(bào)道就提供了一個(gè)很好的例子。它描述了提供自動(dòng)化AI個(gè)人助理的公司聘請(qǐng)人類“教員”來檢查和評(píng)估AI助理的表現(xiàn)?!拔覀冇脧?fù)制人類智能的能力來定義人工智能,這很諷刺,”Sean Gourley說,他是數(shù)據(jù)分析公司Primer的創(chuàng)始人,善于在算法的幫助下從大型數(shù)據(jù)集挖掘智能。
無論是Spotify、Netflix或者是新一代AI聊天機(jī)器人,所有這些工具都依賴于人類自身提供數(shù)據(jù)。當(dāng)我們?cè)诼牳钑r(shí),把歌曲加入播放列表并分享給別人,我們就在向Spotify釋放重要的信號(hào)。這些信息能訓(xùn)練其算法,使它不僅能發(fā)現(xiàn)我們喜歡什么,還能預(yù)測(cè)我們的喜好。
甚至是我們經(jīng)常談?wù)摰摹坝?jì)算機(jī)視覺”,它之所以有效,是因?yàn)槿祟惿蟼髁藬?shù)十億的照片,并且用元數(shù)據(jù)標(biāo)記這些照片,給予這些照片情境。日益強(qiáng)大的計(jì)算機(jī)可以通過掃描這些照片從中找出模式和意義。同樣地,谷歌利用它多年收集的數(shù)十億語音樣本建立了一個(gè)智能系統(tǒng),能理解各種口音和細(xì)微差別,這使得谷歌的語音搜索功能成為可能。
將Zhou的三個(gè)階段作為衡量標(biāo)準(zhǔn),我們目前還在“識(shí)別智能”階段——今天的計(jì)算機(jī)使用深度學(xué)習(xí)來更快更好地發(fā)現(xiàn)模式。然而,一些公司正在研究能用于推斷意義的技術(shù),這將是我們要走的下一步。“我們是否會(huì)到達(dá)第三階段,這不重要,”Zhou在給我的電子郵件中這樣說?!拔胰匀粺嶂杂谌藱C(jī)共生,那時(shí),計(jì)算機(jī)可以做它們能做到的最好的事(即要求一致性、客觀性和精確度的事),人類做人類能做到最好的事(有創(chuàng)意,不精確但適應(yīng)性強(qiáng))?!?/p>
未來幾十年里,人類將繼續(xù)訓(xùn)練計(jì)算機(jī)來模仿我們。而在此期間,我們將不得不面對(duì)AI的各種泡沫。