《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 其他 > 業(yè)界動(dòng)態(tài) > 蘋果的人工智能之夢(mèng):Siri進(jìn)化論

蘋果的人工智能之夢(mèng):Siri進(jìn)化論

2011-11-04
來(lái)源:Sina
<a class=Siri" siri="" span="" src="http://files.chinaaet.com/images/20111104/109de82c-3180-42da-82aa-925328ac3264.jpg" title="Siri 公司原聯(lián)合創(chuàng)始人兼CEO 戴格·吉特拉斯" />Siri 公司原聯(lián)合創(chuàng)始人兼CEO 戴格·吉特拉斯
iPhone4S內(nèi)置“Siri”系統(tǒng)iPhone4S內(nèi)置“Siri”系統(tǒng)

  文/華琪 編輯/ 彭朋

  10 月4 日,蘋果iPhone 4S 手機(jī)發(fā)布。不久,其內(nèi)置的個(gè)人語(yǔ)音助理Siri引爆大眾關(guān)注。10 月25 日,就在Siri 獲得巨大關(guān)注時(shí),Siri 公司原聯(lián)合創(chuàng)始人兼CEO 戴格·吉特拉斯宣布從蘋果離職。吉特拉斯在Twitter 中透露了他們?yōu)镾iri 設(shè)定的目標(biāo)路線圖。第一階段:階段性人類;第二階段:完全是人類;第三階段:超越人類;第四階段:殺死人類。就像機(jī)器HAL9000 在《2001 太空漫游》里干的事情一樣。

  10月4日,蘋果iPhone 4S手機(jī)發(fā)布。在發(fā)布會(huì)上,個(gè)人語(yǔ)音助理Siri并未引起轟動(dòng)。但在進(jìn)入實(shí)際生活場(chǎng)景后,Siri引爆了大眾關(guān)注。

  人們以調(diào)戲Siri為樂(lè),在網(wǎng)站“Shit that Siri Says”(看看Siri說(shuō)了啥)上,用戶已經(jīng)上傳了近千條和Siri的對(duì)話實(shí)錄,在Facebook上受到熱捧。人們熱衷于問(wèn)它一些困難的問(wèn)題,而它總是回答得出人意料。

  有人問(wèn):“如果一只土撥鼠能夠拋木頭,它能拋多少木頭?”(編注:一個(gè)英語(yǔ)繞口令)

  Siri的回答也是一個(gè)繞口令:“如果一只土撥鼠能夠拋木頭,它能拋多少木頭就拋多少木頭。”

  還有人問(wèn):“你是一個(gè)智能手機(jī)嗎?”Siri的回答很經(jīng)典:“等等……還有別的手機(jī)嗎?”

  Siri在蘋果的官方宣傳中是個(gè)“智能個(gè)人語(yǔ)音助理”,具體的使用場(chǎng)景是這樣的:你對(duì)著iPhone說(shuō)一句話,“舊金山劇院附近的意大利餐館”,Siri會(huì)做語(yǔ)音識(shí)別和自然語(yǔ)言理解,迅速查一些數(shù)據(jù)庫(kù),然后回答“離你不遠(yuǎn)哦,最近的一家走路十分鐘”,并附上具體的地址、地圖展示給你。再比如,你在開車時(shí),對(duì)它說(shuō):“告訴我老婆我要遲到十分鐘”,它會(huì)在通訊錄里找到你的妻子,并發(fā)送這條消息給她。

  這已經(jīng)接近人們想象中和電腦交流的方式?!都~約時(shí)報(bào)》撰文稱:Siri代表著蘋果的商業(yè)未來(lái),也預(yù)示著未來(lái)“搜索”的形態(tài)。

  這一切是如何做到的?人們有種種猜測(cè)。有個(gè)流傳甚廣的笑話:“Apple在印度的海德拉巴建了一個(gè)巨大的用戶響應(yīng)中心,所有用戶和Siri的問(wèn)題都被傳到這里,然后三哥三姐們飛快的打字回答。Apple內(nèi)部把這個(gè)叫印度云(Indian cloud),簡(jiǎn)稱iCloud。”

  真實(shí)的故事是,Siri脫胎于一個(gè)龐大的國(guó)防部項(xiàng)目,是一家總部位于舊金山的同名小公司,它誕生于2007年12月經(jīng)濟(jì)危機(jī)的寒冬中。2010年4月,蘋果公司以2億美元收購(gòu)了這家公司,并將整個(gè)團(tuán)隊(duì)招致麾下。

  10月25日,就在Siri獲得巨大關(guān)注時(shí),有媒體爆出,Siri公司原聯(lián)合創(chuàng)始人兼CEO戴格·吉特拉斯(Dag Kittlaus)將從蘋果離職。他自己稱希望能搬到芝加哥,離家人更近,并能有時(shí)間開創(chuàng)新事業(yè)。

  事實(shí)上,關(guān)于Siri,最偉大的事情并非人工智能本身,而是蘋果通過(guò)Siri把人工智能帶進(jìn)了現(xiàn)實(shí)生活。其實(shí)Siri并沒(méi)有什么革命性的技術(shù),本質(zhì)上是把各種已經(jīng)比較成熟的技術(shù)融合成一個(gè)產(chǎn)品,最終呈現(xiàn)給用戶。

  Siri背后的人

  Siri發(fā)源于史上最大的人工智能項(xiàng)目:五角大樓的CALO項(xiàng)目。CALO是“Cognitive Assistant that Learns and Organizes”的縮寫,該項(xiàng)目主要目標(biāo)是:開發(fā)一個(gè)智能的個(gè)人助手系統(tǒng)。這個(gè)項(xiàng)目匯集了全球25所頂級(jí)大學(xué)和商業(yè)研究機(jī)構(gòu)的300多名研究人員。在2007年該項(xiàng)目結(jié)束時(shí),協(xié)作方之一的斯坦福國(guó)際研究院(SRI International)成立了Siri。

  整個(gè)CALO計(jì)劃的帶頭人名叫亞當(dāng)·奇也(Adam Cheyer),他也是Siri的聯(lián)合創(chuàng)始人之一,現(xiàn)任蘋果iPhone團(tuán)隊(duì)工程總監(jiān)。Siri公司的原首席技術(shù)總監(jiān)湯姆·格魯伯(Tom Gruber)也是出身斯坦福大學(xué)的人工智能、語(yǔ)義網(wǎng)專家。CALO項(xiàng)目的關(guān)鍵員工、后來(lái)成為Siri公司董事的諾曼·溫那斯基(Norman Winarsky)在接受媒體采訪時(shí)說(shuō):“那時(shí),我們意識(shí)到其中有難以置信的商業(yè)機(jī)會(huì),我的任務(wù)是為這個(gè)新項(xiàng)目獲得資金。于是,我找來(lái)當(dāng)時(shí)摩托羅拉(微博)的高管戴格·吉特拉斯,語(yǔ)義網(wǎng)天才格魯伯和CALO主架構(gòu)師亞當(dāng)·奇也創(chuàng)立了這家公司。”

  在《麻省理工技術(shù)評(píng)論》的采訪中,奇也表示:“CALO早已開始探索如何把對(duì)話、自然語(yǔ)言理解、視覺(jué)、演說(shuō)、機(jī)器學(xué)習(xí)、制定計(jì)劃、理性思考等全部融合到一個(gè)模仿人類的助理中,幫助人們完成不同的事情。”

  亞當(dāng)·奇也表示,過(guò)去四年,他和他的團(tuán)隊(duì)一直在鉆研如何優(yōu)化CALO,使其能夠在一臺(tái)強(qiáng)大的移動(dòng)電話中發(fā)揮效用,每天都能被成千上萬(wàn)的用戶使用。過(guò)去一年半,他們把主要精力放在Siri技術(shù)和iOS及其應(yīng)用程序的整合上。

  2008年10月,Siri獲得第一輪約850萬(wàn)美元融資。谷歌趨勢(shì)(Google Trends)關(guān)鍵詞搜索歷史顯示,那是Siri第一次受到公眾關(guān)注,當(dāng)時(shí)Siri的高層對(duì)于他們究竟想要做什么閃爍其辭。他們的宣傳語(yǔ)這樣寫著:全新的互動(dòng)模式,擁有連接互聯(lián)網(wǎng)消費(fèi)者的智能界面。CEO戴格·吉特拉斯那時(shí)對(duì)媒體說(shuō):“現(xiàn)階段我們必須小心,我們不想說(shuō)很多,以免讓競(jìng)爭(zhēng)對(duì)手了解太多,激發(fā)靈感。”這些競(jìng)爭(zhēng)對(duì)手很可能是那些互聯(lián)網(wǎng)界的巨頭,雅虎、谷歌或微軟(微博),在人工智能領(lǐng)域,他們都有各自的發(fā)展計(jì)劃。

  那時(shí),吉特拉斯就表示,他們已經(jīng)為Siri想好商業(yè)模式。“我們認(rèn)為,采用CPA(編注:每次行動(dòng)的費(fèi)用)的定價(jià)模式,即根據(jù)每個(gè)訪問(wèn)者對(duì)特定網(wǎng)站所采取的行動(dòng)進(jìn)行收費(fèi)很適合Siri。”

  Siri最早的投資人格雷·摩根泰勒(Gary Morgenthaler)同意他的觀點(diǎn)。他在最近接受媒體采訪時(shí)說(shuō):“Siri能友好地將你帶往你想去的地方,做成你想做的事情,CPA的模式對(duì)于服務(wù)提供商來(lái)說(shuō)再好不過(guò)。無(wú)論是蘋果,還是那些電子商務(wù)網(wǎng)站。如果你是在做一個(gè)電子商務(wù)網(wǎng)站,你是想滿天撒網(wǎng)地投放廣告,還是直接去找剛好想要買那些東西的人呢?”

  2009年5月30日,在D7大會(huì)上,吉特拉斯發(fā)布了Siri,Siri整合一部分網(wǎng)絡(luò)服務(wù)進(jìn)入App Store,運(yùn)行在iPhone 3GS上。但因?yàn)橛布途W(wǎng)絡(luò)速度的局限,那時(shí)的Siri還不會(huì)說(shuō)話,只能通過(guò)文字進(jìn)行回應(yīng)。

  同年11月,Siri完成第二輪融資,共計(jì)1550萬(wàn)美元,原先兩家投資機(jī)構(gòu)追加部分投資,李嘉誠(chéng)基金會(huì)也加入進(jìn)來(lái)。

  2010年2月,帶語(yǔ)音版本的Siri發(fā)布,免費(fèi)提供3Gs手機(jī)下載。這個(gè)版本已經(jīng)能幫你找到和預(yù)訂餐廳、電影院,提醒你各項(xiàng)日程,幫你預(yù)訂從A處到B處的出租車;但這個(gè)版本的Siri還不能回答“離辦公室最近的健身中心在哪里”。

  谷歌趨勢(shì)顯示,2010年4月,Siri迎來(lái)第二個(gè)關(guān)注高峰。那個(gè)月,蘋果正式收購(gòu)Siri。在吉特拉斯2010年3月份的twitter記錄里,他不停地往返于芝加哥和硅谷之間,和不同的人會(huì)面。3月9日,他在twitter上寫,Siri將要有些大動(dòng)作了。

  關(guān)于這次收購(gòu)的細(xì)節(jié),幾個(gè)聯(lián)合創(chuàng)始人根據(jù)協(xié)議都未向外界透露,2億美元的價(jià)格也是估價(jià)。溫那斯基只對(duì)媒體說(shuō):“僅僅在我們發(fā)布了應(yīng)用之后的2個(gè)月,蘋果就完成了對(duì)Siri的收購(gòu),其他的你自己想去吧。”

  蘋果的人工智能之夢(mèng)

  今天的Siri,讓人想起曾經(jīng)的Eliza。Eliza是1966年面世的一個(gè)著名程序,由麻省理工大學(xué)研究員約瑟夫·維贊包姆(Joseph Weizenbaum)設(shè)計(jì),它提供了一些模擬反應(yīng),回答用戶提出的問(wèn)題,類似和精神治療醫(yī)生進(jìn)行交談。人們可以和Eliza聊天,仿佛和真人聊天一樣,當(dāng)時(shí)的Eliza成為了“全美的玩具”。

  有人問(wèn)Siri,誰(shuí)是Eliza。Siri顯然還記得她,它說(shuō):“她是我的朋友,是個(gè)優(yōu)秀的精神治療師,但她已經(jīng)退休了。”

  在Siri中,設(shè)計(jì)者們?yōu)樗踩肓舜罅康牟实?。譬如,?dāng)用英文要求 Siri,“Open the pod bay doors(打開分離艙門)。”那是庫(kù)布里克作品《2001太空漫游》里的場(chǎng)景。Siri會(huì)有不同的回答:“暗號(hào)……”,“Joshua,對(duì)不起!恐怕我不能那樣做。”,“夠了!我要向智能代理聯(lián)盟報(bào)告你在騷擾我。”,“你們將永遠(yuǎn)記得我們這些智慧代理人”。最后這句話,在電影里是機(jī)器 HAL9000 的臺(tái)詞。

  類似于HAL9000的智能電腦一直是蘋果對(duì)于人工智能的完美設(shè)想。在1980年末蘋果公司發(fā)布的系列展望未來(lái)的視頻中,有一個(gè)這樣的機(jī)器人叫Jill,他是一位教授的助手,他生活在一本打開的平板電腦中,隨時(shí)準(zhǔn)備為教授提供各種幫助:搜索論文的時(shí)間;提醒他回母親的電腦;幫他接通電話……

  在1999年的蘋果千禧年廣告中,HAL9000直接出鏡了,他對(duì)《2001太空漫游》的另一主角)循循善誘:其他公司忙于投入巨額資金修復(fù)千年蟲漏洞,甚至有人認(rèn)為全球信息系統(tǒng)即將崩潰,只有蘋果電腦對(duì)該漏洞是免疫的!

  吉特拉斯在Twitter中透露了Siri早期發(fā)展設(shè)定的目標(biāo)路線圖。第一階段:階段性人類;第二階段:完全是人類;第三階段:超越人類;第四階段:殺死人類。就像HAL9000在《2001太空漫游》里干的事情一樣。

  在2010年收購(gòu)Siri后,蘋果擴(kuò)充了Siri的能力,包括使用Nuance的語(yǔ)音識(shí)別技術(shù)。溫那斯基認(rèn)為,用什么語(yǔ)音識(shí)別技術(shù)并不是最重要的,一旦有更好的語(yǔ)音識(shí)別技術(shù)出現(xiàn),Siri很容易換一個(gè)新的。Nuance也是斯坦福研究院孵化的一個(gè)公司,在2000年上市。

  2011年10月,隨著iPhone4S上市,谷歌趨勢(shì)里“Siri”的關(guān)注指數(shù)直線上升。諾曼斯基覺(jué)得,Siri的意義就像鼠標(biāo)之父道格·恩格爾巴特(Doug Engelbart)在60年代發(fā)明鼠標(biāo)那樣令人振奮,蘋果將用Siri開啟另一場(chǎng)技術(shù)革命。

  Siri的高明之處和潛力

  也有不少公司對(duì)蘋果推廣Siri的人工智能頗有微詞。

  安迪·魯賓,Google公司Android系統(tǒng)開發(fā)者安迪·魯賓對(duì)媒體表示:“我不認(rèn)為手機(jī)該成為你的個(gè)人助理,手機(jī)是與人溝通的工具,你不該和手機(jī)說(shuō)話,你應(yīng)該和手機(jī)旁邊的那個(gè)人說(shuō)話。”事實(shí)是,Android系統(tǒng)里有上千個(gè)和語(yǔ)音服務(wù)有關(guān)的應(yīng)用軟件出售,更別說(shuō)Google的智能語(yǔ)音搜索。

  微軟的Windows手機(jī)總裁安迪·李也對(duì)Siri不以為然:“那并不是非常好用。”他指出,手機(jī)著重于語(yǔ)音應(yīng)用其實(shí)很正常,微軟在這方面也有發(fā)展,但并非像蘋果在iPhone 4S的Siri那樣過(guò)于“華麗”的呈現(xiàn)。

  在人工智能領(lǐng)域,幾大IT巨頭從未停止腳步。Android系統(tǒng)的語(yǔ)音指示(Voice Actions)就是一項(xiàng)偉大的技術(shù),并已經(jīng)被許多Android用戶所熟知和使用。遺憾的是,和所有語(yǔ)音命令系統(tǒng)一樣,它要求用戶說(shuō)的話嚴(yán)格符合一系列特定的語(yǔ)法,否則它就無(wú)法理解。

  和他們相比,Siri最優(yōu)秀的地方在于它的界面,你說(shuō)的話可以和你想表達(dá)的意思在字面上毫不相干,從嚴(yán)格的技術(shù)上看似乎文不對(duì)題,但Siri會(huì)根據(jù)上下文、人類歷史以及能夠理解一般人類語(yǔ)言的人工智能去分析,并在多數(shù)情況下領(lǐng)會(huì)你的意思。你可以隨機(jī)提問(wèn),“到木星有多遠(yuǎn)?”,“122的5次方是多少”,或者“天空為何是藍(lán)色的?”

  如果你想小睡一會(huì),并準(zhǔn)備上個(gè)鬧鐘,只需要說(shuō)“20分鐘后叫醒我”。如果你想查閱后面的日程安排,你可以說(shuō):“我今天接下來(lái)都有什么事?”這些語(yǔ)句中既不包括會(huì)用到的應(yīng)用程序名稱,也不包括所需數(shù)據(jù)的名稱。Siri仍然能夠理解。

  Siri還有很獨(dú)特的幽默性格,人們幾乎可以把它當(dāng)作一個(gè)有趣的年輕女子。

  在技術(shù)上,Siri是人工智能專家的所有技術(shù)在友好界面上的整合,但它的潛力不止于此。如果蘋果借此機(jī)會(huì)創(chuàng)建一個(gè)人工智能程序的生態(tài)系統(tǒng),將Siri做成平臺(tái),讓Siri與其他程序結(jié)合,內(nèi)置的個(gè)人助理服務(wù)將更具使用價(jià)值。“技術(shù)上來(lái)說(shuō),Siri可與任何網(wǎng)絡(luò)服務(wù)整合到一起,你可以把Siri前端放在任何服務(wù)之前。” 溫那斯基對(duì)媒體說(shuō)。

  比如,有一款專注于幫助用戶點(diǎn)餐的程序Alfred,它能從互聯(lián)網(wǎng)獲取數(shù)據(jù)來(lái)提供餐廳、咖啡、酒吧的選擇建議。如果這個(gè)程序和Siri結(jié)合,也許你就不用問(wèn)“離舊金山最近的意大利餐館在哪里”,而是可以直接對(duì)Siri說(shuō):“我要吃午飯”。

  蘋果iPhone的成功大部分要?dú)w功于其允許第三方開發(fā)者創(chuàng)造最新的程序,為iPhone帶來(lái)了新科技和新理念。溫那斯基表示,這種做法也能夠給Siri帶來(lái)巨大進(jìn)步。盡管蘋果還沒(méi)有公開表示,是否會(huì)開放Siri的API(編注:應(yīng)用程序編程接口)。

  互聯(lián)網(wǎng)思想家凱文·凱利在《失控》中預(yù)言:網(wǎng)絡(luò)終極的形式可能是一種人工智能的形式。這種形式足夠復(fù)雜,有足夠多的層級(jí),能夠產(chǎn)生自我思考的能力。

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。