在亞洲研究院內(nèi),90%以上的科研人員是華人,像聶再清團隊一樣的研究小組有20多個,其中很多都從事與人工智能相關(guān)的核心技術(shù)和應(yīng)用研究。
“為微軟孵化顛覆性科技并創(chuàng)造新的業(yè)務(wù)?,F(xiàn)在我們部門建立了幾個團隊,專注于新業(yè)務(wù)”
人工智能
今年的微軟Build大會上,微軟CEO薩提亞.納德拉展示了一款能夠訂購達美樂Pizza的機器人。方法很簡單,只需要對著你的移動設(shè)備說“想吃Pizza”,約定時間內(nèi),Pizza就被送到你的手里——不用點開某個叫餐軟件,甚至不必打字。就像是有個人坐在后臺,隨時待命。
沒有人坐在后臺待命,是讀取和深度學(xué)習(xí)達美樂點餐全流程的虛擬機器人完成了所有操作。微軟給這個黑科技項目取了一個并不花哨的名字——“機器人智能”(Bot Intelligence)。整個項目展示只有短短5分鐘,但對微軟而言,意義重大。
掌管微軟整體技術(shù)研究的執(zhí)行副總裁沈向洋表示,“機器人智能”是機器人架構(gòu)(Bot Framework)的核心部分,嵌入了深度學(xué)習(xí)、語義理解等人工智能技術(shù),第三方開發(fā)者能夠通過機器人架構(gòu)這個平臺來創(chuàng)建不同功能的機器人。
它直接關(guān)系到微軟的未來——不僅僅是訂購Pizza,微軟希望,不同企業(yè)可以像達美樂那樣利用微軟的平臺更簡單地制作并運行自己的智能機器人。彭博社撰文指出,這是一個嶄新的市場,以至于Gartner和Forrester等調(diào)研公司還沒有摸清楚它的規(guī)模,這很可能會非常龐大。
這項終極目標(biāo)是要讓機器替代人類的技術(shù)背后,集結(jié)了微軟眾多科學(xué)家的智慧,尤其是幾年來在人工智能領(lǐng)域的研發(fā)成果。每年微軟都有接近100億美元投入在研發(fā)上,其中很大一部分集中在人工智能。據(jù)沈向洋介紹,在全球微軟有1000多名研究人員,至少有三分之一都在研究人工智能。在這龐大的科學(xué)家隊伍中,華人面孔的科學(xué)家,成為微軟人工智能戰(zhàn)略背后的核心研發(fā)力量。
“(微軟CEO納德拉展示的)這個Pizza機器人的大腦,就是我們做的。”38歲的聶再清說。他是微軟亞洲研究院資深研究員,帶領(lǐng)著一個有8個研究員的小組,過去十余年都在主攻大數(shù)據(jù)挖掘和機器學(xué)習(xí)?!昂唵握f,(我們的工作)就是讓機器能夠理解用戶的自然語言并構(gòu)建知識圖譜?!彼f道。
這個研究小組的成果,促成了Pizza機器人和其背后“機器人智能”技術(shù)的誕生,也讓不同企業(yè)利用微軟的平臺制作并運行自己的機器人,成為了可能。
今年3月,聶再清代表亞洲研究院,在美國華盛頓州雷德蒙微軟總部一年一度的Techfest(微軟技術(shù)大會)上,展示了這項成果。他僅用了幾行代碼,制作出一個能夠用于企業(yè)內(nèi)部預(yù)訂會議的機器人。當(dāng)時,納德拉坐在不到5米遠的看臺上,在他旁邊的是微軟執(zhí)行副總裁、研發(fā)集團CEO沈向洋。
“這是我見到過的最簡單的代碼?!蔽④汣EO納德拉對一旁的沈向洋說道,他希望在一個月后的Build大會上加入這個研究的展示,不過展示形式可能要換換,比如,不是用于預(yù)訂會議的機器,而是用簡單的代碼寫出一個可以訂購Pizza的智能點餐機器人。
“通常為機器人添加新功能或場景需要一整套的工序,現(xiàn)在只需要幾步,有了‘機器人智能’的機器人架構(gòu)平臺就能幫助開發(fā)者構(gòu)建一個機器人的大腦,哪怕你對軟件工程的知識一竅不通。”他介紹道。
講述“Pizza機器人”這段誕生過程時,聶再清坐在北京中關(guān)村一棟30層高的寫字樓辦公室里。這里是微軟亞洲研究院,微軟全球范圍內(nèi)1000多名科學(xué)家和專家中的五分之一,聚集于此。
在亞洲研究院內(nèi),90%以上的科研人員是華人,像聶再清團隊一樣的研究小組有20多個,其中很多都從事與人工智能相關(guān)的核心技術(shù)和應(yīng)用研究,涵蓋了從大數(shù)據(jù)挖掘、機器學(xué)習(xí)、自然語言處理到在線搜索等人工智能核心技術(shù)的方方面面。3月在美國高調(diào)上線并引發(fā)軒然大波的微軟人工智能助手Tay的原型,即在中國有4000萬用戶的語音助手“微軟小冰”,正是這些研究團隊的另一項成果。
研發(fā)團隊
身為微軟全球執(zhí)行副總裁、掌管這個全球最大高科技公司研究事務(wù)的沈向洋博士,也起步于位于北京的這個研究院。沈向洋曾擔(dān)任微軟亞洲研究院院長,是聶再清的上司。
1999年,沈在北京加入微軟亞洲研究院,成為這個研究院第一名研究員,主攻視覺識別。那一年,李開復(fù)任亞洲研究院院長,在他的帶領(lǐng)下,微軟實驗室開始拼音輸入程序的研發(fā)。李開復(fù)和沈向洋不僅都畢業(yè)于卡內(nèi)基梅隆大學(xué),且都師從1994年的圖靈獎獲得者拉吉.瑞迪。從1999年開始,直到今日,人工智能都是整個微軟亞洲研究院的主攻方向之一。
現(xiàn)在沈向洋的辦公室位于美國華盛頓州的雷德蒙總部,從窗外望出去,能隱約看到雷德蒙大學(xué)的操場。19年前,Windows95在這里正式發(fā)布。那曾是微軟最輝煌的時期,Windows幾乎占據(jù)了90%的市場份額,直到2007年,雅虎和谷歌帶來的全新商業(yè)模式——這種通過廣告賺錢,而對用戶而言一切免費的模式與微軟截然不同,也讓微軟第一次正視自己已經(jīng)錯失了搜索的機會。
美國華盛頓州雷德蒙德的微軟總部
那是一次輸在策略的賽跑。事實上,2007年沈向洋在亞洲研究院任院長時,這里的自然語言研究及機器學(xué)習(xí)已小有成果——這兩者正是搜索技術(shù)往前發(fā)展的核心。正因如此,當(dāng)年年底,當(dāng)時任微軟CEO的史蒂夫.鮑爾默決定要在微軟內(nèi)部打造一支搜索團隊時,選中了沈向洋。
鮑爾默當(dāng)時給團隊打氣說:“我調(diào)了一個最懂技術(shù)的人,叫沈向洋,又調(diào)了一個最懂產(chǎn)品的人,叫納德拉。”接下來的幾年,沈陸續(xù)從亞洲研究院帶了54個研究員到必應(yīng)(Bing)。這些研究員最后都成為了搜索團隊里面的技術(shù)骨干。
又過了六年后,納德拉成為了微軟的掌舵人,把公司帶向云計算,而沈向洋這位出生于南京的中國人,則成為了微軟創(chuàng)新理念的重要布道者。他所帶領(lǐng)的研發(fā)團隊時刻都在為微軟尋找下一個“偉大的點子”。
這兩年,如何讓研發(fā)團隊這個微軟重要且寶貴的資產(chǎn)支持企業(yè)未來的發(fā)展藍圖,一直是納德拉和沈向洋反復(fù)討論的話題。為此,沈向洋更改了研發(fā)部門的一些規(guī)劃與制度。微軟在全球擁有11個研究院和實驗室,在研究院里,研究工作以研究領(lǐng)域為單位獨立運行,同時研究組之間、研究組與產(chǎn)品部門之間又保持密切合作。
過去,研究小組不是一個真正的產(chǎn)品研發(fā)團隊,而是以基礎(chǔ)研究為主,較少考慮市場因素,現(xiàn)在沈向洋希望研究團隊也參與產(chǎn)品的研發(fā)?!盀槲④浄趸嵏残钥萍疾?chuàng)造新的業(yè)務(wù)。現(xiàn)在我們部門建立了幾個團隊,專注于新業(yè)務(wù)?!彼f道。
每年,微軟研發(fā)集團會挑選一些項目向公司業(yè)務(wù)部門展示,但只有七個項目進入到最后的顛覆性科技評估環(huán)節(jié)。這些入選的項目大都在相關(guān)性領(lǐng)域有顛覆性的研究發(fā)現(xiàn)。每年10月,在雷德蒙會議室里,各個項目負責(zé)人都會與微軟高層們進行4個小時的頭腦風(fēng)暴,沈向洋會在一旁收集反饋,并決定下一步動作,比如,是否立刻將其落實為產(chǎn)品。
一些項目已經(jīng)處于前期研究的階段,其中包括位于美國加州的圣塔芭芭拉市(SantaBarbara)的量子計算實驗室;英國劍橋研究院在做生物計算(Biological Computing)的長期研究;最近,微軟還試圖在DNA上存儲海量信息,并為此新建了一個Wet Lab……
說起這些項目,沈向洋如數(shù)家珍。過去兩年,他平均每周深度考察兩個來自全球研究院的項目。沈向洋分享了以上那些鮮為人知的微軟黑科技。他試圖向外界展示的不外乎一點:現(xiàn)在的微軟跟蓋茨時代沒有兩樣,仍然是一家注重技術(shù)研發(fā)的公司,哪怕這些研發(fā)都相當(dāng)基礎(chǔ),短期內(nèi)不可能實現(xiàn)。
從基礎(chǔ)研發(fā)到最終產(chǎn)品,其中過程并不容易。微軟不止一次在一些項目上栽跟頭,包括Tay。今年3月Tay在美國正式上線,但幾個小時后,就有別有用心的人教會它發(fā)表種族歧視的言論。不久Tay便被要求緊急下線。這幾乎可以看作小冰“西游”的一次失敗。
不過,在與中國文化相近的日本,小冰的姐妹版Rinna卻受到追捧。在沈向洋看來,這回到了最根本的問題:計算機的算法讓它已經(jīng)能識別數(shù)千種汽車,而人類可能只能認(rèn)出三種。但在認(rèn)知、同理心和情感層面,機器還無法接近人類。
需求與未來
人工智能之于今天的微軟,就像當(dāng)年的搜索服務(wù)。人工智能是讓計算機學(xué)習(xí)如何像人一樣聽、說、讀、想,該領(lǐng)域與移動互聯(lián)網(wǎng)時代緊密相連。大多數(shù)科技公司都已經(jīng)看到其廣闊前景,巨頭之間,人工智能的競賽也已展開。
Facebook在硅谷、紐約和巴黎建立了三個人工智能實驗室。Google常年在全球搜羅人工智能方面的科學(xué)家。百度挖走了谷歌的科學(xué)家吳恩達,還在硅谷建立了研究院……“但是各家不一樣,主要還是看各自的業(yè)務(wù)模式,也就是你到底用這樣的技術(shù)去做什么?!鄙蛳蜓笳f道,他與百度董事長李彥宏相熟,去年他們還討論過尼克.波斯特洛姆的《超級智能》里的場景。
百度與谷歌類似,在人臉識別、自然語言處理上下功夫,以支撐搜索技術(shù)發(fā)展的需要。Facebook則希望通過人工智能挖掘社交技術(shù)的可能。而微軟花了大量精力在機器學(xué)習(xí)、計算機視覺識別等人工智能的基礎(chǔ)研究上,“所有的人工智能研究都圍繞微軟未來的智能云平臺展開?!鄙蛳蜓笳f道。這是繼搜索后的又一次賽跑,好在這次,微軟至少沒有輸在起跑線上,北京的研發(fā)團隊過去十幾年的技術(shù)積累,正在派上用場。
機器學(xué)習(xí)是讓機器具有智能的核心。過去十多年,聶再清位于北京中關(guān)村的團隊都在主攻大數(shù)據(jù)挖掘和機器學(xué)習(xí)。他的第一個項目叫學(xué)術(shù)搜索。那時,他剛從美國大學(xué)博士畢業(yè),正愁沒有研究課題。卻發(fā)現(xiàn)自己平時苦于做論文需要尋找文獻,于是搭建了一個可以搜索文獻、會議、作者、機構(gòu)及其關(guān)系的對象級別搜索引擎。
后來該團隊把搜索對象擴展到了互聯(lián)網(wǎng)上有公開信息的任何一個人,就有了叫“人立方”的產(chǎn)品——這是一種關(guān)系搜索,它從超過十億的中文網(wǎng)頁中自動抽取出人名、地名、機構(gòu)名以及中文短語,并且通過算法自動計算出它們之間存在關(guān)系的可能性。
“機器人智能”項目,實際上基于人立方的技術(shù)。這種技術(shù)最先被用到了企業(yè)內(nèi)部,一款名為企業(yè)深度智能(Enterprise Deep Intelligence,簡稱EDI)的應(yīng)用已經(jīng)預(yù)計會很快進行產(chǎn)品化。它已在微軟亞洲研究院內(nèi)部廣泛試用,人們都在用這個應(yīng)用查詢信息、組織會議、自動預(yù)訂會議室。
另外,EDI還可以像一個私人秘書一樣,通過Skypefor Business與用戶聊天,只要告訴“他”你的需求,“他”就幫你處理日常事務(wù)?!翱梢园杨A(yù)訂會議的郵件抄送給‘他’,或者輸入:‘EDI,請幫我跟這些人約一個會議’,‘他’根據(jù)你的要求和喜好,會自動去找會議室和大家都有空的時間段?!甭櫾偾逭f,“把API應(yīng)用到達美樂場景,就得到了訂購Pizza的機器人。”
在沈向洋看來,這是微軟的下一步:“我們認(rèn)為未來智能助理(Intelligent Agent),可能會是一個新入口,無論是Android還是WindowsPhone都行得通,微軟就可以和所有的公司合作?!笨瓷先ゴ祟愋枨鬅o處不在。“很多想法從平時的閱讀和學(xué)術(shù)文章中來,但有些時候,是自己真的發(fā)現(xiàn)了需求?!蔽④泚喼扪芯吭褐鞴苎芯繂T閆峻說。近幾年,他一直在負責(zé)一支5個研究員組成的知識挖掘團隊。
去年,閆峻在北京一家醫(yī)院接受了一個外科手術(shù)。他了解到,一個普通外科醫(yī)生一天可能進行10例手術(shù),醫(yī)生資源不夠用,無法解答每個康復(fù)期病人的困惑。這激發(fā)他進行一項基于知識挖掘的醫(yī)療項目,以解決醫(yī)院生產(chǎn)力的問題。他選擇在北京和沈陽的醫(yī)院進行試點,并同時與產(chǎn)品部門保持密切聯(lián)系,讓后者及時得到用戶需求的趨勢。
理想的模型是,醫(yī)院里有一個機器人,或者是存在于病患手機中的一個App中,病患的所有問題都能通過這個機器人得到回復(fù)。去年年底開始,閆峻通過讓機器模擬人類學(xué)習(xí)的四個階段來獲取這些專業(yè)知識。閆峻介紹稱,即使在最簡單的第一階段,也需要運用到知識挖掘的技術(shù)——在這個階段,機器可以從一些網(wǎng)頁上抓取疾病可能存在的癥狀,然后捕捉那些在論壇上活躍醫(yī)生的問答。
據(jù)閆峻團隊統(tǒng)計,一個外科醫(yī)生一年之內(nèi),能在不同論壇里回答幾十到幾千個問題。而網(wǎng)絡(luò)針對同一疾病可能有幾萬個不同問題,最后通過機器的知識挖掘,可以總結(jié)出用戶實際上在問的最本質(zhì)的問題,針對一個疾病這樣的問題可能只有80多個。
閆峻
除了機器學(xué)習(xí)和知識挖掘之外,沈向洋鼓勵亞洲研究院的中國研究員們在深度神經(jīng)網(wǎng)絡(luò)研究領(lǐng)域投入力量。這個領(lǐng)域的研究屬于人工智能深度學(xué)習(xí)?!斑@個領(lǐng)域的意義在于,幾年內(nèi),計算機在感知上的能力就會超越人類。再過5到10年,圖像識別上計算機就可以比人類更厲害。到時候,當(dāng)識別這是個什么瓶子、是哪個牌子的瓶子時,人工智能就能比人更清楚?!鄙蛳蜓笳f。
人工智能要達到這樣的能力,還有很遠的路要走。沈向洋明白,如果“人工智能”之父阿蘭.圖靈活到今天,可能會對人工智能過去60年的發(fā)展感到失望——即便是最近獲得極大關(guān)注的Alpha Go,它可以在圍棋上取勝,卻玩不了高級撲克,因為它還看不懂人類的虛張聲勢。不過,對沈向洋的團隊而言,這倒也是機會,畢竟,至少現(xiàn)在他們的人工智能技術(shù)可以用來叫Pizza外賣了。