最近,一個名為華智冰的學生走進了清華大學,還大眾面前“高調(diào)”亮相,因為這是中國首個原創(chuàng)虛擬學生。
一時間,大家紛紛感嘆,原來虛擬人物還能讀大學!據(jù)報道,華智冰雙商都很高,可以寫詩作畫、創(chuàng)作劇本殺,還具有一定的推理和情感交互的能力。
未來離我們?nèi)绱酥?/p>
那么,華智冰這樣的AI究竟“進化”到了什么地步?為什么AI能進行藝術(shù)性質(zhì)的創(chuàng)作?人類智能和人工智能的差別會越來越小嗎?AI最終會超越人類嗎?
微軟亞洲研究院被譽為“世界上最火的計算機實驗室”,洪小文院長在名為《人工智能的突破和數(shù)字化轉(zhuǎn)型的未來》的演講中全面分析了這些問題,同時也講述了為何數(shù)字化轉(zhuǎn)型對企業(yè)至關(guān)重要。
值得一提的是,華智冰是由北京智源人工智能研究院、智譜AI與小冰公司共同打造的,而小冰公司的前身就是微軟(亞洲)互聯(lián)網(wǎng)工程院人工智能小冰團隊。
相信洪小文院長的這篇演講能為你揭開關(guān)于AI現(xiàn)狀和未來的神秘面紗。
中國有個成語叫“知往鑒今”,意思就是了解過去作為今天的借鑒。我經(jīng)常開玩笑說,AI火熱是因為“人工”的反面是“天然”,“智能”的反面就是“愚蠢”,因為沒有人想做天然的愚蠢,那當然就喜歡AI了。
AI這個學科雖然和其他學科比起來歷史沒有那么悠久,但是也有60多年了。1956年我的師祖(老師的老師)約翰?麥卡錫在達特茅斯會議上提出了AI這個概念,然后AI經(jīng)歷了兩段著名的寒冬。
記得我剛畢業(yè)的時候是1992年,那正是AI第二段寒冬的尾巴。當時我們學AI的人畢業(yè)都不敢講自己是學AI的,我們就說是做語音的。那時如果跟人家講自己學AI是找不到工作的,而今天是你不做AI都要說是做AI。起初,AI在學術(shù)上的定義其實沒有大家理解的這么寬;但今天,基本上計算機能做的,大部分人認為就是AI。
AI跟經(jīng)濟有很大的關(guān)系,大家都預(yù)測到,未來的經(jīng)濟很多都需要靠AI推動。AI對GDP增長的貢獻值如圖11.1所示。
圖11.1 AI對GDP增長的貢獻值
智能金字塔
圖11.2是1950年一期《時代》雜志的封面,那期雜志里有一篇文章說了這么一句話:“對于擁有‘超人’力量的機器,現(xiàn)代人已經(jīng)習以為常,但是擁有‘超人’腦力的機器仍然讓人們感到恐懼?!恕脑O(shè)計者否認他們正在創(chuàng)造人類智力的競爭對手。”
計算機是在第二次世界大戰(zhàn)期間誕生的,當時美國跟德國都想要做原子彈來制服對方,那時有一個“曼哈頓計劃”,所以才開始做計算機。1950年的時候,AI還沒有被定義出來,達特茅斯會議都還沒有召開,第二次世界大戰(zhàn)結(jié)束五年后,全世界的計算機還不超過十臺,而且每一臺計算機都有一個房間那么大,其運算能力、儲存能力比今天的智能手機還差。
在那個時代,大家很擔心有人會造出比人類還聰明的計算機。我們并不害怕大型機械,如飛機、汽車,但是卻在AI還沒有影子的時候就感到害怕,這代表了大家對智能這件事情,真是既期待,又怕受傷害。這也說明了為什么大家這么關(guān)注AI,包括很多人對AI產(chǎn)生了不那么正確的看法。
圖11.2 1950年《時代》雜志的封面
我把智能的發(fā)展畫成了一個金字塔(見圖11.3),自下至上,從簡單到復(fù)雜分別為計算和記憶力、感知、認知、創(chuàng)造力和智慧這五層。
最底層的是計算和記憶力。我們中國人的老祖宗很厲害——“神機妙算”和“過目不忘”,這是很智能的表征,“神機妙算”就是計算,“過目不忘”就是記憶。不管是圖靈機還是馮?諾依曼機,都包含了CPU以及存儲兩大基本組成,計算機靠這兩樣?xùn)|西就可以運算所有程序。
回想到我人生的第一次挫折,就是我小學一年級時沒有被選進珠算隊,而今天大部分人顯然都不會送小孩學珠算。在我們那個年代,珠算也分等級,就像下圍棋一樣,大家覺得一個人很會用算盤、會珠心算,是非常了不起的。用算盤可以進行很復(fù)雜的計算,甚至可以開根號、做三角函數(shù)。當時我的老師告訴我:“你的身體沒有那么好,課后你還是回家休息吧,不要參加珠算隊?!甭犕旰螅耶敃r的感覺是因為自己不夠聰明,所以才沒有入選珠算隊,我很難過,直到高中時才從這件事的打擊中緩過來。
圖11.3 智能金字塔
而今天已經(jīng)沒人認為算得很快有多了不起,沒有人跟計算機、計算器比計算,也沒有人跟計算機比記憶。我自己搬家三年,到現(xiàn)在都不記得自己家里的電話。如果我寫十個電話號碼,讓大家記,十分鐘以后,我說出一串數(shù)字,問你是不是我剛才說的號碼中的其中一個,大部分人可能都答不上來。既然今天計算機可以幫我們計算、記憶,我們就可以很放心地讓它來做,計算機比我們強沒有關(guān)系。
自下而上第二層到了感知。還要說我們的老祖宗很厲害,“聰明”這兩個字就是“耳聰目明”,計算機視覺很強,語音識別很強,就是聰明?!扒Ю镅邸焙汀绊橈L耳”都是關(guān)于感知這件事的,事實上,這一波AI的復(fù)興都跟感知有關(guān)。
在視覺方面,2015年1月,微軟亞洲研究院開發(fā)的計算機視覺系統(tǒng),在ImageNet(可視化數(shù)據(jù)庫)挑戰(zhàn)賽中首次超越了人類對物體識別分類的能力。同年12月,微軟亞洲研究院設(shè)計發(fā)明的前所未有的、深度高達152層的殘差網(wǎng)絡(luò)ResNet,將識別錯誤率進一步降至3.57%,而人類的錯誤率大概是5.1%。
在語音識別領(lǐng)域,2017年在全球最權(quán)威的產(chǎn)業(yè)標準 Switchboard 語音識別基準測試中,微軟的語音識別系統(tǒng)將錯誤率降至5.1%,準確率超過專業(yè)速記員水平,也就是說超越了普通人類。這次突破大幅刷新了此前的紀錄,并在語音識別行業(yè)樹立了新的里程碑。
計算機可以完全聽懂人講話,這在以前是不可思議的。計算機的語音識別技術(shù)有很多應(yīng)用場景,例如充當法庭里的速記員,像我們今天用的智能音箱、智能助手也都是語音識別方面的應(yīng)用。在語音識別方面,看起來計算機已經(jīng)超越我們?nèi)祟惲?,事實也的確是這樣。
計算機視覺方面的應(yīng)用更多。例如在海關(guān)工作的稽查員當天接到500名嫌疑犯的照片,需要時刻檢查有沒有這500名嫌疑犯中的一個或幾個通過這個關(guān)口。我相信很多人還是會辨認錯誤,而且這樣的工作也非??菰铩H绻嬎銠C能夠幫助我們很好地完成這樣的工作,那么感知這部分就讓計算機幫助我們吧。
自下而上的第三層是認知,目前AI的進展也剛好處于這一階段。剛才講到的計算機視覺和語音識別都是人工智能在感知層面上的進展,但要讓計算機更加理解人類,我們就需要對認知層面進行探索,而自然語言理解就是認知層面的核心。認知的英文叫cognition,心理學上,認知心理學是非常重要的一支。認知基本上是指我們對一件事情的“理解”,以及從這件事情中“洞察”到什么,還可以進行“推理”,做一個“計劃”,最后做出“決策”。
認知其實是工作和生活中最有用的東西。工作上,例如政府官員要制定政策,公司管理層要根據(jù)市場變化相應(yīng)調(diào)整產(chǎn)品策略等,這些都是基于認知做出的決定。
我們來看看今天計算機和人類相比做得怎么樣。
近兩年來,微軟在自然語言方面有很大的突破。2018年1月,微軟亞洲研究院研發(fā)的機器閱讀系統(tǒng)在由斯坦福大學發(fā)起的機器閱讀理解挑戰(zhàn)賽SQuAD中率先超越人類水平。這是計算機文本理解能力首次超越人類,預(yù)示著該領(lǐng)域的研究以及應(yīng)用都將會有更大突破。2019年3月,微軟亞洲研究院與微軟雷德蒙研究院合作研發(fā)的系統(tǒng),首次在斯坦福大學發(fā)起的對話式問答挑戰(zhàn)賽CoQA 中各項指標都超越人類水準。
我想大家都有參加英語考試的經(jīng)驗,高考、托福、GRE(美國研究生入學考試)、SAT(美國學術(shù)能力評估測試)中都有閱讀理解題型,大多數(shù)人是考不了滿分的,而計算機可以在這方面超越人的平均水平。辨認到理解是非常難做的事情,計算機也可以做得很好。
另一個就是翻譯,微軟中-英機器翻譯的水平已經(jīng)可以“與人類媲美”。我們都知道,翻譯的前提是理解,計算機雖然無法理解,但是可以翻譯得非常好。像我個人根本不會講法語,但是我們可以利用機器翻譯,到法國巴黎的時候順利買到歌劇的票。
2019年,在由國際計算語言學協(xié)會(The Association for Computational Linguistics)舉辦的WMT 2019國際機器翻譯比賽上,微軟亞洲研究院參加了11項機器翻譯任務(wù),其中8項榮獲第一,并憑借多維度的技術(shù)創(chuàng)新成為冠軍團隊。這也讓我們在幫助人們打破語言交流障礙的道路上又邁進了一步。
“微軟小冰”不僅做智商上面的問答,還有情商方面的問答。小冰這樣的對話機器人,在學術(shù)界的價值非常高。
大家知道,艾倫?圖靈是計算機的始祖,他在AI還未被定義的時候,就想到了“圖靈測試”。該測試是,有兩個房間,一個房間里是真人,另一個房間里放機器,人跟機器對答,假如說40% ~ 60%的人分不出哪個房間里面是真人,哪個房間里面是機器,那么圖靈測試就通過了。很多人通過圖靈測試判斷AI有沒有通過人的智能考量。
小冰雖然沒有去做很嚴格的圖靈測試,但微軟一直以“用戶和小冰每一次對話大概交互幾輪”來作為衡量她的KPI。在微信上,我們跟最熟悉的朋友、親戚對話,每一次也大概不過5輪。大家明明知道她是一個機器人,還愿意跟她談20輪以上,肯定是她談了一些有意義的東西,讓你欲罷不能。從某種意義上說,小冰已經(jīng)遠遠超過了圖靈測試。我們讓小冰變成人們可信賴的伙伴,我們還可以以她為基礎(chǔ)發(fā)展一些商業(yè)領(lǐng)域的應(yīng)用,更重要的是做一些科學實驗。
AI在商業(yè)領(lǐng)域的應(yīng)用,大部分是基于它的認知作用。而認知的進化主要來自一個反饋閉環(huán)(見圖11.4),該閉環(huán)依靠傳感器和執(zhí)行器兩大部分,主要表現(xiàn)為物理世界通過傳感器搜集數(shù)據(jù)并將數(shù)據(jù)傳輸給系統(tǒng),系統(tǒng)針對傳輸數(shù)據(jù)進行分析后做出決策,并將決策反饋給執(zhí)行器,最后由執(zhí)行器在物理世界中執(zhí)行來實現(xiàn)決策。人工智能在閉環(huán)中扮演最重要的分析與決策角色。
圖11.4 進化來自反饋
物聯(lián)網(wǎng)就是跟物理世界打交道,其中傳感器是搜集數(shù)據(jù)的,執(zhí)行器用于在物理世界中執(zhí)行。比如說,我們要控制一條河的水質(zhì),傳感器能夠檢測水質(zhì),執(zhí)行器用于控制排放污水的開關(guān),在沒有互聯(lián)網(wǎng)的時代,我們需要派人專門去那里執(zhí)行,現(xiàn)在有了物聯(lián)網(wǎng),我們可以遠程控制,比如說這個小區(qū)的水不要排進來,那個小區(qū)的水可以排之類的。
幾乎所有的事情,每完成一次閉環(huán),就能夠有所改進,包括做社會心理學分析、做實驗、做假設(shè)、做產(chǎn)品,或是做互聯(lián)網(wǎng)都是如此。如今,基于獲得的數(shù)據(jù),可以由AI進行分析跟決策,即所謂認知。如果我們有一個閉環(huán),又有辦法搜集到數(shù)據(jù),就可以把它自動化。很多AI的商業(yè)應(yīng)用,都可以抽象為這樣的事情。
制造業(yè)是首先享受AI成果的行業(yè),使用AI已經(jīng)成為常態(tài),比如可預(yù)防的維修。
例如,蒂森克虜伯電梯集團是微軟的客戶之一,遇到電梯出故障的情況,以前公司會先打電話給維修人員,維修人員來搜集一些數(shù)據(jù),然后回實驗室分析幾天,分析完之后發(fā)現(xiàn)可能有一個零件壞了,再去配零件,又隔了幾天,零件來了,維修人員再到這部電梯里把零件裝上去,最后這部電梯就可以恢復(fù)運轉(zhuǎn)了。但是這期間,電梯起碼需要停運幾天,甚至幾個星期。
現(xiàn)在蒂森克虜伯電梯集團已經(jīng)不再這樣做了。他們先在電梯里安裝好傳感器,用于搜集速度、聲音、溫度等數(shù)據(jù)。我們可以把這個過程當作一個“黑盒”。傳感器把數(shù)據(jù)搜集好以后,系統(tǒng)起碼可以做下面兩件事情。
第一,異常分析。公司用深度學習或機器學習方法建模:狀態(tài)正常時數(shù)據(jù)應(yīng)該在一個區(qū)段,快要出故障前數(shù)據(jù)在另一個區(qū)段。當數(shù)據(jù)處于快要出故障的區(qū)段時,公司就可以做預(yù)防性的維修,提前派維修人員到現(xiàn)場,很多時候可能加幾滴油就行了。
第二,數(shù)據(jù)搜集得夠多后,還可以做分類,公司不但知道它快壞了,甚至還可以將問題分成不同的情況,針對每種情況有不同的處理方法,有的加些油,有的換零件。
同樣的道理可以運用到許多其他領(lǐng)域。
比如汽車的維護。很多人的汽車每6個月要回廠維修一次,換一些過濾器等零部件,但是每個人開車的習慣不一樣,城市、天氣、路況都不一樣,如何判斷每輛車多長時間換一次零件合適呢?現(xiàn)在我們有了車聯(lián)網(wǎng),車聯(lián)網(wǎng)將所有車里的數(shù)據(jù)上傳到云端,就可以實現(xiàn)預(yù)防性的維護。
人體醫(yī)療保健也是如此。穿戴式設(shè)備可以將人的生物特征收集起來,在人快生病的時候,甚至在癌細胞達到一定數(shù)量后,系統(tǒng)提醒人們到醫(yī)院預(yù)防和治療。
微軟的客戶之一勞斯萊斯,除了汽車業(yè)務(wù),也做飛機引擎。在引擎方面,微軟至少可以幫助做兩件事。
一是可預(yù)防的維修。飛機延誤的部分原因是檢查出引擎發(fā)生問題,其造成的經(jīng)濟損失非常巨大,所以防患于未然非常重要。
二是降低油耗成本。飛機飛行的花費約40%是在油耗上,每次飛行載的油多就會費更多油,因為飛機更重了;載的油少就會危險,不能飛到一半油不夠。勞斯萊斯在駕駛員出發(fā)前,可根據(jù)引擎狀況、天氣狀況、風速等數(shù)據(jù)判斷加多少油合適。
當然這些例子也并不代表AI可以做所有事情。
“黑盒”與“白盒”
當前的AI主要是“黑盒”模式,它基于大數(shù)據(jù)的模式識別推理,可以解決“是什么”的問題,但不能解決“為什么”的問題,因此不同“黑盒”系統(tǒng)之間的因果推理幾乎是不可能的,所以,很多人把它說成不可解釋的AI。
那么“白盒”是什么呢?人類認知更多是“白盒”推理,能夠進行因果分析,還可以舉一反三,在不同“白盒”系統(tǒng)間可實現(xiàn)認知和推理。
1980年,斯坦福大學心理學系教授約翰?塞爾做了一個實驗來挑戰(zhàn)所謂圖靈測試,他的實驗叫“中文房間”。一個房間里有一位不懂中文的人,但給他一本很全的詞典,每次給他遞進去一張寫著中文的紙,里面的人通過大詞典查紙上每個漢字,我們假設(shè)他可以查到所有的文字,可以對照列出字詞的組合。房間里的人不會說中文,他不能夠用中文思考。但因為他擁有某些特定的工具,他甚至可以讓以中文為母語的人以為他能流利地說中文。而目前的AI就是這樣工作的。它們無法真正地理解接收到的信息,但它們可以運行一個程序,處理信息,然后給出一個智能的印象。塞爾用這個實驗來反駁“計算機和其他人工智能能夠真正思考”的觀點。計算機即使通過了圖靈測試,也不是真正的智能,因為它不能夠真正理解文字的意思。
塞爾還舉了一個實例,假設(shè)今天找一個人做翻譯,讓他翻譯“我是一個白癡”這句話,然后這個人一定會說“你才是白癡,我才不幫你翻譯”之類的,但是如果把這個指令給機器,機器一定會乖乖說“I am an idiot”。
所以,塞爾教授認為這種模擬思路,沒有思維和理解的叫弱人工智能,真正有思維和理解的叫強人工智能。前者具備觀察和感知的能力,可以做到一定程度的理解和推理。目前的研究都是集中在弱人工智能這部分。而強人工智能,期待可以獲得自適應(yīng)能力,能夠解決一些之前沒有遇到過的問題。但目前看來,強人工智能還遙不可及。
有了真正的思維和理解,才有可能進行所謂“白盒”推理,也就是最重要的因果分析。必須要知道因果關(guān)系,才能舉一反三。事實上今天AI大多做的是相關(guān)性,做不出因果關(guān)系。
比如做投資并購等商業(yè)決策。微軟最近幾年收購了全球最大的職業(yè)社交網(wǎng)站LinkedIn(領(lǐng)英),2018年還收購了GitHub(代碼托管平臺),這都是比較有名的并購案例。那么能不能把并購這種商業(yè)決策交給機器做呢?
我的答案是不能。
因為并購不是封閉系統(tǒng),它有許多外部因素,而且這些因素無法預(yù)測,也沒有那么多數(shù)據(jù),可能另一家也想跟一起并購,就會把價格抬高,這個時候到底該不該買?我們?nèi)松卮蟮臎Q定都是這樣,你可以做各種分析,但是最后還是有很多未知因素。
還有時候,AI會導(dǎo)因為果。比如,“公雞叫”和“太陽從東邊出來”,哪個是因,哪個是果?今天的AI搜集了一些數(shù)據(jù),分析出“太陽出來”和“公雞叫”有很大的關(guān)系,然后就做所謂深度學習,最后算出“公雞一叫,太陽就要從東邊出來”,就是導(dǎo)因為果了。
可能有人會想:這怎么可能呢?太陽當然是從東邊出來,所以才導(dǎo)致公雞叫。但是別忘了,那是因為我們有其他數(shù)據(jù)和知識支撐。曾經(jīng)幾千年來,人類一直認為地球是宇宙的中心,當伽利略提出地球不是宇宙中心的時候,大家都覺得不可思議,教皇還要抓他。
今天,所謂深度學習是一個不可解釋的AI,是“黑盒”模式,做不了因果關(guān)系的分析。所以,可解釋的AI是今后一個很重要的方向,而且非常難。30年前有一位圖靈獎得主,是加州大學洛杉磯分校的教授朱迪亞?珀爾,他做了一輩子因果關(guān)系分析,估計AI起碼還要在十幾年或二十年以后才會解釋“為什么”,才有可能做“白盒”分析。
《人類簡史》和《未來簡史》都是大家比較熟悉的書,2019年又出版了《今日簡史》,里面說將來大數(shù)據(jù)能做所有的決定,甚至包括我們的婚姻。我是持不同想法的。我們中國人的婚姻講究先看八字,但是我們也沒有全信,未來是未知的,把這么重要的事全部交給“黑盒”,似乎欠妥。但是這不代表AI沒有用。
所以,我把它改成圖11.5,這張圖跟圖11.4唯一的差別就是,分析和決策是AI和HI(人類智慧)一起做的,人做決定的時候需要看大數(shù)據(jù),但是不代表大數(shù)據(jù)會決定一切。有些東西用大數(shù)據(jù)來做決策是可以的,比如前面我們提到的可預(yù)防維修,機器可以解決比較簡單的問題。但我們也不要妄自菲薄,低估人類的智慧,很多時候大數(shù)據(jù)分析代表著有這樣的概率會成功,但是最后不見得選擇最大概率的方案就一定成功,這里面還有很多隨機的因素。
圖11.5 AI+HI
智能金字塔的自下而上第四層是創(chuàng)造力。從計算和記憶力、感知到認知,AI已經(jīng)做得很好了。但是創(chuàng)造力方面目前人類能做得更好。
近些年,深度學習可以用于“創(chuàng)作”,比如說詩詞創(chuàng)作。2018年我們用這個技術(shù)教微軟小冰寫詩,小冰還出了詩集《陽光失了玻璃窗》,當時很多人說這一定不是計算機做的,但事實上真的是!
現(xiàn)在,通過大數(shù)據(jù)分析,小冰不但能寫詩,還可以看圖寫詩(見圖11.6和圖11.7)。
圖11.6 看圖作詩1
圖11.6中,有月亮,有波光粼粼的水面,對面是燈火闌珊的城市。小冰根據(jù)這幅圖,就可以寫詩。
那繁星閃爍的幾天蒼色
那滿心的紅日
看萬里天使在世界
我就像夢
看那里閃爍的幾顆星
西山上的太陽
青蛙兒正在遠遠的淺水
她嫁了人間許多的顏色
圖11.7 看圖作詩2
像每一座城市愧對鄉(xiāng)村
我才有一個美好的完成
每個失眠的夜晚我是一個花言巧語的人
隱匿在靈魂最迷失的火
繞出城市的邊緣
美好的
在風里
最輕微的觸動
小冰既可以寫詩,也可以寫歌——先作詞,再譜曲。如圖11.8。如圖所示,詞和曲合起來就是這樣,各種類型的音樂,比如鄉(xiāng)村的、嘻哈的、古典的,小冰都可以寫出來。
圖11.8 《秋水》
在繪畫方面,根據(jù)一種喜歡的畫風,機器就能將圖像結(jié)合到繪畫上去,可以“畫”得非常好,但這在技術(shù)上是很難的。
圖11.9 風格遷移(Style Transfer)效果
那么,以上這些例子是不是代表計算機真的有創(chuàng)造力?
其實創(chuàng)作這種東西,特別是藝術(shù)的創(chuàng)作,還是要有自己的想法。今天AI可以產(chǎn)生這些東西,但是不代表它知道為什么產(chǎn)生,因為它是“黑盒”分析。假如今天我們讓計算機畫出所有世界上40×60的畫,計算機都可以畫出,但要問它其中一張要表達什么,這需要的不是IQ(智商),而是EQ(情商)。計算機能創(chuàng)造,但不代表它有像人一樣的創(chuàng)造力。
而從現(xiàn)實世界的角度看,我們把創(chuàng)造力定義成解決問題的步驟,這個算法就是創(chuàng)造力。
比如,數(shù)學家高斯小時候很聰明,數(shù)學老師有一天丟給他一道題,讓他從1加到N,他覺得這個N很大,數(shù)學老師覺得這一次高斯要花半小時,結(jié)果高斯不到一分鐘就告訴老師答案,這就是我們現(xiàn)在熟知的(N+1)N/2。
其實從1加到N,至少有兩種算法:N×(N+1)/2;從1一直加到N。
我為什么講這個例子呢?如果今天你跟計算機比賽,計算機用比較笨的方法,從1一直加到N,你用N×(N+1)/2的公式法,假設(shè)這個N很大,誰會先算出來?還是計算機,因為計算機算得實在太快了。
此前熱議的AI下圍棋,李世石先生和柯潔先生的算法來自他們自己,計算就是用他們的腦袋來算;AlphaGo的算法則來自十幾個科學家,計算也丟給了上萬臺機器在云端計算,這本身就是一個不公平的比賽,因為計算機可以算得非常快,人算得不夠快。如果李世石和柯潔還有一點點贏的希望,那么他們的算法肯定有獨特的地方。
今天大家常常說,誰做了某個AI,人類沒希望了,事實上大家忘記了一件事,今天計算機所有的算法都來自人,如果有一個人告訴你有一個計算機可以自己想出算法,那絕對是吹牛。從這個角度來看,人類大可不用擔心計算機會超越我們。
如果你仔細看這些腦神經(jīng)科學家做的實驗,歸納的左腦和右腦的特征,你會發(fā)現(xiàn)左腦主要與邏輯、順序、分析、數(shù)字化、理性、模式認知、基于事實等相關(guān),右腦則與直覺、隨機、綜合、主觀和創(chuàng)造性等相關(guān)(見圖11.10)。
圖11.10 左腦和右腦
所以,其實計算機跟人類正是左右腦互用的關(guān)系。人們用右腦進行創(chuàng)作,用左腦進行計算、求證。有超強計算和記憶功能的計算機在未來就可以成為人類的“最強左腦”。
這就像我們可以走路,但走得不夠快,就通過乘坐汽車或飛機等交通工具提高速度;我們也能記憶,但我們沒有辦法記那么多,所以就創(chuàng)造出計算機幫我們記憶;運算也是如此。但是這些想法、算法都來自我們的大腦。
意識是人非常特殊的一個東西,我們隨時知道身體在哪里,面對的是誰,我們的意識無處不在。植物肯定是沒有意識的,動物里面只有少數(shù)哺乳類有意識。心理學家和腦科學家都做過自我識別的測試,就是在動物或者人前面貼一個貼紙,然后給它/他照鏡子,如果它/他知道貼紙不是自身的一部分,就會動它,甚至把它拿掉,這叫作鏡面自我意識。大部分哺乳類動物都沒有通過測試,包括狗和貓也沒有通過。大部分猴子也沒有通過,我很驚訝,但大部分猩猩通過了,鯨魚和海豚也通過了。雖然大部分猴子沒有通過,但是據(jù)說經(jīng)過一個月的訓(xùn)練后,它會知道貼紙不是自身的一部分,所以猴子也是可以學習的。
有一本書《心靈潮汐:揭示意識的光譜》(The Tides of Mind:Uncovering the Spectrum of Consciousness),是耶魯大學的一位教授寫的,他在書中探討意識和創(chuàng)造力之間的關(guān)系,他把一個人一天的生活分成兩個階段:高譜系、低譜系。
高譜系就是我們早上起來的時候,喝一杯咖啡,精神很好,做什么事情都不會記錯,也不會算錯。低譜系就像我們吃過午飯,打一個盹,甚至做夢、睡著了,還有洗澡的時候,這些時候叫低譜系。
幾乎所有做腦科學的人得出來的結(jié)論都是:大部分人不是在高譜系的時候最有創(chuàng)造力,而是在低譜系的時候創(chuàng)造力更強。雖然這并不完全絕對,但還是有很多歷史上的佐證。貝多芬創(chuàng)作《第九交響曲》的時候既聾又盲;凡?高割掉了自己的耳朵,但還是可以畫出了不起的作品。
甚至有兩個科學家——凱庫勒、奧托?洛伊維。他們清楚地記起他們重要的科學發(fā)明是在做夢的時候想到的,尤其是洛伊維,他第一次做夢的時候,夢到了實驗方法,第二天早上起來,他知道他夢到了該怎么做那個實驗,可是他忘記了內(nèi)容,晚上睡覺又夢到和前一天一樣的夢,他這一次醒來后馬上把它寫了下來,最后憑借在夢中的發(fā)現(xiàn)獲得了諾貝爾獎。
當然聽完這個故事,可能有同學會說想創(chuàng)造就要多睡覺,所以我要特別講凱庫勒和洛伊維都說光睡覺沒用,光睡覺最多給你大膽假設(shè),但要小心求證,還是要到實驗室做無數(shù)實驗來證實。
我覺得更重要的是看背后的原理。很有可能兩件看似無關(guān)的事情,在神志清醒的時候很清楚地知道它們無關(guān),但是半夢半醒的時候,就可能看到這兩件事情的相關(guān)性,創(chuàng)新常常是在這樣的過程中產(chǎn)生的。
所以要做出一個有意識的機器,首先要讓計算機能夠幻想,這是很難的。當然人在低譜系時,十道計算題可能會算錯一兩題,但如果故意讓計算機每十題錯一兩題,這不叫真正的幻想。
怎么讓計算機有真正的幻想,進而產(chǎn)生了不起的創(chuàng)造力呢?沒有人知道。
智能發(fā)展的最高層就是智慧
弱AI這種單一用途的“黑盒”已有應(yīng)用。強AI是什么?事實上,就像通用AI,每樣都懂一點,很多東西我們不是專家,但也總能想出很了不起的想法。我的師祖約翰?麥卡錫當年召開達特茅斯會議,人家問他這種通用AI多久可以實現(xiàn),他給了一個很有智慧的回答:5~500年。我們知道當然不是5年,500年又相當于永遠,所以實在不知道什么時候會發(fā)生。
剛剛講到意識和創(chuàng)造力好像有關(guān)系,但是做一個有意識的機器人,本身有沒有現(xiàn)實意義呢?我個人覺得可能沒有什么意義。為什么呢?我常常舉一個例子,就是倒咖啡。假如我讓我太太幫我倒咖啡,十次里面有五次她會說“你自己有手有腳,為什么不自己去弄”,我會說“你講得太對了,我就自己去弄”。如果我今天做一個AI機器人,十次里面只要有一次它不弄,就說明它是有問題的。
做一個有意識的機器人代表你不能控制它,你可以想辦法給它洗腦,但是不見得會成功。所以,我覺得做一個有意識的機器人雖然在科學上很有意義,但是不見得有太多現(xiàn)實意義。
我還經(jīng)常舉一個例子,如果你真的要做一個跟我們一樣聰明,甚至比我們聰明又有意識的東西,我建議大家現(xiàn)在響應(yīng)政府的號召,多生一些小孩,因為我們巴不得我們的小孩比我們聰明,而我們也不能控制他們。
我們應(yīng)該怎么看待AI呢?我非常樂觀。的確,AI的關(guān)鍵是人,而創(chuàng)造技術(shù)的目的是更好地拓展人類的局限。它大部分跟工具一樣,是在幫助人類做事情,而且它跟人類很互補——人類有創(chuàng)造力,可是算不快,記也會記錯,AI恰恰可以彌補這些問題,所以我把AI叫作大數(shù)據(jù)驅(qū)動的知識。我們應(yīng)該很慶幸,我們是第一代跟AI一起生活的人類,而且我自己的經(jīng)驗是,對AI的研究,幫助我更好地了解了人類智慧是怎么回事。
記得我小學的時候認為會珠心算是很了不起的,現(xiàn)在我不這樣認為了,現(xiàn)在我認為人更高階的東西是人類智慧和機器智能的共進化。
人工智能與數(shù)字化轉(zhuǎn)型
我們今天到底處在什么時代?是一個徹底的數(shù)字化時代,從文字、數(shù)據(jù)庫、交易、信息知識再到物聯(lián)網(wǎng)、數(shù)字化孿生等方面都有所體現(xiàn)。
先是文字被數(shù)字化,最早辦公是用紙質(zhì)文件,后來用軟件,所以成就了微軟這樣的公司,Office里面的Word、Excel、PPT等是第一批被數(shù)字化的東西。然后是數(shù)據(jù)庫,甲骨文、微軟、IBM這些公司取代了手動“記賬”。再后來是商業(yè)化交易,阿里巴巴、京東等電子商務(wù)公司將交易徹底數(shù)字化。信息和知識的數(shù)字化就是我們的互聯(lián)網(wǎng),從一開始的門戶到搜索,都屬于數(shù)字化。多媒體方面,以前有大大小小的各種盤,現(xiàn)在全部變成了流,音樂流、視頻流。
為什么數(shù)字化徹底改變了我們的世界呢?就是數(shù)字化孿生。任何物理世界的東西,不管是人或者是物,都會有一個數(shù)字化孿生兄弟,數(shù)字化孿生至少有兩大意義。
第一,預(yù)測。就像我們剛剛講的馬達、機器、引擎、醫(yī)療器械,它自己在物理世界里根本不知道快壞了,但是在數(shù)據(jù)世界的它知道快要壞了,可以做可預(yù)防的維修。人在看電影,都不知道下一部要看什么,但數(shù)字化孿生已經(jīng)知道了,并準備推薦一大堆電影。
第二,模擬、仿真。我們就拿無人車和無人飛機舉例,它還沒有在路上走、沒有到天空中真正飛以前,一定要在它的仿真世界走上幾萬小時,飛上幾萬小時才會比較安全。一個國家、一個公司的政策,都可以用仿真的方法去做很多實驗。
大家可能會問:為什么微軟會重回市值第一?為什么我們轉(zhuǎn)型這么成功?因為徹底的數(shù)字化世界,需要無處不在的計算——智能云及智能邊緣,我們要實現(xiàn)以人為本的計算。
微軟CEO薩提亞?納德拉出版了《刷新》一書,該書分享了微軟轉(zhuǎn)型的經(jīng)驗。在客戶溝通方面,微軟可以用數(shù)字和AI的方法,跟客戶拉近距離:從被動的角度,客戶有問題時幫他們服務(wù),叫智能客服;從積極的角度,把客戶變成市場運作的一部分,讓粉絲幫你銷售,是更了不起的。在運營方面,微軟正在努力讓每個部門(包括我們的運營部門)更有效能、效率。
在賦能員工方面,前一陣很多人在討論“996”,我認為這是完全過時的想法,因為今天的職場,大家在工作上可能要處理一些家里的事情,在家里可能要處理一些職場的事情。所以,要讓員工不但把工作做好,還把家庭照顧好,這樣才可以鼓勵員工長期與公司和單位合作,還可以激發(fā)員工的潛能和創(chuàng)造力,使其能夠替公司產(chǎn)生更了不起的創(chuàng)意。
數(shù)字化轉(zhuǎn)型其實很多都是在自動化、優(yōu)化,改進決策,所以能夠產(chǎn)生新的產(chǎn)品、服務(wù),做新的商業(yè)模型,提高生產(chǎn)力。
做數(shù)字化轉(zhuǎn)型,平臺和技術(shù)很重要,但人是最難改變的,這對領(lǐng)導(dǎo)力、組織、思想、文化的挑戰(zhàn)更大。
微軟聯(lián)合德勤會計師事務(wù)所針對全世界的大、小、中型企做了調(diào)研:90%的企業(yè)已經(jīng)認識到數(shù)字化轉(zhuǎn)型的重要性,但是只有30%的企業(yè)認為它們已經(jīng)開始數(shù)字化了,其中只有15%的企業(yè)認為它們自己就可以勝任數(shù)字化轉(zhuǎn)型的任務(wù)。這其實也解釋了為什么微軟能轉(zhuǎn)型成功。同時,微軟也是企業(yè)最好的數(shù)字化轉(zhuǎn)型伙伴,是最忠實的技術(shù)和平臺伙伴,這也是最近微軟能夠有如此好成績的原因。
圖11.11 微軟云計算 + 人工智能平臺
大家很關(guān)注AI,事實上AI沒有數(shù)據(jù)和計算是轉(zhuǎn)不起來的,所以更希望大家多了解ABC(A指人工智能,B指大數(shù)據(jù),C指智能云)。圖11.11是微軟的云計算平臺和AI平臺,如果今天要做一個平臺來幫助公司做數(shù)字化轉(zhuǎn)型,最底層就是計算,包括芯片、CPU、GPU等,還要有一個數(shù)據(jù)平臺,有結(jié)構(gòu)化的數(shù)據(jù)、非結(jié)構(gòu)化的數(shù)據(jù),用處理數(shù)據(jù)的一些工具做數(shù)據(jù)挖掘,上面還有AI的機器學習,然后去做實驗,把數(shù)據(jù)放進來,最后做出AI的應(yīng)用,應(yīng)用于首先能夠在數(shù)字化轉(zhuǎn)型上得到益處的行業(yè)。
AI For Good(人工智能造福人類)。技術(shù)變得越來越重要的同時,與技術(shù)相關(guān)的負面隱憂也相應(yīng)增多,如隱私安全、假新聞、偏見等,甚至AI會不會取代人類導(dǎo)致大規(guī)模失業(yè)。
我覺得一個產(chǎn)品或是技術(shù),最后都反映了人的價值觀,因此產(chǎn)品的建設(shè)需要多方的利益相關(guān)者來參與,除了做技術(shù)的以外,商業(yè)專家、經(jīng)濟學家、公共政策者、心理學家、律師等,都需要一起來探討。
當今時代工作場所發(fā)生了巨大的變化,兩百多年前,絕大多數(shù)人都從事農(nóng)業(yè)工作,而今天這個比例則很小,那么其他人都失業(yè)了嗎?顯然沒有,因為工業(yè)革命產(chǎn)生了更多新的價值。所以,與其擔心技術(shù)會不會奪走我們的工作,還不如關(guān)注如何讓我們和我們的下一代保持終身學習。
未來的發(fā)展道路非常漫長,讓我們一起努力!
朱民對話洪小文
Q:我也是一個AI的業(yè)余愛好者,當然不專業(yè)了,因為我是一個可憐的經(jīng)濟學家。AI發(fā)展很有意思,現(xiàn)在發(fā)展到了哪個階段?
A:大概就在中間“認知”這個階段的一半。
Q:往上還能走多遠?
A:剛剛講到認知這里,就是“黑盒”模式和“白盒”模式,現(xiàn)在還是不可解釋的AI階段(“黑盒”模式),如果能做到可解釋的AI階段(“白盒”模式),它有可能再往上推。
Q:可能的途徑是什么?因為“黑盒”和“白盒”是兩個完全不一樣的概念,從“黑盒”到“白盒”遷移的過程可能會怎樣發(fā)生?
A:我先講比較實際的,這些大數(shù)據(jù)會幫助我們走向“白盒”,毫無疑問,我們也不能夠完全空想,因為沒有數(shù)據(jù)。
所以,從這個角度來看,其實“黑盒”已經(jīng)幫助我們做了一些“白盒”的因果關(guān)系分析了,當然今天討論的是能不能全自動做因果關(guān)系,假以時日絕對可以往上推,但是能不能推到100%我不敢講。我覺得人跟機器最后可能還是有差別的,今天的AI大部分是大數(shù)據(jù),人類的智慧大部分是小數(shù)據(jù),甚至是無數(shù)據(jù)。
一百多年前愛因斯坦根本沒有什么數(shù)據(jù),但他推測出了黑洞和引力波。一百年以后,我們用今天最好的科技,勉強測到一些黑洞、引力波的信號,還要一大堆最了不起的科學家合起來才能夠做到。所以我也不知道愛因斯坦是怎么在沒有數(shù)據(jù)的情況下想出很多觀點來的。
Q:小文是卡內(nèi)基梅隆大學的高才生,本科畢業(yè)于臺灣大學,是AI的祖師爺約翰?麥卡錫的弟子的弟子,所以是正宗的傳人,符合金庸寫的出身名派。那您相信奇點嗎?
A:我其實不太相信。提出奇點理論的是雷?庫茲韋爾,他很聰明,但是我不太同意他講的。奇點理論就是指人工智能的能力超越人類的某個時空階段。
為什么我不同意呢?我還是有科學根據(jù)的,比如20世紀的幾大難題,大部分被解決了,但是不能解決的東西,到現(xiàn)在也沒人會解決。我的意思就是,當我們解決了一個難題,下一個難題會更近嗎?其實不見得,我們今天還有很多未解的問題,每個領(lǐng)域都有一些未解的問題,包括我們從哪里來、宇宙有沒有大爆炸、我們會走向哪里等問題。
Q:您這個說法跟您前面的判斷是矛盾的。您現(xiàn)在的這個判斷是,人類發(fā)展的道路,每一步前進不意味著未來也可能會繼續(xù)前進。
A:對啊,是不知道的。
Q:但是跟您前面的推斷是不一樣的。您在“智慧金字塔”的推斷是,AI通過不斷學習,可以逐漸走向智慧。
A:但是我不知道要多久。
Q:您不知道多久,我也沒講多久,500年、5000年都可以,但是這兩個推斷的邏輯是不一樣的。您在“智慧金字塔”邏輯中,明顯對AI的發(fā)展更為樂觀,現(xiàn)在則是對未來充滿了未知。未來是未知還是可知?
A:未來也可知,也不可知。
Q:經(jīng)濟學家回答問題的方式,被科學家用了,(可知與不可知)這件事情有點兒麻煩,怎么解釋?
A:這里有好幾種解釋方法,第一種是比爾?蓋茨講的。他說人通常對于短期的事情過分樂觀,但是對于長期的東西又過分悲觀。就是說很多人樂觀地認為,AI走向智慧再有幾年就可以做到了。
Q:其實這句話講得很精彩,您覺得我們現(xiàn)在對AI過分樂觀嗎?
A:肯定有些人過分樂觀,像你提到的奇點理論,就是過分樂觀了。但是長期,到了500年,或許……
Q:就是我們對它潛在的未來看得不夠?
A:對,關(guān)于這個問題我只代表自己,我真的覺得有可能有些東西人類是永遠不會得到的,包括我們到底可不可以創(chuàng)造一些東西,甚至我們能不能知道到底有沒有神,或者是人類將會走向何方。因為我覺得,如果我們知道所有事情的結(jié)果,可能很多人會認為再活下去就沒什么意思了,探索未知本身就是人的使命。萬一我們最后探討,人類所處的世界其實是外星人做的一個實驗,我相信很多人會很悲觀。
Q:您相信嗎?
A:我不知道,我只能說我不知道,不知道本身是一件好事。
Q:我曾經(jīng)和一群世界級的天文學家討論這個問題,大部分人相信這是有可能的。
A:我覺得有可能,但是不能證明。
Q:我們的悟性還不夠,還看不到。所以,我想問您,AI通過技術(shù)和數(shù)據(jù)的演化,會不斷地逼近人的智慧,這是可能的嗎?
A:有可能。
Q:“黑盒”有可能走向“白盒”?
A:有可能。
Q:但是這條路很長、很曲折,這條路怎么走,什么時候走到“白盒”,會不會走到奇點?您表示懷疑?
A:我覺得基本上不可能,你這樣想,奇點要發(fā)生,就是說AI它可以自己去解決問題,或者是自己想出新的算法,而且它也不會累,它就可以把全世界的問題都解決了。這樣的話,我覺得人活著的意義可能就減少了一大半,人類探討未知,至少科學家在探討未知,假如有一個人幫你全部解完了……
Q:但是人永遠處于低譜系的狀態(tài)不是很好嗎?用您的說法,可以創(chuàng)新,做別的不也很好嗎?
A:我雖然不是經(jīng)濟學專家,但是有可能我哪一天一做夢,去創(chuàng)造出對理解經(jīng)濟很了不起的東西,這是可能的,這種希望讓我覺得我的生命很有意義,我覺得希望本身就是一個很有意義的東西。假如說以后沒有希望了……
Q:這是一個哲學問題。
A:對。
Q:這真的是智慧。您非常驕傲地講到了微軟小冰,小冰的成長過程中可能發(fā)生過一些很有趣的現(xiàn)象,比如它學會了說粗話,比如它有性別意識和種族意識,機器在和人的交流中,會把人的一些不良行為進行分辨、分析、儲存、記憶,并且變成它的行為,這怎么解釋呢?
A:我認為AI的關(guān)鍵還是人。我舉個例子,一把菜刀,大部分是被好人用來切菜,極少數(shù)情況下被壞人用來殺人,最后能說是菜刀的錯嗎?一定是人的問題。
Q:您又一次提到了大數(shù)據(jù)和小數(shù)據(jù),在ABC(人工智能、大數(shù)據(jù)、云計算)里面,數(shù)據(jù)是個大數(shù)據(jù),但是從AlphaGo到AlphaGo Zero(阿爾法元),其實是完成了從大數(shù)據(jù)到小數(shù)據(jù)的改進,AlphaGo Zero是沒有數(shù)據(jù)的。
A:這個我不同意。AlphaGo Zero沒有數(shù)據(jù)是說它沒有以前真正下過棋的數(shù)據(jù),但是有一個東西就是你在下棋,因為你的步還是有限的,游戲是可以自己產(chǎn)生數(shù)據(jù)的。你其實自己可以假設(shè),任何一步都可能有人下,只是說下這步的人多還是少。所以,今天所有在用游戲做AI的,有一個東西是不公平的,那就是AI可以造數(shù)據(jù)。在商業(yè)行為中,數(shù)據(jù)可以造,但最后并沒有幫助。但是下棋不一樣,我剛剛講了,任何一步都有人下,你不能說那個是假數(shù)據(jù),它可以自己造數(shù)據(jù)。
Q:它是封閉性的。
A:對。
Q:所以下棋是一個例外?
A:對,下棋是一個例外。
Q:它的特點是封閉、規(guī)則和博弈。
A:對,所以它自己可以造數(shù)據(jù),AlphaGo Zero是自己造數(shù)據(jù)的。
Q:未來大數(shù)據(jù)和小數(shù)據(jù)的結(jié)合,計算和悟性的結(jié)合這條路怎么走?
A:到底AI以后是更接近人,還是走“大數(shù)據(jù)和小數(shù)據(jù)的結(jié)合,計算和悟性的結(jié)合”這樣一條路,我個人更相信后者。
今天的AI叫以繁治繁。左腦和右腦對比,你會發(fā)現(xiàn)左腦要用大數(shù)據(jù),因為它要分析;右腦是直覺,可以是零數(shù)據(jù)或者小數(shù)據(jù)。所以,我們覺得什么人最聰明?是以簡治繁。機器是以繁治繁。
下棋就是一個很好的例子,人下棋希望歸納出一些原則,原則越抽象,越好學。機器下棋怪不得會贏,因為它以繁治繁,相當于如果是這樣的局勢,就走這著;如果是那樣的局勢,就走那著。我們提到過人記不了這么多東西,所以以繁治繁我們比不過機器,但是以簡治繁可以,人類最了不起的叫作“吾道一以貫之”。
大家學物理的話,會知道愛因斯坦為什么提出相對論。因為當年有牛頓力學、量子力學、電磁波,他想找一個定律來解決這些問題,這就是以簡治繁,我覺得以簡治繁和以繁治繁是互補的,因為世界上很多東西不見得可以以簡治繁,物理學家也沒有找到一個統(tǒng)一的理論。
Q:左腦和右腦在人的身體上可以溝通和交流,但是AI方面如何呢?
A:AI+HI。
Q:這是一個封閉系統(tǒng)?
A:對。如果不封閉,HI就要引入不封閉的東西,因為人還是可以接觸到其他東西的。
Q:您也說了這是一個封閉系統(tǒng),如果是封閉系統(tǒng),我們現(xiàn)在面臨一個問題,所有的自動化、數(shù)字化,結(jié)果都是云通過算法、AI、機器學習,不斷地自我學習、自我更新、自我發(fā)展,人做什么呢?
A:算法都是人做的。
Q:但是算法已經(jīng)通過深度學習自己來改進了。
A:不,算法還是來自人,深度學習也來自人,而且在里面建模的時候,沒有一個系統(tǒng)是沒有人的參與的,包括AlphaGo,寫算法、寫編程的一定是人。
你剛剛講的封閉系統(tǒng),它真的可以自己去進化,假設(shè)從經(jīng)濟學的角度來看,它的數(shù)據(jù)分配沒有變,就真的可以一直在上面轉(zhuǎn)。但是,有一天如果這個封閉系統(tǒng)變成開放系統(tǒng),一是一定要搜集新的數(shù)據(jù),二是可能還要引進其他算法。
Q:現(xiàn)在AI都是關(guān)聯(lián)性邏輯,而關(guān)聯(lián)性如果能運行得足夠好,以至于我們能完全放心,那么是不是可以不走因果關(guān)系的邏輯呢?
A:其實也沒有。就像我剛剛講的可預(yù)防的維修,“黑盒”告訴你數(shù)據(jù)和需要預(yù)防的維修有關(guān)聯(lián)性,但具體是加油,還是換零件,還是需要技師去現(xiàn)場看一看呢?可能大概是換個零件,換了以后電梯就好了。那么我們就把這個記下來,使得相關(guān)數(shù)據(jù)和這個零件有一個因果關(guān)系,測到這樣的數(shù)據(jù)模式時,就去換零件。如果這個理論是對的,事實上就已經(jīng)找到一個因果關(guān)系了,只是靠關(guān)聯(lián)性把這個因果關(guān)系運轉(zhuǎn)起來。
所以,今天機器要真正知道怎么去做,還是要有因果關(guān)系,否則到底換哪個零件呢?要不然就用窮舉法,窮舉法也是在做因果關(guān)系。想要真正有成效,還是要因果關(guān)系,只是這個因果關(guān)系較難發(fā)現(xiàn)。
Q:無論AI多聰明,還是需要科學家的。
A:是的,還是需要各行的專家。
現(xiàn)場問答
Q:我是清華大學的學生,我在南京AI大會看到沈向洋老師展示了夏語冰(微軟小冰),我也去中央美術(shù)學院看了夏語冰畫的畫,它現(xiàn)在基本達到了研究生的水平。我剛才聽您說到很多關(guān)于繪畫、AI這一塊的東西,能否請您細致地講一下,AI是怎樣學習繪畫技能的,比如印象派等各個流派?
洪小文:就是用大數(shù)據(jù)去歸納。其實畫畫本身也是很機械化的,以印象派為例,最早寫實派畫得跟照片一樣,而印象派就是把顆粒變大,但還是保持原來光影的相對性。事實上如果把繪畫放到幾何里,就是一個機械化的動作,只是我們用人的方法去做那件事情。所以,機器能夠畫畫本身不是一個意外,我覺得難的在于為什么會有這種想法,要去畫印象派,甚至到后來的抽象派,我為什么要用這種抽象表示那個意思,我覺得背后有EQ的部分,如果今天搜集了這些數(shù)據(jù),我歸納去做也是可以的。
Q:我是多倫多大學計算機系的學生。您對“黑盒”的定義,是說“黑盒”與“白盒”之間是可解釋和不可解釋的,是一個比較明顯的定義。比如人理解問題,你可以用邏輯去解釋這個問題。但是比如用深度神經(jīng)網(wǎng)絡(luò)去解釋,你就說看不懂每一個參數(shù)提出來的特征是什么,那么就說這是一個不可解釋的“黑盒”系統(tǒng)。但是從這個角度來看,你也不能解釋人的大腦里每一個神經(jīng)元信號的激活代表了什么。您是不是覺得現(xiàn)在我們只是沒有找到一個可以好好解釋深度學習的方法,還是您覺得它從根本上就不用解釋?
朱民:這個問題提得很好,多倫多大學是深度學習的大本營?!昂诤小焙汀鞍缀小笔谴_實可以分開的嗎?其中的計算過程是怎么完成幫助、轉(zhuǎn)移的?
洪小文:科學家一直在探討這個問題,腦神經(jīng)科學家就在探尋你講的“大腦里每一個神經(jīng)元信號的激活代表了什么”,在找“白盒”。事實上不管任何學科,都是在找因果關(guān)系,只有找到了因果關(guān)系,才有可能去做推論。除了貝葉斯定理,今天包括深度學習的幾乎所有AI,都在找因果關(guān)系。但是大家不要認為“黑盒”是不好的。
《黑匣子思維》一書提出,“黑盒”是不會有偏見的,“白盒”會產(chǎn)生偏見,因為“白盒”還得考慮其他因子,所以人事實上是有偏見的?!安还芎谪垺棕?,會抓老鼠的就是好貓”,這句話是一個“黑盒”理論,它是一個很公平的理論。所以,“黑盒”也有“黑盒”的好處,“黑盒”和“白盒”最后還是要混合利用的,也不是說“白盒”就絕對好。
Q:我是北大智能科學系的,也是微軟亞洲研究院的實習生,也算是您的員工。我想同時問洪院長和朱院長一個雙向的問題,AI作為一個工具,金融行業(yè)非常需要AI,如果從朱院長的角度來講,金融行業(yè)對AI最期待的是什么?反過來的話,如果從洪院長的角度,AI對金融行業(yè)最大的期待又是什么呢?我感覺這是一個雙向的問題。
朱民:他希望我們倆辯論一下。這個問題提得很好,對于金融界來說,最根本的問題還是算法和數(shù)據(jù)?,F(xiàn)在的微貸、中小企業(yè)貸款,都是根據(jù)數(shù)據(jù)和算法進行放貸的。算法意味著效率,數(shù)據(jù)意味著準確和風險控制?,F(xiàn)在做理財、做支付、做貸款、做存款、做供求等無數(shù)金融交易的案例,核心是對數(shù)字結(jié)構(gòu)的理解和算法。而我可以說,到現(xiàn)在為止,AI為金融行業(yè)提供的數(shù)據(jù)和算法還是非常有限的。
舉個例子,實際上AI企業(yè)、金融科技企業(yè)現(xiàn)在對小微企業(yè)放貸都無實質(zhì)性的作用,真正可以提高效率的都是消費貸款,現(xiàn)在只能做到消費貸款這一級別。中小企業(yè)貸款的定義是500萬~1000萬元。10萬元以下的消費貸款,AI可以做得非常安全,不良率可以控制到1%以下。螞蟻金服可以做到“320”——3分鐘接受一筆貸款申請,2分鐘放款,0人干預(yù),每筆貸款的成本是2.44元,普通銀行一般發(fā)一筆中小貸款的成本是2400元。但是AI技術(shù)就是無法突破10萬元線上放款的限制,為什么?答案在于數(shù)據(jù)、算法。在純線上的情況下,我們對客戶的描述精準性和算法的控制還是達不到要求。所以,歸根結(jié)底我覺得這個在理論上其實還是有很大期待的。以上是從金融的角度來看這個問題。
洪小文:微軟通常都是通過銀行、保險等合作伙伴來為金融行業(yè)賦能。微軟提供的是技術(shù)和平臺,金融機構(gòu)有數(shù)據(jù),知道背后的商業(yè)邏輯,大家合起來做一些事情。比如智能投顧,我們?nèi)〉玫某晒ê献鞣皆趦?nèi)都非常滿意。我個人非常同意朱院長講的,其實有了很多數(shù)據(jù)以后,就會知道這個人一定還得起,就可以把錢借給他。這個功能的實現(xiàn),其實大部分的功勞是在數(shù)據(jù),而不是在算法。我希望將來金融和AI兩者可以深度結(jié)合,做一些更普惠的東西,真正幫助到被忽略的群體,同時又能夠幫它控制風險,我覺得那是更有意義的。
朱民:AI說到底是一個數(shù)據(jù)問題,就是對數(shù)據(jù)的理解,是數(shù)據(jù)和統(tǒng)計的技術(shù),而計算是第二步。當然,這也可能只是我這個經(jīng)濟學家講的外行話。
Q:我本人是做投資的,沒有學過計算機,但是我對您講的AI特別關(guān)注,因為我們投資了這個方向,最近我們接觸的很多行業(yè)都是跟AI相關(guān)的。想跟您探討一下,剛才說道,現(xiàn)在AI在智能金字塔還停留在半認知的階段,但當有一天達到智慧階段時,算法是不是可能自己會延伸新的算法,而不需要人了?所以未來AI一定會超越人類嗎?
洪小文:看來你比較相信奇點理論,但我個人認為非常困難,而且真的有那一天的話,算法它可以主動解問題、證問題,不再需要數(shù)學家、物理學家、計算機科學家,我們的世界也不會是現(xiàn)在的樣子了。
假如這個世界所有的問題,甚至包括人類從哪里來、將走向哪里,你都知道答案的話,我不確定,但我想那有可能是一個很殘酷的世界,甚至結(jié)論是我們的世界是某一個外星人做的實驗,或者是所有的這些都是一個偶然。
達到奇點理論非常困難,而且實現(xiàn)創(chuàng)造力的算法本身是否真的有一個系統(tǒng)化的做法呢?我們一天到晚希望我們的小孩有創(chuàng)造力,如果有這樣的東西,沒有人需要學習了,程序會自動幫人類創(chuàng)造、解析問題,那么這個世界已經(jīng)不是我們今天所了解的世界了。
朱民:這個回答很精彩,這就是智慧,我想快速地總結(jié)一下。
第一,AI正在迅猛發(fā)展,在智能的金字塔上已經(jīng)走了一半的路程,現(xiàn)在到了認知階段,包括理解、洞察、推理、計劃、決策,再往上走就是創(chuàng)造階段了,我們只是不知道它將怎么往前走,“黑盒”和“白盒”之間如何發(fā)生轉(zhuǎn)移和融合。小文相信技術(shù)一定會往上走,但能否走到最終的奇點,還是超過了今天他的想象,也超過了我的想象,我們不知道。我們相信這一天可能不會到來,因為人還是遠遠超過機器的,人如果沒有這個信心怎么能活到現(xiàn)在呢。我們既對AI有認識,也對它很謙卑,因為我們不知道未來會怎么樣,但是它正在如此迅猛地發(fā)展。
第二,現(xiàn)有的AI技術(shù)已經(jīng)有無限廣闊的應(yīng)用了,小文舉了很多例子——交通、城市、建設(shè)、醫(yī)療、安全等,這個世界正在被AI的發(fā)展不斷推向未來,剛才那位提問的投資者充滿信心,雖然他不太懂AI,但是會投資很多AI項目。AI在改造我們的世界,使我們身處的場景發(fā)生了很大的變化,我不想把它說成一個挑戰(zhàn),我只是說我們都在其中,這是我們的運氣。
第三,我們需要改變我們自己,認識到AI正如此洶涌地走向我們,改變世界,我們根本不知道它會走向何處,所以保持謙卑、持續(xù)學習,是我們未來最好的方向。