《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 業(yè)界動態(tài) > 為什么堅(jiān)信人工智能

為什么堅(jiān)信人工智能

2016-06-29

  沒錯,前段時(shí)間,好多朋友留言說——是否為了向Alpha GO致敬?怎么理解,都成。總之,Alpha GO戰(zhàn)勝了人類,我認(rèn)為,這是一個標(biāo)志性的里程碑事件。為什么呢?先科普一下。

  圍棋有多難,有句話叫千古無同局。你永遠(yuǎn)不可能走過相同的一盤棋,甚至每個地方都不一樣。每一種可能都是一個分支數(shù),然后每一個分支下面,還有無數(shù)個分支數(shù)。而且黑白之間,怎么判斷哪個黑子比哪個白字強(qiáng)?這是一個非常復(fù)雜的策略。

  幾乎算是人族歷史上最復(fù)雜的智力游戲。

  當(dāng)然,Alpha GO贏了。其實(shí)早在1997年,IBM投資的深藍(lán)電腦也完勝了世界象棋冠軍卡斯帕羅。兩場比賽都是里程碑事件。但不同在于,深藍(lán)計(jì)算能力為10的50次方,Alpha GO為10的170次方。

  兩個比賽整整差了120次方。

  Alpha GO學(xué)習(xí)能力太強(qiáng),短時(shí)間就能掌握圍棋高手的棋路。更重要的是,Alpha GO的自我學(xué)習(xí)能力更強(qiáng)。它可以模擬左右手互搏,相當(dāng)于兩個Alpha GO對戰(zhàn)。A勝則學(xué)A,B勝就學(xué)B。隨機(jī)改變棋路,不斷否定自己。

  具體講,Alpha Go采用了三大核心技術(shù):策略網(wǎng)絡(luò)(Policy Network)、估值網(wǎng)絡(luò)(Value Network)和蒙特卡羅樹搜索(Monte Carlo Tree Search)。

  其中,策略網(wǎng)絡(luò)負(fù)責(zé)落子選擇。不做窮舉計(jì)算,從幾千種可能里面選出最好的幾種或者幾十種。將理論上存在的幾百種可能的棋步,縮小到幾種得分最高的可能。減少了計(jì)算寬度,不用去計(jì)算所有落子可能。

  價(jià)值網(wǎng)絡(luò),則負(fù)責(zé)評估落子后的局面和最終勝負(fù)的概率關(guān)系,減少了計(jì)算深度。蒙特卡羅樹搜索,則是采樣越多,越近似最優(yōu)解。它負(fù)責(zé)支撐兩種網(wǎng)絡(luò)的最優(yōu)解搜索——盡量找最優(yōu)解,不保證找到最優(yōu)解。

  通過以上三種技術(shù)順利完成了整個Alpha Go強(qiáng)大自學(xué)習(xí)能力,以及與之匹配的強(qiáng)大計(jì)算能力和概率生成。

  盡管如此,象棋和圍棋的計(jì)算難度,仍不可等同于一個量級。象棋子數(shù)較少,每個子都有固定走法,計(jì)算時(shí)可以遍歷每種可能,從而決定當(dāng)前落子最優(yōu)解。

  但,圍棋不行。有人對圍棋和象棋的可能變化做過統(tǒng)計(jì):象棋的變化是3.74×10^248,而圍棋是1.73×10^686。

  對于圍棋,若想做到像象棋一樣遍歷,運(yùn)算量會大到目前機(jī)器無法承受。原來的方法不適用了。所以,要引入一套人類智能最新的研究成果——深度學(xué)習(xí)算法。

  最近,我也深度學(xué)習(xí)了深度學(xué)習(xí)。我突然發(fā)現(xiàn)——深度學(xué)習(xí)是計(jì)算機(jī)歷史上出現(xiàn)過最簡單、最美麗的東西。我也可以去寫一個以前,可能在我當(dāng)程序員,無法完成的一些圖象識別的基本算法結(jié)構(gòu)。

  它只需要通過像搭積木一樣地搭建那些神經(jīng)網(wǎng)絡(luò)的組合,用數(shù)據(jù)灌入到網(wǎng)絡(luò),你就可以驚奇地等待它會發(fā)生什么。而等它發(fā)生后,你會發(fā)現(xiàn),比人類幾十年積累的很多算法的效果要好得多得多。

  在圖象識別領(lǐng)域,三年前還沒有人認(rèn)為,計(jì)算機(jī)能夠通過各種算法完成對人類圖象識別能力的超越。但深度學(xué)習(xí)引入后,計(jì)算機(jī)圖像識別能力取得了飛速進(jìn)展。新近研究的超級計(jì)算機(jī)Minwa,在一項(xiàng)備受關(guān)注的人工智能基準(zhǔn)測試Image Net取得了世界最好成績,錯誤率僅為4.58%,超越了微軟和谷歌。此前,世界最好記錄4.82%由谷歌創(chuàng)造,同樣實(shí)驗(yàn),人眼辨識錯誤率大概為5.1%。

  這意味著:今天開始,計(jì)算機(jī)對圖象識別的能力開始超越人類了。而且這種識別,不會疲勞。

  不僅如此,人工智能與深度學(xué)習(xí)會極大超出我們想象。比摩爾定律還要快地突破。這樣的突破就可能會帶來一次算法革命,甚至?xí)购芏嗫萍计髽I(yè)積累了很久的技術(shù)壁壘,蕩然無存。

  所有重復(fù)腦力勞動,都會被人工智能取代。人工智能將幫助人類從繁重的體力和腦力勞動中解放出來。

  這是一個偉大的機(jī)會。我們不再需要每天重復(fù)進(jìn)行一個已經(jīng)進(jìn)行過很多年的工作。

  甚至,只要數(shù)據(jù)足夠,電腦程序都可以產(chǎn)生情感。

  在電影《黑客帝國》第三集開端,主角尼奧被困在火車站,碰到一個程序時(shí),那個程序?yàn)榱怂呐畠海ㄟ@也是生出的一個程序的小女兒)去不斷地躲避大程序的追殺,想把她運(yùn)到一個很安全的地方時(shí),他說,我愛我的女兒。尼奧說,你是一個程序,怎么會知道愛呢?他說:“l(fā)ove is aword”。

  我堅(jiān)信,人和機(jī)器人共存的時(shí)代必將到來——Today is history。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。